データのお砂場(117) R言語、frets、「ヤバイ」サンプルデータかも、{boot}

Joseph Halfmoon

R言語のパッケージbootのサンプルデータを abc 順に見てます。前回は「モミの木」でした。平和。今回は「頭の形」のデータです。サンプルデータセットにもその処理例にも一言もヤバそうなことは書いてないのです。しかし忘却力の年寄には「先の大戦前後の忌まわしい記憶」(戦後生まれだけれども)が呼び起されます。くわばらくわばら

※「データのお砂場」投稿順Indexはこちら

「頭の形」の計測、不穏な感じ

年寄は頭の形のサンプルデータと聞いただけで不穏な印象を受けました。正直、触りたくないな。「最近の若い人」は御存じないかもしれませんが、先の大戦(第2次世界大戦ですぞ)前、ナチス・ドイツの影響からか優生思想なるものが世界的に流行し、それが欧州でのホロコーストに繋がったわけです。影響は欧州にとどまらず、米国にも、そして日本にも影響あり、数々の悲劇を引き起こしたと。その思想そのものは結局都市伝説的な根拠のものだったわけでありますが。

日本においてもその反省に基づく調査と報告がなされておったようです。『日本国・衆議院』の以下の報告書に書かれてます。

衆議院のPDF資料より  第1章 優生学・優生運動の歴史と概要

上記より、関係する1か所を引用させていただきます。

人種は、肌の色以外の変数でも多く測定され、頭の形(cephalic index)は、人種の違いを測る代表的な指標であった。

くわばらくわばら、急急如律令。

Head Dimensions in Brothers

サンプルデータセットの解説ページは以下です。

Head Dimensions in Brothers

データセット自体は戦前のものなのでヤバイ感じがあるのですが、救われるのは、このデータセットが成年に達した兄弟(第1子と第2子)の頭の「長さ」と「幅」を記録したデータであることです。比較しているのが兄弟なのでヤバさは薄まってます(けれど最近は頭の長さや幅など気にせんよな。)

bootパッケージ内のサンプルデータセットはすべからく「ブートストラップ法」関連関数のエクササイズ用だと思うのですが、ほとんどのサンプルデータセットには具体的な試用例などは書かれてません。しかし、このfretsサンプルデータセットについては、以下の2つの処理関数のExampleで使われておるのです。

    • plot.boot、Plots of the Output of a Bootstrap Simulation
    • jack.after.boot 、Jacknife-after-Bootstrap Plots

以下の論文を拾い読みするに

行動計量学19巻2号 1992年 ブートストラップ法 最近までの発展と今後の展望

歴史的には先に「ジャックナイフ法」あり、そこから「ブートストラップ法」が開発されたということ見たいっす。知らんけど。

『tomsekiguchi』先生が、以下のページで

ブートストラップ法の直感的理解

ブートストラップ法について解説されている中でもジャックナイフ法に言及されます。私はなんともムツカシイこと分かりませんけど。

まずは生データ

生データ自体は無味乾燥な数字がならんだシンプルなデータフレームです。こんな感じ(bootパッケージの事前ロード必要。)fretsRawData

頭の長さと頭の幅(いずれもmm)、でかいノギスみたいなもので測ったのかな~。ちょっと不気味。

処理例

今回は祟りが怖いので、処理例をサクッと実行してお茶を濁します(いつも濁してばかりだな。)plot_fretsBootOpr

なにやら「相関」とっているみたいですが、これにどんな意味があるのやら統計素人の年寄にはサッパリです。結果のグラフが以下に。

plot_fretsBoot

「いつもの」ブートストラップ法のグラフの下に regression jackknife valueというグラフが添付されてます。この形がジャックナイフに似ているとか言わないよね。。。

なお、以下のjack.after.boot関数では、上記の下のグラフ部分のみ得ることができます。frets_jackAfterBoot

こんな感じ。frets_jackAfterBootPlot

なんだかな~。まったく分からん。

データのお砂場(116) R言語、fir、バルサムモミの苗を数える、{boot} へ戻る

データのお砂場(118) R言語、gravity、処理例豊富なセット、処理例1、{boot}へ進む