データのお砂場(108) R言語、claridge、左利きと遺伝、{boot}

Joseph Halfmoon

R言語のパッケージbootには、ブートストラップ法のサンプルデータセット多数、しかし今回もブートストラップ法は試みておりませぬ。いつやるの?さて、今回のデータセット名は claridge です。そのお名前で検索すると「五つ星」高級ホテルがドーンと見つかりますが関係ないみたい。左利きの傾向と遺伝に関するデータらしいっす。

※「データのお砂場」投稿順Indexはこちら

余談ですが、Claridge’sは英国倫敦(ロンドンね)の由緒正しい5つ星のホテルらしいです。歴史をたどると江戸時代末の開業、現在の建物ですら19世紀末の建造とのこと。勿論何度かリノベーションしているみたいなので内部の設備は近代的なのでしょうが。当方は無縁だな。

検索するとClaridgeの名を冠するホテルが世界各地に。何か関係あるのか、それとも「あやかった」だけなのか。日本にも有名ホテルの名にあやかったらしいホテル結構あるものなあ、特に田舎に。

さてClaridgeは、サンプルデータセットの元データを提供してくださったオックスフォード大の先生のお名前 Dr. Gordon S. Claridgeから取られたタイトルみたいです。もしかしてホテル経営者の一族?分かりませぬ。

Claridgeデータセット

データセットの解説ページが以下に。

Genetic Links to Left-handedness

「左利きと遺伝」に関する研究のために集められたデータのごくごく一部みたいです。ちょっと特殊な遺伝をもつ37人の母親(すべて男児を持つ)に関して、そのDNA測定の結果と左利きの「尺度」を並べたものだということです。

DNA測定の結果は、ちょっとセンシティブなものであるためか単なる数値です。何をどう測ったのかなど一切の情報なし。

なお、利き手と遺伝の間には「何かある」かもみたいですが、利き手には母親の胎内環境から後天的な経験までいろいろ影響するらしいです。単純明快な遺伝関係などサンプルデータセットから分かるわけないと見ました(個人の意見です。)

左利きの「尺度」

左利きの「尺度」が「いろいろ」あることを、今回調べてみて初めて知りました。「右利き」だと関心低いのだと思う。自分や子供に左利きがいて関心が高まるものかと。いろいろな尺度がある中で「メジャー」らしいものを列挙してみました(検索でよくヒットする、生成AIがその名をあげる、という程度だけれども。)

    1. エディンバラ利き手テスト
    2. チャップマン利き手テスト
    3. フランダース利き手テスト
    4. N.H.「利き手」テスト

どれも設問に答えていって、その結果を積算すると左利きの程度を示す数字が出てくるという形式です。ただし、Claridgeデータセットの尺度は1から8(1が一番右手で8が左手)なのですが、上記のどれも当てはまりませぬ。

また調べていて『日本左利き協会』様なるホームページがあることにも気づきました。そんな協会あったのね?知らんけど。2018年スタートの新しい団体で特に法人格がどんなだとか書かれてなかったです。見落とした?他にも「左手」系の組織は複数あるみたい。実は調べていくと「左手」系、かなり奥深そう。新たな世界か?

まずは生データ

以下で生データをロードしてその様子を眺めてます。データ形式は単純なデータフレーム、被験者37名様、測定項目は2種のみ。claridge_RawData

DNAをどうやって数値化(それも単純な整数に)しているのか不明ですが、プロットしてみたところが以下に。claridge_plot

なぜか上記のデータをみると、DNANというDNAの何かの指標と「左手度」の間に相関関係があり、みたいな傾向を読み取ってしまいそうになります。。。ホントか?騙されているな、自分。

そういうところの信頼度をブートストラップ法で確かめよ、というのがサンプルデータセットの心なんでありましょうや。

その心を知らず回帰直線を無理やり作成。

g0<-ggplot(claridge, aes(x=dnan, y=hand)) + geom_point() + geom_smooth(method="lm")
g0

こんな感じ。claridge_lm

いや、多分、そんな単純な相関ないから。

データのお砂場(107) R言語、channing、老人ホーム入居者データ、{boot}へ戻る

データのお砂場(109) R言語、cloth、布地のキズ、{boot} へ進む