データのお砂場(221) R言語、eagles、海賊鷲?の襲撃成功率とな {MASS}

Joseph Halfmoon

今回は鷲デス。米国の国鳥でもある白頭鷲っす。大きくて勇壮な鷲だと思っていたら、中にはこ狡い行動をする鷲もいるようです。他の鷲の獲物を横から掠める海賊鷲です(海賊とか言うとちょっとカッコイイかも。)不届きなそやつらの襲撃の成功率を調べたのが今回のサンプルデータセットです。データはシンプルだけれど解析方法はムズイよ。

※「データのお砂場」投稿順Indexはこちら

白頭鷲、合衆国関係の各種紋章に立派な姿で描かれている「あの鷲」です。昔から米国の国鳥ということになっていたのかと思いきや、「国鳥」と定める法律できたのはつい最近みたいです。知らんけど。大きく強力なその力で海辺で狩り(今回は相手が魚なので漁?)をしている鷲さんです。

Foraging Ecology of Bald Eagles

今回もMASSパッケージのサンプル・データ・セットです。その名もズバリ eagles とな。

https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/eagles.html

ハクトウワシは、英語だとBald Eaglesということです。そして、彼ら(もしくは彼女ら)の獲物は、chum salmon、これは普通にワシらが食ってるシャケをさしているみたい。ワシさんたちもシャケが好きなのだなあ。

さてワシさんたちが皆真面目?に水に潜ってシャケを捕まえているのかと思えばさにあらず。他のワシさんが捕まえたシャケを横取りするよからぬ行動をするものがおるようです。やっぱり水に潜るより楽ってことかい?その行動を本サンプル・データ・セットでは、

Foraging Ecology

と称しているみたい。

サンプル・データ・セット自体は以下の5変数の小規模なものです。

    • y (略奪が)成功した試行回数。
    • n 合計試行回数。
    • P 海賊鷲の大きさ(L=大きい、S=小さい)。
    • A 海賊ワシの年齢(I= 未成熟、A= 成鳥)。
    • V 被害を受けたワシの大きさ(L= 大きい、S= 小さい)。
先ずは生データ

まずはMASSパッケージからサンプルデータセットをロード。以下のようにシンプル。rawDataEagles

全貌を表示しても以下の通り。EaglesFull

上記のデータを眺めるだけでも、大きい鷲さんを小さな鷲さんが襲ってもまず成功せん、ましてや小さい上に経験不足の若い鷲さんでは無理、ってことが明らかかと。

処理例

ただ、漫然と数字を眺めて、上のような「感想」を唱えていてもR言語の練習にならないです。今回はglm関数をつかってロジスティック回帰分析を行うという処理例が掲載されてました。

説明変数として、P、A、Vがすべて2値の変数なので binomial ってことみたい。また、海賊鷲側の大きさに加えて「経験値」がものをいうのではないかということを考えて、相互作用項としてP*Aをとるみたい。処理例掲載のglm関数の部分を丸ごと引用したのが以下に。

eagles.glm <- glm(cbind(y, n - y) ~ P*A + V, data = eagles,family = binomial)

さて上記で、eagles.glmに回帰分析結果が格納されている筈なのでサマリをみたものが以下に。summaryGLM

緑色のマーカ引いたのはPr値小さいので、それっぽいところっす。PSは、襲う側がチイセーと襲撃は失敗しがち(Estimateは負)、VSは、襲われる側がチイセーと襲撃は成功しがち(Estimateは正)という理解でよいですかね。

因みに、鷲さんの大きさに経験加味した相互作用項を考えた?  PS:AI は上のPS、VSほどではないけれども、まあそれっぽいかも(黄色マーカ。)

dropterm

しかし、処理例はそんな表面的な理解にとどまらず、dropterm関数というものを使って赤池情報基準(AIC)計算して、何か「落とせる」ものないかなど探索しているみたい。こんな感じ。dropterm

上記結果をみると、<none>の行のAICより、変数Vを「落とした」場合のAICは大きくなっている(黄色マーカ)ので、変数Vは落とさない方がよいってこってすかね。一方、P:Aをみると、AICの増加はそれほどでもない。経験値はそれほど重要でないってこと?いいのか?

profile

さらに処理例は、Likelihood Profileなるものに突入。処理例を丸写しにしたものが以下に。

prof <- profile(eagles.glm)
plot(prof)
pairs(prof)

結果のプロット2枚を並べますが、掛け値なしで老い先短いお惚け老人にはLikelihood Profile は過ぎたる処理です。

plot_prof

まあ、呼吸をするように尤度を計算できるプロは、グラフの曲がり方をみていろいろ察するところもあるみたいなんだけれども。pairs_plof

今回はこれにて。

データのお砂場(220) R言語、drivers、 既にスーパセットやってた {MASS} へ戻る

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です