このところ「植物」関係のデータが多い気がします。こちらはR言語のサンプルデータセットをABC順(大文字先)で端から試してみているので他意はございません。毎度、Rの処理からすれば蛇足な背景などを調べて一人悦に入っておりました。面白いので。しかし、今回は植物のデータですが無味乾燥(データは乾燥重量)。
※「データのお砂場」投稿順Indexはこちら
今回のデータセットの解説ページは以下です。
Results from an Experiment on Plant Growth
植物の成長について、3条件下での収量(乾燥重量とのこと)データで比べる実験のようです。植物=Plantとありますが、何だか言及はありません。乾燥重量も単位は不明。生育の3条件も、ただ ctrl、trt1、trt2と書かれているのみ。抽象的ですが、本題の統計処理を行うには必要十分。しかし、その他のところに「お楽しみ」を見つけていた私メとしては若干物足らない感じがしないでもないです。
ということでさっさと処理に入ります。
まずは生データから
例によって生データのロードから。
単純なデータフレームでした。データも単純、生育条件を示すgroupと乾燥重量を示すweightのペアが30件です。各条件は10データづつでした。
ボックスプロット
このデータを使ってやることと言えば、3条件の間に有意な差がみられるのかどうかという件でありますね。以前にも以下投稿などで勉強した件。
データのお砂場(14) R言語、InsectSprays、殺虫剤の効きの分散分析とな?
以下のような手順でよかですか。
- ボックスプロットをやってデータの全貌を見る
- ANOVAかけて、有意な差があるかどうか確認する
最初のボックスプロットですが、今回の説明ページには処理例コマンド載っていました。そのままやってみます。
あれれれ、warningでてますな。そして、生成されたプロットが以下です。
なんだか、notchというものをつけて「見栄え」を狙っているみたいなのですが、いまいちよく分からんです。処理系のバージョンの違いなどがあるのかな~。
とりあえず notch つけなくても影響無さそうなので、notchを外し、お愛想に条件毎に色を変えてみました。処理はこんな感じ。
上記の boxplotの結果は、冒頭のアイキャッチ画像に掲げました。
こうしてboxplotを見ると、私なんぞは直ぐに、条件毎に差異があるじゃん、と早合点してしまいます。でもよく見ると、3条件とも範囲が結構被っているし、データは10点づつだし、早合点していいのという感じがしないでもないです。
ANOVA(analysis of variance)
条件毎に差異があると言えるものなんだか、どうだか、anovaかけてみることになります。
以前にも参照させていただきましたが、以下の同志社大学様のページを参考にさせていただいてます(日本語だし。)
今回のケースは、一元(one-way)の分散分析(ANOVA)ということで良いですかね。処理は1撃です。
上記の Pr(>F) のところのP値を読むと、0.01591 とな。結構小さめではあるけれど、有意水準 0.01 より大きいではないですか! ということは1%の有意水準で「各水準の平均値に差がない」という仮説は棄却できん、ということでないですか。group条件に差があるとは言い切れないってこと!
まあね、何時も差があるという結論のデータばかりでは練習にならないものねえ。素っ気ないデータなのはそのせい?気のせい?