
R言語のサンプルデータセットをABC順(大文字先)で端から試してみていますが、お薬ネタ?も時々ありますな。今回は、ピューロマイシンという抗生物質だそうです。この抗生剤を使ったときと使わぬときでの何やら反応速度の違いを測定したデータみたい。これまた分かったような分からぬような。でも処理の方法は以前の回同様で良さそう。
デバイス作る人>>デバイス使う人>>デバイスおたく
前回オレンジの木の幹の太さでしたが、今回は果樹園用?の農薬の効果の実験みたいです。「みたい」というのはどんな実験なんだか説明読んでもよく分からない、から。農業(農学)の知識のないものが、データを見ながら想像(妄想?)して処理をばいたしました。なんだかな~ ま、効果はある、濃ゆい方があるってことでええじゃないか。
第16回でヒューロン湖の水位変動データを扱ってみましたが、今回はナイル川の水量データです。1871年から1970年までの100年間のものです。その最大水量1370×108立方m/yearとな。エジプト南端のアスワンでの値のようです。そういえば1970年、アスワン・ハイ・ダムの完成の年らしいです。
前回に続き、今回も時系列データです。北米大陸の巨大な湖、ヒューロン湖の水位のデータ。前回4半期毎の季節変動をトレンドと分離できたので、今回もその手か、と思ったのですが違いました。1年1点のデータであるので季節変動などはありません。長い目でみた長期のトレンドを探れということみたい。
前回につづき今回も因子分析(factor analysis)です。わけわからないまま手を動かしてグラフにしています。データセットは「シカゴの郊外の中一、中二くらいの生徒さん145名分の24種の心理学テストの結果」の分散共分散行列みたいです。今回は、分けわからないまま promax回転とな。
前回は線形モデル・単回帰でしたが、今回はクロス集計です。基本かつ王道のデータ処理で良い感じです。クロス集計に威力を発揮?するらしいmosaicplotを使ってみます。色を付けないと地味だけれども、色を付けるとかなりカッコよいです。ターゲットとするデータは、髪と目の色とな。