前回オレンジの木の幹の太さでしたが、今回は果樹園用?の農薬の効果の実験みたいです。「みたい」というのはどんな実験なんだか説明読んでもよく分からない、から。農業(農学)の知識のないものが、データを見ながら想像(妄想?)して処理をばいたしました。なんだかな~ ま、効果はある、濃ゆい方があるってことでええじゃないか。
データのお砂場(20) R言語、Orange、オレンジの木の幹の太さの成長曲線とな?
桃栗三年柿八年などと申しますが、このデータを見るとオレンジの木は4~5年くらいでそこそこの太さまで生育するように見えます。しかし、「木の幹の太さを測る」、データの解析以前にいろいろあるようです。米国と日本で測る高さが違う?それどころか日本国内でも北海道と本州以南では違う?いろいろあるのね。
データのお砂場(19) R言語、Nile、ナイル川の水量百年とな?
第16回でヒューロン湖の水位変動データを扱ってみましたが、今回はナイル川の水量データです。1871年から1970年までの100年間のものです。その最大水量1370×108立方m/yearとな。エジプト南端のアスワンでの値のようです。そういえば1970年、アスワン・ハイ・ダムの完成の年らしいです。
データのお砂場(18) R言語、Lobololly、テーダマツの成長「曲線」とな?
今回登場は米国テキサスからフロリダあたりの湿地帯?のようなところに生えている松の一種みたいです。Lobololly pine tree、またの名をテーダマツとな。R言語の「内蔵」サンプル・データセットをABC順に全部「舐めて」みようなどと思いつかなければ多分お目にかかることは無かった植物であります。
データのお砂場(17) R言語、LifeCycleSavings、各国の貯蓄データとな?
今回はデータを眺めて愕然といたしました。「日本も世界も変わってしまった」のだと。今回のデータセットは1960年代の世界50か国の貯蓄率のデータです。貯蓄率を人口分布や可処分所得から説明する、という仮説を検証するためのものなのです。しかしこの年寄りが驚いたのはその人口の割合です。若いです、日本も世界も。
データのお砂場(16) R言語、LakeHuron、ヒューロン湖の水位とな?
前回に続き、今回も時系列データです。北米大陸の巨大な湖、ヒューロン湖の水位のデータ。前回4半期毎の季節変動をトレンドと分離できたので、今回もその手か、と思ったのですが違いました。1年1点のデータであるので季節変動などはありません。長い目でみた長期のトレンドを探れということみたい。
データのお砂場(15) R言語、JohnsonJohnson、四半期毎一株あたり利益
今回のデータは60年くらい前から40年くらい前のJ&J社の一株利益のデータです。60年前これ知っていたら大儲け(できる筈ないですが。)まさに儲かっていますなJ&J。が、しかし、このデータセットサンプル処理の意義は、その儲かっているトレンドから、結構大きな4半期毎の変動を分離せよ、ということみたいです。
データのお砂場(14) R言語、InsectSprays、殺虫剤の効きの分散分析とな?
毎回テキトーにグラフを描いてお茶を濁してきたので、今回は多少なりとも統計的な意味に近づきたいです。そこに「飛んで火にいる夏の虫」であったのが今回のシンプルな一元配置の分散分析、one-way ANOVAです。データセットはInsectSprays、「殺虫剤の効果はありや、無しや」と。
データのお砂場(13) R言語、Indometh、インドメタシンの薬物動態とな?
歳をとると解熱鎮痛剤のお世話になることがままあります。ロキソプロフェンなどはお馴染み。家の人も飲んでいたような。インドメタシンは私、塗り薬で使ったことがあったです。今回のデータセットは、そのインドメタシンが体内から排泄されていく過程のデータらしいです。電気信号の減衰波形とはまた違う、当たり前ですかな。
データのお砂場(12) R言語、Harman74.cor、因子分析?「続」何が何やら
前回につづき今回も因子分析(factor analysis)です。わけわからないまま手を動かしてグラフにしています。データセットは「シカゴの郊外の中一、中二くらいの生徒さん145名分の24種の心理学テストの結果」の分散共分散行列みたいです。今回は、分けわからないまま promax回転とな。
データのお砂場(11) R言語、Harman23.cor、因子分析?何が何やら
ABC順に端から「当たって」いるので、よく分からない分析手法が登場するのは当然です。今回は因子分析(factor analysis)とな。サッパリ分かりません。ターゲットのデータセットは「7歳から17歳までの305名の girlsの物理計測8種データの分散共分散行列」です。girlsは良いが、分散共分散行列とは何者。
データのお砂場(10) R言語、HairEyeColor、クロス集計、mosaicplot
前回は線形モデル・単回帰でしたが、今回はクロス集計です。基本かつ王道のデータ処理で良い感じです。クロス集計に威力を発揮?するらしいmosaicplotを使ってみます。色を付けないと地味だけれども、色を付けるとかなりカッコよいです。ターゲットとするデータは、髪と目の色とな。
データのお砂場(9) R言語、Formaldehyde、線形モデル、単回帰
サンプルデータをABC順に端から見ていこうという無謀な方針のため、「難しいのが先」、「基本的なものが後」になることは致し方ありません。今回、基本中の基本、線形モデルで単回帰というサンプルデータセットが登場しました。ようやく当たりを引いた感じ。Formaldehydeであります。しかし、Formaldehydeって一体何?
データのお砂場(8) R言語、EuStockMarkets、色付きの時系列データプロット
前回はデータフレームだったですが、今回は久しぶりに時系列データ、それもマルチプルなやつ、に戻ります。ggplotのお陰で美麗なグラフを描けるようになったので今回も適用っと思ったら、時系列データには直接作用できないみたい。要変換ってことか。それにしてもスイスってEUじゃなかったろ~、気になる。