データのお砂場(19) R言語、Nile、ナイル川の水量百年とな?

Nile_MovingAVG
Joseph Halfmoon

第16回でヒューロン湖の水位変動データを扱ってみましたが、今回はナイル川の水量データです。1871年から1970年までの100年間のものです。その最大水量1370×108立方m/yearとな。エジプト南端のアスワンでの値のようです。そういえば1970年、アスワン・ハイ・ダムの完成の年らしいです。

“データのお砂場(19) R言語、Nile、ナイル川の水量百年とな?” の続きを読む

データのお砂場(18) R言語、Lobololly、テーダマツの成長「曲線」とな?

ggplot004_EC
Joseph Halfmoon

今回登場は米国テキサスからフロリダあたりの湿地帯?のようなところに生えている松の一種みたいです。Lobololly pine tree、またの名をテーダマツとな。R言語の「内蔵」サンプル・データセットをABC順に全部「舐めて」みようなどと思いつかなければ多分お目にかかることは無かった植物であります。

“データのお砂場(18) R言語、Lobololly、テーダマツの成長「曲線」とな?” の続きを読む

データのお砂場(17) R言語、LifeCycleSavings、各国の貯蓄データとな?

srPOP15
Joseph Halfmoon

今回はデータを眺めて愕然といたしました。「日本も世界も変わってしまった」のだと。今回のデータセットは1960年代の世界50か国の貯蓄率のデータです。貯蓄率を人口分布や可処分所得から説明する、という仮説を検証するためのものなのです。しかしこの年寄りが驚いたのはその人口の割合です。若いです、日本も世界も。

“データのお砂場(17) R言語、LifeCycleSavings、各国の貯蓄データとな?” の続きを読む

データのお砂場(16) R言語、LakeHuron、ヒューロン湖の水位とな?

LakeHuronMovingAVGPlot
Joseph Halfmoon

前回に続き、今回も時系列データです。北米大陸の巨大な湖、ヒューロン湖の水位のデータ。前回4半期毎の季節変動をトレンドと分離できたので、今回もその手か、と思ったのですが違いました。1年1点のデータであるので季節変動などはありません。長い目でみた長期のトレンドを探れということみたい。

“データのお砂場(16) R言語、LakeHuron、ヒューロン湖の水位とな?” の続きを読む

データのお砂場(15) R言語、JohnsonJohnson、四半期毎一株あたり利益

RawDataGraph
Joseph Halfmoon

今回のデータは60年くらい前から40年くらい前のJ&J社の一株利益のデータです。60年前これ知っていたら大儲け(できる筈ないですが。)まさに儲かっていますなJ&J。が、しかし、このデータセットサンプル処理の意義は、その儲かっているトレンドから、結構大きな4半期毎の変動を分離せよ、ということみたいです。

“データのお砂場(15) R言語、JohnsonJohnson、四半期毎一株あたり利益” の続きを読む

データのお砂場(14) R言語、InsectSprays、殺虫剤の効きの分散分析とな?

InsectSpraysBoxPlot
Joseph Halfmoon

毎回テキトーにグラフを描いてお茶を濁してきたので、今回は多少なりとも統計的な意味に近づきたいです。そこに「飛んで火にいる夏の虫」であったのが今回のシンプルな一元配置の分散分析、one-way ANOVAです。データセットはInsectSprays、「殺虫剤の効果はありや、無しや」と。

“データのお砂場(14) R言語、InsectSprays、殺虫剤の効きの分散分析とな?” の続きを読む

データのお砂場(13) R言語、Indometh、インドメタシンの薬物動態とな?

IndomethPlot001
Joseph Halfmoon

歳をとると解熱鎮痛剤のお世話になることがままあります。ロキソプロフェンなどはお馴染み。家の人も飲んでいたような。インドメタシンは私、塗り薬で使ったことがあったです。今回のデータセットは、そのインドメタシンが体内から排泄されていく過程のデータらしいです。電気信号の減衰波形とはまた違う、当たり前ですかな。

“データのお砂場(13) R言語、Indometh、インドメタシンの薬物動態とな?” の続きを読む

データのお砂場(12) R言語、Harman74.cor、因子分析?「続」何が何やら

Harman74_factor5_PROMAX_BAR_EC
Joseph Halfmoon

前回につづき今回も因子分析(factor analysis)です。わけわからないまま手を動かしてグラフにしています。データセットは「シカゴの郊外の中一、中二くらいの生徒さん145名分の24種の心理学テストの結果」の分散共分散行列みたいです。今回は、分けわからないまま promax回転とな。

“データのお砂場(12) R言語、Harman74.cor、因子分析?「続」何が何やら” の続きを読む

データのお砂場(11) R言語、Harman23.cor、因子分析?何が何やら

factor analysis barplot
Joseph Halfmoon

ABC順に端から「当たって」いるので、よく分からない分析手法が登場するのは当然です。今回は因子分析(factor analysis)とな。サッパリ分かりません。ターゲットのデータセットは「7歳から17歳までの305名の girlsの物理計測8種データの分散共分散行列」です。girlsは良いが、分散共分散行列とは何者。

“データのお砂場(11) R言語、Harman23.cor、因子分析?何が何やら” の続きを読む

データのお砂場(10) R言語、HairEyeColor、クロス集計、mosaicplot

mosaicPlot001
Joseph Halfmoon

前回は線形モデル・単回帰でしたが、今回はクロス集計です。基本かつ王道のデータ処理で良い感じです。クロス集計に威力を発揮?するらしいmosaicplotを使ってみます。色を付けないと地味だけれども、色を付けるとかなりカッコよいです。ターゲットとするデータは、髪と目の色とな。

“データのお砂場(10) R言語、HairEyeColor、クロス集計、mosaicplot” の続きを読む

データのお砂場(9) R言語、Formaldehyde、線形モデル、単回帰

Joseph Halfmoon

サンプルデータをABC順に端から見ていこうという無謀な方針のため、「難しいのが先」、「基本的なものが後」になることは致し方ありません。今回、基本中の基本、線形モデルで単回帰というサンプルデータセットが登場しました。ようやく当たりを引いた感じ。Formaldehydeであります。しかし、Formaldehydeって一体何?

“データのお砂場(9) R言語、Formaldehyde、線形モデル、単回帰” の続きを読む

データのお砂場(8) R言語、EuStockMarkets、色付きの時系列データプロット

EuStockCompPlot
Joseph Halfmoon

前回はデータフレームだったですが、今回は久しぶりに時系列データ、それもマルチプルなやつ、に戻ります。ggplotのお陰で美麗なグラフを描けるようになったので今回も適用っと思ったら、時系列データには直接作用できないみたい。要変換ってことか。それにしてもスイスってEUじゃなかったろ~、気になる。

“データのお砂場(8) R言語、EuStockMarkets、色付きの時系列データプロット” の続きを読む

データのお砂場(7) R言語、DNase、ELISAアッセイって何?

DNase ggplot
Joseph Halfmoon

前回、美麗なグラフが描けるようになって喜びましたが、今回は「またしても」なんだか分からないデータに遭遇です。ELISAアッセイ?人工無能なイライザ様なら遥か昔にお付き合いしたことありますが、皆目見当もつきません。抗原とか抗体を酵素反応を利用して調べるためのものみたい。それをまたしても非線形回帰分析せよ、と。

“データのお砂場(7) R言語、DNase、ELISAアッセイって何?” の続きを読む

データのお砂場(6) R言語、ChickWeight、ggplot2で見違えた

CWggplotEC
Joseph Halfmoon

前回、チキンの肥育データ ChickWeight サンプルデータセットを開いてみました。グラフは描いたものの白黒で地味。確かR言語にはもっと「エレガント」なグラフを描ける機能があったのでは?そう思って探して思い出しました ggplot2であります。今回はこれを「インストール」してChickWeightに再挑戦。

“データのお砂場(6) R言語、ChickWeight、ggplot2で見違えた” の続きを読む