今回のデータは60年くらい前から40年くらい前のJ&J社の一株利益のデータです。60年前これ知っていたら大儲け(できる筈ないですが。)まさに儲かっていますなJ&J。が、しかし、このデータセットサンプル処理の意義は、その儲かっているトレンドから、結構大きな4半期毎の変動を分離せよ、ということみたいです。
データのお砂場(14) R言語、InsectSprays、殺虫剤の効きの分散分析とな?
毎回テキトーにグラフを描いてお茶を濁してきたので、今回は多少なりとも統計的な意味に近づきたいです。そこに「飛んで火にいる夏の虫」であったのが今回のシンプルな一元配置の分散分析、one-way ANOVAです。データセットはInsectSprays、「殺虫剤の効果はありや、無しや」と。
データのお砂場(13) R言語、Indometh、インドメタシンの薬物動態とな?
歳をとると解熱鎮痛剤のお世話になることがままあります。ロキソプロフェンなどはお馴染み。家の人も飲んでいたような。インドメタシンは私、塗り薬で使ったことがあったです。今回のデータセットは、そのインドメタシンが体内から排泄されていく過程のデータらしいです。電気信号の減衰波形とはまた違う、当たり前ですかな。
データのお砂場(12) R言語、Harman74.cor、因子分析?「続」何が何やら
前回につづき今回も因子分析(factor analysis)です。わけわからないまま手を動かしてグラフにしています。データセットは「シカゴの郊外の中一、中二くらいの生徒さん145名分の24種の心理学テストの結果」の分散共分散行列みたいです。今回は、分けわからないまま promax回転とな。
データのお砂場(11) R言語、Harman23.cor、因子分析?何が何やら
ABC順に端から「当たって」いるので、よく分からない分析手法が登場するのは当然です。今回は因子分析(factor analysis)とな。サッパリ分かりません。ターゲットのデータセットは「7歳から17歳までの305名の girlsの物理計測8種データの分散共分散行列」です。girlsは良いが、分散共分散行列とは何者。
データのお砂場(10) R言語、HairEyeColor、クロス集計、mosaicplot
前回は線形モデル・単回帰でしたが、今回はクロス集計です。基本かつ王道のデータ処理で良い感じです。クロス集計に威力を発揮?するらしいmosaicplotを使ってみます。色を付けないと地味だけれども、色を付けるとかなりカッコよいです。ターゲットとするデータは、髪と目の色とな。
データのお砂場(9) R言語、Formaldehyde、線形モデル、単回帰
サンプルデータをABC順に端から見ていこうという無謀な方針のため、「難しいのが先」、「基本的なものが後」になることは致し方ありません。今回、基本中の基本、線形モデルで単回帰というサンプルデータセットが登場しました。ようやく当たりを引いた感じ。Formaldehydeであります。しかし、Formaldehydeって一体何?
データのお砂場(8) R言語、EuStockMarkets、色付きの時系列データプロット
前回はデータフレームだったですが、今回は久しぶりに時系列データ、それもマルチプルなやつ、に戻ります。ggplotのお陰で美麗なグラフを描けるようになったので今回も適用っと思ったら、時系列データには直接作用できないみたい。要変換ってことか。それにしてもスイスってEUじゃなかったろ~、気になる。
データのお砂場(7) R言語、DNase、ELISAアッセイって何?
前回、美麗なグラフが描けるようになって喜びましたが、今回は「またしても」なんだか分からないデータに遭遇です。ELISAアッセイ?人工無能なイライザ様なら遥か昔にお付き合いしたことありますが、皆目見当もつきません。抗原とか抗体を酵素反応を利用して調べるためのものみたい。それをまたしても非線形回帰分析せよ、と。
データのお砂場(6) R言語、ChickWeight、ggplot2で見違えた
前回、チキンの肥育データ ChickWeight サンプルデータセットを開いてみました。グラフは描いたものの白黒で地味。確かR言語にはもっと「エレガント」なグラフを描ける機能があったのでは?そう思って探して思い出しました ggplot2であります。今回はこれを「インストール」してChickWeightに再挑戦。
データのお砂場(5) R言語、ChickWeight、チキンの肥育、生後日数と体重の増加
クリスマスも終わったというのに今回はチキンねたです。R言語のサンプルデータセットをABC順で開いてきて、Cの2番目が ChickWeight であったということ。チキンの生後日数とその体重のデータです。前回のCO2で使った多変量データをグラフにしてくれる coplot()関数が使えるみたい。今回もヤッツケでご乱心。
データのお砂場(4) R言語、CO2、イネ科植物における二酸化炭素の取り込み
分けも分からずR言語のサンプルデータセットに端から飛び込む、やっつけでご乱心な第4回はCO2です。CO2と言うからには二酸化炭素みたい。話題のトピックで嬉い。しかし知らないお言葉が多数登場、端から調べていても埒があかず。まあ、coplotが良いものだというのは何となくわかったので良しとするか。
データのお砂場(3) R言語、BOD、生物化学的酸素要求量、非線形回帰分析をやれと
R言語のサンプルデータセットを端から味わってみる、やっつけでご乱心な第3回はBODです。たまに水質汚染などのニュースで聞く生物化学的酸素要求量というもの。なんだか分かりませぬが、第3回にしてようやく時系列データを離れ、データフレームが登場しました。目出度い(何が?)
データのお砂場(2) R言語、BJsales よくわからないけれど「先行指標」?
年寄りの冷や水、R言語を標準インストールすればもれなくついてくるサンプルデータセットを、使い方も良く分からぬまま、それどころか統計も勉強せずに、端から触ってみるというやっつけでご乱心な第2回は BJsales と BJsales.lead であります。なんだかよく分からないデータです。先行指標ってやつ?どんだけ先行してんだろ。 “データのお砂場(2) R言語、BJsales よくわからないけれど「先行指標」?” の続きを読む