
今回はデータを眺めて愕然といたしました。「日本も世界も変わってしまった」のだと。今回のデータセットは1960年代の世界50か国の貯蓄率のデータです。貯蓄率を人口分布や可処分所得から説明する、という仮説を検証するためのものなのです。しかしこの年寄りが驚いたのはその人口の割合です。若いです、日本も世界も。
デバイス作る人>>デバイス使う人>>デバイスおたく
前回に続き、今回も時系列データです。北米大陸の巨大な湖、ヒューロン湖の水位のデータ。前回4半期毎の季節変動をトレンドと分離できたので、今回もその手か、と思ったのですが違いました。1年1点のデータであるので季節変動などはありません。長い目でみた長期のトレンドを探れということみたい。
前回につづき今回も因子分析(factor analysis)です。わけわからないまま手を動かしてグラフにしています。データセットは「シカゴの郊外の中一、中二くらいの生徒さん145名分の24種の心理学テストの結果」の分散共分散行列みたいです。今回は、分けわからないまま promax回転とな。
前回は線形モデル・単回帰でしたが、今回はクロス集計です。基本かつ王道のデータ処理で良い感じです。クロス集計に威力を発揮?するらしいmosaicplotを使ってみます。色を付けないと地味だけれども、色を付けるとかなりカッコよいです。ターゲットとするデータは、髪と目の色とな。
前回はデータフレームだったですが、今回は久しぶりに時系列データ、それもマルチプルなやつ、に戻ります。ggplotのお陰で美麗なグラフを描けるようになったので今回も適用っと思ったら、時系列データには直接作用できないみたい。要変換ってことか。それにしてもスイスってEUじゃなかったろ~、気になる。
前回、美麗なグラフが描けるようになって喜びましたが、今回は「またしても」なんだか分からないデータに遭遇です。ELISAアッセイ?人工無能なイライザ様なら遥か昔にお付き合いしたことありますが、皆目見当もつきません。抗原とか抗体を酵素反応を利用して調べるためのものみたい。それをまたしても非線形回帰分析せよ、と。
前回、チキンの肥育データ ChickWeight サンプルデータセットを開いてみました。グラフは描いたものの白黒で地味。確かR言語にはもっと「エレガント」なグラフを描ける機能があったのでは?そう思って探して思い出しました ggplot2であります。今回はこれを「インストール」してChickWeightに再挑戦。
クリスマスも終わったというのに今回はチキンねたです。R言語のサンプルデータセットをABC順で開いてきて、Cの2番目が ChickWeight であったということ。チキンの生後日数とその体重のデータです。前回のCO2で使った多変量データをグラフにしてくれる coplot()関数が使えるみたい。今回もヤッツケでご乱心。