
MASSパッケージのサンプルデータセットを巡回中。大文字優先のABC順。今回はビーバーです、北米の川にダム作って堰き止めて巣をつくる動物さんの体温と行動履歴のデータです。ぐぬぬ、遥か昔に一度やった記憶アリ。それにサンプルデータに「1」と「2」があるんだが、関係どうなっているの?まずはその辺の整理から。
※「データのお砂場」投稿順Indexはこちら
datasetsパッケージのbeaversとMASSパッケージのbeav1、beav2
以下の過去回で「ビーバーの体温」のサンプルデータセットを練習してます。
データのお砂場(46) R言語、beavers、ビーバー2匹の体温の測定とな
上記で扱ったのは、datasetsパッケージ内のbeavers という名を冠した1個のデータセットであったのです。その中に
-
- beaver1
- beaver2
という御名前で、各1頭、ほぼ1日分のデータが含まれてました。日付も違えば、個体も違うデータです。
一方、今回のMASSパッケージ内には以下のお名前の2つの独立なデータセットが含まれてます。
-
- beav1
- beav2
結論から言うと
-
- MASSのbeav1はdatasetsのbeaver1と同一データ
- MASSのbeav2はdatasetsのbeaver2と同一データ
です。なんだ同じデータか、やらんでいいじゃん?と思ったのですが、そのまま通りすぎるわけにもいかんなと思いました。それは、
datasetsパッケージ内のbeaversは、実質2つのデータについて1種類の処理例(時系列プロットするもの)だけが示されている。過去回ではそれを実施してグラフが描けたところでお開きにしていた。なお、処理例の記載のある解説ページURLを以下にならべます
https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/beavers.html
https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/beav1.html
https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/beav2.html
上記のMASSパッケージ内のbeav1とbeav2に対する解説ページには、それぞれ異なる処理例が例示されてます。 beav1についてみると、時系列プロット(過去回と似ているが表現方法異なる)に加えて、自己相関などとって解析してます。beav2はまた別処理。
ということで「データは同じだけれど、処理例を少しなぞる」必要を認めましたです。
処理例はbeav1とbeav2で異なるうえにそこそこいろいろやってるので今回は beav1 の方のみです。それもチョロイ前半だけ?
先ずは生データ
上記データを過去回と見比べてもまったく差はみられませぬ(目視だけれども。)
お次は時系列プロット
元のデータが同じなので時系列プロット自体は「同じような」プロットです。ただし以下異なります。
-
- 過去回、アクティブにビーバーさんが動いているところに「赤丸」
- 今回、ビーバーさんのアクティブさを点線グラフで表示
まあ、「お外」へ出ているところは体温あがってますなあ。
自己相関関数(ACF)と偏自己相関関数
さて、ここからは過去回の処理ではなかった部分です。まずは体温(temp)について、自己相関関数(Autocorrelation Function: ACF)、コレログラムというみたい、を求めてます。
Lagの1単位は10分みたいなので、100分くらい経つと「反転」するような気配が見える感じがします、ビミョーだけれども。
一方、同じデータに対して偏自己相関関数(Partial Autocorrelation Function: PACF)も求めてます。
こちらはぜんぜんダメね。
素人老人にはサッパリだけれども、200分とかそんな周期性などはなく、直近「活動的」だと活動、「静か」だと静かという程度の関係性なんじゃないかと思います。ビーバーさんもお疲れ?寒いから表に出たくなかった?
この後、処理例では、ARモデル (AutoRegressive Model: 自己回帰モデル)を駆使して、解析を続けていくのですが、素人老人にはこの辺で脱落させていただきます。次の beav2 ではも少し頑張れよ、自分。