
MASSパッケージのサンプルデータセットを巡回中。大文字優先のABC順。今回はちと不吉なお名前、accdeathsです。古い交通事故死データなのだけれども、どこかで見たような。調べてみたら、3年以上前に datasets パッケージで練習してみたデータと同じみたい。まあ、データセットのお名前は違うのだけれども。
※「データのお砂場」投稿順Indexはこちら
Accidental Deaths in the US 1973-1978
今回のサンプルデータセットは accdeaths です。解説ページが以下に。
https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/accdeaths.html
1970年代の米国における、交通事故の死亡者数の統計です。忘却力の老人の心の片隅に、なんだか見たことあるような、という気持ちが湧いてくるのです。似たようなサンプルデータベースが無かったかと、過去回を振り返ってみると、交通事故関係で以下の2件がありました。
(24) R言語、Seatbelts、英国における道路交通事故の死傷者数
(31) R言語、USAccDeaths、米国における事故死データ6年分
どちらも、datasetsパッケージ内のサンプルデータです。どうも今回のデータベースは第31回のUSAccDeathsというデータベースに一致するように思われました。MASSパッケージは大きなパッケージではあるものの、その成立経緯からか重複が多いみたい(素人老人の感想デス。)
ということで今回は「一致」を確かめるだけ。異なるお名前ですが、同じサンプルデータセットだと。
まずは生データ
ここまで見るに、第31回で練習したサンプルデータとクリソツ。
一応、プロットをして全データを眺めてみると
ts.plot(accdeaths, main="Accidental Deaths in the US 1973-1978")
やっぱり、USAccDeaths {datasets}と同じもののようです。第31回ではこのデータに関して以下のような処理を行ってます。
-
- acf (自己相関)とって季節変動の様子を観察(夏に多くなるのよ)
- STL解析で時系列データから、季節変動、トレンドなどを分離してプロット
まあ、同じことをやるのも疲れるので、今回はここまでということで。またまた手抜き。