データのお砂場(205) R言語、accdeaths、デジャブ?以前やった? {MASS}

Joseph Halfmoon

MASSパッケージのサンプルデータセットを巡回中。大文字優先のABC順。今回はちと不吉なお名前、accdeathsです。古い交通事故死データなのだけれども、どこかで見たような。調べてみたら、3年以上前に datasets パッケージで練習してみたデータと同じみたい。まあ、データセットのお名前は違うのだけれども。

※「データのお砂場」投稿順Indexはこちら

Accidental Deaths in the US 1973-1978

今回のサンプルデータセットは accdeaths です。解説ページが以下に。

https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/accdeaths.html

1970年代の米国における、交通事故の死亡者数の統計です。忘却力の老人の心の片隅に、なんだか見たことあるような、という気持ちが湧いてくるのです。似たようなサンプルデータベースが無かったかと、過去回を振り返ってみると、交通事故関係で以下の2件がありました。

(24) R言語、Seatbelts、英国における道路交通事故の死傷者数

(31) R言語、USAccDeaths、米国における事故死データ6年分

どちらも、datasetsパッケージ内のサンプルデータです。どうも今回のデータベースは第31回のUSAccDeathsというデータベースに一致するように思われました。MASSパッケージは大きなパッケージではあるものの、その成立経緯からか重複が多いみたい(素人老人の感想デス。)

ということで今回は「一致」を確かめるだけ。異なるお名前ですが、同じサンプルデータセットだと。

まずは生データ

生データはデータ点数72点の時系列データでした。rawDataAccdeaths

その時間的なポイントを調べてみると以下のようです。startEndAccdeaths

ここまで見るに、第31回で練習したサンプルデータとクリソツ。

一応、プロットをして全データを眺めてみると

ts.plot(accdeaths, main="Accidental Deaths in the US 1973-1978")

プロット現物が以下に。tsplotAccdeaths

やっぱり、USAccDeaths {datasets}と同じもののようです。第31回ではこのデータに関して以下のような処理を行ってます。

    1. acf (自己相関)とって季節変動の様子を観察(夏に多くなるのよ)
    2. STL解析で時系列データから、季節変動、トレンドなどを分離してプロット

まあ、同じことをやるのも疲れるので、今回はここまでということで。またまた手抜き。

データのお砂場(204) R言語、abbey、ニッケル含有量の測定 {MASS} へ戻る

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です