
MASSパッケージのサンプルデータセットを巡回中。大文字優先のABC順。前回は溶岩の組成でした。今回は交通事故と制限速度の有無の関係です。1960年代のスウェーデンにおけるデータです。どうもこの時代のスウェーデンは、自動車交通における先駆的な調査や「社会実験」的な挑戦を推し進めていたみたい。流石だなスウェーデン。
※「データのお砂場」投稿順Indexはこちら
Effect of Swedish Speed Limits on Accidents
今回のサンプルデータセットは Traffic です。解説ページが以下に。
https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/Traffic.html
上記を参照させていただくに、1961年と1962年のスウェーデンで行われた「社会実験」というべきものの結果のようです。motorwayというからには自動車専用道路(高速道路)なのでしょう。そこに速度制限を設けた場合と設けなかった場合の交通事故数を数えたデータセットのようです。なかなか今時はできない「実験」じゃないでしょか。
各年、実験期間は92日間だったそうです。そして日の番号が振られてますが、 comparableな日に同じ番号が振られるようになっているみたい。ここでのcomparableってどういうこと?分からんです。
まずは生データ
生データはフツーのデータフレームです。ロードして、サマリをとったところが以下のようです。
合計184日の実験期間のうち、上の緑枠をみると速度制限なし(no)が115日、速度制限あり(yes)が69日間だったみたいです。
まずは層別
1961年と1962年、速度制限の有無で層別して事故数の平均値を求めてみることにいたします。
aggregate(y~limit+year, Traffic, mean)
上記の集計を眺めてみれば、制限があった方が事故は少なめ、そして1961年よりも1962年の方が少なくなってます。
グラフを描いてみる
各実験日に振られた1から92の day of yearという値がよくわからなかったので、まずはこれをx軸にして散布図を描いてみましたぞ。
library(ggplot2) p0 <- ggplot(Traffic, aes(x=day, y=y)) + geom_point(aes(color=limit)) p1 <- p0 + ggtitle("Effect of Swedish Speed Limits on Accidents") + ylab("traffic accident count") + xlab("day of year") p1
こうしてプロットしてみても、イマイチ day of year の意味は分からんよなあ。でも、縦方向になにか揃っているような気がしないでもない。「似た条件の日」ってことなのかな、「別な年」なんだけれども。
しかし、制限速度があった方が無いよりも、「下側な感じ」がいたします。ほぼ確実に(統計的な検証じゃないけど。)
同じデータをヒストグラムにしてみました。処理はこんな感じ。
p10 <- ggplot(Traffic, aes(x = y, fill = limit)) p11 <- p10 + geom_histogram(position = "identity", alpha = 0.5) p12 <- p11 + ggtitle("Effect of Swedish Speed Limits on Accidents") + ylab("count") + xlab("traffic accident count") p12
やっぱり制限速度がある方が良い感じ。
Dagen H
今回のサンプル・データ・セットと直接の関係はないですが、1960年代のスウェーデンにおける交通ルールの変更ということでは、「Dagen H」を抜きにはできますまい。Googleの生成AI、Gemini 2.5 Flash様のご説明が以下に。
ううむ、一日にして左側通行を捨て、右側に変えたのか?過激。まあ、日本でも沖縄返還のときに同じことをやった遠い記憶(現地にいたわけではないケド)があるのだが、あのときはどうだったんだろう?かなりいろいろ準備したと聞いているのだが。また、もし、現代日本で同じことをやったら、膨大な事故が起きて収拾つかなくなりそうなんだが。
交通ルールはともかく、自動車そのものの右ハンドル、左ハンドルは変えられないから、それも大変そうだなあ。