前回は一酸化炭素肺拡散能でしたが、今回は炭鉱事故です。R言語のパッケージbootに含まれているサンプルデータセットを abc 順にみているので coの次はcoalという順番です。carbon繋がりデス。この老人が子供の頃に国内の炭鉱事故のニュースを何度か聞いた記憶がありますが最近は聞きませぬ。国内の炭鉱ってまだあるの?
※「データのお砂場」投稿順Indexはこちら
Dates of Coal Mining Disasters
今回のサンプルデータセットのお名前は coal です。内容は19世紀半ばの1851年3月15日から20世紀半ばの1962年3月22日までの炭鉱事故の日付データです。サンプルデータセットの解説ページへのリンクが以下に。
Dates of Coal Mining Disasters
どこの国のデータとも書かれていないのですが、データの出元からして英国の炭鉱でのデータではないかと思われます。ただただ日付に対応づけられる数値が並んでいるだけのもの。ただし、ここにリストされている日付は恐ろしいものです。10人以上の死者を出した坑内爆発事故の日付らしいです。それがズラズラと。。。
炭鉱事故については知識がないのでちと調べてみました。「本場」筑豊の『田川市立図書館/筑豊・田川デジタルアーカイブ』様の
を拝見いたしました。上記ページより2か所引用させていただきます。
“明治32(1899)年から昭和59(1984)年までの86年間で、日本の炭鉱事故の死者が48,067人”
“最大出炭量(56,313,334t)を記録した昭和15(1940)年を例にすると、この年の炭鉱災害は85,662回,死亡者数1,357人に及びます。1,000,000tの石炭を掘り出すのに24人の死者が出ていたことになります。”
かつての石炭産業、とんでもなくブラックだったのだなあ。朧気な記憶があるけど。事故を分類すると
-
- 落盤事故
- 出水事故
- ガス爆発
- 炭車事故
という感じになるみたいです。3番目のガス爆発は、炭鉱内に出てくるメタンガスが溜まったところに火がついておきるものかな。4番目の炭車事故は、石炭の積み出し用の貨車の暴走?ってことでしょうか。
日本国内の炭鉱の場合1980年代にはほぼ閉山の流れとなったみたいですが、現在も操業を続けている『国内唯一の坑内堀り炭鉱』がありました。
ホームページに行くと、近代的な設備で機械化されとるようです。巨大なドラムカッタで削り取り、自走枠というもので運び出すみたい。安全第一。
まずは生データ
データフレームとはいうものの、詰まっているのは1列だけ。日付を示す数値データが一つだけです。普通の日付データではなくて、年を整数、その年の中の日付(の位置)を小数点以下であらわしたものみたいです。この数字の裏側には数々の英霊の方々が。。。恐ろしや。
プロットしてみる
ただ数字を眺めていてもなんだか分からぬのでプロットしてみました。最初は年代毎の事故の頻度を遠くから眺めるためのもの。操作が以下に。
coal.w <- coal coal.w$N <- rep(c(1), times=nrow(coal)) coal.w$Year <- trunc(coal$date) colnames(coal.w) <- c("Date", "N", "Year") plot(coal.w$Date, coal.w$N, type="h", ylim=c(0,1.0), xlab="Date", ylab="", main="Dates of Coal Mining Disasters")
上記をみると分かるのが、19世紀の間、高い頻度であったものが、20世紀になると頻度が落ちること。その20世紀でも第2次世界大戦前と後では頻度が違いそう。20世紀の中で頻度が高まっているのは戦争の影響?
年毎に集計するためのデータ形式ではないけれど「年」集計した結果が以下に。まず操作。
coal.sum <- aggregate(coal.w$N, by=list(coal.w$Year), sum) plot(coal.sum, type="l", xlab="Year", ylab="number of cases", main="Coal Mining Disasters", lwd=3, col=2)
明らかに時代を経るにつれ、低下している感じ。
データのフォーマットからは、事故と事故の間隔を求めよ、ということにも思えたので、計算してみたものが以下に。
coal.btf <- diff(coal$date) plot(coal.btf, ylab="time(year) between disasters", main="Coal Mining Disasters") abline(h=mean(coal.btf), col='red', lty=2)
上記、赤の点線は「全体平均の事故間隔」です。上にプロットされるほど間隔が長くてご安全。下にいるのは危ない危ない。結構、続けざまに起きてるってことかい。
どうもこの英国データよりも100年だか50年だか遅れて日本があった感じ。今では海外の炭鉱が危なそう。結局繰り返すことになるのか。