年寄なのでボーイングというと旅客機の747(ジャンボ)をまず思い出します(流石にB29ではありませぬ。)ボーイング社の旅客機は7×7というのが定番ですが、古には720という型番?の機体もあったんだとか。今回のサンプルデータセットは、720のエアコンの故障間隔のデータです。しかし、こんなに度々壊れているものなのか?
※「データのお砂場」投稿順Indexはこちら
ボーイング720ジェット旅客機
初飛行が1959年11月23日だそうなので、黎明期のジェット旅客機ということらしいです。707の派生型で、短距離向けらしいです。この機体についてはいつも楽しく読ませていただいております「乗りものニュース」様の以下の記事に詳しいです。
日本では激レア機!? ボーイング唯一のはぐれ者“720”の伝説 兄の“707”そっくり…違いは?
上記にはなぜ7×7でないのかも書いてあります。
bootパッケージ、aircondit、aircondit7データセット
さて第91回から突入いたしました boot パッケージ中のサンプルデータセットの中には、ボーイング720に関するデータセットが2つ含まれています。10機のBoeing 720のエアコンの故障間隔データのうち、
-
- 9番目の飛行機のデータがaircondit
- 7番目の飛行機のデータがaircondit7
だそうです。failureというのがどの程度の故障を表しているのか定かではないのですが、
the times between failures
のデータだそうです。単位は hours とな。後で実際の数値を見るとこんなに度々故障していてよく運航に支障が出なかったな(出ていたのかも?)と思うような数字が並んでます。多分ね、現代の航空機ではこんな頻度でエアコン壊れたりしないのでは? それともとても細かい不具合なども数えているから高頻度なの?数字を見ただけではまったく予想がつきませぬ。
まずは生データ
形式的には等価なデータセットが2つあるので、両者を並べてロードしてみます。形式はdataframeですが、内容な「時間」の数値ベクトルを一つ含んでいるだけのものです。値そのものは時間間隔ですが、値の短時間から長時間にむけてソート済のようです。時系列的な故障間隔はみえないようです。
上記の黄色のマーカ部分を、該当機のエアコンのMTBF(平均故障間隔、Mean Time Between Failure)と解釈していいのかどうか?この数字だけをみるとスゲー短い気がするのですが、気のせい?
箱ひげ図を描いてみる
残念なことに boot パッケージのドキュメントには、処理例のような記載はなく、このデータをどう扱ってよいものやらアイディアもありません。苦し紛れに箱ヒゲ図を描いてお茶を濁すことにいたしました。2機の飛行機「9番目のヤツ」と「7番目のヤツ」のデータをプロットするので、まずデータを一本化してみました。こんな感じ。
aircraftID<-rep(c("9th"), times=nrow(aircondit)) nineth<-cbind(aircondit, aircraftID) aircraftID<-rep(c("7th"), times=nrow(aircondit7)) seventh<-cbind(aircondit7, aircraftID) aircraft<-rbind(nineth, seventh)
上記で、aircraftという名の1つのデータフレームに全データが含まれてます。これを使ったプロットが以下に。gglot2を使用してます。
libhrary(ggplot2) p<-ggplot(aircraft, aes(x=aircraftID, y=hours))+geom_boxplot() p2<- p + labs(title="Failures of Air-conditioning Equipment") p2
得られたプロットが以下に。
720は短距離向けの飛行機らしいケド、こんな頻度だと飛んでいる最中にも「エアコン壊れた」に遭遇しそうな雰囲気。飛んでいる最中に壊れたらどうなるのだろ?