前回に引き続きbootパッケージの中のサンプルデータセットです。今回はamlとな。「急性骨髄性白血病の寛解時間」に関する約50年前の古い「予備調査」の結果のようです。予備ということもあるのか、調査結果はある時点でスッパリ打ち切られてしまってます。そういう打ち切り(censoring)を勉強するデータなのかもしれません。
データのお砂場(94) R言語、aims、スピード違反と警告(交通)標識、bootパッケージ
前回に引き続きbootパッケージ中のサンプルデータを眺めています。今回は英国の「交通標識とスピード違反」の関係データセットらしい amis です。R素人の処理の結果として出てきた意外なグラフに愕然。どこかの処理を間違えてないか、自分?それとも人間心理の深淵をば覗き込んでおるのか?本当はどうなんだろ。
データのお砂場(93) R言語、aircondit、ボーイング720のエアコン、度々壊れる?
年寄なのでボーイングというと旅客機の747(ジャンボ)をまず思い出します(流石にB29ではありませぬ。)ボーイング社の旅客機は7×7というのが定番ですが、古には720という型番?の機体もあったんだとか。今回のサンプルデータセットは、720のエアコンの故障間隔のデータです。しかし、こんなに度々壊れているものなのか?
データのお砂場(92) R言語、aids、英国におけるAIDS診断と報告1983-1992年
映画『ボヘミアン・ラプソディ』、最初主演のラミ・マレック「似てねえ」と思ったのですが、見ているうちにフレディ・マーキュリーにしか見えなくなってました。さて今回のサンプルデータセットにはマーキュリーご本人が含まれている筈です。bootパッケージのaidsデータセット。マーキュリー没年(1991年)を含む10年間のデータ。
“データのお砂場(92) R言語、aids、英国におけるAIDS診断と報告1983-1992年” の続きを読む
データのお砂場(91) R言語、acme、超過収益、bootパッケージ
R言語のサンプルデータセットという覗き穴から世界を眺めております。今回から bootパッケージに含まれるサンプルデータセットを見て回りたいと思います。その初回はacmeとな。何じゃらほい?と思ったら実在した会社のお名前でした。ACME-CLEVELAND社とな。どうも他社に買収される数年前の会社の「成績表」みたいっす。
データのお砂場(90) R言語、benchmark64.data、bit64パッケージ
前回、R言語の中にあって各種サンプルデータセットを提供してくれているdatasetsパッケージに含まれているデータセットをついに舐め終わりました(身についているのかは怪しいケド。)今回からは他のパッケージに含まれているサンプルデータセットを眺めていきたいと思います。最初はbit64パッケージとな。 “データのお砂場(90) R言語、benchmark64.data、bit64パッケージ” の続きを読む
データのお砂場(89) R言語、women、30代米国女性の身長と平均体重とな
R言語所蔵のサンプルデータセットをABC順(大文字先)で見ています。今回はwomenです。ついに「コンプリート」。とはいえdatasetsパッケージに含まれているデータセットの「舐め終わり」でしかありませぬ。実は他のパッケージにももろもろサンプルデータセットが含まれてます。R言語の練習の種は尽きまじ。 “データのお砂場(89) R言語、women、30代米国女性の身長と平均体重とな” の続きを読む
データのお砂場(88) R言語、warpbreaks、織機での「糸切れ」回数、糸と張力
R言語所蔵のサンプルデータセットをABC順(大文字先)で見ています。今回はwarpbreaksです。ワープで何を思い浮かべるかは人それぞれかと。織機を思い浮かべるのは「正統」ではあるけれども少数派ではないかと想像。宇宙船想像するのが日本人の多数派か?GPUなどプログラムしている人は計算単位のワープを思い出すかも。
“データのお砂場(88) R言語、warpbreaks、織機での「糸切れ」回数、糸と張力” の続きを読む
データのお砂場(87) R言語、volcano、ニュージーランドMaungawhau火山
R言語所蔵のサンプルデータセットをABC順(大文字先)で見ています。今回はvolcanoとな。火山といって何処の?ニュージーランドでした。噴火の履歴的なもの?でも違いました「相手」は単成火山です。「火山業界?」における一発屋的な、1回噴いたら同じ場所では噴かない奴です。アッチで噴いて、コッチで噴いて。たまや~鍵屋~
データのお砂場(86) R言語、uspop、米国の人口(国勢調査)、1790-1970
R言語所蔵のサンプルデータセットをABC順(大文字先)で見ています。今回はuspop とな。popといったってポップミュージックではありませぬ、人口のpopulation の方です。例によって古いデータセットです。1790年から1970年までの約200年間、第1回の国勢調査から10年毎の調査データらしいです。
データのお砂場(85) R言語、trees、ブラックチェリーの直径、樹高、体積とな
ABC順(大文字先)で順番に見ているので、前回は treering(年輪)、今回は trees です。サンプルデータ的には木材の体積を木の直径と樹高から割り出すための「回帰式」をつくるためのものみたいです。対象になっている樹木は「ブラックチェリー」とな。日本では「アメリカンチェリー」と言うみたい。知らんけど。 “データのお砂場(85) R言語、trees、ブラックチェリーの直径、樹高、体積とな” の続きを読む
データのお砂場(84) R言語、treering、約8000年間の年輪幅データとな
今回のデータはいままで見てきたサンプルデータの中で一番長大なデータかもしれないです。約8000年間の年輪の幅のデータです。カリフォルニアはシェラネバダ山脈の山中に生えている Bristlecone Pine という長寿命の木について調査した結果です。データは長大、でも幅だけ。これだけ見たらばどうしたら良いのという感じ。
“データのお砂場(84) R言語、treering、約8000年間の年輪幅データとな” の続きを読む
データのお砂場(83) R言語、swiss、「人口転換期」の出生率と社会経済指標とな
今回のデータは約150年まえのスイスにおけるデータです。古いけれどもこのタイミングには意味があり「人口転換期」であったのだそうな。当時の日本(明治21年)は後進国であったけれどスイスではいち早く出生率の低下がみられていたように推察されます。日本とはちょっと違う?しかしスイスでも地域格差はハッキリしていたみたい。
データのお砂場(82) R言語、sunspot.year、時系列データの小技あれこれ
R言語所蔵のサンプルデータセットをABC順(大文字)優先で拝見させていただいとります。前回、前々回と太陽黒点関係のデータセットが続いています。正直飽きました。しかし今回は太陽黒点らしい解析など絶無。だただた時系列データを「いじる」ときに必要な小ネタ、TIPSの特集という感じです。勉強になったなあ。ホントか? “データのお砂場(82) R言語、sunspot.year、時系列データの小技あれこれ” の続きを読む