データのお砂場(47) R言語、cars、自動車の制動距離?いや停止距離とな

plotLog
Joseph Halfmoon

R言語所蔵のサンプルデータセットを、ABC順(大文字先)で端から眺めております。今回はcars、自動車の停止距離の測定データです。ただし約100年前、1920年代に測定されたデータみたいです。最近の自動車は性能上がっているからな~などと思いつつ、物理現象でした。100年前も今も実は計算式は変わっていないっと。 “データのお砂場(47) R言語、cars、自動車の制動距離?いや停止距離とな” の続きを読む

データのお砂場(46) R言語、beavers、ビーバー2匹の体温の測定とな

BeaverPlot
Joseph Halfmoon

R言語所蔵のサンプルデータセットを、ABC順(大文字先)で端から眺めております。前回はオーストラリアの人口でしたが、今回はビーバー2匹の体温測定です。「サンプル」なので致し方ないですが、雑多なものの寄せ集め感ハンパないです。まあRでの処理のやり方を学ぶためのデータと割り切れば良いんでしょうが。 “データのお砂場(46) R言語、beavers、ビーバー2匹の体温の測定とな” の続きを読む

データのお砂場(45) R言語、austres、オーストラリアの人口、4半期毎

tsPlot
Joseph Halfmoon

前回は意味が良く分からないデータでしたが、今回は単純明快「オーストラリアの人口」です(Residentsという表現なので国籍的なものとはまた別かと。)データは1971年から1994年まで、既に四半世紀経過してますが、とても古いデータが多いRのサンプルデータセットの中では比較的新しい感じです。 “データのお砂場(45) R言語、austres、オーストラリアの人口、4半期毎” の続きを読む

データのお砂場(44) R言語、attitude、%で測れる「態度」ってなんなのよ?

lm2Plot
Joseph Halfmoon

今回のデータは米国の(半世紀くらい前の)金融機関らしい組織の事務職員のアンケート調査みたいなものの集計らしいです。R言語の処理としては線形回帰の練習データです。淡々と処理はできるんじゃないかと思いますが、人事情報的な「意見」の集約なので「その意味」がとても気になります。データとしてはすべて%で表される数値なのですが。
“データのお砂場(44) R言語、attitude、%で測れる「態度」ってなんなのよ?” の続きを読む

データのお砂場(43) R言語、attenu、カリフォルニアの23個の地震のピーク加速度とな

Joseph Halfmoon

前回は演習用の人工データでしたが、今回は自然現象の観測データです。米国カリフォルニア州内で発生した23個の地震のピーク加速度データです。古いデータのようですが比較的デカイ地震ばかり。震源までの距離とピーク加速度の間に関係性を見出すための練習データに見えます。しかし多くの日本人は知っています。地震は一筋縄ではいかねーと。

“データのお砂場(43) R言語、attenu、カリフォルニアの23個の地震のピーク加速度とな” の続きを読む

データのお砂場(42) R言語、anscombe、平均、分散、線形な回帰直線、同じだけど違う

ascombeSamplePlot
Joseph Halfmoon

前回は寄せ集め感たっぷりながら、生々しい実データでした。今回は「アーティフィシャルなフレーバー漂う」多分、確実に、このデータセットを可視化してみる人物(私を含む)に「インプレッション」を与えるため意図された人為的なデータです。なんだそれ。勿体ぶらずに上の画像見れば一目瞭然。

“データのお砂場(42) R言語、anscombe、平均、分散、線形な回帰直線、同じだけど違う” の続きを読む

データのお砂場(41) R言語、airquality、ニューヨークの空気の品質?とな

Wind
Joseph Halfmoon

R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めております。今回のデータも古いです。1973年の5月から9月にかけてのニューヨークでの「空気の品質」データです。空気の品質といってオゾン濃度を調べてるんです。最初は意味不明でした。NOx濃度とかでないの?でも調べてみたら根拠がありーの。知らんけど。 “データのお砂場(41) R言語、airquality、ニューヨークの空気の品質?とな” の続きを読む

データのお砂場(40) R言語、airmiles、米国の航空会社の旅客マイルとな、昔の

plotMA5
Joseph Halfmoon

R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めております。今回のデータセットairmiles、デジャヴか、いよいよ妄想でたか、と思ったら以前に似たものやってました。以前のは「人数」で「月次データ」、今回のものは「RPM」値で「年次データ」であります。いずれも60年以上前の航空業界のデータです。

“データのお砂場(40) R言語、airmiles、米国の航空会社の旅客マイルとな、昔の” の続きを読む

データのお砂場(39) R言語、ability.cov、能力/知能テストの共分散行列とな

BarPlot
Joseph Halfmoon

R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めておりますが、ついに大文字完了、小文字先頭のaに戻りましたです。なんか元の木阿弥感が強いデス。まだ先は長い。さて今回は能力/知能テストの集計結果の処理なんであります。そういえば遥かな昔に似たようなことをやったような。既に忘却の彼方。

“データのお砂場(39) R言語、ability.cov、能力/知能テストの共分散行列とな” の続きを読む

データのお砂場(38) R言語、WorldPhones、世界の電話台数、70~60年前

ExampleGraph
Joseph Halfmoon

R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めております。正直、古色蒼然たるデータが多いです。データを眺め、そして「その頃」がどんな世界だったのかに思いをはせるってもんでしょうか。グラフを眺めているうちに今日に繋がる事象も見える?今回のデータセットは電話の台数です。70年から60年以上前の。

“データのお砂場(38) R言語、WorldPhones、世界の電話台数、70~60年前” の続きを読む

データのお砂場(37) R言語、WWWusage、毎分のインターネット接続ユーザ数とな

diffPlot
Joseph Halfmoon

前回は1940年と古いデータでした。今回のデータはWWWねたなので、それほど古いことはないでしょう。でも振り返ると最初にWWW(ワールドワイドウエッブ)にアクセスしたのはNCSA Mosaicというブラウザででした、まだWindows 3.x の時代だったかと。それからすると30年くらいたってますな。今は昔、違うか。

“データのお砂場(37) R言語、WWWusage、毎分のインターネット接続ユーザ数とな” の続きを読む

データのお砂場(36) R言語、VADeaths、戦前1940年の米バージニア州の死亡率とな

coplot000
Joseph Halfmoon

R言語に所蔵されとりますサンプルデータをABC順(大文字先)で端から眺めております。処理方法をお勉強するためのデータなので、古かろうがどうだろうが関係ないのですが、今回のデータも1940年、年代もの。米国バージニア州の死亡率データらしいです。でもこれが3元の分散分析のよさげな例なんだとか。知らんけど。

“データのお砂場(36) R言語、VADeaths、戦前1940年の米バージニア州の死亡率とな” の続きを読む

データのお砂場(35) R言語、UScitiesD、米国都市間の直線距離とな

hccomp
Joseph Halfmoon

今回は、初登場のデータ形式、距離行列を扱いますです。階層的なクラスタリングで使ったりするもの。通常は何かの指標等を「距離に見立てて」計算して生成する行列なのだと思いますが、今回はもろ距離そのもの(直線距離、マイル表示)で距離行列として生成済でした。クラスタリングの結果は如何に?

“データのお砂場(35) R言語、UScitiesD、米国都市間の直線距離とな” の続きを読む

データのお砂場(34) R言語、Personal Expenditure Data

USPersonalExpenditure plot
Joseph Halfmoon

今回も米国の古い時代のデータです。戦前(第2次大戦ですぞ。応仁の乱でもウクライナ戦争でもありませぬ)から戦後にかけての米国の消費支出のデータらしいです。戦後の「順調な拡大」が読み取れる一方、米国といってもまだまだエンゲル係数高そうな感じです。今と比べると大分様子が異なります。だいたいタバコが重要な支出となっているし。

“データのお砂場(34) R言語、Personal Expenditure Data” の続きを読む