データのお砂場(43) R言語、attenu、カリフォルニアの23個の地震のピーク加速度とな

Joseph Halfmoon

前回は演習用の人工データでしたが、今回は自然現象の観測データです。米国カリフォルニア州内で発生した23個の地震のピーク加速度データです。古いデータのようですが比較的デカイ地震ばかり。震源までの距離とピーク加速度の間に関係性を見出すための練習データに見えます。しかし多くの日本人は知っています。地震は一筋縄ではいかねーと。

“データのお砂場(43) R言語、attenu、カリフォルニアの23個の地震のピーク加速度とな” の続きを読む

データのお砂場(42) R言語、anscombe、平均、分散、線形な回帰直線、同じだけど違う

ascombeSamplePlot
Joseph Halfmoon

前回は寄せ集め感たっぷりながら、生々しい実データでした。今回は「アーティフィシャルなフレーバー漂う」多分、確実に、このデータセットを可視化してみる人物(私を含む)に「インプレッション」を与えるため意図された人為的なデータです。なんだそれ。勿体ぶらずに上の画像見れば一目瞭然。

“データのお砂場(42) R言語、anscombe、平均、分散、線形な回帰直線、同じだけど違う” の続きを読む

データのお砂場(41) R言語、airquality、ニューヨークの空気の品質?とな

Wind
Joseph Halfmoon

R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めております。今回のデータも古いです。1973年の5月から9月にかけてのニューヨークでの「空気の品質」データです。空気の品質といってオゾン濃度を調べてるんです。最初は意味不明でした。NOx濃度とかでないの?でも調べてみたら根拠がありーの。知らんけど。 “データのお砂場(41) R言語、airquality、ニューヨークの空気の品質?とな” の続きを読む

データのお砂場(40) R言語、airmiles、米国の航空会社の旅客マイルとな、昔の

plotMA5
Joseph Halfmoon

R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めております。今回のデータセットairmiles、デジャヴか、いよいよ妄想でたか、と思ったら以前に似たものやってました。以前のは「人数」で「月次データ」、今回のものは「RPM」値で「年次データ」であります。いずれも60年以上前の航空業界のデータです。

“データのお砂場(40) R言語、airmiles、米国の航空会社の旅客マイルとな、昔の” の続きを読む

データのお砂場(39) R言語、ability.cov、能力/知能テストの共分散行列とな

BarPlot
Joseph Halfmoon

R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めておりますが、ついに大文字完了、小文字先頭のaに戻りましたです。なんか元の木阿弥感が強いデス。まだ先は長い。さて今回は能力/知能テストの集計結果の処理なんであります。そういえば遥かな昔に似たようなことをやったような。既に忘却の彼方。

“データのお砂場(39) R言語、ability.cov、能力/知能テストの共分散行列とな” の続きを読む

データのお砂場(38) R言語、WorldPhones、世界の電話台数、70~60年前

ExampleGraph
Joseph Halfmoon

R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めております。正直、古色蒼然たるデータが多いです。データを眺め、そして「その頃」がどんな世界だったのかに思いをはせるってもんでしょうか。グラフを眺めているうちに今日に繋がる事象も見える?今回のデータセットは電話の台数です。70年から60年以上前の。

“データのお砂場(38) R言語、WorldPhones、世界の電話台数、70~60年前” の続きを読む

データのお砂場(37) R言語、WWWusage、毎分のインターネット接続ユーザ数とな

diffPlot
Joseph Halfmoon

前回は1940年と古いデータでした。今回のデータはWWWねたなので、それほど古いことはないでしょう。でも振り返ると最初にWWW(ワールドワイドウエッブ)にアクセスしたのはNCSA Mosaicというブラウザででした、まだWindows 3.x の時代だったかと。それからすると30年くらいたってますな。今は昔、違うか。

“データのお砂場(37) R言語、WWWusage、毎分のインターネット接続ユーザ数とな” の続きを読む

データのお砂場(36) R言語、VADeaths、戦前1940年の米バージニア州の死亡率とな

coplot000
Joseph Halfmoon

R言語に所蔵されとりますサンプルデータをABC順(大文字先)で端から眺めております。処理方法をお勉強するためのデータなので、古かろうがどうだろうが関係ないのですが、今回のデータも1940年、年代もの。米国バージニア州の死亡率データらしいです。でもこれが3元の分散分析のよさげな例なんだとか。知らんけど。

“データのお砂場(36) R言語、VADeaths、戦前1940年の米バージニア州の死亡率とな” の続きを読む

データのお砂場(35) R言語、UScitiesD、米国都市間の直線距離とな

hccomp
Joseph Halfmoon

今回は、初登場のデータ形式、距離行列を扱いますです。階層的なクラスタリングで使ったりするもの。通常は何かの指標等を「距離に見立てて」計算して生成する行列なのだと思いますが、今回はもろ距離そのもの(直線距離、マイル表示)で距離行列として生成済でした。クラスタリングの結果は如何に?

“データのお砂場(35) R言語、UScitiesD、米国都市間の直線距離とな” の続きを読む

データのお砂場(34) R言語、Personal Expenditure Data

USPersonalExpenditure plot
Joseph Halfmoon

今回も米国の古い時代のデータです。戦前(第2次大戦ですぞ。応仁の乱でもウクライナ戦争でもありませぬ)から戦後にかけての米国の消費支出のデータらしいです。戦後の「順調な拡大」が読み取れる一方、米国といってもまだまだエンゲル係数高そうな感じです。今と比べると大分様子が異なります。だいたいタバコが重要な支出となっているし。

“データのお砂場(34) R言語、Personal Expenditure Data” の続きを読む

データのお砂場(33) R言語、USJudgeRatings、米国の判事さんの評価?とな?

example
Joseph Halfmoon

今回のR言語所蔵のサンプルデータベース、米国の司法制度を理解していない私には訳わかりません。理解すべくWebを漁ってみましたです。日本語資料も結構あり、しかし大部。ご本家、米国の連邦最高裁のページまで探してみましたが、結局理解不能。意味も分からぬ数字をただ定形処理してお茶を濁した、と。残念な回であります。いつもか?

“データのお砂場(33) R言語、USJudgeRatings、米国の判事さんの評価?とな?” の続きを読む

データのお砂場(32) R言語、USArrests、犯罪逮捕率データを訂正とな?

USArrestsPairCorrected
Joseph Halfmoon

R言語所蔵のサンプルデータをABC順(大文字先)で端から眺めておりますが、今回も前回に引き続き目出度いデータとは言えません。1973年の米国の各州別の都市人口比率と凶悪犯逮捕の比率です。その関係性について調べるのかと思いきや今回のテーマはデータの訂正の仕方です。誰かが転記ミスをしてそれに気づいた人がいると。流石です。

“データのお砂場(32) R言語、USArrests、犯罪逮捕率データを訂正とな?” の続きを読む

データのお砂場(31) R言語、USAccDeaths、米国における事故死データ6年分

stl00
Joseph Halfmoon

R言語所蔵のサンプルデータをABC順(大文字先)で端から眺めております。今回は1970年代の米国における事故死者の統計6年分です。前回に続き時系列データです。前回のガスの消費量に季節変動があるのは素直に納得できるのでありますが、事故にも季節変動があることが明らかな感じです。なぜ?

“データのお砂場(31) R言語、USAccDeaths、米国における事故死データ6年分” の続きを読む

データのお砂場(30) R言語、UKgas、英国のガス消費量4半期毎

stPlot
Joseph Halfmoon

R言語所蔵のサンプルデータをABC順にみております。今回登場は1960年代から80年代中盤にかけての英国のガス消費量のデータです。時系列データの定番サンプル的なやつ。結構あちこちで目にするような気がします。データは天然ガス限定と書いていないですが、今や無色無臭の天然ガスも、ガス臭い、いや、きな臭くなった世界。

“データのお砂場(30) R言語、UKgas、英国のガス消費量4半期毎” の続きを読む