R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めておりますが、ついに大文字完了、小文字先頭のaに戻りましたです。なんか元の木阿弥感が強いデス。まだ先は長い。さて今回は能力/知能テストの集計結果の処理なんであります。そういえば遥かな昔に似たようなことをやったような。既に忘却の彼方。
データのお砂場(38) R言語、WorldPhones、世界の電話台数、70~60年前
R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めております。正直、古色蒼然たるデータが多いです。データを眺め、そして「その頃」がどんな世界だったのかに思いをはせるってもんでしょうか。グラフを眺めているうちに今日に繋がる事象も見える?今回のデータセットは電話の台数です。70年から60年以上前の。
データのお砂場(37) R言語、WWWusage、毎分のインターネット接続ユーザ数とな
前回は1940年と古いデータでした。今回のデータはWWWねたなので、それほど古いことはないでしょう。でも振り返ると最初にWWW(ワールドワイドウエッブ)にアクセスしたのはNCSA Mosaicというブラウザででした、まだWindows 3.x の時代だったかと。それからすると30年くらいたってますな。今は昔、違うか。
データのお砂場(36) R言語、VADeaths、戦前1940年の米バージニア州の死亡率とな
R言語に所蔵されとりますサンプルデータをABC順(大文字先)で端から眺めております。処理方法をお勉強するためのデータなので、古かろうがどうだろうが関係ないのですが、今回のデータも1940年、年代もの。米国バージニア州の死亡率データらしいです。でもこれが3元の分散分析のよさげな例なんだとか。知らんけど。
データのお砂場(35) R言語、UScitiesD、米国都市間の直線距離とな
今回は、初登場のデータ形式、距離行列を扱いますです。階層的なクラスタリングで使ったりするもの。通常は何かの指標等を「距離に見立てて」計算して生成する行列なのだと思いますが、今回はもろ距離そのもの(直線距離、マイル表示)で距離行列として生成済でした。クラスタリングの結果は如何に?
データのお砂場(34) R言語、Personal Expenditure Data
今回も米国の古い時代のデータです。戦前(第2次大戦ですぞ。応仁の乱でもウクライナ戦争でもありませぬ)から戦後にかけての米国の消費支出のデータらしいです。戦後の「順調な拡大」が読み取れる一方、米国といってもまだまだエンゲル係数高そうな感じです。今と比べると大分様子が異なります。だいたいタバコが重要な支出となっているし。
データのお砂場(33) R言語、USJudgeRatings、米国の判事さんの評価?とな?
今回のR言語所蔵のサンプルデータベース、米国の司法制度を理解していない私には訳わかりません。理解すべくWebを漁ってみましたです。日本語資料も結構あり、しかし大部。ご本家、米国の連邦最高裁のページまで探してみましたが、結局理解不能。意味も分からぬ数字をただ定形処理してお茶を濁した、と。残念な回であります。いつもか?
データのお砂場(32) R言語、USArrests、犯罪逮捕率データを訂正とな?
R言語所蔵のサンプルデータをABC順(大文字先)で端から眺めておりますが、今回も前回に引き続き目出度いデータとは言えません。1973年の米国の各州別の都市人口比率と凶悪犯逮捕の比率です。その関係性について調べるのかと思いきや今回のテーマはデータの訂正の仕方です。誰かが転記ミスをしてそれに気づいた人がいると。流石です。
データのお砂場(31) R言語、USAccDeaths、米国における事故死データ6年分
R言語所蔵のサンプルデータをABC順(大文字先)で端から眺めております。今回は1970年代の米国における事故死者の統計6年分です。前回に続き時系列データです。前回のガスの消費量に季節変動があるのは素直に納得できるのでありますが、事故にも季節変動があることが明らかな感じです。なぜ?
データのお砂場(30) R言語、UKgas、英国のガス消費量4半期毎
R言語所蔵のサンプルデータをABC順にみております。今回登場は1960年代から80年代中盤にかけての英国のガス消費量のデータです。時系列データの定番サンプル的なやつ。結構あちこちで目にするような気がします。データは天然ガス限定と書いていないですが、今や無色無臭の天然ガスも、ガス臭い、いや、きな臭くなった世界。
データのお砂場(29) R言語、UCBAdmmissions、UCバークレーの入試男女比?
ABC順に端からサンプリングデータ、再びカテゴリカルデータの集計登場。UCバークレー校のAdmissions(入試)の学部別、男女別の合否データみたいです。出典は1975年の御本なので、相当古いデータ。しかしこのデータ「シンプソンのパラドックス」を説明するときの定番データらしいです。知らないとモグリ的なやつ?
データのお砂場(28) R言語、ToothGrowth、ビタミンCの効果とな、ホントか?
前回は1回だけPythonでの処理に行きましたが、今回はR言語でR言語所蔵のサンプルデータセットの処理に戻ります。今回のデータ自体は分かり易いと言えば分かり易いです。ビタミンCがモルモットの歯の成長に及ぼす影響についてのデータみたいです。でもねえ、このデータだけ見せられても、という感じ。処理はできるでしょうが。
データのお砂場(27) Python、Titanic、前回データの別な切り口
前回、R言語所蔵のTitanicデータセットを処理。事故のデータなのであまり気色の良いものではないな、などと思っていたら、痛ましい海難事故発生。人間はそういうことに「因果関係」を感じてしまうものであり、私も例外ではないです。が、因果は無いのであります。そうしたら別口でTitanicデータをまた発見。何かあるのか?
データのお砂場(26) R言語、Titanic、タイタニック号の生存者とな
今回のサンプルデータセットは皆さんよくご存じのタイタニック号です。映画タイタニックも見ましたが、この老人の記憶の奥底にあるタイタニックはTVドラマ「タイムトンネル」のタイタニックなんであります。といって若者も中年も知らないか、タイムトンネル、SFタイムトラベル物の嚆矢かと。それはさておきデータ処理にとりくみますです。