今回のサンプルデータセットには “Student’s Sleep Data” というタイトルがついてます。以前であれば「学生さんのデータなの?」とボケをかますところです。今では知っています。また出たなStudent先生、t検定をやれってことですかい?データ自体は「眠くなるお薬」を飲んだ時の睡眠時間のデータらしいっす。
データのお砂場(76) R言語、rock、石油貯留層の油層岩サンプル、特性測定結果とな
前回に続き、今回も「どう処理したらよいのかサッパリ」なサンプルデータセットです。rockとな。どうも石油貯留層から取り出した岩石サンプルの物理的な測定結果のデータセットみたいです。ただサンプルデータ眺めていても、なんのこっちゃサッパリ分かりませぬ。処理例等も一切なし。しかし国土交通省様がヒントをくれる?と。ホントか。
データのお砂場(75) R言語、rivers、川のお名前をつけたい、名無しベクトルに名前を
R言語所蔵のサンプルデータセットをABC順(大文字)優先で拝見させていただいております。今回は rivers とな。北米の主要河川の「長さ」のデータみたいです。長さ順に並べるくらいしかその処理を思いつかないのです。しかしデータは名無しの権兵衛、単なる数値の羅列です。川のお名前がありませぬ。 “データのお砂場(75) R言語、rivers、川のお名前をつけたい、名無しベクトルに名前を” の続きを読む
データのお砂場(74) R言語、randu、線形合同法の「乱数は平面に落ちる」とな、ほんとだ
前回は地震の震源?を3次元空間にプロットしたらばプレート界面らしきものが浮かび上がってきました。今回は乱数を3次元空間にプロットすると平面が現れてくるの巻です。最近使われるカッコイい乱数発生アルゴリズムではなく古典的な線形合同法によるものです。VAX FortranのRANDU関数とな。ナツカシー?
データのお砂場(73) R言語、quakes、フィジー周辺の地震、3次元分布とな
今回は日本人には馴染み深い、地震データです。といっても場所は南太平洋、フィジー周辺のもの。最近も火山の大噴火がありましたが、フィジーも日本同様のプレート沈み込み帯、それもプレート2枚に挟まれたそれなりに複雑な地域みたいっす。Rのサンプルデータを見てもプレートの存在が一目瞭然じゃないかと。ホントか? “データのお砂場(73) R言語、quakes、フィジー周辺の地震、3次元分布とな” の続きを読む
データのお砂場(72) R言語、pressure、水銀の蒸気圧、単位はミリメートルHgで
今回、解説のvapor pressure of mercury in millimeters (of mercury)という句を読んで、一瞬親父ギャグと思った私の頭が親父ギャクです。水銀の蒸気圧曲線データです。古いので単位もmmHg(水銀柱高さ)です。当時はSI単位じゃなかったんだな。水銀が重なるのはいたしかたない。
“データのお砂場(72) R言語、pressure、水銀の蒸気圧、単位はミリメートルHgで” の続きを読む
データのお砂場(71) R言語、presidents、米国大統領支持率(誤魔化?忖度?)とな
サンプルデータセットは処理のお勉強のためのものなので嘘のデータであっても問題ないと。しかし、私、密かに、サンプルデータセットを通して世界の不思議と世の中を見ておりましたぞ。しかし今回のデータセット(fudged version)とうたっております。なんだこりゃ?何か隠す必要があったのか?大統領支持率。
データのお砂場(70) R言語、precip、米国70都市(プエルトリコ含)の年間平均降水量
今回は米国各地の年間平均降水量データです。しかし眼目は「つづり間違い」の訂正みたいです。都市名をタイプしつづけて、つい綴りを間違えてしまったみたい。タイポの訂正ならばちゃちゃっと直して口を拭っておいても良いのに、データの修正方法と修正の検証の事例にしちまっているみたいっす。エラーに悪乗り?やらせじゃないみたいだが。
データのお砂場(69) R言語、英国の階級社会の投影? occupationalStatus
今回は英国における父と子の “occupational status” 統計です。1979年以前の統計、半世紀くらいは前のもの。「大人の事情」か具体的なことは一切ない、ただ数値(整数の度数)の小さなテーブルです。想像するに、英国は今もそんなに変わっていないのではないかと。それどころか、このところの日本も似てきている?
データのお砂場(68) R言語、npk、古典的なn,p,k要因実験とな。NPKって何?
農業系?の方ならNPKに直ぐにピンとくるのでしょうが、頭の固い電子デバイス系年寄にはサッパリです。NPKって一体何なのよ。でも「窒素N、リン酸P、カリK」と日本語で教えてもらえれば、ようやく理解できますな。なんだ肥料じゃん。なんだとは何だ。肥料もやりすぎるとダメらしいけど、バランスよければいいんじゃね?そうでもない?
“データのお砂場(68) R言語、npk、古典的なn,p,k要因実験とな。NPKって何?” の続きを読む
データのお砂場(67) R言語、nottem、英国ノッティンガムの毎月の気温とな
前回も平均気温で今回も平均気温と同じようなデータセットが続くなと思ったのですが違いました。米国と英国、場所も違いますが、今回のは月毎のデータで明らかな「季節変動」が見えるデータなのです。これをARIMAモデルに当てはめて処理し、「36か月先まで予測」してみようということみたいです。未来予測?カッコイイけれども。
データのお砂場(66) R言語、nhtemp、コネティカット州ニューヘイブンの年平均気温とな
今回は、コネティカット州ニューヘイブンの年平均気温のデータです。20世紀前半から中盤にかけての60年間のデータ。平均気温というとついつい地球温暖化が気になるのですが、まだこのころはそれほどシビアに考えられていなかった時代。それでもグラフを眺めてみると、なにやら増加傾向が見えるような見えないような。 “データのお砂場(66) R言語、nhtemp、コネティカット州ニューヘイブンの年平均気温とな” の続きを読む
データのお砂場(65) R言語、mtcars、50年前の自動車「ロードテスト」の結果
今回のサンプルデータは、約50年前のMotor Trend US誌に掲載された1973年から74年モデルの自動車に関する諸元の比較表です。燃費とか比べてもいるのだけれど、「ガソリン垂れ流しているのかよ」という感じです。データには日本車、ドイツ車も混じっているけれど、当時のアメ車主体のデータだろうから当然か。 “データのお砂場(65) R言語、mtcars、50年前の自動車「ロードテスト」の結果” の続きを読む
データのお砂場(64) R言語、morley、実際はMichelson、光速の測定
「マイケルソンとモーリー」と名が印象深いのでついサンプルデータセット名を morley としてしまったらしいです。お二人は協力していたけれど、このデータについてはMichelson先生単独のものみたい。それに現代からすると「光速を測った」ことが前面に出ているけれど、当時としては「エーテルの存在」を証明したかった?
“データのお砂場(64) R言語、morley、実際はMichelson、光速の測定” の続きを読む