データのお砂場(71) R言語、presidents、米国大統領支持率(誤魔化?忖度?)とな

presidentsPlotNA
Joseph Halfmoon

サンプルデータセットは処理のお勉強のためのものなので嘘のデータであっても問題ないと。しかし、私、密かに、サンプルデータセットを通して世界の不思議と世の中を見ておりましたぞ。しかし今回のデータセット(fudged version)とうたっております。なんだこりゃ?何か隠す必要があったのか?大統領支持率。

“データのお砂場(71) R言語、presidents、米国大統領支持率(誤魔化?忖度?)とな” の続きを読む

データのお砂場(70) R言語、precip、米国70都市(プエルトリコ含)の年間平均降水量

precipRawPlot
Joseph Halfmoon

今回は米国各地の年間平均降水量データです。しかし眼目は「つづり間違い」の訂正みたいです。都市名をタイプしつづけて、つい綴りを間違えてしまったみたい。タイポの訂正ならばちゃちゃっと直して口を拭っておいても良いのに、データの修正方法と修正の検証の事例にしちまっているみたいっす。エラーに悪乗り?やらせじゃないみたいだが。

“データのお砂場(70) R言語、precip、米国70都市(プエルトリコ含)の年間平均降水量” の続きを読む

データのお砂場(69) R言語、英国の階級社会の投影? occupationalStatus

occuPlot
Joseph Halfmoon

今回は英国における父と子の “occupational status” 統計です。1979年以前の統計、半世紀くらいは前のもの。「大人の事情」か具体的なことは一切ない、ただ数値(整数の度数)の小さなテーブルです。想像するに、英国は今もそんなに変わっていないのではないかと。それどころか、このところの日本も似てきている?

“データのお砂場(69) R言語、英国の階級社会の投影? occupationalStatus” の続きを読む

データのお砂場(68) R言語、npk、古典的なn,p,k要因実験とな。NPKって何?

npkBoxPlot
Joseph Halfmoon

農業系?の方ならNPKに直ぐにピンとくるのでしょうが、頭の固い電子デバイス系年寄にはサッパリです。NPKって一体何なのよ。でも「窒素N、リン酸P、カリK」と日本語で教えてもらえれば、ようやく理解できますな。なんだ肥料じゃん。なんだとは何だ。肥料もやりすぎるとダメらしいけど、バランスよければいいんじゃね?そうでもない?
“データのお砂場(68) R言語、npk、古典的なn,p,k要因実験とな。NPKって何?” の続きを読む

データのお砂場(67) R言語、nottem、英国ノッティンガムの毎月の気温とな

NottemPredictPlot
Joseph Halfmoon

前回も平均気温で今回も平均気温と同じようなデータセットが続くなと思ったのですが違いました。米国と英国、場所も違いますが、今回のは月毎のデータで明らかな「季節変動」が見えるデータなのです。これをARIMAモデルに当てはめて処理し、「36か月先まで予測」してみようということみたいです。未来予測?カッコイイけれども。

“データのお砂場(67) R言語、nottem、英国ノッティンガムの毎月の気温とな” の続きを読む

データのお砂場(66) R言語、nhtemp、コネティカット州ニューヘイブンの年平均気温とな

nhtempPlot2
Joseph Halfmoon

今回は、コネティカット州ニューヘイブンの年平均気温のデータです。20世紀前半から中盤にかけての60年間のデータ。平均気温というとついつい地球温暖化が気になるのですが、まだこのころはそれほどシビアに考えられていなかった時代。それでもグラフを眺めてみると、なにやら増加傾向が見えるような見えないような。 “データのお砂場(66) R言語、nhtemp、コネティカット州ニューヘイブンの年平均気温とな” の続きを読む

データのお砂場(65) R言語、mtcars、50年前の自動車「ロードテスト」の結果

mtcarsCoplot
Joseph Halfmoon

今回のサンプルデータは、約50年前のMotor Trend US誌に掲載された1973年から74年モデルの自動車に関する諸元の比較表です。燃費とか比べてもいるのだけれど、「ガソリン垂れ流しているのかよ」という感じです。データには日本車、ドイツ車も混じっているけれど、当時のアメ車主体のデータだろうから当然か。 “データのお砂場(65) R言語、mtcars、50年前の自動車「ロードテスト」の結果” の続きを読む

データのお砂場(64) R言語、morley、実際はMichelson、光速の測定

Joseph Halfmoon

「マイケルソンとモーリー」と名が印象深いのでついサンプルデータセット名を morley としてしまったらしいです。お二人は協力していたけれど、このデータについてはMichelson先生単独のものみたい。それに現代からすると「光速を測った」ことが前面に出ているけれど、当時としては「エーテルの存在」を証明したかった?
“データのお砂場(64) R言語、morley、実際はMichelson、光速の測定” の続きを読む

データのお砂場(63) R言語、lynx、カナダ・オオヤマネコの捕獲数の推移

lynx_tsPLOT2
Joseph Halfmoon

今回はカナダ・オオヤマネコです。You Tubeで探したら動画発見できましたが、オオヤマネコというだけあってデカいです。そしてアラスカからカナダの森林地帯(当然寒そう)に生息しているので長毛です。今日では保護されていますが、19世紀においては罠で捕獲されていたみたいです。今回のデータはそのときのデータみたいっす。 “データのお砂場(63) R言語、lynx、カナダ・オオヤマネコの捕獲数の推移” の続きを読む

データのお砂場(62) R言語、longley、重回帰分析における多重共線性?知らんけど

EmployedPlot
Joseph Halfmoon

R言語付属のデータセットをアルファベット順(大文字優先)で眺めてます。今回のデータセットはlongleyです。お名前の由来はソースがLongley先生のデータであるからみたいです。第二次世界大戦後1960年代までのマクロな経済指標のデータです。ちょっと訳あり? で有名なデータみたいっす。 “データのお砂場(62) R言語、longley、重回帰分析における多重共線性?知らんけど” の続きを読む

データのお砂場(61) R言語、lh、血中黄体ホルモン濃度の時系列変化とな?

lh_tsplot
Joseph Halfmoon

R言語付属のデータセットをアルファベット順(大文字優先)で眺めてます。今回のデータセット名は lh。luteinizing hormoneの頭文字みたいです。私にはまったく知識のない分野であります。正直、サッパリわかりませぬよう。そして頼りの処理例もなし。どうしたらよいの?テキトーに「処理」してみました。いいのかそんなことで。 “データのお砂場(61) R言語、lh、血中黄体ホルモン濃度の時系列変化とな?” の続きを読む

データのお砂場(60) R言語、islands、島だけでない面積のランキング?

dotChart2EC
Joseph Halfmoon

R言語付属のデータセットをアルファベット順(大文字優先)で眺めてます。今回のデータセット名は islands。しかし島ばかりでない、大陸も含めたメジャーな土地の面積の羅列です。なにか統計処理するほどでもない、せいぜいランキングを作るくらい?のもの。クイズ豆知識か?でも眺めてみると意外と知らない名前の島があること。 “データのお砂場(60) R言語、islands、島だけでない面積のランキング?” の続きを読む

データのお砂場(59) R言語、IrisとIris3、データセット形式の変換と比較

IrisPlot0
Joseph Halfmoon

R言語付属のデータセットをアルファベット順(大文字優先)で眺めてます。今回は「かの」Irisです。本サイトでも何度か使わせていただいたことがあります。ML(Machine Learning)業界のHello World. 定番中のド定番のデータセット。しかし、今回のR言語の処理例をみると分類でも識別でもないです。

“データのお砂場(59) R言語、IrisとIris3、データセット形式の変換と比較” の続きを読む

データのお砂場(58) R言語、infert、自然/人工流産後不妊症のケースコントロール研究

Infert_RawData00
Joseph Halfmoon

R言語付属のデータセットをアルファベット順(大文字優先)で経めぐっております。今回は infert という名のサンプルデータセットです。医療(婦人科)の「マッチドケースコントロール研究」のデータを「条件付きロジスティック回帰」せよと。しかしそれ以前に項目の意味がさっぱり分かりませぬ。ここで言う「パリティ」って何?

“データのお砂場(58) R言語、infert、自然/人工流産後不妊症のケースコントロール研究” の続きを読む