ユーロは相当昔からの気でいましたが、今回のサンプルデータセットの件で振り返ってみると紙幣の一般への流通が始まってからだと高々20年、年寄にはつい昨日であったのですな。今回のサンプルデータはその過程の1ステップ?統合前に参加各国の通貨の為替レートを固定化したときの換算テーブルであります。外積が出てくるの?意外ね。 “データのお砂場(53) R言語、euro、1998年末のユーロ参加国の為替固定レートとな?” の続きを読む
データのお砂場(52) R言語、esoph、食道がんの症例対処研究とな?
R言語のサンプル・データセットをABC順(大文字先)で端から眺めております。今回のデータセットは espoh、「食道がんの症例対処研究」のデータだそうです。その要因として酒とタバコの摂取量を想定するもの。ちょいと込み入ってます。今回は処理例が提示されているので、それをつかえば処理はできると。 “データのお砂場(52) R言語、esoph、食道がんの症例対処研究とな?” の続きを読む
データのお砂場(51) R言語、Discoveries、複数年ある最小値の年を知る
R言語のサンプル・データセットをABC順(大文字先)で端から眺めております。解説ページ見るとデータセット「Source」などにデータの出元が記載されとります。わざわざ調べたりしないのですが、今回は灯台下暗し。手元にSourceの本がありました(Editionは違うケド。)あったからといってなんのこっちゃなんだけれども。
“データのお砂場(51) R言語、Discoveries、複数年ある最小値の年を知る” の続きを読む
データのお砂場(50) R言語、crimtab、スチューデントの「t分布」登場
今回のサンプル・データセットのタイトル、「Student’s 3000 Criminals Data」を見て「学生さんの犯罪データ??」と思った私は、統計素人、いやモグリです。記憶の奥底に「スチューデントのt分布」という言葉はあったものの、タイトルの「Student」が偉大なるかなスチューデント様と気づかなかったとは。
“データのお砂場(50) R言語、crimtab、スチューデントの「t分布」登場” の続きを読む
データのお砂場(49) R言語、ハワイ、マウナロア山でのCO2濃度データとな
以前にも大文字のCO2というサンプルデータセットを扱ったのですが、今回は小文字の co2 です。小文字の方が話がデカイです。地球規模での皆さまの関心、CO2濃度の上昇についてのデータです。サンプルデータセットはある時点までのデータですが、このデータセット自体は現在も測定中です。ここを入り口に地球規模の変動を確かめる? “データのお砂場(49) R言語、ハワイ、マウナロア山でのCO2濃度データとな” の続きを読む
データのお砂場(48) R言語、chickwts、ニワトリさんの体重、「再び」とな
R言語所蔵のサンプルデータセットを、ABC順(大文字先)で端から眺めております。今回は chickwts です。でも以前にも眺めたような?デジャヴ? いえ、第5回、第6回とChickWeightというチキンの肥育データを扱っておりました。今回は小文字始まりのchickwtsです。やはりチキンの肥育。でも内容は違うと。 “データのお砂場(48) R言語、chickwts、ニワトリさんの体重、「再び」とな” の続きを読む
データのお砂場(47) R言語、cars、自動車の制動距離?いや停止距離とな
R言語所蔵のサンプルデータセットを、ABC順(大文字先)で端から眺めております。今回はcars、自動車の停止距離の測定データです。ただし約100年前、1920年代に測定されたデータみたいです。最近の自動車は性能上がっているからな~などと思いつつ、物理現象でした。100年前も今も実は計算式は変わっていないっと。 “データのお砂場(47) R言語、cars、自動車の制動距離?いや停止距離とな” の続きを読む
データのお砂場(46) R言語、beavers、ビーバー2匹の体温の測定とな
R言語所蔵のサンプルデータセットを、ABC順(大文字先)で端から眺めております。前回はオーストラリアの人口でしたが、今回はビーバー2匹の体温測定です。「サンプル」なので致し方ないですが、雑多なものの寄せ集め感ハンパないです。まあRでの処理のやり方を学ぶためのデータと割り切れば良いんでしょうが。 “データのお砂場(46) R言語、beavers、ビーバー2匹の体温の測定とな” の続きを読む
データのお砂場(45) R言語、austres、オーストラリアの人口、4半期毎
前回は意味が良く分からないデータでしたが、今回は単純明快「オーストラリアの人口」です(Residentsという表現なので国籍的なものとはまた別かと。)データは1971年から1994年まで、既に四半世紀経過してますが、とても古いデータが多いRのサンプルデータセットの中では比較的新しい感じです。 “データのお砂場(45) R言語、austres、オーストラリアの人口、4半期毎” の続きを読む
データのお砂場(44) R言語、attitude、%で測れる「態度」ってなんなのよ?
今回のデータは米国の(半世紀くらい前の)金融機関らしい組織の事務職員のアンケート調査みたいなものの集計らしいです。R言語の処理としては線形回帰の練習データです。淡々と処理はできるんじゃないかと思いますが、人事情報的な「意見」の集約なので「その意味」がとても気になります。データとしてはすべて%で表される数値なのですが。
“データのお砂場(44) R言語、attitude、%で測れる「態度」ってなんなのよ?” の続きを読む
データのお砂場(43) R言語、attenu、カリフォルニアの23個の地震のピーク加速度とな
前回は演習用の人工データでしたが、今回は自然現象の観測データです。米国カリフォルニア州内で発生した23個の地震のピーク加速度データです。古いデータのようですが比較的デカイ地震ばかり。震源までの距離とピーク加速度の間に関係性を見出すための練習データに見えます。しかし多くの日本人は知っています。地震は一筋縄ではいかねーと。
データのお砂場(42) R言語、anscombe、平均、分散、線形な回帰直線、同じだけど違う
前回は寄せ集め感たっぷりながら、生々しい実データでした。今回は「アーティフィシャルなフレーバー漂う」多分、確実に、このデータセットを可視化してみる人物(私を含む)に「インプレッション」を与えるため意図された人為的なデータです。なんだそれ。勿体ぶらずに上の画像見れば一目瞭然。
データのお砂場(41) R言語、airquality、ニューヨークの空気の品質?とな
R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めております。今回のデータも古いです。1973年の5月から9月にかけてのニューヨークでの「空気の品質」データです。空気の品質といってオゾン濃度を調べてるんです。最初は意味不明でした。NOx濃度とかでないの?でも調べてみたら根拠がありーの。知らんけど。 “データのお砂場(41) R言語、airquality、ニューヨークの空気の品質?とな” の続きを読む
データのお砂場(40) R言語、airmiles、米国の航空会社の旅客マイルとな、昔の
R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めております。今回のデータセットairmiles、デジャヴか、いよいよ妄想でたか、と思ったら以前に似たものやってました。以前のは「人数」で「月次データ」、今回のものは「RPM」値で「年次データ」であります。いずれも60年以上前の航空業界のデータです。