データのお砂場(60) R言語、islands、島だけでない面積のランキング?

dotChart2EC
Joseph Halfmoon

R言語付属のデータセットをアルファベット順(大文字優先)で眺めてます。今回のデータセット名は islands。しかし島ばかりでない、大陸も含めたメジャーな土地の面積の羅列です。なにか統計処理するほどでもない、せいぜいランキングを作るくらい?のもの。クイズ豆知識か?でも眺めてみると意外と知らない名前の島があること。 “データのお砂場(60) R言語、islands、島だけでない面積のランキング?” の続きを読む

データのお砂場(59) R言語、IrisとIris3、データセット形式の変換と比較

IrisPlot0
Joseph Halfmoon

R言語付属のデータセットをアルファベット順(大文字優先)で眺めてます。今回は「かの」Irisです。本サイトでも何度か使わせていただいたことがあります。ML(Machine Learning)業界のHello World. 定番中のド定番のデータセット。しかし、今回のR言語の処理例をみると分類でも識別でもないです。

“データのお砂場(59) R言語、IrisとIris3、データセット形式の変換と比較” の続きを読む

データのお砂場(58) R言語、infert、自然/人工流産後不妊症のケースコントロール研究

Infert_RawData00
Joseph Halfmoon

R言語付属のデータセットをアルファベット順(大文字優先)で経めぐっております。今回は infert という名のサンプルデータセットです。医療(婦人科)の「マッチドケースコントロール研究」のデータを「条件付きロジスティック回帰」せよと。しかしそれ以前に項目の意味がさっぱり分かりませぬ。ここで言う「パリティ」って何?

“データのお砂場(58) R言語、infert、自然/人工流産後不妊症のケースコントロール研究” の続きを読む

データのお砂場(57) R言語、Freeny’s Revenue Dataとな

step4_fm1_plot
Joseph Halfmoon

前回は「構造をもった」データセットでロード時と使用時でお名前が違いフェイント気味でした。今回も内部に構造をもったデータセットなのですが、ロードも使用もすんなりです。この辺の作り方にいろいろ流派があるのかも知れないです。でもコマケー話にガタガタ言うなとか言われそう。中を見れば分かる、と。

“データのお砂場(57) R言語、Freeny’s Revenue Dataとな” の続きを読む

データのお砂場(56) R言語、fdeaths(UKLungDeaths)、肺疾患死亡者数

ldeathSTL
Joseph Halfmoon

今回のサンプルデータセットは、英国における肺疾患による月間死亡者数です。1970年代のもの。年寄には最近のデータに思えるのですが、若者には太古の時代のデータかと。しかしこのデータ「セット」のロードはちょいフェイント気味。コマケー話なんだけれどもあれあれとなるわいな。

“データのお砂場(56) R言語、fdeaths(UKLungDeaths)、肺疾患死亡者数” の続きを読む

データのお砂場(55) R言語、faithful、間欠泉(イエローストーン)の噴出時間とな

faithful_ex07
Joseph Halfmoon

オールド・フェイスフルと言えば、間欠泉の代表選手?です。米国はワイオミング州、山また山のその先にある大火山地帯イエローストーン国立公園の中にある大間欠泉です。数十メートルにも吹き上がる熱水を拝めば、しばらく待たされた退屈の後のカタルシス。でもま温度が高いのでかなり遠くから眺めるしかないのでありますが。

“データのお砂場(55) R言語、faithful、間欠泉(イエローストーン)の噴出時間とな” の続きを読む

データのお砂場(54) R言語、eurodist、欧州都市間の道のり(dist)とな?

DendrogramComplete
Joseph Halfmoon

R言語のサンプル・データセットをABC順(大文字先)で端から眺めております。今回のデータセットは eurodist、ヨーロッパ都市間の距離です。以前にも似たデータをやってます。UScitiedDとな(第35回)以前のものは米国、今回は欧州。以前のものは直線距離、今回のものは道のりと。似ているようで違う、でも処理は一緒?

“データのお砂場(54) R言語、eurodist、欧州都市間の道のり(dist)とな?” の続きを読む

データのお砂場(53) R言語、euro、1998年末のユーロ参加国の為替固定レートとな?

outerEC
Joseph Halfmoon

ユーロは相当昔からの気でいましたが、今回のサンプルデータセットの件で振り返ってみると紙幣の一般への流通が始まってからだと高々20年、年寄にはつい昨日であったのですな。今回のサンプルデータはその過程の1ステップ?統合前に参加各国の通貨の為替レートを固定化したときの換算テーブルであります。外積が出てくるの?意外ね。 “データのお砂場(53) R言語、euro、1998年末のユーロ参加国の為替固定レートとな?” の続きを読む

データのお砂場(52) R言語、esoph、食道がんの症例対処研究とな?

mosaicPlotEsoph
Joseph Halfmoon

R言語のサンプル・データセットをABC順(大文字先)で端から眺めております。今回のデータセットは espoh、「食道がんの症例対処研究」のデータだそうです。その要因として酒とタバコの摂取量を想定するもの。ちょいと込み入ってます。今回は処理例が提示されているので、それをつかえば処理はできると。 “データのお砂場(52) R言語、esoph、食道がんの症例対処研究とな?” の続きを読む

データのお砂場(51) R言語、Discoveries、複数年ある最小値の年を知る

TheWorldAlmanacAndBookOfFacts1986
Joseph Halfmoon

R言語のサンプル・データセットをABC順(大文字先)で端から眺めております。解説ページ見るとデータセット「Source」などにデータの出元が記載されとります。わざわざ調べたりしないのですが、今回は灯台下暗し。手元にSourceの本がありました(Editionは違うケド。)あったからといってなんのこっちゃなんだけれども。
“データのお砂場(51) R言語、Discoveries、複数年ある最小値の年を知る” の続きを読む

データのお砂場(50) R言語、crimtab、スチューデントの「t分布」登場

crimtabPlot
Joseph Halfmoon

今回のサンプル・データセットのタイトル、「Student’s 3000 Criminals Data」を見て「学生さんの犯罪データ??」と思った私は、統計素人、いやモグリです。記憶の奥底に「スチューデントのt分布」という言葉はあったものの、タイトルの「Student」が偉大なるかなスチューデント様と気づかなかったとは。
“データのお砂場(50) R言語、crimtab、スチューデントの「t分布」登場” の続きを読む

データのお砂場(49) R言語、ハワイ、マウナロア山でのCO2濃度データとな

co2STL
Joseph Halfmoon

以前にも大文字のCO2というサンプルデータセットを扱ったのですが、今回は小文字の co2 です。小文字の方が話がデカイです。地球規模での皆さまの関心、CO2濃度の上昇についてのデータです。サンプルデータセットはある時点までのデータですが、このデータセット自体は現在も測定中です。ここを入り口に地球規模の変動を確かめる? “データのお砂場(49) R言語、ハワイ、マウナロア山でのCO2濃度データとな” の続きを読む

データのお砂場(48) R言語、chickwts、ニワトリさんの体重、「再び」とな

boxPlotNNotch
Joseph Halfmoon

R言語所蔵のサンプルデータセットを、ABC順(大文字先)で端から眺めております。今回は chickwts です。でも以前にも眺めたような?デジャヴ? いえ、第5回第6回とChickWeightというチキンの肥育データを扱っておりました。今回は小文字始まりのchickwtsです。やはりチキンの肥育。でも内容は違うと。 “データのお砂場(48) R言語、chickwts、ニワトリさんの体重、「再び」とな” の続きを読む

データのお砂場(47) R言語、cars、自動車の制動距離?いや停止距離とな

plotLog
Joseph Halfmoon

R言語所蔵のサンプルデータセットを、ABC順(大文字先)で端から眺めております。今回はcars、自動車の停止距離の測定データです。ただし約100年前、1920年代に測定されたデータみたいです。最近の自動車は性能上がっているからな~などと思いつつ、物理現象でした。100年前も今も実は計算式は変わっていないっと。 “データのお砂場(47) R言語、cars、自動車の制動距離?いや停止距離とな” の続きを読む