データのお砂場(59) R言語、IrisとIris3、データセット形式の変換と比較

IrisPlot0
Joseph Halfmoon

R言語付属のデータセットをアルファベット順(大文字優先)で眺めてます。今回は「かの」Irisです。本サイトでも何度か使わせていただいたことがあります。ML(Machine Learning)業界のHello World. 定番中のド定番のデータセット。しかし、今回のR言語の処理例をみると分類でも識別でもないです。

“データのお砂場(59) R言語、IrisとIris3、データセット形式の変換と比較” の続きを読む

データのお砂場(58) R言語、infert、自然/人工流産後不妊症のケースコントロール研究

Infert_RawData00
Joseph Halfmoon

R言語付属のデータセットをアルファベット順(大文字優先)で経めぐっております。今回は infert という名のサンプルデータセットです。医療(婦人科)の「マッチドケースコントロール研究」のデータを「条件付きロジスティック回帰」せよと。しかしそれ以前に項目の意味がさっぱり分かりませぬ。ここで言う「パリティ」って何?

“データのお砂場(58) R言語、infert、自然/人工流産後不妊症のケースコントロール研究” の続きを読む

データのお砂場(57) R言語、Freeny’s Revenue Dataとな

step4_fm1_plot
Joseph Halfmoon

前回は「構造をもった」データセットでロード時と使用時でお名前が違いフェイント気味でした。今回も内部に構造をもったデータセットなのですが、ロードも使用もすんなりです。この辺の作り方にいろいろ流派があるのかも知れないです。でもコマケー話にガタガタ言うなとか言われそう。中を見れば分かる、と。

“データのお砂場(57) R言語、Freeny’s Revenue Dataとな” の続きを読む

データのお砂場(56) R言語、fdeaths(UKLungDeaths)、肺疾患死亡者数

ldeathSTL
Joseph Halfmoon

今回のサンプルデータセットは、英国における肺疾患による月間死亡者数です。1970年代のもの。年寄には最近のデータに思えるのですが、若者には太古の時代のデータかと。しかしこのデータ「セット」のロードはちょいフェイント気味。コマケー話なんだけれどもあれあれとなるわいな。

“データのお砂場(56) R言語、fdeaths(UKLungDeaths)、肺疾患死亡者数” の続きを読む

データのお砂場(55) R言語、faithful、間欠泉(イエローストーン)の噴出時間とな

faithful_ex07
Joseph Halfmoon

オールド・フェイスフルと言えば、間欠泉の代表選手?です。米国はワイオミング州、山また山のその先にある大火山地帯イエローストーン国立公園の中にある大間欠泉です。数十メートルにも吹き上がる熱水を拝めば、しばらく待たされた退屈の後のカタルシス。でもま温度が高いのでかなり遠くから眺めるしかないのでありますが。

“データのお砂場(55) R言語、faithful、間欠泉(イエローストーン)の噴出時間とな” の続きを読む

データのお砂場(54) R言語、eurodist、欧州都市間の道のり(dist)とな?

DendrogramComplete
Joseph Halfmoon

R言語のサンプル・データセットをABC順(大文字先)で端から眺めております。今回のデータセットは eurodist、ヨーロッパ都市間の距離です。以前にも似たデータをやってます。UScitiedDとな(第35回)以前のものは米国、今回は欧州。以前のものは直線距離、今回のものは道のりと。似ているようで違う、でも処理は一緒?

“データのお砂場(54) R言語、eurodist、欧州都市間の道のり(dist)とな?” の続きを読む

データのお砂場(53) R言語、euro、1998年末のユーロ参加国の為替固定レートとな?

outerEC
Joseph Halfmoon

ユーロは相当昔からの気でいましたが、今回のサンプルデータセットの件で振り返ってみると紙幣の一般への流通が始まってからだと高々20年、年寄にはつい昨日であったのですな。今回のサンプルデータはその過程の1ステップ?統合前に参加各国の通貨の為替レートを固定化したときの換算テーブルであります。外積が出てくるの?意外ね。 “データのお砂場(53) R言語、euro、1998年末のユーロ参加国の為替固定レートとな?” の続きを読む

データのお砂場(52) R言語、esoph、食道がんの症例対処研究とな?

mosaicPlotEsoph
Joseph Halfmoon

R言語のサンプル・データセットをABC順(大文字先)で端から眺めております。今回のデータセットは espoh、「食道がんの症例対処研究」のデータだそうです。その要因として酒とタバコの摂取量を想定するもの。ちょいと込み入ってます。今回は処理例が提示されているので、それをつかえば処理はできると。 “データのお砂場(52) R言語、esoph、食道がんの症例対処研究とな?” の続きを読む

データのお砂場(51) R言語、Discoveries、複数年ある最小値の年を知る

TheWorldAlmanacAndBookOfFacts1986
Joseph Halfmoon

R言語のサンプル・データセットをABC順(大文字先)で端から眺めております。解説ページ見るとデータセット「Source」などにデータの出元が記載されとります。わざわざ調べたりしないのですが、今回は灯台下暗し。手元にSourceの本がありました(Editionは違うケド。)あったからといってなんのこっちゃなんだけれども。
“データのお砂場(51) R言語、Discoveries、複数年ある最小値の年を知る” の続きを読む

データのお砂場(50) R言語、crimtab、スチューデントの「t分布」登場

crimtabPlot
Joseph Halfmoon

今回のサンプル・データセットのタイトル、「Student’s 3000 Criminals Data」を見て「学生さんの犯罪データ??」と思った私は、統計素人、いやモグリです。記憶の奥底に「スチューデントのt分布」という言葉はあったものの、タイトルの「Student」が偉大なるかなスチューデント様と気づかなかったとは。
“データのお砂場(50) R言語、crimtab、スチューデントの「t分布」登場” の続きを読む