今回はカナダ・オオヤマネコです。You Tubeで探したら動画発見できましたが、オオヤマネコというだけあってデカいです。そしてアラスカからカナダの森林地帯(当然寒そう)に生息しているので長毛です。今日では保護されていますが、19世紀においては罠で捕獲されていたみたいです。今回のデータはそのときのデータみたいっす。 “データのお砂場(63) R言語、lynx、カナダ・オオヤマネコの捕獲数の推移” の続きを読む
データのお砂場(62) R言語、longley、重回帰分析における多重共線性?知らんけど
R言語付属のデータセットをアルファベット順(大文字優先)で眺めてます。今回のデータセットはlongleyです。お名前の由来はソースがLongley先生のデータであるからみたいです。第二次世界大戦後1960年代までのマクロな経済指標のデータです。ちょっと訳あり? で有名なデータみたいっす。 “データのお砂場(62) R言語、longley、重回帰分析における多重共線性?知らんけど” の続きを読む
データのお砂場(61) R言語、lh、血中黄体ホルモン濃度の時系列変化とな?
R言語付属のデータセットをアルファベット順(大文字優先)で眺めてます。今回のデータセット名は lh。luteinizing hormoneの頭文字みたいです。私にはまったく知識のない分野であります。正直、サッパリわかりませぬよう。そして頼りの処理例もなし。どうしたらよいの?テキトーに「処理」してみました。いいのかそんなことで。 “データのお砂場(61) R言語、lh、血中黄体ホルモン濃度の時系列変化とな?” の続きを読む
データのお砂場(60) R言語、islands、島だけでない面積のランキング?
R言語付属のデータセットをアルファベット順(大文字優先)で眺めてます。今回のデータセット名は islands。しかし島ばかりでない、大陸も含めたメジャーな土地の面積の羅列です。なにか統計処理するほどでもない、せいぜいランキングを作るくらい?のもの。クイズ豆知識か?でも眺めてみると意外と知らない名前の島があること。 “データのお砂場(60) R言語、islands、島だけでない面積のランキング?” の続きを読む
データのお砂場(59) R言語、IrisとIris3、データセット形式の変換と比較
R言語付属のデータセットをアルファベット順(大文字優先)で眺めてます。今回は「かの」Irisです。本サイトでも何度か使わせていただいたことがあります。ML(Machine Learning)業界のHello World. 定番中のド定番のデータセット。しかし、今回のR言語の処理例をみると分類でも識別でもないです。
データのお砂場(58) R言語、infert、自然/人工流産後不妊症のケースコントロール研究
R言語付属のデータセットをアルファベット順(大文字優先)で経めぐっております。今回は infert という名のサンプルデータセットです。医療(婦人科)の「マッチドケースコントロール研究」のデータを「条件付きロジスティック回帰」せよと。しかしそれ以前に項目の意味がさっぱり分かりませぬ。ここで言う「パリティ」って何?
データのお砂場(57) R言語、Freeny’s Revenue Dataとな
前回は「構造をもった」データセットでロード時と使用時でお名前が違いフェイント気味でした。今回も内部に構造をもったデータセットなのですが、ロードも使用もすんなりです。この辺の作り方にいろいろ流派があるのかも知れないです。でもコマケー話にガタガタ言うなとか言われそう。中を見れば分かる、と。
データのお砂場(56) R言語、fdeaths(UKLungDeaths)、肺疾患死亡者数
今回のサンプルデータセットは、英国における肺疾患による月間死亡者数です。1970年代のもの。年寄には最近のデータに思えるのですが、若者には太古の時代のデータかと。しかしこのデータ「セット」のロードはちょいフェイント気味。コマケー話なんだけれどもあれあれとなるわいな。
データのお砂場(55) R言語、faithful、間欠泉(イエローストーン)の噴出時間とな
オールド・フェイスフルと言えば、間欠泉の代表選手?です。米国はワイオミング州、山また山のその先にある大火山地帯イエローストーン国立公園の中にある大間欠泉です。数十メートルにも吹き上がる熱水を拝めば、しばらく待たされた退屈の後のカタルシス。でもま温度が高いのでかなり遠くから眺めるしかないのでありますが。
データのお砂場(54) R言語、eurodist、欧州都市間の道のり(dist)とな?
R言語のサンプル・データセットをABC順(大文字先)で端から眺めております。今回のデータセットは eurodist、ヨーロッパ都市間の距離です。以前にも似たデータをやってます。UScitiedDとな(第35回)以前のものは米国、今回は欧州。以前のものは直線距離、今回のものは道のりと。似ているようで違う、でも処理は一緒?
データのお砂場(53) R言語、euro、1998年末のユーロ参加国の為替固定レートとな?
ユーロは相当昔からの気でいましたが、今回のサンプルデータセットの件で振り返ってみると紙幣の一般への流通が始まってからだと高々20年、年寄にはつい昨日であったのですな。今回のサンプルデータはその過程の1ステップ?統合前に参加各国の通貨の為替レートを固定化したときの換算テーブルであります。外積が出てくるの?意外ね。 “データのお砂場(53) R言語、euro、1998年末のユーロ参加国の為替固定レートとな?” の続きを読む
データのお砂場(52) R言語、esoph、食道がんの症例対処研究とな?
R言語のサンプル・データセットをABC順(大文字先)で端から眺めております。今回のデータセットは espoh、「食道がんの症例対処研究」のデータだそうです。その要因として酒とタバコの摂取量を想定するもの。ちょいと込み入ってます。今回は処理例が提示されているので、それをつかえば処理はできると。 “データのお砂場(52) R言語、esoph、食道がんの症例対処研究とな?” の続きを読む
データのお砂場(51) R言語、Discoveries、複数年ある最小値の年を知る
R言語のサンプル・データセットをABC順(大文字先)で端から眺めております。解説ページ見るとデータセット「Source」などにデータの出元が記載されとります。わざわざ調べたりしないのですが、今回は灯台下暗し。手元にSourceの本がありました(Editionは違うケド。)あったからといってなんのこっちゃなんだけれども。
“データのお砂場(51) R言語、Discoveries、複数年ある最小値の年を知る” の続きを読む
データのお砂場(50) R言語、crimtab、スチューデントの「t分布」登場
今回のサンプル・データセットのタイトル、「Student’s 3000 Criminals Data」を見て「学生さんの犯罪データ??」と思った私は、統計素人、いやモグリです。記憶の奥底に「スチューデントのt分布」という言葉はあったものの、タイトルの「Student」が偉大なるかなスチューデント様と気づかなかったとは。
“データのお砂場(50) R言語、crimtab、スチューデントの「t分布」登場” の続きを読む