R言語のサンプルデータセットという覗き穴から世界を眺めております。今回から bootパッケージに含まれるサンプルデータセットを見て回りたいと思います。その初回はacmeとな。何じゃらほい?と思ったら実在した会社のお名前でした。ACME-CLEVELAND社とな。どうも他社に買収される数年前の会社の「成績表」みたいっす。
データのお砂場(90) R言語、benchmark64.data、bit64パッケージ
前回、R言語の中にあって各種サンプルデータセットを提供してくれているdatasetsパッケージに含まれているデータセットをついに舐め終わりました(身についているのかは怪しいケド。)今回からは他のパッケージに含まれているサンプルデータセットを眺めていきたいと思います。最初はbit64パッケージとな。 “データのお砂場(90) R言語、benchmark64.data、bit64パッケージ” の続きを読む
データのお砂場(89) R言語、women、30代米国女性の身長と平均体重とな
R言語所蔵のサンプルデータセットをABC順(大文字先)で見ています。今回はwomenです。ついに「コンプリート」。とはいえdatasetsパッケージに含まれているデータセットの「舐め終わり」でしかありませぬ。実は他のパッケージにももろもろサンプルデータセットが含まれてます。R言語の練習の種は尽きまじ。 “データのお砂場(89) R言語、women、30代米国女性の身長と平均体重とな” の続きを読む
データのお砂場(88) R言語、warpbreaks、織機での「糸切れ」回数、糸と張力
R言語所蔵のサンプルデータセットをABC順(大文字先)で見ています。今回はwarpbreaksです。ワープで何を思い浮かべるかは人それぞれかと。織機を思い浮かべるのは「正統」ではあるけれども少数派ではないかと想像。宇宙船想像するのが日本人の多数派か?GPUなどプログラムしている人は計算単位のワープを思い出すかも。
“データのお砂場(88) R言語、warpbreaks、織機での「糸切れ」回数、糸と張力” の続きを読む
データのお砂場(87) R言語、volcano、ニュージーランドMaungawhau火山
R言語所蔵のサンプルデータセットをABC順(大文字先)で見ています。今回はvolcanoとな。火山といって何処の?ニュージーランドでした。噴火の履歴的なもの?でも違いました「相手」は単成火山です。「火山業界?」における一発屋的な、1回噴いたら同じ場所では噴かない奴です。アッチで噴いて、コッチで噴いて。たまや~鍵屋~
データのお砂場(86) R言語、uspop、米国の人口(国勢調査)、1790-1970
R言語所蔵のサンプルデータセットをABC順(大文字先)で見ています。今回はuspop とな。popといったってポップミュージックではありませぬ、人口のpopulation の方です。例によって古いデータセットです。1790年から1970年までの約200年間、第1回の国勢調査から10年毎の調査データらしいです。
データのお砂場(85) R言語、trees、ブラックチェリーの直径、樹高、体積とな
ABC順(大文字先)で順番に見ているので、前回は treering(年輪)、今回は trees です。サンプルデータ的には木材の体積を木の直径と樹高から割り出すための「回帰式」をつくるためのものみたいです。対象になっている樹木は「ブラックチェリー」とな。日本では「アメリカンチェリー」と言うみたい。知らんけど。 “データのお砂場(85) R言語、trees、ブラックチェリーの直径、樹高、体積とな” の続きを読む
データのお砂場(84) R言語、treering、約8000年間の年輪幅データとな
今回のデータはいままで見てきたサンプルデータの中で一番長大なデータかもしれないです。約8000年間の年輪の幅のデータです。カリフォルニアはシェラネバダ山脈の山中に生えている Bristlecone Pine という長寿命の木について調査した結果です。データは長大、でも幅だけ。これだけ見たらばどうしたら良いのという感じ。
“データのお砂場(84) R言語、treering、約8000年間の年輪幅データとな” の続きを読む
データのお砂場(83) R言語、swiss、「人口転換期」の出生率と社会経済指標とな
今回のデータは約150年まえのスイスにおけるデータです。古いけれどもこのタイミングには意味があり「人口転換期」であったのだそうな。当時の日本(明治21年)は後進国であったけれどスイスではいち早く出生率の低下がみられていたように推察されます。日本とはちょっと違う?しかしスイスでも地域格差はハッキリしていたみたい。
データのお砂場(82) R言語、sunspot.year、時系列データの小技あれこれ
R言語所蔵のサンプルデータセットをABC順(大文字)優先で拝見させていただいとります。前回、前々回と太陽黒点関係のデータセットが続いています。正直飽きました。しかし今回は太陽黒点らしい解析など絶無。だただた時系列データを「いじる」ときに必要な小ネタ、TIPSの特集という感じです。勉強になったなあ。ホントか? “データのお砂場(82) R言語、sunspot.year、時系列データの小技あれこれ” の続きを読む
データのお砂場(81) R言語、sunspot.month、オケイジョナリにアップデート?
R言語所蔵のサンプルデータセットをABC順(大文字)優先で拝見させていただいとります。前回は太陽黒点関係のデータセット3種を一気にロードして比較してしまいました。しかし似ていても異なるデータセットです。個別に処理例が付属しております。今回はsunspot.monthデータセットの処理例をそのまま練習してみます。 “データのお砂場(81) R言語、sunspot.month、オケイジョナリにアップデート?” の続きを読む
データのお砂場(80) R言語、sunspots、太陽黒点数の月次データとな
R言語所蔵のサンプルデータセットをABC順(大文字)優先で拝見させていただいとります。今回はsunspots、太陽黒点数データです。毎度サンプルデータセットのデータは古いよなどとブー垂れてましたが今回は古いことにも意義があります。3つのデータセットをあわせると1700年以来2014年までのデータが含まれている、と。
“データのお砂場(80) R言語、sunspots、太陽黒点数の月次データとな” の続きを読む
データのお砂場(79) R言語、state、米国50州のFacts and Figures
今回のデータは米国50州の「各種」データです。見ていて飽きませんが、例によって古いです。ほぼ50年以上前にまとめられたデータですが、項目によっては100年近く前に遡るデータもあり。まあこの手のデータだと、地図上に表したくなるのが人情?というもの。実際、処理例では米国地図を描いて一部を表示してみてます。地図の練習回? “データのお砂場(79) R言語、state、米国50州のFacts and Figures” の続きを読む
データのお砂場(78) R言語、stackloss、オストワルト法の「逆効率」データとな
今回のデータセット、stackloss名と別に、stack.xとかstack.lossという名でも呼び出せるみたいです。独立変数3個がstack.xで、従属変数1個がstack.loss。stacklossには「もれなく」両方入っているのでこれをロードすりゃええ、というこってす。今回のデータはなんだ、無機化学?
“データのお砂場(78) R言語、stackloss、オストワルト法の「逆効率」データとな” の続きを読む