前回は diamondsデータセットのお値段とカラット数の散布図を作り、clarityなどで各点の色を塗り分けてみました。今回も diamondsデータセットの続きです。今度はfacetを使い、「切り口」を変えたプロットを並べてみたいと思います。1枚のプロットにダイアモンドの「4C」パラメータを全部載せだっ。
データのお砂場(150) R言語、diamonds、scaleを変えてみる{ggplot2}
今回から ggplot2 パッケージです。ggplot2自体は「美麗な」グラフを描きたいときにお世話になってきたパッケージ。その中にもサンプル・データ・セットあり。当然、ggplot2 でグラフ化するためのデータです。今回使ってみるのは diamonds データセット。パッケージ付属の中では一番参照されているサンプル?
データのお砂場(149) R言語、max_chroma_table、{colorspace}
前回から colorspace パッケージに「侵入」してます。colorspaceパッケージはグラフに彩りを与えるためのお道具箱デス。素人老人の密な楽しみ、「サンプル・データ」の中にこの世の不思議、世界の秘密を発見する、には不向きなパッケージっす。含まれているのはお道具のためのデータベース、単なる数値の集まりね。
“データのお砂場(149) R言語、max_chroma_table、{colorspace}” の続きを読む
データのお砂場(148) R言語、USSouthPolygon、{colorspace}
R言語付属のサンプルデータセットをABC順に眺めてます。前回clusterパッケージ内のデータを舐め終わりました。今回からはcolorspace パッケージ。このパッケージは「グラフに色をつける」ことに特化したお道具箱。色彩パレットをいろいろ作れるみたい。付属データはあるにはあるけれどもデモ用の人工的なデータね。
データのお砂場(147) R言語、xclara、2変量で3クラスタ{cluster}
ABC順に眺めてきた clusterパッケージのサンプル・データ・セットも末尾に到達です。xclaraとな。「残念なこと」に人工データみたいです。データ処理を学ぶ観点からは残念も何もないのですが、サンプル・データ・セットの向こう側にこの世の仕組み、世界の不思議を目撃したいお惚け老人にとっては残念。
データのお砂場(146) R言語、votes.repub、昔の共和党得票率{cluster}
米国大統領選挙も近いです。サンプル・データ・セットをABC順に舐めているのでたまたまですが、今回はvotes.repubです。約170年前から約50年前にいたる合計31回の米国大統領選挙における共和党の州別得票率データです。これをみるに共和党(そしてその相手の民主党)はダイナミックに変化してきておるのだと。
“データのお砂場(146) R言語、votes.repub、昔の共和党得票率{cluster}” の続きを読む
データのお砂場(145) R言語、Ruspini、「ファジィな」?、{cluster}
忘却力の年寄ですが「昔の事」は覚えているのです。前世紀末に近付いたころ、当時の記法では「ファジィ」と綴るものが家電製品やら何やらに蔓延っていた記憶、ファジィな洗濯機とかね。流行語になった?くらいなので当時広く「言葉は知られていた」けれど、何が何だか分かっている人は少なかったような。。。しかし最近はとんと聞かず。
“データのお砂場(145) R言語、Ruspini、「ファジィな」?、{cluster}” の続きを読む
データのお砂場(144) R言語、pluton、プルトニウム同位体混合比、{cluster}
前回は心休まる?植物の特徴データでしたが、今回は心休まらない?プルトニウムの同位体の混合比です。プルトニウムには非常に多くの同位体が存在するみたい。すべて放射性核種で半減期いろいろ。超微量天然にも存在する他は全て人工物のようです。元になった燃料の素性やら、原子炉の運転条件、その他によって同位体の混合比もバラバラ。
“データのお砂場(144) R言語、pluton、プルトニウム同位体混合比、{cluster}” の続きを読む
データのお砂場(143) R言語、plantTraits、植物の特徴、{cluster}
前回の「お花の特徴」ではお花の名前書いてないじゃん、と不平を述べてましたが、今回の「植物の特徴」では5文字の英字ですがお名前ついてます。しかし、サンプル・データ・セットがちょいと大き目です。136種類の植物種に対して31の因子についてのデータです。端から調べていくと何日かかかりそう。不平不満ばかりだな、自分。
“データのお砂場(143) R言語、plantTraits、植物の特徴、{cluster}” の続きを読む
データのお砂場(142) R言語、flower、お花の特徴、{cluster}
前回は極北の大地の土壌の奥の方の元素成分データでした。今回は土壌の上に育つ植物、それも「お花」をつける草本どもの特徴についてのサンプルデータセットです。育つ土壌もその特徴の中に入っております。ただし具体的なお花のお名前は排除されております。1番とか2番とか数字だけ。お花ではなく、その処理に集中しろと?
データのお砂場(141) R言語、chorSub、C土壌層の元素含有量{cluster}
今回のサンプル・データ・セットのタイトルは、Subset of C-horizon of Kola Data です。素人老人は、”C-horizon”って何? “Kola Data”って何?という世界です。解説ページには僅かな手がかりのみ。なんのこっちゃ?インターネットのお陰で出所は判明。それだけで嬉しい。しかしそれでどうするの? “データのお砂場(141) R言語、chorSub、C土壌層の元素含有量{cluster}” の続きを読む
データのお砂場(140) R言語、animals、動物のクラスタリング{cluster}
サンプル・データ・セットをダウンロードしたときの老人の密な楽しみは、数字の裏側にある世界の不思議、今だ知らぬ事象を目の当たりにすることです。そこで忘却力の老人は、毎度Rによる統計処理より背景調査?に勤しむのであります。しかし今回は調査の余地がありませぬな。つまらん?いやいや生成AIに問いかける題材が多数?
“データのお砂場(140) R言語、animals、動物のクラスタリング{cluster}” の続きを読む
データのお砂場(139) R言語、agriculture、EUの農業従事者{cluster}
今回からはRのパッケージ「cluster」所蔵のサンプル・データ・セットを経めぐりたいと思います。パッケージのお名前通り「クラスタリング」用のサンプルデータ多数みたいです。初回の今回は、agricultureとな。どうも今をさること30年ほど前のEU域内の農業従事者の特性を国別にクラスタリングするためのもののようです。 “データのお砂場(139) R言語、agriculture、EUの農業従事者{cluster}” の続きを読む
データのお砂場(138) R言語、wool、オーストラリア産ウールの相対価格、{boot}
長らく巡ってきましたパッケージ「Boot」のサンプル・データ・セットも今回のwoolで完了であります。「ブートストラップ法」のサンプルデータといいつつ、ブートストラップ法を適用してみたのはごくわずか。ただただ、お惚け老人がサンプルデータの向こうに世界の不思議を見てきたのみ。今回は「羊毛」です。どんな不思議があるのか? “データのお砂場(138) R言語、wool、オーストラリア産ウールの相対価格、{boot}” の続きを読む