R言語所蔵のサンプルデータをABC順に眺めてます。今回はlatticeパッケージのsinger、歌手の皆さまの身長のデータです。お惚け老人はソプラノというと身長低めな女性、バスというと体格の良いおじさんを想像。それって老人の偏見?まあこのデータを見ると分かるかも知れんけど。身長だけ、体重はないのだけれど。
※「データのお砂場」投稿順Indexはこちら
※使用させていただいている Rのversionは 4.3.1。RStudioは 2024.04.2+764 “Chocolate Cosmos” です。
singer
今回のサンプルデータセットの解説ページは以下です。
Heights of New York Choral Society singers
素のまま訳すと「ニューヨーク合唱協会」?となる組織に属する歌手の皆さま多数の身長のデータです。素人老人が知らなかっただけで、世界の大都会、ニューヨーク市の音楽シーン(多分クラシック)に欠かせない主要な歌手の皆さまが多数在籍されている組織みたいです。URLが以下に。
所属歌手の皆さまを以下の8つのセクションにわけて、それぞれ身長(インチ単位)を記録しておるデータベースです。
-
- ソプラノ1
- ソプラノ2
- アルト1
- アルト2
- テノール1
- テノール2
- バス2
- バス1
素人老人は、ソプラノにも1と2があり、とかまったく知識がなかったので、例によってGoogle Gemini様にお伺いをたててしまいました。こんな感じ。
どうも、「1」がつくのは、ソプラノ、アルト、テノールについては音域の高い方みたいっす(Gemini様のお言葉が正しければ。知らんけど。)しかし、バスは低い方が1なのね~。つい周波数でハッキリしてくれ、と思う老人は芸術を理解せぬ不届きものです。
一方、調べると以下のようなセクション分けもあるみたいです。
-
- ソプラノ
- メゾソプラノ
- アルト
- テノール
- バリトン
- バス
こっちの方が聞いたことあるかも。
先ずは生データ
生データは身長とパートだけのシンプルなデータ・フレームでした。
身長はインチ単位なのでイマイチですが、60インチはかなり低め、70インチは178cmくらい、80インチともなると2Mを超えてアーロン・ジャッジ的な巨人っす。
処理例
今回も latticeパッケージ所蔵のサンプルデータセットということで、処理例が掲載されてます。そのままそれを実行してみただけ。
-
- histogram
latticeパッケージでもヒストグラムは使えますが、ここではパート毎に個別のグラフになるように整理してくれてます。処理コマンドが以下に。
-
- Quantile-Quantile plot
クオンタイル・クオンタイル・プロットという関数をあり、これを使うと回帰直線まで描いてくれるみたい。
まあ、処理例どおりだ、グラフは描ける。