R言語所蔵のサンプルデータセットをABC順(大文字先)で見ています。今回はwomenです。ついに「コンプリート」。とはいえdatasetsパッケージに含まれているデータセットの「舐め終わり」でしかありませぬ。実は他のパッケージにももろもろサンプルデータセットが含まれてます。R言語の練習の種は尽きまじ。
※「データのお砂場」投稿順Indexはこちら
今回のサンプルデータセット
サンプルデータセット women の解説ページは以下にあります。
Average Heights and Weights for American Women
米国の女性、30代に限った、の身長、平均体重のサンプルデータセットです。1インチ刻みの身長に対して、「そのクラスの」平均体重をリストしたもののようです。詳細は不明、多分1970年代の研究データから持ってこられたものらしいデス。
米国なので、身長はインチ、体重はポンドです。まあ、インチ、ポンドは良いとして、この数字は部屋着と靴を履いたままのデータみたいです。日本での身体測定というと、靴は脱いでいるし、衣服の重さは「一律xxg差っ引く」みたいな操作をしているのが普通じゃないかと思います。そのまま鵜呑みにして日本のデータとは比較できないでしょう、多分。
なお、インチ、ポンドとセンチメートル、キログラムの換算は以下で。
-
- 1 [inch] 2.54 [cm]
- 1 [lbs] 0.453592 [kg]
まずは生データ
データは、通常のデータフレームです。最初、単に15名様分の個人データかと思っていたので、素でsummaryとってしまいました。
実際には「インチ毎のクラス」の平均体重のようです。
とりあえずcm/kgに換算
インチとポンドではイマイチなので、換算してみたものが以下に。
やっぱりこちらの方がしっくりくるなあ。
プロット
今回の解説ページには処理例があるものの、以下のようにしたプロットだけです。
プロットが以下に。
やっぱり、インチとポンドはイマイチなので、換算した方で再プロットしてみました。
plot(women.conv, xlab = "Height (cm)", ylab = "Weight (kg)", main = "women data: American women aged 30-39")
個人の感想などはひかえさせていただきます。