データのお砂場(89) R言語、women、30代米国女性の身長と平均体重とな

Joseph Halfmoon

R言語所蔵のサンプルデータセットをABC順(大文字先)で見ています。今回はwomenです。ついに「コンプリート」。とはいえdatasetsパッケージに含まれているデータセットの「舐め終わり」でしかありませぬ。実は他のパッケージにももろもろサンプルデータセットが含まれてます。R言語の練習の種は尽きまじ。

※「データのお砂場」投稿順Indexはこちら

今回のサンプルデータセット

サンプルデータセット women の解説ページは以下にあります。

Average Heights and Weights for American Women

米国の女性、30代に限った、の身長、平均体重のサンプルデータセットです。1インチ刻みの身長に対して、「そのクラスの」平均体重をリストしたもののようです。詳細は不明、多分1970年代の研究データから持ってこられたものらしいデス。

米国なので、身長はインチ、体重はポンドです。まあ、インチ、ポンドは良いとして、この数字は部屋着と靴を履いたままのデータみたいです。日本での身体測定というと、靴は脱いでいるし、衣服の重さは「一律xxg差っ引く」みたいな操作をしているのが普通じゃないかと思います。そのまま鵜呑みにして日本のデータとは比較できないでしょう、多分。

なお、インチ、ポンドとセンチメートル、キログラムの換算は以下で。

    • 1 [inch] 2.54 [cm]
    • 1 [lbs] 0.453592 [kg]
まずは生データ

データは、通常のデータフレームです。最初、単に15名様分の個人データかと思っていたので、素でsummaryとってしまいました。womenRawdata

実際には「インチ毎のクラス」の平均体重のようです。

とりあえずcm/kgに換算

インチとポンドではイマイチなので、換算してみたものが以下に。womenCONVRawdata

やっぱりこちらの方がしっくりくるなあ。

プロット

今回の解説ページには処理例があるものの、以下のようにしたプロットだけです。womenPlotOpr

プロットが以下に。

womenPlot

やっぱり、インチとポンドはイマイチなので、換算した方で再プロットしてみました。

plot(women.conv, xlab = "Height (cm)", ylab = "Weight (kg)", main = "women data: American women aged 30-39")

こんな感じ。womenConvPlot

個人の感想などはひかえさせていただきます。

データのお砂場(88) R言語、warpbreaks、織機での「糸切れ」回数、糸と張力 へ戻る

データのお砂場(90) R言語、benchmark64.data、bit64パッケージのベンチマーク結果とな へ進む