ABC順(大文字先)で順番に見ているので、前回は treering(年輪)、今回は trees です。サンプルデータ的には木材の体積を木の直径と樹高から割り出すための「回帰式」をつくるためのものみたいです。対象になっている樹木は「ブラックチェリー」とな。日本では「アメリカンチェリー」と言うみたい。知らんけど。
※「データのお砂場」投稿順Indexはこちら
Black Cherry Trees
サンプルデータセットの解説ページへのURLは以下です。
Diameter, Height and Volume for Black Cherry Trees
上記解説ページには、Black Cherry Treesと書かれています。どんな木なのかキになるので調べたところ、以下の North Carolina大 様のページに写真多数と解説がありました。
Prunus serotina, Common Name(s): Black CherryWild CherryWild Rum Cherry
上記をみると、学名 Prunus serotina、Common Name(つい俗名と書こうとしたけどこりゃ違うし) Black Cherry みたいです。材木として家具などに使われるそうです。香りが良いので燻製のチップにも使われるみたいです。以下のページが詳しいデス。「世界の有用木材950種から和名で検索の結果」より
日本では材木として「アメリカンチェリー」と呼ばれているみたいですが、ちょっと気になったのは、スーパーで売られている米国産の「さくらんぼ」、あれも「アメリカンチェリー」と呼ばれることがあるんじゃないかと思います、との関係です。食べ物の方は以下に。
アメリカンチェリーの特徴!ブラックチェリーやダークチェリーと違いは?
上記では「ブラックチェリー」は別品種で、実は食べられるけれど流通することは少ない、とあります。ノースカロライナ大様のページにはPrunus serotinaの果実の写真もでていますが、形こそサクランボだけれども実がとても小さいです。
さてサンプルデータセットに戻ります。データセットは、切り倒した31本のブラックチェリーの木に関するデータとして、各3項目のデータであるようです。3項目が以下に。
-
- Girth、英訳的には「幹周」となる筈が、データセットのエラーで実は直径
- Height 高さ
- Volume 体積
直径はインチ[2.54cm]単位、 高さはフィート[0.3048m]単位、体積は立方フィート[28.32L]単位です。
まずは生データ
まずはサンプルデータセットをロードしてデータの形式を確かめます。
データセットはデータフレーム形式でした。summaryをみるとそれぞれのフィールドの「バラツキの雰囲気」が分かりますが、インチ、フィートではいまいち実感に乏しいので、MAX値をメートル系に換算しておくと以下のようです。
-
- Girth 実は直径、最大 20.6inch=52.324cm
- Height 高さ、最大 87ft=26.52m
- Volume 体積、最大 77cubic feet、2180リットル
処理例に従って処理してみる
今回のデータセットには処理例が付属しているので、その通りに処理してみます。まずはプロットから。3種類も描いてます。
pairsの結果が以下に。
体積(Volume)と直径(データセット上ではGrith)の関係をプロットしたものが以下に。
coplot(コンディショニング・プロット)の結果が以下に、log(体積)~log(直径)を軸に、高さを条件にしているもの
当然、材木がどれだけとれるの?という目的のためだと思うので、グラフを描いた後は、回帰分析しとります。まずは単純に直径(Grithと書いてあるケド)と体積の関係。
さらに、AIC(赤池情報量基準)を使ったステップワイズ法を実施。もとより統計素人、ステップワイズ法って何ですか状態デス。赤池情報量基準についても同様。これはまた後で別途お勉強の必要ありということで。結果のみ。
上記の結果を見て、処理例では以下のようにコメントありです。1か所引用させていただきます。
## i.e., Volume ~= c * Height * Girth^2 seems reasonable
一瞬流石と思ったですが、あたりまえですがな。Grithは直径なので、体積は高さ×直径x直径x比例定数であると。それって円筒の体積の公式もどき。形状は円筒じゃなくても、高さに比例し直径の二乗に比例するというのはまず避けられないのではないかと。