今回のサンプルデータセットはBramblesです。辞書を引くと「イバラ」。その空間分布、何じゃらほいという感じっす。英米的にはブラックベリーやラズベリーなどのキイチゴ属を指すみたい。そして茎(杖という表記もあり?)の年数で実の付き方が変わることがあるみたいです。剪定するには年数の見極めが大事?
※「データのお砂場」投稿順Indexはこちら
R言語向けのパッケージ boot には、サンプルデータセット多数が含まれております。それを ABC順に「舐めて」ます。今回のサンプルデータセットはBramblesとな。
Brambles
”Rubus”とタイプしようとして、無意識に”Rambus”と打っていたこの年寄は電子デバイスに毒されております。今年の夏の猛暑によって伸びきった庭の雑草刈を迫られつつもまだ暑いと逃げてます。園芸の知識など皆無。
Bramblesとは何、ということでWebを調べてみました。まずは、その言葉の指すものについて。以下は米国のサイトだと思います。「GARDENER’S PATH」様のページです。
ALL ABOUT BRAMBLES: THE MANY MARVELOUS PLANTS IN THE RUBUS GENUS
“RUBUS”属には多数の品種があり、食用になる実がつくものが多いので栽培品種も多いみたいです。上記のサイトを参照させていただくと、英国、米国北東部、米国西部、場所によってBRAMBLEが指す品種は異なるみたいです。上記はその「ALL ABOUT」っす。充実。
元のサンプルデータセットは、ケンブリッジ大プレスの発行なので、データは多分英国で測定されたものでしょう。英国ではどうよ、と探してみると以下のサイトを発見。「WOODLAND TRUST」様のページです。
上記をみると、英国ではブラックベリーが代表選手みたいです。美味しそう?なブラックベリーのお写真が上記ページのトップにあり。
一方、米国のサイトですが「Gardening know how」様の以下のページを拝見しました。
What Are Brambles – Learn What Makes A Plant A Bramble
上記より、1か所引用させていただきます。
Bramble varieties may be summer-bearing, producing fruit just once each summer, or primocane-bearing, which means both first-year and second-year canes bear fruit at different times. Knowing which you have is important for pruning.
上記から「枝の年数」によって実の付き方が変わるみたいです。これから実が付く枝を刈り払ったりすると大変だ。
Spatial Location of Bramble Canes
さて、サンプルデータセットはシンプルで、9mx9mの正方形の土地に生えているBrambleの枝について、そのx、y座標と年数、今年は0、1年目は1、2年目は2を記録したものです。きっとトゲトゲが沢山あるなかに入って数えたんじゃないかと想像します。痛くなかったのかしら?
まずは生データ
bootライブラリをとりこんだあと、以下でサンプルデータセットを使用できるようになります。
data(brambles)
以下で、データセットの形式を確かめてみました。シンプルな data.frameね。x, y座標の横に年数(age)が記されているだけのもの。
なお、今回の処理にあたって、以下のライブラリを使用可能としております。
boot dplyr ggplot2
何年目の枝が全部で何本あるの?という疑問について計算してみました。dplyrのお陰です。
brambles %>% count(age)
空間分布をプロットしてみる
空間(といっても2次元ですが)座標が含まれてます。その空間分布は散布図使えば描けるんじゃね、ということで描いてみました。gglot2使用。
g0 <- ggplot(brambles) + geom_point(mapping=aes(x=x, y=y, color=age)) g1 <- g0 + ggtitle("Spatial Location of Bramble Canes") g1
結果が以下に。枝があるところと無いところがあるけど、人間が歩くところもいるだろうからな~。どんな感じで植わっているのか不明。
上記の図をみて、ここからどう処理したものか困りました。苦し紛れに、上記図をスライス。
まずは一番古い2年目の枝のみのプロット
brambles.a2<-brambles[brambles$age==2,] g2 <- ggplot(brambles.a2) + geom_point(mapping=aes(x=x, y=y)) g2a <- g2 + ggtitle("Spatial Location of Bramble Canes, AGE=2 only") g2a
次は1年目の枝ね。処理は以下同文です。上の古い枝の近くに「発展」している感じ?
最後は初年、新興の元気のよい?やつらね。
こうしてプロットしても次の処理ステップを思いつかんよなあ。ましてやブートストラップ法をどう使うの?枝をサンプリング抽出して距離の平均値でも計算してみる?なんだかな~意味あるのかな~分からんよな~。トホホ。