データのお砂場(160) R言語、seals、アザラシのベクトル場???、{ggplot2}

Joseph Halfmoon

R言語所蔵のサンプルデータをABC順にて眺めてます。今回その順番にあたったのは ggplot2パッケージの seals です。sealsってアザラシだよね。サンプルデータの参考文献に上げられている論文は動物の移動に関するもの。しかし「処理例」通りに処理してみたらナンジャラホイ?お惚け老人には理解の外にあるデータっす。

※「データのお砂場」投稿順Indexはこちら

※使用させていただいている Rのversionは 4.3.1。RStudioは 2024.04.2+764 “Chocolate Cosmos” です。

EDA 探索的データ解析とsealsデータセット

今回のサンプルデータセットの背景にあるのは、EDA(exploratory data analysis)、探索的データ解析とよばれる考え方であるようです。お惚け老人はEDAというと慣れ親しんだ Electronic Design Automation を思い浮かべてしまうのですが、辺境の半導体業界に毒されたものの発想であるらしいです。

今回の seals サンプルデータセットに関する解説ページが以下に。

Vector field of seal movements

上記の解説ページでリファレンスとして挙げられている論文が以下です。

An exploratory data analysis (EDA) of the paths of moving animals
David R. Brillingera, Haiganoush K. Preislerb,Alan A. Agerc, John G. Kiec

https://www.stat.berkeley.edu/%7Ebrill/Papers/jspifinal.pdf

上記の論文では、ElkとDeerの移動の様子を地図上に「ベクトル場」として表示していたりします。なお、ElkとDeerが動き回っている土地の広さは、縦14km x 横 8 kmの範囲です。

一方サンプルデータセットでは seal がターゲットであるようです。sealってアシカ、オットセイ、アザラシ、何なんだけ?ということで探したところ、『こども英会話教室 ChoCco』様の以下のページが非常に分かり易いことに気づきましたぞ。これみたら何が seal なのか一目瞭然。ありがとうございます。

https://chocco-english.com/walrus-sea-lion-seal/

今回のデータセットは素直にアザラシということで良いのかなあ。。。

でもね、後々のデータをみると、sealsってアザラシさんじゃなくて、データを作製した「人のお名前」とかまったく別物じゃないの?という疑いをもったのであります。何も手がかりないんだけれども。

まずは生データ

今回は ggplot2パッケージ内のサンプルデータセットなので、ggplot2をライブラリ呼び出ししてあります。また、後ほどの処理例で地図データが必要になることが分かっていたので mapsパッケージも使えるようにしてから seals データを呼び出してます。sealsRawData

上記をみると、1155点ものデータが含まれているデータセットですが、含まれているのは lat(latinude、緯度)とlong(longitude、経度)、そしてそれぞれの差分であるようです。

素直に解釈するとlatとlongでベクトルの根本の位置を指定し、delta_logとdelta_latでベクトルの長さを指定しているようです。なお、最初の点を地球儀上でプロットすると太平洋のまんまん中に落ちました。アザラシ、こんなところにも住んでいる? ちょいと疑念が。。。

サンプルデータセットの処理例

どこかに処理例がある筈と思ってさがしたら、ggplot2のサイトの中の以下のページにありました。

Line segments and curves

geomsの沢山あるレイヤ定義の中の geom_segment() についての解説ページです。該当解説ページに掲載されている処理例のコードを引用させていただきます。

ggplot(seals, aes(long, lat)) + geom_segment(aes(xend = long + delta_long, yend = lat + delta_lat),arrow = arrow(length = unit(0.1,"cm"))) + borders("state")

上記の処理例の結果プロット(にお惚け老人の「個人の意見」を書き込んだもの)が以下に。sealsPlot0

まあ、上記の解説ページにもこのプロットが掲げられていたので、処理例そのものは「意図通り」にR上で処理できておる、と。そして確かに2次元ベクトル場が表示されておるようです。

しかしね、これがアザラシさんの動きだとすると意味分かりませぬ。プロットされた場の東端は、太平洋に面する3州を超え「海なし州」のアリゾナに入っております。海どころか荒野というか砂漠。こんなところにアザラシさんが住んでいるわけないっす。

それにほぼ東太平洋一面にわたって矢印が分布しております。島も何もない大洋の真ん中までアザラシさんが住んでいるのか?いくら泳げるといったって、沿岸ぞいに暮らしているんじゃなかろうか?それに太平洋のこんなに広い範囲でグリッド的にベクトルデータが取れていること自体、不思議。これが何か大気の動きとかその手のデータであれば納得いくけど。。。

これだけではなんともな~。これから「探索的データ解析」をやるのだという指令?ちょっとお惚け老人はついていけないっす。

データのお砂場(159) R言語、米国大統領の任期データ、{ggplot2} へ戻る

データのお砂場(161) R言語、txhousing、テキサスの住宅販売、{ggplot2} へ進む