R言語付属のデータセットをアルファベット順(大文字優先)で眺めてます。今回のデータセット名は islands。しかし島ばかりでない、大陸も含めたメジャーな土地の面積の羅列です。なにか統計処理するほどでもない、せいぜいランキングを作るくらい?のもの。クイズ豆知識か?でも眺めてみると意外と知らない名前の島があること。
※「データのお砂場」投稿順Indexはこちら
今回データセットの解説ページ
解説ページが以下に。データセット名は islands ですが、解説のタイトルでは landmasses です。大陸まで含めて islands とよぶのはちょっと気が引けるので、こちらの命名の方が座りが良い感じ。
Areas of the World’s Major Landmasses
データの出所は、The World Almanac and Book of Facts の1975年版です。以前の回で、私も1986年版ならもっているもんね、と書棚の奥から取り出してみたもの。まあ、地球温暖化で海水面の上昇が気になる今日この頃ではありますが、土地の面積はまだそれほど変わりますまい。なにせ単位が、
10000平方マイル
なんであります。1平方マイルは米国にいたらすぐに具体的な面積がイメージできる単位じゃないかと思います(米国西部は一種の「条里制」の場所が多く、1マイルおきに縦横に主要道路が走っていることが多いです。その1区画とな。)
日本的に1平方マイルを1平方キロメートルに換算すると以下のとおり。
1万平方マイル、つまりは2.59万平方キロメートルは、県でいうと岩手県と青森県を合わせた面積よりちと大きいくらい。もっと言えば東京都であれば十数個も入る広さであります。
まずは生データ
生データは数値ベクトルです。ただし、R言語はアトリビュートとてベクトルの各要素に対応するお名前を付けることなどできるので「ネームド・ベクタ」であります。48個の「島」のお名前とその面積(単位10000平方マイル)とな。
処理例にしたがってグラフ化
データセットの解説ページに処理例がありますが、dotchart を使ってグラフ化するだけのものです。
まずは「素の」アルファベット順でプロットするもの。
結果が以下に。abc順ですが、aが原点近くの一番下にあるので一番上には、Victoria島が来てます。2番目はVancouver島。どちらもカナダの島ですが、Victoria島はカナダ北方の北極諸島中の寒くて荒涼としていそうな島です。知らんけど。一方、Vancouver島は大都市バンクバーのすぐ対岸にある自然の豊かな島であります。Vancouver島の中にはブリティッシュコロンビア州の州都、小さいけれど、欧風でこじゃれた街Victoriaもあると、Victoria違いの小ネタね。
アルファベット順ではどうもいかん、と思ったのか、処理例では面積順にソートしたプロットもやってます。
ただソートしただけでは豆知識になりずらかろうということで、ちょっと手を加えてみましたぞ。
大陸とそれ以下の島々の間に赤線を一本。
赤線の左側が島ですが、その島々の中ではグリーンランドが別格、横綱。以下、ニューギニアからスマトラにいたる三役格の5島があり、それより下の前頭の列との間にはギャップがあります。わが本州島はその列の最初に登場しとりますな。前頭筆頭?
念のため、黄色のマーカで日本国に「所属」の島を表しました。また、ランキングに多数入っているのだけれどあまりお馴染みでない(中には無人島もある)カナダ極北の島々には青色マーカつけましたです。他の島々は有名どころであります。
今回はただの豆知識で終わったな。いいのか。