データのお砂場(136) R言語、tuna、ミナミマグロの航空調査、{boot}

Joseph Halfmoon

Rのサンプルデータセットを巡りながら、この世の不思議について学ぶ年寄です。今回はパッケージ「Boot」のサンプルデータセットの中から tuna とな。美味しいミナミマグロ、しかし絶滅危惧種。生息している群れ(school of tuna)の数の調査に aerial line transect survey 適用っと。

※「データのお砂場」投稿順Indexはこちら

Southern Bluefin Tuna

今回のサンプルデータセットは、オーストラリア南方(ということは南極に近い方ね)グレートオーストラリア湾(the Great Australian Bight)におけるミナミマグロ(Southern Bluefin Tuna)の調査データです。

食用にされるマグロにもいろいろありで、以下の『鮪一筋30年の丸長』様の

マグロってどんな種類があるの?

という記事を拝見するに、ミナミマグロはインド洋でとれるのでインドマグロとも言われるらしいです(オーストリア政府的にはグレートオーストラリア湾はインド洋ではない、南氷洋だという見解らしいです。知らんけど。)なお、学名、分類等については『ぼうずコンニャク』様の

市場魚介類図鑑 マグロ属

に各マグロが写真付きで掲載されていました。あざ~す。

さて、Southern Bluefin Tunaについては、『オーストラリア政府』様の、そのものズバリのページがありました。

Southern Bluefin Tuna

上記ページには漁獲量(絶滅危惧種でもあり、厳しく規制されているみたい)、漁獲方法その他について詳しく説明されています。ざっくりまとめてしまうと、

    • グレートオーストラリア湾(ポートリンカーン沖あたりらしい)では、夏場にきんちゃく網漁(Purse Seines)
    • 東方のニューサウスウェールズ州沿岸では、冬場に延縄漁(Longlining)

ということらしいです。オーストラリア政府様の上記のサイト内に美麗なLonglining漁の説明図があったのでお惚け老人も理解することができました。しかし、肝心のグレートオーストラリア湾では旋網(巻き網)の中でも「きんちゃく網」を使う漁法らしいのですが、図が見つかりませんでした。探したら『NOAA(アメリカ海洋大気庁) FISHERIES』様の以下ページに解説図がありました。これまたあざ~す。

Fishing Gear: Purse Seines

Tuna Sighting Data

サンプルデータセットの解説ページが以下に。

Tuna Sighting Data

グレートオーストラリア湾におけるミナミマグロの生息数(グループ数、school of tuna)を推定するための航空調査のサンプルデータセットのようです。以下のように唱える手法です。

aerial line transect survey

まばらに分布した個体群を航空機を使って調査するための方法としてはどうも確立した手法みたいです。調べてみると、ジンバブエのゾウの生息数の推定とか、アラスカでのヘラジカの生息数とか、飛行機でないとなかなか調べきれなさそうなターゲットに対する調査に同様な手法が適用されていることが分かりました。

上記のサンプルデータセットの解説ページは素っ気なくて、何がなんやら、どう処理するものだか手がかりもないのですが、アラスカのヘラジカ調査の文献にいろいろ書かれてました。

Line Transect Moose Surveys.doc

飛行機を「ランダムに選んだ(サンプリングってことだね、多分)直線的な経路を」飛ばして、その上から見える個体(グループ)までの距離(経路に垂直方向)を記録するという方法っす。当然、遠くになると「見落とし」があるんでないの、と思われるのですが、その見落としを逆手にとって実際に検出できる確率を推定するみたいです。そして、その推定のなかにしっかり「ブートストラップ法」も組み込まれてました。

先ずは生データ

生データをロードしてみたところが以下に。tunaRawData

データはシンプルなデータ・フレーム、たった1列です。数値は飛行機からの垂直方向距離(マイル)のみです。

ヒストグラムを描いてみる。

aerial line transect surveyの最初の一歩は、ヒストグラムを描くことみたいです。操作はこんな感じでどうよ。

hist(tuna$y, xlab="perpendicular distance[miles]", main="Tuna Sighting Data")

上記で描かれたグラフが以下に。tunaHist

当然、距離が遠くなる右の方ほどFrequencyが少ないです。しかし、広い海原にほぼ均等(そうでなくてもランダムな調査経路で調査を繰り返せば)にマグロどもが群れていて、仮に距離に関係なく「すべて」検出できるとすれば距離にかかわらずFrequencyは一定なグラフに近くなる筈。どうもこの距離による見掛けの検出率の落ち込みから「真の数」を推定し、その先の解析につなげているみたい。知らんけど。

ヘラジカの件の論文をよく読んだら、処理できるのかもだけれども、結構いろいろあるようだったので、本件はここまで。手抜きだよ。

データのお砂場(135) R言語、tau、タウ粒子の崩壊モード、{boot}へ戻る

データのお砂場(137) R言語、urine、シュウ酸カルシウム結晶と尿の特性、{boot} へ進む