データのお砂場(122) R言語、manaus、マナウスでのリオネグロ川の水位、{boot}

Joseph Halfmoon

Rのパッケージ「Boot」に含まれるサンプルデータセットをabc順に経めぐってます。前回はスコットランドのアイラ島の「岩」でした。今回はブラジルはマナウス市の川の水位です。マナウスって、確かアマゾン川の真ん中辺にある町だったよな。。。アマゾン川の水位ってそんなに変動するのか?わからんなあ。

※「データのお砂場」投稿順Indexはこちら

マナウス

広大なアマゾンのど真ん中といいつつ、アマゾン奥地という表現は不適切な気がするマナウス市です。人口222万人(2020年)とな。思ったよりデカい町なのね。ただし、水路、空路はあれども陸路的には陸の孤島なんだとか。その辺の情報は、『在マナウス日本国総領事館』様の以下のページを拝見いたしました。

マナウス案内

上記ページより、川の幅と深さに関する情報を引用させていただきます。

マナウス市街地は、アマゾン河の本流にあたるソリモンエス河とその支流であるネグロ河の合流点から、ネグロ河の約10km上流にあるマナウス港を中心に広がっています。なお、同港付近では、対岸との川幅は約7km、水深は約30~40mあり、常時1万トンクラスの外航船の接岸が可能となっています。

ということであります。データとしてはネグロ河の水位ということなんだろうけれど、ほぼほぼイコールでアマゾン本流水位ではないかと。

例によってGoogleストリートビューを見ていて気付きましたが、広っろい川に橋かかっているじゃん。さすが220万都市。あ、でもこれネグロ河か。アマゾン本流の方には橋かかってないのね。海岸から1500km上流にして川幅7kmもあると。日本じゃ利根川の一番広いところでも1kmくらいじゃなかったか。

Average Heights of the Rio Negro river at Manaus

さて、今回のサンプルデータセットの解説ページが以下に。

Average Heights of the Rio Negro river at Manaus

水位の測定値はメートル単位、毎日測定したものの月平均だとのことです。測定期間は1903年から約90年間。データは港付近のゲージの特定の点に対する相対値みたいです。海抜ではありません。なお、マナウスは海岸から1500kmも内陸だというのに、このゲージの基準にもなっている教会は海抜約36mしかないようです。ただし先ほどのマナウス案内を参照すると、マナウス市街には凸凹が多くて結構坂道だらけみたいっす。

先ずは生データ

生データを読み込んだところが以下に。manaus_rawdata

1080点(12点/年)の時系列データです。ずらずらと水位(対基準点、m)が並んでいるデータです。サマリとってみるとこんな感じ。manaus_summary

 

平均値はほぼ0であるので、平均水位0の点を基準点としてデータを取っている感じのようです。MaxとMinに印をつけましたが、高い方は約5m、低い方は約7mも平均と異なります。高低差12mもあるのに港が機能しているのは、やはり河川港として何か工夫しているのだろうな、と想像。

最大、最小を与えた時期を調べてみたかったので、以下のようにしてみました。

time(manaus)[which.min(manaus)]
time(manaus)[which.max(manaus)]

結果が以下に。manausWhichEC

time関数使うと十進で月表示してくれるので換算がメンドイです。結果をみると最低水位は1926年5月。最高水位は1973年10月。

ts.plotでデータをプロットしてみました。

ts.plot(manaus)
title(main="Average Heights of the Rio Negro river at Manaus")

プロット結果に上記のMIN/MAX点を書き加えたものが以下に。manaus_tsplot

この手の時系列データなら季節変動じゃね?

ということで季節変動をグラフにしてみることにいたしました。使用するのは以前お世話になったstl関数(Seasonal Decomposition of Time Series by Loess)です。こんな感じ。

manaus.stl <- stl(manaus, s.window = "periodic")
plot(manaus.stl)
title(main="Average Heights of the Rio Negro river at Manaus")

プロット結果が以下に。manaus_stl

確かに季節変動あるみたいだけれども、数値がとても小さくないか。上のデータを眺めてみるとこんな感じ。manaus_STLresult

 

季節変動分は、ミリメートル単位ね。ほとんどドーデモいい感じ。それよりも長周期の「トレンド」変化と、結構短い周期で変化する「それ以外」が同じくらいデカイように見えます。これらの要因は何。そして、bootパッケージのサンプルデータに含まれているということは何等かのブートストラップ法を適用せよ、という意図なのだろうけれど、どうしたら良いのか?

統計素人の老人には分からんよなあ。いつものことか。

データのお砂場(121) R言語、islay、アイラ島の珪岩の古磁気の方角、{boot}へ戻る

データのお砂場(123) R言語、melanoma、悪性黒色腫の生存データ、{boot} へ進む