前回は意味が良く分からないデータでしたが、今回は単純明快「オーストラリアの人口」です(Residentsという表現なので国籍的なものとはまた別かと。)データは1971年から1994年まで、既に四半世紀経過してますが、とても古いデータが多いRのサンプルデータセットの中では比較的新しい感じです。
※「データのお砂場」投稿順Indexはこちら
R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めております。今回のデータセットは austres です。データセットの解説ページが以下に。
Quarterly Time Series of the Number of Australian Residents
上記の説明を見てデータに「付け加えて」分かるのは、千人単位ということと、かつクオーターの数え方は暦年(財政年ではない)であることくらいです(March 1971からの4半期データと書いてあって、最初のレコードが 1971 Q2です。)
実に素っ気ないデータで、データによっては存在する「処理例」みたいなものも皆無です。テキトーに自力で(自分の興味の赴くまま)処理していくしかありません。
まずは生データ
プロットの結果が以下に、ほぼほぼ「線形」に増加してないかい。今更ながらだけれどもオーストラリア、伸びているのね。
トレンド解析
上のグラフをみれば一直線だろ~的にも思うのですが、一応、時系列データであればよくやる stl で解析してみました。
stl(austres, s.window="per") plot(stl(austres, s.window="per"))
数値的にはこんな感じ。
あれれ、seasonal のところに周期性がでている。stl関数に季節性の周期解析をせよといっているがためにムリヤリ見えている?本当に微妙な変動が存在するの?
ちょっと微妙過ぎて良く分かりませんな~。投げやり。
人口のうち、自然増についてはこれほどの周期性があるとは思えないので、「当局の手続き日程」的なものが微妙に影響を与えているような気がしないでもないです。思い出しました。まさに1990年代に、オーストラリアに移民した知り合いがおったのです。移民手続きのため「職務経歴」を証明するような書類が必要ということで作成してあげたことがあります。目出度く移民できたのですが、どうしているのかな~。
当然「お役所」の仕事なので、xxを何時いつまでにといった日程がありました。そのとき1回の「バッチ処理」で認められるのが数千人くらいだったような。とすると上記の周期性はそういう手続きの周期性の反映なのか。
でもま、線形的に「単調増加」しているようにも見えるので、回帰分析してみようと思いましたが、ts データでの処理の仕方を知りませぬ。そこで、自力でできそうなデータフレームに変換してやってしまいました。こんな感じ。
nRes <- as.data.frame(austres) tQ <- as.data.frame(time(austres)) workDF <- cbind(tQ, nRes) colnames(workDF) <- c("x", "y") austres.lm <- lm(y~1+x, data=workDF) summary(austres.lm)
グラフはほぼほぼ1直線なのでp値的には結構イケてる感じです。勾配と切片が求まったので、このデータからはほぼ4半世紀後の2019年時点でのオーストラリアの人口を推定してみました。こんな感じ。
2019年のQ3で、約2300万人様と。答え合わせの数字は以下です。
外務省 オーストラリア連邦(Commonwealth of Australia) 基礎データ
1行引用させていただきましょう。
約2,575万人(2021年9月。出典:豪州統計局)
上記の推定よりも275万人も多いデス。1990年代頃のトレンドより、多少加速しているのではないでしょうかね。Commonwealth of Australia イケイケだな。