今回のデータは約150年まえのスイスにおけるデータです。古いけれどもこのタイミングには意味があり「人口転換期」であったのだそうな。当時の日本(明治21年)は後進国であったけれどスイスではいち早く出生率の低下がみられていたように推察されます。日本とはちょっと違う?しかしスイスでも地域格差はハッキリしていたみたい。
※「データのお砂場」投稿順Indexはこちら
スイスの出生率と社会経済指標(1888)
以下にサンプルデータセットの解説ページへのURLを掲げます。
Swiss Fertility and Socioeconomic Indicators (1888) Data
「スイスの」というタイトルでそう書いてしまいましたが、上記をよく読んでみると
スイスの中でもフランス語圏の47 provinces(県?)
についてのデータです。スイス連邦を構成する州単位の集計ではなくもう少し下のレベルでの集計ってことで良いのかな。
人口転換については国土交通省様の以下のページが参考になります。
上記によると日本においても明治~昭和30年代半ばまでが「人口転換期」であったように読めます。しかし想像するに日本の1888年は死亡率は下がり始めたのかもしれないけれど、出生率はまだ下がっていない転換期への入りはじめくらいで、今回のスイスのサンプルデータは既に出生率が下がり始めた転換期の半ば以降ってことに思えます。知らんけど。
さてサンプルデータセットには、以下の項目を含みます。
-
- Fertility Ig という出生率指標。‘common standardized fertility measure’
- Agriculture 農業従事者(男性)の割合%(男性)
- Examination 徴兵検査で最高点の割合%
- Education 小学校?以上の教育の割合%(徴兵者に対象調査)
- Catholic カトリック信者の割合%(プロテスタントでなければカトリック分類だそうな)
- Infant.Mortality 乳児死亡率
肝心の1のIgという出生率指標がイマイチ判然としません。通常、日本で出生率の低下が議論されるときは、合計特殊出生率を使うことが多いですが、この単位は「人」単位なので何十という数値になることはないので1の指標とは違いますな。かといって単純な1000人あたりの出生率とも違うみたい。‘common standardized fertility measure’って何よ? 勝手に推測するに「有配偶出生率」が近いんでないかと。そのあたり、厚生労働省様の、「出生に関する統計」の概況の以下のページが参考になります。
なお、以下のページには日本における県ごとデータ(といっても20~30年前だけれども)のグラフもあり、地域差が結構あることが分かります。
まずは生データ
まずはサンプルデータのロードから。データは「通常の」data.frameです。県ごとに先ほどあげた6つの指標(すべて数値)が並んでいるものです。
上記のサマリをみるとかなりばらついている感じがします。特にカトリック指標など Min 2.150にたいしてMax 100.000。100ってすごくないか?
処理例通りに処理してみる
今回のサンプルデータセットの解説ページには処理例ありです。とりあえずそのまま実行してみました。まずはプロット。
結果が以下に、ここのcol=で色を付けているところカッコいいっす。カトリックの割合が50%を超えたら青丸、そうでなければ緑丸っと。
上記をみると、明らかに緑丸と青丸はグループ化される感じがありあり。そんなに違うのか?
これみると徴兵検査の成績のExaminationはPrがデカいので外した方がよさげだけれども後の指標はアスタリスクがバッチリついているので「無関係である」という帰無仮説は棄却ということで良いですか?
乳幼児死亡率が高いところで出生率も高いところは、近代以前の?「多産多死」、どうもカトリック地域は出生率が高く、教育高いところは出生率が低く、意外なのは農業地域がマイナス係数?まあスイスの農業って日本的な農業とは全然違うらしいし。
スイスのある1年だけ見ても「人口転換期」の雰囲気は感じられる、ホントか?でも複数地域で時系列でみたいものです。厚生労働省様のページを見れば良いか?