今回も御病気の統計です。カナダはブリティッシュコロンビア州におけるダウン症の発症データです。古いデータが多い印象のRのサンプルデータセット中で今回のデータは20世紀も後半以降のデータのようです。ダウン症自体、最初の報告者のダウン博士のお名前をとって命名されたのが1965年らしいですからそんなに古いわけはないすけど。
※「データのお砂場」投稿順Indexはこちら
このところ、R言語のパッケージbootに含まれているサンプルデータセットを abc 順にみています。今回のデータセットは downs.bc です。
ダウン症(ダウン症候群)
ダウン症についてまったくの無知というわけではなかったですが、染色体の何番目が関係しているとか調べたことはなかったです。『国立研究開発法人 国立成育医療研究センター』様の以下のページ
から1か所引用させていただきます。
通常21番目の染色体が1本多く3本あるため、21トリソミーとも呼ばれます。
通常は一対2本のハズの染色体が3本あるのね。。。上記ページには「染色体 核型 ダウン症候群」というタイトルのもと、人間の染色体を並べた写真?が掲げられております。21番目の染色体小さいです。その小さい染色体が、他は2本1対なのに、そこだけ3個ならんでます。
本題から外れてしまいますが、上記の染色体写真の中で「y染色体」、yと書かれている場所に見えませぬ。かねてより「年々」小さくなっていると聞き及ぶy染色体、ついに消えてしまったのか?いやいや「x 染色体」が2本あるので、写真のケースは女性なのであろうかと。早合点だな。
ブリティッシュ・コロンビア、コマケー話なんだが
さてサンプルデータセットが取得されたのはカナダはブリティッシュコロンビア州であります。日本よりも遥かに広い州ではあるけれども、カナダの州の面積ランキングでは中の上くらい。その中で人口はバンクーバーに集中しておりますな。バンクーバーは大都市だけれども、州都はビクトリア。遥か昔、ビクトリアへも行ったことがありますぞ(仕事ですが。)州政府だか、州会議事堂だかの立派な建物の前を通った曖昧な記憶あり。ビクトリア自体は英国風の美しい小さな港町です。などと書いていたらグーグル様の検索ページの「概要」として以下が書かれてました。州都がバンクーバーになっている??
他をみると州都は依然としてビクトリアだと書かれたものも多数あり。その辺の根拠となる法律の条文を確かめたわけでないので上記の真偽は不明。AIも良いんだが、最近、その真偽を調べるのにかえって時間が掛かっている気がしないでもない。。。
先ずは生データ
今回のサンプルデータセットの解説ページが以下に。
Incidence of Down’s Syndrome in British Columbia
コマケー話に時間を使ってしまったので、今回本筋の処理は手抜きっす。まずは生データ。library(boot)は必須です。
通常のデータフレームです。年齢(出産年齢ということだと思う)age、お母さんの人数 m、そしてダウン症の症例数 r という形です。
処理(手抜き)
ダウン症の発症率を求めないとならないと思ったので、作業用のデータフレームを作り、発症率を書き入れました。
downs.bc.work <- downs.bc downs.bc.work$ratio <- (downs.bc$r / downs.bc$m) * 100 colnames(downs.bc.work) <- c("age", "m", "r", "ratio")
計算しただけじゃ分からないので、プロットしてみました。操作はこんな感じ。
plot(downs.bc.work$ratio~downs.bc.work$age, main="Incidence of Down's Syndrome in British Columbia", xlab="age", ylab="Incidence[%]", col=2, pch=16)
35歳~40歳くらいの間に変曲点?があって、その後は急激に割合が増えるのね。。。