
MASSパッケージのサンプルデータセットを経めぐってます。大文字優先のABC順。前回は殺虫剤のDDTのデータでした。今回は、ヒアルロン酸とかコンドロイチンとかで「お馴染み」かも知れません、GAG(グリコサミノグリカン)です。年齢(といってお年寄りではありませんぞ、お子様です)と尿中濃度を調べたもの。
※「データのお砂場」投稿順Indexはこちら
Level of GAG in Urine of Children
今回のサンプル・データセットの解説ページが以下に。
https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/GAGurine.html
お惚け老人は、ヒアルロン酸とかコンドロイチン硫酸とかが含まれるサプリとかの広告を見ない日がないです。その親玉?のGAGというと「老人の御膝」という発想についなってしまいますが、生体組織の津々浦々に存在し文字通り身体を支えてくれているみたいです。特に代謝が活発なお子様は尿中へのGAGの排泄が多いらしいデス。今回のデータセットはその正常値を探るためのものらしいです。
GAG、グリコサミノグリカンについては「公益社団法人日本生化学会」様の以下の論文などを御参照くだされ。
https://seikagaku.jbsoc.or.jp/10.14952/SEIKAGAKU.2017.890689/data/index.html
また、通例によってGoogleの生成AI、Gemini 2.5 Flash様にGAGとその尿中濃度についてお教えいただいてます。
体中のいたるところにあるみたいね。
この後Gemini様は、年齢(年寄でなくお子様だよ)と目安となる尿中のGAGの値などを列挙されてます。この部分はバッサリ省略させていただきました。そして最後に以下の述べられてます。
そうか、尿中濃度の測定は濃さで左右されそうだわいな~。今頃夏場は「濃いい」感じか。それで補正値使うのね。一方、サンプルデータセットのGAG値については
the units have been lost
と書かれてます。大人の事情かな。知らんけど。まあ、Rの処理のサンプルデータとして使うのに単位など知らんでよいじゃろ、ということですな。
先ずは生データ
上の Age のところを見て、一瞬これ何?と思ったのは 0 とか 0.01とか「普通、年齢とは思えん数字」が書かれておったためです。しかし本データは小児の遺伝性の疾患をスクリーニングする基準値を求めるものみたいで、0歳児など乳児のデータが充実。多分比較のためなのでしょう、17歳くらいまでのデータが含まれてます。17以上は皆オトナ?
プロットしてみる
まずは素のままプロットする指令が以下に。
plot(GAGurine, main="Level of GAG in Urine of Children")
おお、なんだかGAGの尿中濃度(単位不詳)は年齢に反比例している感じ?そこで調子に乗って片対数グラフにしてみました。
plot(GAGurine, log="x", main="Level of GAG in Urine of Children", xlab="log(Age)")
なお、年齢=0というデータが4例あるのでそれらは対数プロットからは弾かれてます。でも「いい感じ」でないかい。年齢で反比例している感じがアリアリ。上のグラフの右端で17歳ちょい、だけれどもそこでは「ほぼほぼGAG0」。多分、代謝される量も減り、それが体内の酵素で分解されて尿中にはほぼほぼ出てこない、ってこってすかね。知らんけど。