データのお砂場(191) R言語、GAGurine、 年齢とGAGの尿中濃度 {MASS}

Joseph Halfmoon

MASSパッケージのサンプルデータセットを経めぐってます。大文字優先のABC順。前回は殺虫剤のDDTのデータでした。今回は、ヒアルロン酸とかコンドロイチンとかで「お馴染み」かも知れません、GAG(グリコサミノグリカン)です。年齢(といってお年寄りではありませんぞ、お子様です)と尿中濃度を調べたもの。

※「データのお砂場」投稿順Indexはこちら

Level of GAG in Urine of Children

今回のサンプル・データセットの解説ページが以下に。

https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/GAGurine.html

お惚け老人は、ヒアルロン酸とかコンドロイチン硫酸とかが含まれるサプリとかの広告を見ない日がないです。その親玉?のGAGというと「老人の御膝」という発想についなってしまいますが、生体組織の津々浦々に存在し文字通り身体を支えてくれているみたいです。特に代謝が活発なお子様は尿中へのGAGの排泄が多いらしいデス。今回のデータセットはその正常値を探るためのものらしいです。

GAG、グリコサミノグリカンについては「公益社団法人日本生化学会」様の以下の論文などを御参照くだされ。

https://seikagaku.jbsoc.or.jp/10.14952/SEIKAGAKU.2017.890689/data/index.html

また、通例によってGoogleの生成AI、Gemini 2.5 Flash様にGAGとその尿中濃度についてお教えいただいてます。geminiGAG1

体中のいたるところにあるみたいね。

そしてGAGを分解される酵素が欠損しているとヤバいみたい。geminiGAG2

この後Gemini様は、年齢(年寄でなくお子様だよ)と目安となる尿中のGAGの値などを列挙されてます。この部分はバッサリ省略させていただきました。そして最後に以下の述べられてます。geminiGAG3

そうか、尿中濃度の測定は濃さで左右されそうだわいな~。今頃夏場は「濃いい」感じか。それで補正値使うのね。一方、サンプルデータセットのGAG値については

the units have been lost

と書かれてます。大人の事情かな。知らんけど。まあ、Rの処理のサンプルデータとして使うのに単位など知らんでよいじゃろ、ということですな。

先ずは生データ

いつのとおり生データをロードしたところが以下に。GAGrawdata

上の Age のところを見て、一瞬これ何?と思ったのは 0 とか 0.01とか「普通、年齢とは思えん数字」が書かれておったためです。しかし本データは小児の遺伝性の疾患をスクリーニングする基準値を求めるものみたいで、0歳児など乳児のデータが充実。多分比較のためなのでしょう、17歳くらいまでのデータが含まれてます。17以上は皆オトナ?

サマリをとってみるとこんな感じ。GAGsummary

プロットしてみる

まずは素のままプロットする指令が以下に。

plot(GAGurine, main="Level of GAG in Urine of Children")

その結果のプロットです。GAGplot

おお、なんだかGAGの尿中濃度(単位不詳)は年齢に反比例している感じ?そこで調子に乗って片対数グラフにしてみました。

plot(GAGurine, log="x", main="Level of GAG in Urine of Children", xlab="log(Age)")

プロットが以下に。GAGplotLOGX

なお、年齢=0というデータが4例あるのでそれらは対数プロットからは弾かれてます。でも「いい感じ」でないかい。年齢で反比例している感じがアリアリ。上のグラフの右端で17歳ちょい、だけれどもそこでは「ほぼほぼGAG0」。多分、代謝される量も減り、それが体内の酵素で分解されて尿中にはほぼほぼ出てこない、ってこってすかね。知らんけど。

データのお砂場(190) R言語、DDT、ケール中のDDT測定値[ppm] {MASS} へ戻る

データのお砂場(192) R言語、Insurance、自動車保険請求件数データ {MASS} へ進む