データのお砂場(222) R言語、epil、てんかん患者様の発作回数 {MASS}

Joseph Halfmoon

このところR言語の「MASS」パッケージ所蔵のサンプル・データ・セットを巡回してきております。しかし、この後におよんで、ようやくMASSパッケージがなぜMASSと綴られているのか判明。お教え下すったのはAI様です。それどころかMASSのネタ本は「知らないとモグリ」な名著なんだとか。すみません、素人っす。

※「データのお砂場」投稿順Indexはこちら

Seizure Counts for Epileptics

今回のMASSパッケージのサンプル・データ・セットは、 epil です。解説ページが以下に。

https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/epil.html

てんかん患者様の発作回数についてのデータ・セットです。素人老人がこのデータセットについて調べていて、MASSパッケージがなぜMASSなのか、ようやく気付きましたです。何でも知っている生成AIのGemini様のお陰であります。geminiEpil00

“Modern Applied Statistics with S” というご本はMASSと通称されていて「統計学の名著」であったのね。知らないとモグリな話みたい。知らなかった素人老人は確実にモグリです。

まずは生データ

先ずは生データをロードして、眺めてみたところが以下に。rawDataEpil

生データをべろりんと眺めたけれども、今回の解説ページには処理例が掲載されてます。どうもこれこそ

「ポアソン回帰」と「一般化線形混合モデル(GLMM)」を用いた非常に高度な解析フロー

であるようです。何も知らない素人老人が眺めても分かるハズもありませぬ。今回は、生成AIのGemini様に「丸投げ」(いつものことか?)

サンプルに掲載の解析フロー

最初の一歩目から、結構ムツカシーことやってます。geminiEpil01

上記を実際に処理したところが以下に。geminiEpil01EX

しかし、その後の第二段階、第三段階が「テク」満載みたいです。geminiEpil02

geminiEpil03第2段階、第3段階を実施すると、epil3という変数に結果が格納されてます。以下は処理後のepil3の先頭部分デス。geminiEpil03EX

さて、その結果の解析に入るのが以下です。geminiEpil04

実際に実施した結果が以下に。これまた結果は長大なのでその先頭部分デス。geminiEpil04EX

そして最終解析の結果です。geminiEpil05

結果2つ(長いよ。)geminiEpil05EXA

geminiEpil05EXB素人老人にはネコに小判な結果がでそろったところで、生成AI様は以下のようにおっしゃってます。geminiEpil06

ムズカシー処理していることは分かるけれども、「巧妙」なところが理解できてない素人老人。

生成AI様は以下のようにも御教示してくれてます。geminiEpil10

そういうことだったのね。ここだけ読んで分かった気になる素人老人。アサハカだな、自分。

データのお砂場(221) R言語、eagles、海賊鷲?の襲撃成功率とな {MASS} へ戻る