R言語所蔵のサンプルデータをABC順に眺めてます。今回はlatticeパッケージのmelanoma、悪性黒色腫のデータです。忘却力の老人は忘れかけてましたが、記憶の片隅にmelanomaのデータが。過去回見直したらbootのとこにありました。同名ながら異なるデータ・セットでした。今回のデータのポイントはどゆこと?
※「データのお砂場」投稿順Indexはこちら
※使用させていただいている Rのversionは 4.3.1。RStudioは 2024.04.2+764 “Chocolate Cosmos” です。
過去回でのmelanoma
過去回でmelanomaを扱ったのは bootパッケージのmelanomaサンプルデータセットでした。
データのお砂場(123) R言語、melanoma、悪性黒色腫の生存データ、{boot}
悪性黒色腫の「厚み」とかと生存率の関係をみるデータセットでした。ただし50年以上前のデータです。最近は治療法も進歩しているのでサンプルデータセットの時代とは違うんじゃないかと思います。
今回のlatticeパッケージのmelanomaデータセットと同名ですが、上記のデータセットは無関係のようです。
Melanoma skin cancer incidence
今回のサンプルデータセットの解説ページは以下です。
https://search.r-project.org/CRAN/refmans/lattice/html/melanoma.html
1936年から1972年にかけて、米国コネチカット州での症例の時系列集計データです。
「時系列の集計」というところがミソで、ソースは
Increased Incidence of Malignant Melanoma After Peaks of Sunspot Activity
という研究らしいです。まあ悪性黒色腫の発症が紫外線の影響を受けることはほぼほぼ間違いないと思われるので、太陽活動と関連性があっても不思議ではないと思われますが、そんな断定できるような相関あるの?と素人老人の感想。
まともに調べても何か変なところにハマリそうだったので、エイヤーでGoogle Gemini様にお伺いをたててみました。こんな感じ。
やっぱりね。もっと「ハルシネーション」っぽい回答がいただけるかと思ったですが、まともじゃん。珍しく同意見だな。ホントか?
まずは生データ
latticeでの処理例
latticeパッケージの処理例なので、latticeパッケージの可視化関数をつかったものです。処理例はこんな感じ。
ちょっと見やすくはなったケドなあ。それにしても太陽活動との関連を調べるよりも、この右肩上がり?のトレンドは何故なのよ。そこが知りたい。