データのお砂場(166) R言語、melanoma、悪性黒色腫データ再び、{lattice}

Joseph Halfmoon

R言語所蔵のサンプルデータをABC順に眺めてます。今回はlatticeパッケージのmelanoma、悪性黒色腫のデータです。忘却力の老人は忘れかけてましたが、記憶の片隅にmelanomaのデータが。過去回見直したらbootのとこにありました。同名ながら異なるデータ・セットでした。今回のデータのポイントはどゆこと?

※「データのお砂場」投稿順Indexはこちら

※使用させていただいている Rのversionは 4.3.1。RStudioは 2024.04.2+764 “Chocolate Cosmos” です。

過去回でのmelanoma

過去回でmelanomaを扱ったのは bootパッケージのmelanomaサンプルデータセットでした。

データのお砂場(123) R言語、melanoma、悪性黒色腫の生存データ、{boot}

悪性黒色腫の「厚み」とかと生存率の関係をみるデータセットでした。ただし50年以上前のデータです。最近は治療法も進歩しているのでサンプルデータセットの時代とは違うんじゃないかと思います。

今回のlatticeパッケージのmelanomaデータセットと同名ですが、上記のデータセットは無関係のようです。

Melanoma skin cancer incidence

今回のサンプルデータセットの解説ページは以下です。

https://search.r-project.org/CRAN/refmans/lattice/html/melanoma.html

1936年から1972年にかけて、米国コネチカット州での症例の時系列集計データです。

「時系列の集計」というところがミソで、ソースは

Increased Incidence of Malignant Melanoma After Peaks of Sunspot Activity

という研究らしいです。まあ悪性黒色腫の発症が紫外線の影響を受けることはほぼほぼ間違いないと思われるので、太陽活動と関連性があっても不思議ではないと思われますが、そんな断定できるような相関あるの?と素人老人の感想。

まともに調べても何か変なところにハマリそうだったので、エイヤーでGoogle Gemini様にお伺いをたててみました。こんな感じ。geminiA

「深掘り考察」ってか。ううむ。geminiB

やっぱりね。もっと「ハルシネーション」っぽい回答がいただけるかと思ったですが、まともじゃん。珍しく同意見だな。ホントか?

まずは生データ

生データは単純な時系列データでした。melanomaRawData

単純なplotコマンドの結果が以下に。melanomaPlot

latticeでの処理例

latticeパッケージの処理例なので、latticeパッケージの可視化関数をつかったものです。処理例はこんな感じ。melanomaXYplotOPR

プロットが以下に。melanomaXYplot

ちょっと見やすくはなったケドなあ。それにしても太陽活動との関連を調べるよりも、この右肩上がり?のトレンドは何故なのよ。そこが知りたい。

データのお砂場(165) R言語、ethanol、圧縮比と当量比とNOx、{lattice} へ戻る

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です