R言語所蔵のサンプルデータをABC順に眺めてます。今回はlatticeパッケージのenvironmental、なんかデジャヴのような。忘却力の年寄りはほぼほぼ忘れてましたが、調べたら2年以上まえに「似たデータセット」を扱ってました。ちょいとツッコミどころがあるデータでした。今回は可視化の処理例なのでまあいいか?
※「データのお砂場」投稿順Indexはこちら
※使用させていただいている Rのversionは 4.3.1。RStudioは 2024.04.2+764 “Chocolate Cosmos” です。
Atmospheric environmental conditions in New York City
今回のサンプルデータセットの解説ページは以下です。
https://search.r-project.org/CRAN/refmans/lattice/html/environmental.html
1973年5月から9月の米国ニューヨーク市における空気(オゾン濃度)と温度、風力等のデータです。以前にもやった気がする、ということで過去回を調べたらありました。
データのお砂場(41) R言語、airquality、ニューヨークの空気の品質?とな
こちらも1973年5月から9月のデータです。データの出所は同じみたいです。ただし、調べてみるとこんな感じでした。
airquality | environmental | |
---|---|---|
時期 | 1973/05~1973/09 | 1973/05~1973/09 |
データ点数 | 153(NA含む) | 111(NA含まず) |
変数 | 6(Month, Day含む) | 4(Month, Day含まず) |
今回の environmental は過去回の airquality のサブセット的なデータセットみたいです。このデータについての「ツッコミどころ」みたいなところは上記過去回に既に書いているので、そちらをご参照あれ。
なお、各種の大気汚染ガスがあるのにオゾンだけを捉えているのは、上空と違って地表面でのオゾン生成プロセスには各種大気汚染ガスが関係しているためのようです。
まずは生データ
latticeパッケージ内のサンプルデータセットです。まずlatticeパッケージをライブラリ呼び出しした後にロードしてます。
以下の4変数です。
-
- ozone、濃度 [ppb]
- radiation、太陽の放射[langley]
- temperature、気温 [F]
- wind、平均風速 [mph]
それぞれツッコミどころのある変数なのですが、過去回と同じなので省略します。
処理例
latticeパッケージに収録のデータセットなので、latticeパッケージ内の関数を使った処理例が3つも掲載されております。今回はそれをそのまま実施してグラフを眺めてお茶を濁したいと思います。手抜きだよ。
-
- Scatter Plot Matrices
-
- Common Bivariate Trellis Plots
つづいて xyplot関数を使ったプロットの処理例が以下に。
-
- Conditioning Plots
末尾は coplot 関数を使ったプロットの処理例が以下に。
太陽光が強くて、気温が高くて、風が弱い方がオゾン濃度が濃くなる感じ?知らんけど。