データのお砂場(159) R言語、米国大統領の任期データ、{ggplot2}

Joseph Halfmoon

R言語所蔵のサンプルデータをABC順にて眺めてます。今回その順番にあたったのは ggplot2パッケージの presidential です。なんという偶然!本日まさに米国大統領選挙の投票日にこのデータセットの順番がまわってくるとは。とは言え、単なる氏名と任期、そして政党名が並べてあるデータセットです。グラフが描けん?

※「データのお砂場」投稿順Indexはこちら

※使用させていただいている Rのversionは 4.3.1。RStudioは 2024.04.2+764 “Chocolate Cosmos” です。

presidential

今回のサンプルデータセットの解説ページは以下です。

Terms of 12 presidents from Eisenhower to Trump

アイゼンハワー大統領からトランプ大統領にいたる12名様の任期と所属政党名の「素っ気ない」データです。R言語付属のデータセットは古いものが多いですが、これからするに、バイデン大統領の就任後のデータセットです。当然、現大統領もこれから決まる次期大統領も含まれておりませぬ。

先ずは生データ

生データをロードして眺めてみました。presiedentialRawData

全データを表示しても上の通りであります。こうしてみると、ケネディ大統領とジョンソン大統領のところ(暗殺)、ニクソン大統領とフォード大統領のところ(ウォーターゲート事件)が特殊。

しかし、全データをダンプしても上記のようなので、これをどうやってグラフにする?

処理例発見

サンプルデータセットとして含まれているデータセットなので、何か処理例くらいあるだろ~ということで探してみたらありました。以下の過去回で練習した economics データセットと組み合わせてプロットするものです。

(152) R言語、economics、米国の経済指標データ{ggplot2}

まず、economicsデータセットの「失業者数」のプロットが以下に。

p <- ggplot(economics, aes(x = date, y = unemploy)) + geom_line()
p

グラフはこんな感じ。graph0

さて、上記のグラフに presidential データセットを重ねてみるものが以下に。

yrng <- range(economics$unemploy)
p2 <- p +
geom_rect(
aes(NULL, NULL, xmin = start, xmax = end, fill = party),
ymin = yrng[1], ymax = yrng[2], data = presidential
)
p2 + scale_fill_manual(values = alpha(c("blue", "red"), .3))

上記のキモは最後の行の scale_fill_manual(values = alpha(~ のところです。これでアルファブレンディングを指定しないと、歌舞伎の緞帳みたいな図になってしまいます。

結果が以下に。graph1

上記をみると、単なる景気循環なのか、なんなのか。民主党が政権とっている時期の方が失業者数が下がる傾向があるような気がしないでもない。でも、いずれが原因で、いずれが結果か判断はつかず。是々非々是々非々。

データのお砂場(158) R言語、哺乳類の睡眠時間データ、{ggplot2} へ戻る

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です