R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めております。正直、古色蒼然たるデータが多いです。データを眺め、そして「その頃」がどんな世界だったのかに思いをはせるってもんでしょうか。グラフを眺めているうちに今日に繋がる事象も見える?今回のデータセットは電話の台数です。70年から60年以上前の。
※「データのお砂場」投稿順Indexはこちら
最近は年間16億台くらい携帯売れているみたいです。ついつい年間の販売台数に目がいってしまうのは「商売っ気」です。しかし、今回取り扱う電話の台数は、多分インストール・ベースの台数だと思います。電話機の販売台数ではないでしょう。当時の電話は POTS ってやつです。Plain Old Telephone Service。もしかするとでなく、若者は確実に触ったことのないやつ。黒電話が代表選手か。ダイアル・パルス(電流の断続)で交換機に番号を伝えるシステム。
実は私は、POTS=Plain Ordinary Telephone Serviceと記憶していたのですが、今回調べたら OrdinaryでなくOldでした。年寄りの記憶の誤りなのか、運用されてた当時はOrdinaryだったものがOldと化したのか。。。閑話休題。
さて、今回のデータセットの解説ページが以下に。
現代的な感覚だと台数の単位は数千万台とか、x.x億台とか想像しますが、1000台単位だそうな。
まずは生データ
以下のようにデータセットをロードしてみると、マトリックス形式のデータです。7x7の表でした。行に年、列に地域、そしてデータ的には1000台単位の台数です。
いかにも米国の統計データだなと思うのが、米州は、北米、中米、南米と3分割されているのに、「その他の」世界を欧州、アジア、太平洋、アフリカと4分割で済ませている点。まあ、台数みても、北米と欧州が圧倒的。60,70年前はそんな世界だったかと。
matplotでグラフ表示
今回のデータセットの説明ページには、matplot使ったグラフ描画の例が掲げられていました。処理方法が以下に。
上記のグラフ化の結果が以下に。Y軸は対数です。目をひくのが赤の6,アフリカが50年代前半にロケットスタート(元が少なすぎたのか)したものの、その後伸び悩む感じがするのと、黄緑の3、アジアが紆余曲折ありそうながらもグイグイ伸びているところかと。しかし、北米と欧州は安定的に伸びてる感じです。
アフリカのロケットスタートは、1950年代から60年くらいにかけて、アフリカ諸国の独立が相次いだことと関連あるのではないかと想像します。また、黄緑のアジアのかなりな部分は日本の高度成長が担っているような気がしないでもないです。知らんけど。
処理例では、log 指定されていたので、log指定しないとどんな感じになるのだか確かめてみました。こんな感じです。北米と欧州が圧倒的で、他の地域はとても分かりずらいものとなりました。
処理例はMatrix形式のままですが、試みにデータフレームに変換してみました。変換しただけでは表面的には何も変わりませぬ。こんな感じ。
これをプロットにかけると、2地域ごとの組み合わせでグラフにしてくれます。
やはり、北米と欧州が目立ちすぎなので、「その他」だけでグラフにもしてみました。部分Matrixの抽出が以下に。
emergingRegion <- WorldPhones[, 3:7]
データは以下に。
さてこれを処理例を真似したmatplotでグラフ化してみました。手順は以下に。
matplot(rownames(emergingRegion), emergingRegion, type = "b", col = 3:6, lty =3:5, xlab = "Year", ylab = "Number of telephones (1000's)") legend(1951.5, 8000, colnames(emergingRegion), col = 3:6, lty = 3:5, pch = rep(21, 5)) title(main = "World phones data, Emerging Regions Only")
グラフは以下に。Y軸はLOGではありません。やはりアジアの急激な伸びと、アフリカのロケットスタートが見てとれます。
今回はグラフ描いて終わってしまいました。なんだかな~。