R言語のサンプルデータセットという覗き穴から世界を眺めております。今回から bootパッケージに含まれるサンプルデータセットを見て回りたいと思います。その初回はacmeとな。何じゃらほい?と思ったら実在した会社のお名前でした。ACME-CLEVELAND社とな。どうも他社に買収される数年前の会社の「成績表」みたいっす。
※「データのお砂場」投稿順Indexはこちら
bootパッケージ
今回から使わせていただきます boot パッケージ。お名前からすると何かを boot するの?という感じですが、元になった書物のタイトルからとられたもののようです。何やらムツカシそうっす。
“Bootstrap Methods and Their Application”
Rのパッケージとしての説明は、いつもお世話になっておりますCRAN様のところにありました。
boot: Bootstrap Functions (Originally by Angelo Canty for S)
なお、このパッケージ、多数の関数とサンプルデータセットなど含んでいます。その辺の手がかりとしてPDF化されたドキュメントも用意されとります。
https://cran.r-project.org/web/packages/boot/boot.pdf
acmeサンプルデータセット
とぼけたお名前のデータセットぞなもし、などと思っていたら実在した会社のお名前でした。ACME-CLEVELAND社とな。歴史的にはCleveland Twist Drill社と、National Acme社が合併してできた機械工具の有力会社だったようです。ドリルの刃などを作っていたのかしらね。
お名前のごとくにその拠点はClevelandにあり。地元オハイオ州はCASE WESTERN RESERVE UNIVERSITY様のEncyclopedia of Cleveland Historyなるところの以下のページにACME-CLEVELAND社の歴史が書かれてました。
上記をみるとその発祥は19世紀に遡る歴史のある会社でした。合併してACME-CLEVELAND社となったのが1968年、しかし、1996年に同業他社に買収されてしまったみたいです。どうも、日本との競争で収益悪化したのが業績不振の原因の一つみたいっす。
サンプルデータセットそのものは、ACME-CLEVELAND社の5年間にわたる超過収益(Excess Return)の数字を「市場全体」の数値と比べたものです。「市場」は多分米国市場ではないかと勝手に想像。データがとられている時期は、1986年1月から1990年12月までの5年間。この時期、バブル崩壊までの日本はイケイケどんどんだったからな~。
なお、Excess Returnについては、日本M&Aセンター様 M&Aマガジンの以下ページを参照させていただきました。
まずは生データ
データは通常のdata.frame形式で、データ取得月の月名が文字列で格納されたベクトルと、市場のExcess Return、acme社のExcess Returnがならべてあります。Excess Returnは比較できるように「比率」であるようなので、「超過収益率」と考えてよいのですかね。念のためsummaryを取ってみると以下のようです。
私はこの手の数字には疎いのですが、証券会社のアナリスト的には、なんじゃこれはという感じの数字じゃないですかね。marketの数字も5年間の平均値でマイナス、acme社の成績はそれを下回っておりますな。acme社の場合、大きく数字が改善する月もあれば、がっくり落ち込む月もあって振れ幅大きいみたいです。
プロット
毎月のプロットが以下に。ひさしぶりにggplot2使ってみました。
library(ggplot2) p0 <- ggplot(data=acme) + geom_point(aes(x=month, y=market, colour="market")) + geom_point(aes(x=month, y=acme, colour="acme")) p1 <- p0 + ylab("Exess Return") p1
横長なプロットが以下に
なんだかね~、acme社、市場の数字を下回っている月が多い気がします。そのくせ、時々「良い数字」を叩きだす月もある(ケド瞬間的。)
これをみると苦闘している感じがするなあ。
多分、このデータをサンプルデータセットにしてあるご本を読むといろいろと処理の仕方が書いてあるのだろうけれども。。。
比率のSUMを求めて何よ、という感じがしないでもないすケド、求めてみたのが以下に。
市場全体もマイナス傾向だけれども、acme社はもっとマイナス。ヤバイぜ。