今回のR言語所蔵のサンプルデータベース、米国の司法制度を理解していない私には訳わかりません。理解すべくWebを漁ってみましたです。日本語資料も結構あり、しかし大部。ご本家、米国の連邦最高裁のページまで探してみましたが、結局理解不能。意味も分からぬ数字をただ定形処理してお茶を濁した、と。残念な回であります。いつもか?
※「データのお砂場」投稿順Indexはこちら
R言語所蔵のサンプルデータをABC順(大文字先)で端から眺めております。今回のサンプルデータセット USJudgeRatings の「説明」が以下のページにあります。
Lawyers’ Ratings of State Judges in the US Superior Court
US Superior Courtといえば、米国の「連邦」最高裁判所ですかい?私のようなものでも、米国における裁判所が「連邦」と「各州」の2本立てであることは一応理解しとります。米国企業などとの契約書類を読むと「管轄はデラウエア州裁判所」みたいな文章をしばしば目撃します。「え、なんでデラウエア州なの?」と法務部の人に聞くと「その州の法律が都合が良いのよ」という感じで結局何だか分かりません。
しかし、今回はどうも連邦最高裁関係みたいです。でもレーティングというからには、判事さんの評価表みたいなもの?でも State JudgesのStateは「州」の方じゃないの?調べてみたら日本の裁判所のホームページに米国の裁判所の概略図というものが載ってました(教科書からの「また引き」みたいですが。)
これみてもお名前が分かるだけで何だかな~。さらに調べると立派な日本語資料(それも分厚い)がありました。(多分米国「連邦」政府の息のかかった?サイトではないかと想像される)アメリカンセンタージャパン様の発行されている以下のような資料です。
これくらい読んでおけよ、とおっしゃる?でもね、最初の資料だけでも215ページもあります。辛いものがあります。ご本家、連邦最高裁のページへ行って「歴代の最高裁判事」さんのリストも見つけました。以下です。
最初サンプルデータは「歴代の最高裁判事さん」が列挙されているのかと早合点して上記のリスト(限られた人数でほぼ終身なので1789年以来といっても大した人数ではありません)を眺めてみましたが違うようです。州の方の最高裁の判事さんのリストなのかい?1970年代とネット情報空白世代のデータと思われるのでなんだか分かりませぬ、難儀やな、このサンプルデータセット。
まずは生データ
いつもの通り、形式的に処理して生データを確認してみます。1レコードあたり12変数を持つ、43レコードの data.frame形式のデータです。レコード毎に、あちらの方の姓名がしっかり記されてます。個人情報などという扱いではないですな。公共のデータ的な扱い。姓名に対して12の項目(の評点?)がぶら下がっておると。
上記で生データそのものをplot()関数に渡したものが以下に。
みればCONTを除く各項目間には、「ほぼほぼ比例」関係的な右肩あがりの傾向が見てとれます。ただ一部の項目の組み合わせに対しては「乱れ」があり、「この辺」をグリグリ解析して考察できると「面白い」んでないかと思うのです。しかし各項目の意味がサッパリです。INTG = Judical integrityって何? DMNR = Demeanor 物腰?なんの尺度よ?
summry()関数を使って各項目のサマリを求めてみたものが以下に。
数値的にはCONTを除き、10点満点での評点にも見えます。
処理例
今回のサンプルデータの解説ページに処理例はあるのですが、結果は以下です。
なんだ。こちらのplotと同じものにタイトルつけただけじゃん。なんだかな~。