
前回は意味が良く分からないデータでしたが、今回は単純明快「オーストラリアの人口」です(Residentsという表現なので国籍的なものとはまた別かと。)データは1971年から1994年まで、既に四半世紀経過してますが、とても古いデータが多いRのサンプルデータセットの中では比較的新しい感じです。 “データのお砂場(45) R言語、austres、オーストラリアの人口、4半期毎” の続きを読む
デバイス作る人>>デバイス使う人>>デバイスおたく
前回は意味が良く分からないデータでしたが、今回は単純明快「オーストラリアの人口」です(Residentsという表現なので国籍的なものとはまた別かと。)データは1971年から1994年まで、既に四半世紀経過してますが、とても古いデータが多いRのサンプルデータセットの中では比較的新しい感じです。 “データのお砂場(45) R言語、austres、オーストラリアの人口、4半期毎” の続きを読む
今回のデータは米国の(半世紀くらい前の)金融機関らしい組織の事務職員のアンケート調査みたいなものの集計らしいです。R言語の処理としては線形回帰の練習データです。淡々と処理はできるんじゃないかと思いますが、人事情報的な「意見」の集約なので「その意味」がとても気になります。データとしてはすべて%で表される数値なのですが。
“データのお砂場(44) R言語、attitude、%で測れる「態度」ってなんなのよ?” の続きを読む
前回は演習用の人工データでしたが、今回は自然現象の観測データです。米国カリフォルニア州内で発生した23個の地震のピーク加速度データです。古いデータのようですが比較的デカイ地震ばかり。震源までの距離とピーク加速度の間に関係性を見出すための練習データに見えます。しかし多くの日本人は知っています。地震は一筋縄ではいかねーと。
前回は寄せ集め感たっぷりながら、生々しい実データでした。今回は「アーティフィシャルなフレーバー漂う」多分、確実に、このデータセットを可視化してみる人物(私を含む)に「インプレッション」を与えるため意図された人為的なデータです。なんだそれ。勿体ぶらずに上の画像見れば一目瞭然。
R言語所蔵のサンプルデータセットをABC順(大文字先)で端から眺めております。今回のデータも古いです。1973年の5月から9月にかけてのニューヨークでの「空気の品質」データです。空気の品質といってオゾン濃度を調べてるんです。最初は意味不明でした。NOx濃度とかでないの?でも調べてみたら根拠がありーの。知らんけど。 “データのお砂場(41) R言語、airquality、ニューヨークの空気の品質?とな” の続きを読む
前回は1940年と古いデータでした。今回のデータはWWWねたなので、それほど古いことはないでしょう。でも振り返ると最初にWWW(ワールドワイドウエッブ)にアクセスしたのはNCSA Mosaicというブラウザででした、まだWindows 3.x の時代だったかと。それからすると30年くらいたってますな。今は昔、違うか。