データのお砂場(29) R言語、UCBAdmmissions、UCバークレーの入試男女比?

mosaicplot000
Joseph Halfmoon

ABC順に端からサンプリングデータ、再びカテゴリカルデータの集計登場。UCバークレー校のAdmissions(入試)の学部別、男女別の合否データみたいです。出典は1975年の御本なので、相当古いデータ。しかしこのデータ「シンプソンのパラドックス」を説明するときの定番データらしいです。知らないとモグリ的なやつ?

“データのお砂場(29) R言語、UCBAdmmissions、UCバークレーの入試男女比?” の続きを読む

データのお砂場(28) R言語、ToothGrowth、ビタミンCの効果とな、ホントか?

plot002
Joseph Halfmoon

前回は1回だけPythonでの処理に行きましたが、今回はR言語でR言語所蔵のサンプルデータセットの処理に戻ります。今回のデータ自体は分かり易いと言えば分かり易いです。ビタミンCがモルモットの歯の成長に及ぼす影響についてのデータみたいです。でもねえ、このデータだけ見せられても、という感じ。処理はできるでしょうが。

“データのお砂場(28) R言語、ToothGrowth、ビタミンCの効果とな、ホントか?” の続きを読む

データのお砂場(27) Python、Titanic、前回データの別な切り口

violinPlotEC
Joseph Halfmoon

前回、R言語所蔵のTitanicデータセットを処理。事故のデータなのであまり気色の良いものではないな、などと思っていたら、痛ましい海難事故発生。人間はそういうことに「因果関係」を感じてしまうものであり、私も例外ではないです。が、因果は無いのであります。そうしたら別口でTitanicデータをまた発見。何かあるのか?

“データのお砂場(27) Python、Titanic、前回データの別な切り口” の続きを読む

データのお砂場(26) R言語、Titanic、タイタニック号の生存者とな

mosaicplot
Joseph Halfmoon

今回のサンプルデータセットは皆さんよくご存じのタイタニック号です。映画タイタニックも見ましたが、この老人の記憶の奥底にあるタイタニックはTVドラマ「タイムトンネル」のタイタニックなんであります。といって若者も中年も知らないか、タイムトンネル、SFタイムトラベル物の嚆矢かと。それはさておきデータ処理にとりくみますです。

“データのお砂場(26) R言語、Titanic、タイタニック号の生存者とな” の続きを読む

データのお砂場(25) R言語、Theoph、テオフィリンの薬物動態とな

g1plot
Joseph Halfmoon

R言語のサンプルデータセットをABC順(大文字先)で端から試してみています。今回はお薬ネタ再びです。テオフィリン、どうも喘息などで処方される薬のようです。これの薬物動態、時間に対する血中濃度を処理するもの。何度かお薬ネタをやっているうちに、何だかよく分からないけれど処理の手順は覚えましたぜ。

“データのお砂場(25) R言語、Theoph、テオフィリンの薬物動態とな” の続きを読む

データのお砂場(24) R言語、Seatbelts、英国における道路交通事故の死傷者数

ts_002
Joseph Halfmoon

R言語のサンプルデータセットをABC順(大文字先)で端から試してみています。今回は英国の交通事故のデータです。かなり古いシートベルトの着用が法制化される前後のもの。シートベルトの効果が分かる?時系列データで季節変動もあり、その中で法律の施行やら燃料費やらがどう影響を与えているのか処理せよと。 “データのお砂場(24) R言語、Seatbelts、英国における道路交通事故の死傷者数” の続きを読む

データのお砂場(23) R言語、Puromycin、酵素反応の反応速度とな?

g2Graph
Joseph Halfmoon

R言語のサンプルデータセットをABC順(大文字先)で端から試してみていますが、お薬ネタ?も時々ありますな。今回は、ピューロマイシンという抗生物質だそうです。この抗生剤を使ったときと使わぬときでの何やら反応速度の違いを測定したデータみたい。これまた分かったような分からぬような。でも処理の方法は以前の回同様で良さそう。

“データのお砂場(23) R言語、Puromycin、酵素反応の反応速度とな?” の続きを読む

データのお砂場(22) R言語、PlantGrowth、植物の成長実験、無味乾燥?

BoxPlotOPR2
Joseph Halfmoon

このところ「植物」関係のデータが多い気がします。こちらはR言語のサンプルデータセットをABC順(大文字先)で端から試してみているので他意はございません。毎度、Rの処理からすれば蛇足な背景などを調べて一人悦に入っておりました。面白いので。しかし、今回は植物のデータですが無味乾燥(データは乾燥重量)。

“データのお砂場(22) R言語、PlantGrowth、植物の成長実験、無味乾燥?” の続きを読む

データのお砂場(21) R言語、OrchardSprays、果樹園用農薬?の効果とな?

boxPlot
Joseph Halfmoon

前回オレンジの木の幹の太さでしたが、今回は果樹園用?の農薬の効果の実験みたいです。「みたい」というのはどんな実験なんだか説明読んでもよく分からない、から。農業(農学)の知識のないものが、データを見ながら想像(妄想?)して処理をばいたしました。なんだかな~ ま、効果はある、濃ゆい方があるってことでええじゃないか。

“データのお砂場(21) R言語、OrchardSprays、果樹園用農薬?の効果とな?” の続きを読む

データのお砂場(20) R言語、Orange、オレンジの木の幹の太さの成長曲線とな?

SSlogisPlot
Joseph Halfmoon

桃栗三年柿八年などと申しますが、このデータを見るとオレンジの木は4~5年くらいでそこそこの太さまで生育するように見えます。しかし、「木の幹の太さを測る」、データの解析以前にいろいろあるようです。米国と日本で測る高さが違う?それどころか日本国内でも北海道と本州以南では違う?いろいろあるのね。

“データのお砂場(20) R言語、Orange、オレンジの木の幹の太さの成長曲線とな?” の続きを読む

データのお砂場(19) R言語、Nile、ナイル川の水量百年とな?

Nile_MovingAVG
Joseph Halfmoon

第16回でヒューロン湖の水位変動データを扱ってみましたが、今回はナイル川の水量データです。1871年から1970年までの100年間のものです。その最大水量1370×108立方m/yearとな。エジプト南端のアスワンでの値のようです。そういえば1970年、アスワン・ハイ・ダムの完成の年らしいです。

“データのお砂場(19) R言語、Nile、ナイル川の水量百年とな?” の続きを読む

データのお砂場(18) R言語、Lobololly、テーダマツの成長「曲線」とな?

ggplot004_EC
Joseph Halfmoon

今回登場は米国テキサスからフロリダあたりの湿地帯?のようなところに生えている松の一種みたいです。Lobololly pine tree、またの名をテーダマツとな。R言語の「内蔵」サンプル・データセットをABC順に全部「舐めて」みようなどと思いつかなければ多分お目にかかることは無かった植物であります。

“データのお砂場(18) R言語、Lobololly、テーダマツの成長「曲線」とな?” の続きを読む

データのお砂場(17) R言語、LifeCycleSavings、各国の貯蓄データとな?

srPOP15
Joseph Halfmoon

今回はデータを眺めて愕然といたしました。「日本も世界も変わってしまった」のだと。今回のデータセットは1960年代の世界50か国の貯蓄率のデータです。貯蓄率を人口分布や可処分所得から説明する、という仮説を検証するためのものなのです。しかしこの年寄りが驚いたのはその人口の割合です。若いです、日本も世界も。

“データのお砂場(17) R言語、LifeCycleSavings、各国の貯蓄データとな?” の続きを読む

データのお砂場(16) R言語、LakeHuron、ヒューロン湖の水位とな?

LakeHuronMovingAVGPlot
Joseph Halfmoon

前回に続き、今回も時系列データです。北米大陸の巨大な湖、ヒューロン湖の水位のデータ。前回4半期毎の季節変動をトレンドと分離できたので、今回もその手か、と思ったのですが違いました。1年1点のデータであるので季節変動などはありません。長い目でみた長期のトレンドを探れということみたい。

“データのお砂場(16) R言語、LakeHuron、ヒューロン湖の水位とな?” の続きを読む