R言語所蔵のサンプルデータセットをABC順(大文字先)で見ています。今回はwarpbreaksです。ワープで何を思い浮かべるかは人それぞれかと。織機を思い浮かべるのは「正統」ではあるけれども少数派ではないかと想像。宇宙船想像するのが日本人の多数派か?GPUなどプログラムしている人は計算単位のワープを思い出すかも。
※「データのお砂場」投稿順Indexはこちら
織機
warpといって織機の経糸を思い浮かべる人は少数派なんじゃないかと勝手に思います。現代日本においては多分、自動車の構造を分かっている人は多いけれど、織機の構造は「一般には失われた記憶」になっているのではないかと(当然業界人は除く。)
織機における経糸の位置および織機の構造については、HANDWOVEN様の以下のページに絵図(手動織機)があります。
日本でも、郷土資料館などで木でできた江戸~明治期くらいの手動織機の現物がおかれていることがありますが、近代的な自動織機の展示品を見たことがありません。どこか繊維業関係の展示館などへ行ったら見れるのか?
個人的には、ミュンヘンにあるドイッチェランド博物館で「織機」の展示を見たことあるのが記憶に残っております。古代の手動織機から産業革命期の自動織機、そして近代的な機械まで各種織機をこれでもかと並べてありました。自動織機と言えば英国が本場じゃないかと思いますがドイツも機械工業の本場として充実した展示をしているのではないかと。閑話休題。
今回のサンプルデータセット
さて今回のサンプルデータセットの解説ページは以下にあります。
The Number of Breaks in Yarn during Weaving
単位長さ(具体的な数字はありませぬ)の織物を織る(具体的な装置の記述もありませぬ)ときに、糸の材質(woolというファクタ、AとBの2種類)と張力(tensionというファクタ、L、M、Hという3種類)について断糸回数を数えたデータセットみたいです。当然、工業的な近代的な機械装置に関するデータだと想像しますが、詳細は一切不明。
まずは生データ
まずは生データということで、サンプルデータセットをロードして、データ形式を確認し、サマリをとってみました。
上記のように形式は、フツーのdata.frameです。ファクタの2つをみるとwoolとtensionで合計6個の組み合わせについていずれも9点づつのデータであるようです。断糸回数は最低10回から最高70回と。
処理例に従って処理してみる
上記の生データをロードしてみたものの、どう処理していいかサッパリです。しかし、今回のサンプルデータセットの解説ページには処理例がありました。その通りに処理してみます。まずはプロットから。
ウールAもウールBもテンションが低いと切れやすい感じであります。しかしウールAは中くらいのテンションが一番切れにくそうなのに対して、ウールBは中くらいではバラツキ多し。ウールBはテンションが高いほうが良さげ。ううむ、強い方が切れにくい感じがするものの、使用する糸ごとに最適のテンションがありそうな感じもあり、なんとも言えんな。
まず断糸回数と因子を lm つかって回帰分析してました。こんな感じ。
ここで突然 * というオペレータが現れました。Tilda演算子で記述されるフォーミュラの中に現れるので当然数値の掛け算じゃありません。だいたい * の両側にあるのはファクタです。R言語のhelpから1か所引用させていただきます。
The * operator denotes factor crossing: a*b is interpreted as a + b + a:b.
a:b は「交互作用」ってことらしいです。なんだそれ。確かに、中くらいのテンション(tensionM)のときはwoolAとwoolBの差は明らか。でもtensionHでは微妙?
明らかにtension効いてる感じっす。星三つだし。先ほどの交互作用の項、微妙。5%なら有意といえるけれど、1%では有意とは言えない。。。も少しデータを増やしたら良いのか?