前回に続き、今回も「どう処理したらよいのかサッパリ」なサンプルデータセットです。rockとな。どうも石油貯留層から取り出した岩石サンプルの物理的な測定結果のデータセットみたいです。ただサンプルデータ眺めていても、なんのこっちゃサッパリ分かりませぬ。処理例等も一切なし。しかし国土交通省様がヒントをくれる?と。ホントか。
※「データのお砂場」投稿順Indexはこちら
R言語所蔵のサンプルデータセットをABC順(大文字)優先で拝見させていただいております。ときどき「なんのことやらサッパリ分からない」データセットに遭遇いたします。そういうときこそ「新たな世界、この世の不思議」に遭遇しているものと。妄想は広がる。
今回のサンプルデータセット
サンプルデータセットの解説ページが以下に。
Measurements on Petroleum Rock Samples
このページのきわめて簡潔な記述から分かるのは以下です。なおソースはBP ResearchとあるのでBP=British Petroleumでないかと。
-
- 石油貯留層から得た48の岩石サンプル(12個のコアサンプル、各コアサンプル毎4つの断面、合計48)の測定値、測定項目は以下の4つ
-
-
- 断面毎の空隙の面積(256×256ピクセル区画単位)合計
- 空隙の周囲長(ピクセル単位)
- shape、空隙の周囲長を空隙面積の平方根で割ったもの
- perm、浸透率、単位ミリダルシー
-
1~3もどこをどう測っているのだかよく分からん数字ではあるのです。例えば3番のshapeという値は、2を1の平方根で割ったもの?とも考えましたが計算してみたら違いました。しかし大体のケタはあっているので、合計面積ではなく、個別の空隙毎の計算値(の平均?)とも想像されます。本当はなんなの?
それに「単位ミリダルシー」初めて聞く単位です。SI単位系ではありませぬ。どうも石油探査業界御用達の単位みたいっす。ダルシー様が発見したダルシーの法則に基づく単位らしいです。なんのこっちゃと思ったら、「簡単な説明」が以下のページにありました。独立行政法人エネルギー・金属鉱物資源機構様 石油・天然ガス資源情報の中のページです
おお、ミリダルシー、分かったような気がします(ホントか?)しかしよく考えるとサッパリ。でもね助け舟?は意外なところに見つかりました。国土交通省様の以下の大部なPDF資料の一部です。
P.117の3.5.2 油層岩特性のところをご覧あれ、貯留岩の特性について解説があります。ただし、そこで論じられている孔隙率というものは体積的な比率で、上記の断面から求めた面積的な測定値とは異なります。また隙間が空いているように見えても他の隙間と「つながっていない」隙間は活用できないので無いも同然みたいっす。本当は、有効孔隙ーーつながりあっているものーーが大事みたい。
まずは生データ
生データをロードしてみました。通常のdata.frameです。
とりあえず、データの感触をみるために summaryとってみました。こんな感じ。
データ数は大したことないので、全体も眺めてみました。以下は全体48個の先頭16個分です。
上記をみると perm(浸透率)が同一のデータが4個づつ並んでいるので、4個のデータは同じ一つのサンプル岩の4断面ということみたいです。
そこに何か傾向はないんか?ということで困ったときのplot()頼みです。こういうときにR言語は渡されたオブジェクトにより「適切に(テキトーに)」挙動が変わるので便利。
plot(rock)
実は、浸透率permと他の項目で何か相関がでるんではないの、と期待していたのですが、このグラフではよく分かりませんな。一方、areaとperiには正の相関がありそうです。でもな~、穴ぼこの面積が大きければ、その周囲長も長くなるのは道理だよなあ。そこに不思議はない?
無理やり「プライヤー」にかけてみた
tidyverseパッケージをロードして、プライヤー相当の機能を使えるようにしてみました。一つのサンプル岩の4断面は同じperm値を持っているので、それでグループ化することでサンプル岩毎に処理できます。その中間データに対してareaの平均値を求めてみました。こんな操作ね。
library(tidyverse) work = group_by(rock, perm) result = summarize(work, mean(area)) result
操作結果が以下に。
上記をプロットしたものが以下に。黄色のマーカは勝手な妄想デス。
上は、岩を3種に分類できるのではないかという妄想っす。空隙はあるけれど浸透率が低い左上のグループ。空隙と浸透率がほほぼぼ比例関係にある真ん中のグループ、そして右下の浸透率ヤバイよ、なサンプル岩ひとつであります。
本当はどうなんだか、妄想は出来るけど。