
お惚け老人も学べば立派になれるかもなGoogle様のMACHINE LEARNING CRASH COURSEを学ぶ全12ユニットの第8回です。過去回でワンホット・エンコーディングを学びましたが、今回はエンベディングだそうな。しかしこの可視化ツール(Web上の)に感動、見ていて飽きませぬ。40分、「足らんな~」
エンベディング
ワンホット・エンコーディングを学んだときに、密に「スパースすぎるんでないの」などと不埒な感想を持ってました(恐れ多くていいませんが)、まあ、そう思うのは当然だったようです。そこで登場するのが「エンベディング」です。今回の単元のお品書きが以下に。
40分かあ、そしてインタラクティブな演習はあるものの、プログラミング演習はない、です。前回よりも大分負荷が軽い? とおもったら可視化ツールの面白さに40分じゃ全然足らないこと必定。
食べ物のお名前
最初の説明のところで、いろいろな食べ物(似た食べ物をレコメンデーションするようなアプリモデルの作成をイメージしているみたい)が出てくるのですが、英語で綴られると日本人には食べ物のお名前が素直に入ってきませぬなあ。borscht(ボルシチ)はまあ分かるケド、shawarmaって何? どうも日本で任期のトルコ式のケバブに類似しているが微妙に違うものなの?どうなの。apple strudel(シュトゥルーデル)は、もしかするとウチのカミさんが好きなアレ?お菓子詳しくないしな。tangyuanって何?漢字で書くと「湯円」ね。昔、台湾とか上海に行っていたころに食べたかも知れない。まあ、肝心の「エンベディング」のお勉強の最中に横道にそれてしまって頭に入りませぬ。
Embedding Projector
そして登場するのが Tensorflow の中の可視化ツールの一つらしい、Embedding Projectorであります。
https://projector.tensorflow.org/?hl=ja
まさに「エンベディング」を可視化するものらしいです。こんな感じ。
3次元空間にすると3次元の空間がグルグル回っている中に、各点が表示されます。クリックすると回転は停止する代わり、マウスを使って所望の位置にズームしたり回転したりと思うがまま。パラメータもそこそこあるので、操作していると飽きませぬ。なお、上記でPCA指定してますが、カブスの選手ではありませんよ、主成分分析です。
上記ツールは今回単元の各所に現れるのですが、「エンベディング空間と静的エンベディング」の項で予定時間5分とな。短すぎます。
また、「Interactive exercises」の項は、どういうわけか英語ページのみです。前後のページは例によって日本語に自動翻訳してくれる(そしてイマイチな日本語が悲しいのですが)のに何故?
お勉強の結果
完了した直後から忘却力の年寄りの忘却曲線が始まっておると。どうなんだい。