トホホな疑問(7) Arm, PMCCNTRへのUSERモードアクセス

ちょっと思い立って、Raspberry Pi 3 model B+で、x86のRdtscみたいなサイクル数カウントをとろうとしたのです。Armにもサイクルカウンタはあるのですが、通常は特権アクセス。しかし、USERモードでもアクセス可にできるビットがあったので、これをONにしてUSERプログラムで測定すべし、と思ったところがまたまたハマリました。Pi 1 model B+であったならば顕在化しなかった問題であります。 “トホホな疑問(7) Arm, PMCCNTRへのUSERモードアクセス” の続きを読む

AIの片隅で(16) block, thread, warp, lane

AIをタイトルにしながら、低レベルな話ばかり書いていますが、それもこれも

Jetson Nano

は、AIネタと決めたからなんであります。先は長いですが、やっていく先にはAIにもつながりましょう。さて、月曜日に cuda-gdb でハマった話を投稿いたしましたが、デバッガが立ち上がったところでおしまいになってました。CUDA用のデバッガらしい話題皆無。というわけで今回は、実際にcuda-gdbを動かして、CUDAのサンプルプログラムの中身をのぞいてみます。 “AIの片隅で(16) block, thread, warp, lane” の続きを読む

トホホな疑問(6) なぜハング、cuda-gdb

このところ、Jetson Nano用のOSイメージに最初から含まれているJetPackの中のツール類をあれこれ当たってみているのですが、ハングしました。デバッグに必須

cuda-gdb

です。これがハングしているのではデバッグもままなりません。いろいろ調べた結果、動くようになったので書き留めておきます。ま、ちゃんと調べずにとりあえず使ってみて、問題起きたらようやく調べるという、泥縄式がまずい、という自覚はあり、しかし、やめられまへん。 “トホホな疑問(6) なぜハング、cuda-gdb” の続きを読む

AIの片隅で(15) nvccとgprof, oprofile

前回はJetson nano上で nvprof を使い、GPU実行部分のプロファイリングをちょっとだけ触ってみました。しかし、本来はCPU部分のプロファイリングもできる筈の nvprofですが、このプラットフォームではCPUのプロファイリングは駄目だと警告がでます。そこで、CPU部分のプロファイリングについては nvcc生成のCUDA使用の実行ファイルを、定番のgprof と oprofile の2つでプロファイリングしてみました。 “AIの片隅で(15) nvccとgprof, oprofile” の続きを読む

AIの片隅で(14) Jetson Nano、nvprof

Jetson Nanoを使っていくために、大事な

/usr/local/cuda (私の環境では実体は /usr/local/cuda-10.0)

の中のコマンドなどについて順に実際に動かして確かめておこうと思い立ちました。一番といえばやはり nvcc でしょうが、サンプルプログラムをコンパイルするのに既に使っているし、かといってその機能を網羅しようとしたりすればどれだけかかるか分かりません。今回は、使う人は使うけれども、使わない人は使わないんじゃないかと想像する、

nvprof

から動かしてみることにいたしました。コマンドラインのcuda用プロファイラですね。

“AIの片隅で(14) Jetson Nano、nvprof” の続きを読む

トホホな疑問(5) aplay -L、返ってこない

Jetson Nanoに、音声ファイルを食わせたいと思ったのであります。音から判定するようなAIも多いしね。既にRaspberry Pi上でテスト済のUSBオーディオインタフェース(大特価ウン百円)をつなげれば即OKと考えたのですが、あれれ

aplay -L

aplay -l

も戻ってきません。無限ループでもしている感じ。でも意外な所に原因がありました。1箇所直したら再生、録音問題なし。 “トホホな疑問(5) aplay -L、返ってこない” の続きを読む

AIの片隅で(13) Jetson NanoでLチカ

前回、AI業界の “Hello World!” である MNISTをやってしまったので、遅ればせながらマイコン業界の “Hello World!”である Lチカを Jetson Nanoにもやっていただくことにいたしました。128個のCUDAコアをもつJetson Nanoには恐れ多い仕事ですが、エッジでAI狙いのJetsonですからIOくらい制御していただいても文句は言いますまい。 “AIの片隅で(13) Jetson NanoでLチカ” の続きを読む

AIの片隅で(12) Jetson NanoでChainer

前回は Jetson Nanoを立ち上げて CUDA が使えることを確認いたしました。今日は、CUDAにそれらしいことをやらせたい。やっぱりAIネタですね。それであれば、既にOSイメージに含まれている

NVIDIA JetPack SDK

というライブラリを使うことになります。JetPackには肝心のCUDAも含まれているので勿論使わせていただくのですが、こちらはこちらで、以前 Raspberry Pi にChainerをインストールし、人工知能業界のHello World! である MNIST を動かして、モデル間の速度を比べてみたりしております。そこで、 Chainer+MNISTの組み合わせで Raspberry Piと速度を比べてみました。 “AIの片隅で(12) Jetson NanoでChainer” の続きを読む

AIの片隅で(11) NVIDIA Jetson Nanoセットアップ

8月14日の投稿で、NVIDIA Jetson Nano到着、と書きました。しかし時はお盆。15日は作業を中断、本日再開であります。結論から言えば、特に大きな問題もなく、セットアップを完了し、CUDAが使えるという確認をとるところまで行えました。でも、細かい事を言えば、引っかかるところいろいろありました。 “AIの片隅で(11) NVIDIA Jetson Nanoセットアップ” の続きを読む

トホホな疑問(4) Raspberry Pi、Google Home Mini 音を出す小ネタ

この間、Raspberry Pi ZeroにUSBオーディオを取り付けて、音声の録音と再生などを行ってみたことは書かせていただきました。Raspberry Piなどの音声関係については疎くて知らずにいたことも多いです。USBオーディオの記事で書かなかったことについてもメモを残しておくことにいたしました。なにせ記録せずに1週間もたつと皆忘れている今日この頃。 “トホホな疑問(4) Raspberry Pi、Google Home Mini 音を出す小ネタ” の続きを読む

AIの片隅で(10) Actcastベータ版リリース

昨日、Raspberry Piにカメラを取り付けたので、がぜん気になってきたものがあるのです。

Actcast

という「クラウドサービス」です。気になった理由はRaspberry PiのGPUをAIの推論に使っているらしいから。Raspberry PiのGPUはあることは知っていても、NVIDIAのCUDAのように「表立って」使っているようなケースをほとんど聞いたことないので、かなり気になってました。そうしたらちょうど、今月8月1日にActcastはアルファ版からベータ版へと進んだというリリースが。タイミングが良いな。。。 “AIの片隅で(10) Actcastベータ版リリース” の続きを読む

トホホな疑問(3)PYTHONHOME、忘れてました

遅ればせながらも、Python3に移行しなければとようやく決意したのは、Raspberry Pi上で何度もpipを動かしていたためでした。何度も「警告」文が表示されるので、ああ、2020年になったら打ち切りだったのね、と認識を新たにいたしました。ギリギリになって慌てるのも嫌なのでいまから着手しておくかい、と思い至りました。私なんぞの使い方であれば、そんなに「ハマる」ところも無さそうだし。。。 “トホホな疑問(3)PYTHONHOME、忘れてました” の続きを読む

AIの片隅で(9) 続Chainer Tutorial Book

前回、「Chainer演習はまた明日」などと書きながら、わずかに最初の項目を実施しておったんでございます。本来ならば、本日も投稿書いている暇あったら Chainer Tutorial Bookの勉強進めろよ、とも思うのですが、とりあえず演習に辿りつくところまでは書いておきます。そうしないと忘れてしまうから。 “AIの片隅で(9) 続Chainer Tutorial Book” の続きを読む

IoT何をいまさら(32) M5Stackへ, Nucleoから移植

ロガーが必要だな、などと思い至りました。そのお役目はM5Stackへお願いしようと考えているのであります。小なりとは言え、ロガーに必須な記憶装置のスロットあり、自前の表示パネルあり、無線も使えて、なんとなれば自前のバッテリーも使えると至れり尽くせり。ハード的には、センサをI2Cで接続してやればOK。後はソフトを書くだけ。しかしね、ドキュメントが無い分けじゃない(結構いろいろある)割に、私が気になることは見つからなかったりする。一歩一歩確かめていくしかありますまい。 “IoT何をいまさら(32) M5Stackへ, Nucleoから移植” の続きを読む