カテゴリー: SoC

2024-08-072024-08-21

ぐだぐだ低レベルプログラミング(178)ARM64(AArach64)オプショナル命令確認

Joseph Halfmoon

前回「表引き」命令を練習した後も練習すべき「SIMDのデータ処理命令は尽きまじ」などと思っておったお惚け老人です。しかしマニュアルをよく見てみれば、残り２つのカテゴリのうち一つは ARMv8.3、もう一つは ARMv8.0だけれども「optional」でした。ラズパイ４機で該当の「optional」使えるのか？

“ぐだぐだ低レベルプログラミング(178)ARM64(AArach64)オプショナル命令確認” の続きを読む

2024-07-31

ぐだぐだ低レベルプログラミング(177)ARM64(AArach64)SIMD 表引き命令群

Joseph Halfmoon

今回は「表引き」命令群です。「群」といっても２命令だけ。SIMD（ベクトル）ソースレジスタのバイト要素をインデックスとして、複数のSIMDレジスタを「バイト・テーブル」としてアクセスし、引いた結果をデスティネーションのSIMDレジスタに書き込むという命令です。１度に最大１６個の表引きをできるもの。単純だけれど強力？

“ぐだぐだ低レベルプログラミング(177)ARM64(AArach64)SIMD 表引き命令群” の続きを読む

2024-07-242024-07-31

ぐだぐだ低レベルプログラミング(176)ARM64(AArach64)SIMD ペア操作群2

Joseph Halfmoon

前回はベクトルレジスタ２個の隣接要素どうし演算、ベクトルレジスタ１個分（半分の長さ）に縮める「ペアワイズ」操作のうち整数演算の命令５つを練習。今回は残りの「ペアワイズ」操作命令５個を練習してみます。今度は浮動小数点命令ね。やっぱりADDとMAX、MIN操作なのだけれどもNANの扱いでMAX、MINは各２命令あり。
“ぐだぐだ低レベルプログラミング(176)ARM64(AArach64)SIMD ペア操作群2” の続きを読む

2024-07-172024-07-24

ぐだぐだ低レベルプログラミング(175)ARM64(AArach64)SIMD ペア操作群1

Joseph Halfmoon

前回まで「ベクトル横断」命令群を練習してました。ベクトルにつまった要素を縮約処理して１個のスカラーにまとめてしまうもの。しかし、スカラーにまでまとめる前にもう一手間あるんじゃないすか、というのが今回のペア操作です。複数SIMDレジスタにまたがる長大なベクトルを隣接要素どうしで処理して半分の長さに縮めるもの。
“ぐだぐだ低レベルプログラミング(175)ARM64(AArach64)SIMD ペア操作群1” の続きを読む

2024-07-102024-07-17

ぐだぐだ低レベルプログラミング(174)ARM64(AArach64)SIMD FMAXV

Joseph Halfmoon

前回から「Across Vector」、SIMDレジスタに並ぶ各要素を横断的に処理（縮約）して１個のスカラー値を得る命令を練習してます。今回はFMAXVとその一族です。浮動小数要素のMAXおよびMINを求める命令ですが２命令づつあります。同じMAXとる命令でもNaNの扱いで２種類に分かれるっと。メンドクセー奴だよ。
“ぐだぐだ低レベルプログラミング(174)ARM64(AArach64)SIMD FMAXV” の続きを読む

2024-06-262024-07-03

ぐだぐだ低レベルプログラミング(172)ARM64(AArach64)SIMD即値シフト8

Joseph Halfmoon

ついにA64のSIMD即値シフト命令、８回を費やし今回にて完了であります。命令数トンデモなかったデス。今回は残るナロー化（ソース要素のビット幅の半分の結果を得る）右シフト一族のうち、サチュレーションやらラウンディングやら複数重なるような複雑な奴らです。でもね、順番にやっているうちに慣れました？どんとこいっと。ホントか？
“ぐだぐだ低レベルプログラミング(172)ARM64(AArach64)SIMD即値シフト8” の続きを読む

2024-06-192024-06-26

ぐだぐだ低レベルプログラミング(171)ARM64(AArach64)SIMD即値シフト7

Joseph Halfmoon

どんだけあるんだA64のSIMD即値シフト命令ということですが、後一息デス。今回は残る「ナロー化一族（勝手命名）」を２回に分けて練習する予定の１回目です。ロング化が左シフトのみであったのに対して、ナロー化は右シフトのみです。右シフトした結果のビット幅を半分にして格納するナロー化一族。でもいろいろあるのよ。
“ぐだぐだ低レベルプログラミング(171)ARM64(AArach64)SIMD即値シフト7” の続きを読む

2024-06-122024-06-19

ぐだぐだ低レベルプログラミング(170)ARM64(AArach64)SIMD即値シフト6

Joseph Halfmoon

前回、ロング化一族（勝手命名）を２回に分けて練習すると書きました。しかし既視感。実は今回練習にとってあった４命令、練習済でした。実体がない上に、二股かけてる？奴らだったからです。気を取り直して今回は挿入系一族（勝手命名）といっても２命令だけですがを練習していきたいと思います。ぐだぐだな成り行きだな。
“ぐだぐだ低レベルプログラミング(170)ARM64(AArach64)SIMD即値シフト6” の続きを読む

2024-06-052024-06-12

ぐだぐだ低レベルプログラミング(169)ARM64(AArach64)SIMD即値シフト5

Joseph Halfmoon

今回も対称性（直交性）は破れているの回です。前回のアキュムレート付きシフトは全て右シフトでした。今回から２回にわけて練習する予定のロング化（デスティネーションがソースのビット幅の倍のビット幅になる）シフトは全て左シフトです。当たり前っちゃ当たり前だけれども。ただロング化一族の中でも微妙に凸凹あり。 “ぐだぐだ低レベルプログラミング(169)ARM64(AArach64)SIMD即値シフト5” の続きを読む

2024-05-292024-06-05

ぐだぐだ低レベルプログラミング(168)ARM64(AArach64)SIMD即値シフト4

Joseph Halfmoon

SIMDの即値シフト命令の練習４回目。今回は勝手命名「即値シフトのアキュムレート系」を練習。即値シフト後の値をデスティネーションレジスタの値に加えるものです。命令を並べてみるとこの一族は「直交的」です。A64にはめずらしい対称性？ただし、アキュムレート一族は右シフトのみ。根本的なところで対称性は破れている？違うか。
“ぐだぐだ低レベルプログラミング(168)ARM64(AArach64)SIMD即値シフト4” の続きを読む

2024-05-222024-05-29

ぐだぐだ低レベルプログラミング(167)ARM64(AArach64)SIMD即値シフト3

Joseph Halfmoon

SIMDの即値シフト命令の練習３回目です。前回は「一番ちょろい」命令３つばかりを練習してお茶を濁しました。今回は「ちょっと複雑な」命令に入っていきたいと思います。ただし、ナローとかロングとかは無。インサートとアキュムレートも無。それでも飽和と丸めが有り。その上、符号付だか符号無だかハッキリしろいと言いたくなる奴あり。
“ぐだぐだ低レベルプログラミング(167)ARM64(AArach64)SIMD即値シフト3” の続きを読む

2024-05-162024-05-26

冥界のLSI(10) NEC（大昔の）Vシリーズ、シングルチップおまとめ

Joseph Halfmoon

２０世紀のチップ共の記憶が薄れゆく中、いくらかでも記憶にとどめるべく取りとめないこと書き連ねてます。今回は第７回「V41/V51、NEC版PC/XTワンチップ」の補足。NEC V30は「いろいろあって」多くの人が記憶にとどめているけれど、VシリーズにはMCUもSoC（当時はそういう名前はなかったけど）もあったのだよね。
“冥界のLSI(10) NEC（大昔の）Vシリーズ、シングルチップおまとめ” の続きを読む

2024-05-152024-05-22

ぐだぐだ低レベルプログラミング(166)ARM64(AArach64)SIMD即値シフト2

Joseph Halfmoon

前回は、即値でシフトのビット数を指定できるSIMD命令のあまりの多さに、その特徴を表に整理するところで力つきました。ようやく今回から実機練習に戻ります。まずは「一番簡単な」シフトから。まあ後に控えている奴らを考えたら素直で分かり易いです。単純な左シフトと右シフトです。対称な２命令かと思えば、A64がそんな筈ないっと。
“ぐだぐだ低レベルプログラミング(166)ARM64(AArach64)SIMD即値シフト2” の続きを読む

2024-05-082024-05-15

ぐだぐだ低レベルプログラミング(165)ARM64(AArach64)SIMD即値シフト

Joseph Halfmoon

何時ものツブヤキですが、今回こそは腹の底から言いたいです。「命令多過ぎA64」と。今回はSIMDの即値を引数にとるシフト命令です。シフト命令なので、右、左あり、シフト量は即値で指定ね、とシンプルに行くことを期待したものの、A64がそれを許すハズが無かったのです。いろいろオプションありすぎ命令も多過ぎ。 “ぐだぐだ低レベルプログラミング(165)ARM64(AArach64)SIMD即値シフト” の続きを読む

月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31