タグ: ぐだぐだ低レベルプログラミング

2024-05-082024-05-15

ぐだぐだ低レベルプログラミング(165)ARM64(AArach64)SIMD即値シフト

Joseph Halfmoon

何時ものツブヤキですが、今回こそは腹の底から言いたいです。「命令多過ぎA64」と。今回はSIMDの即値を引数にとるシフト命令です。シフト命令なので、右、左あり、シフト量は即値で指定ね、とシンプルに行くことを期待したものの、A64がそれを許すハズが無かったのです。いろいろオプションありすぎ命令も多過ぎ。 “ぐだぐだ低レベルプログラミング(165)ARM64(AArach64)SIMD即値シフト” の続きを読む

2024-05-012024-05-08

ぐだぐだ低レベルプログラミング(164)ARM64(AArach64)SIMD即値命令

Joseph Halfmoon

前回はSIMDの転置(transpose)命令に「絶対自分じゃ思いつかね～」と感心しました。今回はSIMDでも即値（イミーディエイト）をソースにとる命令群です。たった８ビットなんだけれどもその効果たるや意外と複雑？中でも８ビット即値を浮動小数にエンコードしてロードするFMOV命令にはちょいとてこずりましたぞ。

“ぐだぐだ低レベルプログラミング(164)ARM64(AArach64)SIMD即値命令” の続きを読む

2024-04-242024-05-01

ぐだぐだ低レベルプログラミング(163)ARM64(AArach64)SIMD 転置命令

Joseph Halfmoon

今回はSIMD命令の華「transpose」命令の実習をしたいと思います。転置デス。行列にはつきもののアレです。「簡単な操作」なのでメモリ上の要素をループで読んで順序を変えて書き戻せば可能。でもメモリにアクセスする時間を考えると大変。しかしA64のTRN1、TRN2を使えばレジスタ上で転置ができてしまうっと。
“ぐだぐだ低レベルプログラミング(163)ARM64(AArach64)SIMD 転置命令” の続きを読む

2024-04-172024-04-24

ぐだぐだ低レベルプログラミング(162)A64(AArach64)SIMD permute

Joseph Halfmoon

今回からSIMDレジスタ２個の内容を「混ぜあわせて並び変える」permute命令群の練習に入りたいと思います。SIMD命令でプログラムを書こうとすると避けて通れないどころか、ここの始末のエレガントさで性能段違いっす。まさにSIMDの華というべきか。ホントか？誰が言った？今回はその露払いね。 “ぐだぐだ低レベルプログラミング(162)A64(AArach64)SIMD permute” の続きを読む

2024-04-102024-04-17

ぐだぐだ低レベルプログラミング(161)A64 SIMD要素毎SQDMLAHはARMv8.1

Joseph Halfmoon

今回こそ「SIMDレジスタの一方の全要素に他方の一要素を共通に掛け算」する命令の練習を完了せんとしたところ、既に完了していることに気づいて愕然。お楽しみにとっておいた「符号付整数の乗算結果を２倍して積和した結果の上側半分を丸めて格納、もし溢れたらサチュレーション」は実習不可。それどころかあちこち要訂正。トホホ。

“ぐだぐだ低レベルプログラミング(161)A64 SIMD要素毎SQDMLAHはARMv8.1” の続きを読む

2024-04-032024-04-10

ぐだぐだ低レベルプログラミング(160)A64 SIMD要素毎SQDMLAL(題訂正）

Joseph Halfmoon

前回に続き「SIMDレジスタの一方の全要素に他方の一要素を共通に掛け算」する命令の練習です。今回は「符号付整数の乗算結果を２倍した上で倍のビット幅のレジスタに積和もしくは積差を行った結果が溢れたらサチュレーションさせる」命令を練習してみます。まあ何度となくメンドクセー奴らを練習してきたのでこのくらいはなんてことない？ “ぐだぐだ低レベルプログラミング(160)A64 SIMD要素毎SQDMLAL(題訂正）” の続きを読む

2024-03-272024-04-10

ぐだぐだ低レベルプログラミング(159)A64(AArach64)SIMD要素毎FMULX

Joseph Halfmoon

前回につづき「SIMDレジスタの一方の全要素に他方の一要素を共通に掛け算」する浮動小数点演算命令を練習しようとして発覚。FMLAL, FMLAL2, FMLSL, FMLSL2の４命令、ARMv8.2以降の実装です。ARMv8.0では練習できません。ラッキー？残りはと見ればFMULXのみ。しかしメンドクセー奴なんだ。
“ぐだぐだ低レベルプログラミング(159)A64(AArach64)SIMD要素毎FMULX” の続きを読む

2024-03-202024-03-27

ぐだぐだ低レベルプログラミング(158)ARM64(AArach64)SIMD要素毎FMUL

Joseph Halfmoon

「SIMDレジスタの一方の全要素に他方の一要素を共通に掛け算」する系統の命令があまりに数が多いです。前回それらを表にまとめました。今回はそれらの中から「シンプル」な浮動小数の乗算、積和算、積差算を練習してみたいと思います。シンプルとは言え積和が出てくると fused計算を避けて通れませぬ。fusedの効果確認メンドい

“ぐだぐだ低レベルプログラミング(158)ARM64(AArach64)SIMD要素毎FMUL” の続きを読む

2024-03-132024-03-20

ぐだぐだ低レベルプログラミング(157)ARM64(AArach64)SIMD 要素毎MUL

Joseph Halfmoon

前回、SIMDレジスタの全要素に、別なSIMDレジスタの１要素を乗じる形の命令を練習しました。この「全要素に他方の一要素を共通で掛け算」する系統の命令は実に３３種あり（前回の３種含む）、忘却力の老人が覚えきれるものではありませぬ。そこで今回は一覧表を作って「整理」してみたのだけれど、ダメだ、こんがらがる。。。

“ぐだぐだ低レベルプログラミング(157)ARM64(AArach64)SIMD 要素毎MUL” の続きを読む

2024-03-062024-03-13

ぐだぐだ低レベルプログラミング(156)ARM64(AArach64)SIMD MUL

Joseph Halfmoon

SIMDの「整数変換系」まだあると思ったらFRINT32X一族はARMv8.0には存在せず。ラッキー？前回で整数変換系の練習は終わりであります。そこで次の単元？に入ったですが、今度はSIMDのMUL系、まだ練習してないことに気づきました。もっとムツカシー奴らは練習していたのにシンプルなMULやってなかったのね。。。

“ぐだぐだ低レベルプログラミング(156)ARM64(AArach64)SIMD MUL” の続きを読む

2024-02-282024-03-06

ぐだぐだ低レベルプログラミング(155)ARM64(AArach64)SIMD FCVTxy

Joseph Halfmoon

前回は浮動小数を浮動小数フォーマットのまま整数に丸めるFRINTx命令でした。今回は浮動小数を丸めて「ホンモノの」整数表現に変換してしまうFCVTxy命令です。前回は丸めモードフラグに影響される命令が２個ありましたが、今回は相当する命令はありません。命令減ったの？とみれば増えとります。変換先が２種類あるから。
“ぐだぐだ低レベルプログラミング(155)ARM64(AArach64)SIMD FCVTxy” の続きを読む

2024-02-212024-02-28

ぐだぐだ低レベルプログラミング(155)ARM64(AArach64)SIMD FRINTx

Joseph Halfmoon

前回につづき今回も勝手命名「SIMD整数変換系」の命令の練習です。浮動小数値を浮動小数形式のまま整数に丸めるもの。メンドイので後回しにしたかった奴ら。浮動小数に「つきもの」の丸めモロだしです。丸めの差が見えるように入力値を選ばねばならないけれど、一部の結果はステータスフラグまで見に行かないとわかりませぬ。メンドイ。

“ぐだぐだ低レベルプログラミング(155)ARM64(AArach64)SIMD FRINTx” の続きを読む

2024-02-14

ぐだぐだ低レベルプログラミング(154)ARM64(AArach64)SIMD from整数

Joseph Halfmoon

前回はSIMD「整数変換系」と勝手に称して表をまとめるだけで疲れてしまい、実習なしでした。今回は実習編。整数から浮動小数への変換命令の練習です。ニーモニック的には前回の巨大な表の末尾の２個だけです。浮動小数からの変換命令がそれだけ多いということだけれども、整数からの変換にも多少は凸凹あり。それほど単純ではありませぬ。 “ぐだぐだ低レベルプログラミング(154)ARM64(AArach64)SIMD from整数” の続きを読む

2024-02-072024-02-14

ぐだぐだ低レベルプログラミング(153)ARM64(AArach64)SIMD 整数変換系

Joseph Halfmoon

メンドクセーのでなるべく後回しにしていたのですが、やる順番です。勝手命名、SIMD「整数変換系」です。浮動小数の数値を「整数」に変換したりその逆をするもの。前回が浮動小数の数値のフォーマット変換（単精度から倍精度とか）であったのでここでやっとかないとイケない感じ。毎度のことですが叫ばざるを得ません。命令多過ぎA64と。

“ぐだぐだ低レベルプログラミング(153)ARM64(AArach64)SIMD 整数変換系” の続きを読む

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28