タグ: ぐだぐだ低レベルプログラミング

2023-12-202023-12-27

ぐだぐだ低レベルプログラミング(146)ARM64(AArach64)SIMD カウント系

Joseph Halfmoon

前回ようやく２要素を演算した結果の要素のビット幅が変わる奴らをやっつけ終えました。今回から１要素を処理して１要素が得られる系統の命令に入ります。ともかく命令数が多いのでコマケー話は踏みつぶしてサッサと通り過ぎたい気でいるのですがどうなることか。その初回は「カウント系」です。クセさえ分かればどおってことない。ホントか？
“ぐだぐだ低レベルプログラミング(146)ARM64(AArach64)SIMD カウント系” の続きを読む

2023-12-132023-12-20

ぐだぐだ低レベルプログラミング(145)ARM64(AArach64)SIMD ビット幅変4

Joseph Halfmoon

SIMD要素のビット幅が変化する命令群の練習の最後は乗算系です。今まで練習してきた加算系、減算系と異なり、ビット幅が狭くなる方向の命令はありません。そして広くなる方向にWideとLongの２種類の区別があるとかもありません。だから命令数少ないかと言ったらそうはいかないA64です。18個とな。命令多過ぎA64。

“ぐだぐだ低レベルプログラミング(145)ARM64(AArach64)SIMD ビット幅変4” の続きを読む

2023-12-062023-12-13

ぐだぐだ低レベルプログラミング(144)ARM64(AArach64)SIMD ビット幅変3

Joseph Halfmoon

前回、前々回でSIMD要素のビット幅が狭く(narrow)なる、広く（wide/long）なる命令群のうち「加算系」を練習してみました。加算あれば減算あり、とは言え加算命令群と「対称な」減算命令群ならパスしても良いのでは？と思ったら「減算系」には差を取った後、絶対値をとる命令群もあるのです。命令多過ぎA64。

“ぐだぐだ低レベルプログラミング(144)ARM64(AArach64)SIMD ビット幅変3” の続きを読む

2023-11-292023-12-06

ぐだぐだ低レベルプログラミング(143)ARM64(AArach64)SIMD ビット幅変2

Joseph Halfmoon

前回は、SIMD要素のビット幅が狭く(narrow)なる、広く（wide/long）なる命令の転送パターンを整数加算を例にいくつか練習してみました。今回は、丸め有/丸め無、符合付／符号無、各種組み合わせを練習してみます。題材は整数加算のみなんだけれども。いったいどんだけ組み合わせがあるんじゃ。つくづく命令多過ぎA64。

“ぐだぐだ低レベルプログラミング(143)ARM64(AArach64)SIMD ビット幅変2” の続きを読む

2023-11-222023-11-29

ぐだぐだ低レベルプログラミング(142)ARM64(AArach64)SIMD ビット幅変？

Joseph Halfmoon

前回、前々回とA64のSIMD比較命令を練習。今回から要素のビット幅が「変わる」SIMD算術演算命令に入ります。通常のSIMD命令は要素のビット幅は不変なのでコイツ等はちょっと変わり者です。しかし変わり者といえどフツーにひと揃いの演算が含まれております。命令多過ぎA64。いったい何個あるんじゃあ。

“ぐだぐだ低レベルプログラミング(142)ARM64(AArach64)SIMD ビット幅変？” の続きを読む

2023-11-152023-11-22

ぐだぐだ低レベルプログラミング(141)ARM64(AArach64)SIMD fcmeq

Joseph Halfmoon

前回に続きSIMDの比較命令の練習です。今回は浮動小数型。条件一致すればオール１、不一致でオール０が結果です。いつもの通りA64の命令多すぎ、と書いておきます。前回の整数型であったビット比較が無くなって１個減ったと思ったら、絶対値比較が２個も増えている。かえって練習するパターン増だと。流石だなA64。

“ぐだぐだ低レベルプログラミング(141)ARM64(AArach64)SIMD fcmeq” の続きを読む

2023-11-082023-11-15

ぐだぐだ低レベルプログラミング(140)ARM64(AArach64)SIMD cmeq

Joseph Halfmoon

今回練習するのはSIMDの比較命令です。スカラー同士の比較であれば分岐のためですが、SIMDの場合は各要素の計算を「通すか否か」のマスク的なものの生成。今回対象は浮動小数比較でなく整数のみですが、いつものとおりA64の命令多すぎ。便利そうな命令は網羅するのがArmの行き方か。ミニマリストではないわいな。多分。

“ぐだぐだ低レベルプログラミング(140)ARM64(AArach64)SIMD cmeq” の続きを読む

2023-11-012023-11-08

ぐだぐだ低レベルプログラミング(139)ARM64(AArach64)SIMDsqdmulh

Joseph Halfmoon

今回練習するのは２命令、その一つのニーモニックはSQRDMULHです。マニュアルから命令の意味を引用すると「Signed saturating Rounding Doubling Multiply returning High half」です。これだけでメンドクセー奴だということだけは分かります。掛け算系の氷山の一角。

“ぐだぐだ低レベルプログラミング(139)ARM64(AArach64)SIMDsqdmulh” の続きを読む

2023-10-252023-11-01

ぐだぐだ低レベルプログラミング(138)ARM64(AArach64)SIMD sqshl

Joseph Halfmoon

毎度ですがA64の命令多すぎ。今回練習するのはSIMDのシフト命令です。符合付/符号無、サチュレーションの有無、丸めの有無で２の３乗、合計８種のニーモニックが存在します。そしてニーモニック上はLEFTと読めるので左シフトだけかと思えば「負の左シフトは右シフト」ということで右シフトも出来。でもこれだけじゃなかったんだ。

“ぐだぐだ低レベルプログラミング(138)ARM64(AArach64)SIMD sqshl” の続きを読む

2023-10-182023-10-25

ぐだぐだ低レベルプログラミング(137)ARM64(AArach64)SIMD sqadd

Joseph Halfmoon

前回は演算後のHavingで桁あふれに備える系統の命令を実験しました。今回はサチュレーション演算によって桁あふれしない範囲内に結果をとどめるための系統の命令を使ってみます。SQADD、UQSUBなどと命令ニーモニックの中にQを含む命令共です。しかし命令充実（A64の命令数大すぎ。）とても１回じゃ練習しきれませぬ。 “ぐだぐだ低レベルプログラミング(137)ARM64(AArach64)SIMD sqadd” の続きを読む

2023-10-112023-10-18

ぐだぐだ低レベルプログラミング(136)ARM64(AArach64)SIMD shadd

Joseph Halfmoon

前回はチラリと代数学が出てきてビビリました。今回はビビらないで済む普通の算術っす。整数の足し算ね。でもSIMDあるあるデス。整数の足し算といっても一筋縄ではいかんのですな（勿論フツーの足し算もあるけれども。）今回は加算後に１ビット右シフトを伴う（値をだいたい半分にするということだね）一族を練習してみます。
“ぐだぐだ低レベルプログラミング(136)ARM64(AArach64)SIMD shadd” の続きを読む

2023-10-042023-10-11

ぐだぐだ低レベルプログラミング(135)ARM64(AArach64)SIMD pmul

Joseph Halfmoon

何度も書いてますが、A64の命令、特にSIMD命令多すぎ。SIMDで普通の足し算だのはメンドイのでほぼ省略、ユニークな奴らだけ練習してます。前回はニュートン・ラフソン法にてご利益があるらしい命令をやりました。今回は多項式っす。ここを掘っていくと群、環、体などという者どもが飛び出してくること必定。ヤバイ命令だよ。
“ぐだぐだ低レベルプログラミング(135)ARM64(AArach64)SIMD pmul” の続きを読む

2023-09-27

ぐだぐだ低レベルプログラミング(134)ARM64(AArach64)SIMD frecps

Joseph Halfmoon

今回練習するのは frecps 命令です。なんじゃそれ？という感じ。これぞニュートン法（ニュートン・ラフソン法）で方程式を解く（当然SIMD命令を駆使して）ときに活躍する命令なのであります。遥かなる太古の時代、大学の数値解析の授業の最初の方でニュートン法やりましたな。最近の縁の下ではこういう命令が駆使されておる、と。

“ぐだぐだ低レベルプログラミング(134)ARM64(AArach64)SIMD frecps” の続きを読む

2023-09-202023-09-27

ぐだぐだ低レベルプログラミング(133)ARM64(AArach64) SIMD bit操作

Joseph Halfmoon

まだSIMDのMOV命令は残っているのですが、今回はさっさと先に進みます。言ってもしょうがないけどA64の命令多すぎ。特にSIMD命令多すぎ。今回実験してみるのはSIMDのbit操作関係の命令群です。ビット操作なので要素は記述の形式的で、実際はSIMDレジスタの全ビット幅の各ビットに対して作用するもの。

“ぐだぐだ低レベルプログラミング(133)ARM64(AArach64) SIMD bit操作” の続きを読む

月	火	水	木	金	土	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31