タグ: ぐだぐだ低レベルプログラミング

2023-07-052023-07-12

ぐだぐだ低レベルプログラミング(123)ARM64(AArach64)LDNP/STNP

Joseph Halfmoon

前回はレジスタ・ペアをロード／ストアするLDPとSTP命令を練習しました。今回のLDNP/STNP、「表向きの機能」はLDPとSTPとクリソツです。アドレシングモードが少ないことを除けば見分けがつきません。しかしこの命令の真の機能は無駄にキャッシュラインをアサインしないことにあります。確かめるのはムツカシーです。

“ぐだぐだ低レベルプログラミング(123)ARM64(AArach64)LDNP/STNP” の続きを読む

2023-06-282023-07-05

ぐだぐだ低レベルプログラミング(122)ARM64(AArach64)LDP/STP

Joseph Halfmoon

似たような命令を何度も練習しているのも、A64の命令が多すぎるからと同じ文句を垂れてます。今回は浮動小数/SIMD（スカラー扱い）レジスタの「ペア」を一度にロード、ストアするLDP命令とSTP命令です。この命令とは別に複数レジスタを一度にロードできるベクトルロード、ストアもあるのだけれども、また後で。

“ぐだぐだ低レベルプログラミング(122)ARM64(AArach64)LDP/STP” の続きを読む

2023-06-212023-06-28

ぐだぐだ低レベルプログラミング(121)ARM64(AArach64)LDUR/STUR

Joseph Halfmoon

今回も「A64の命令多すぎ」感を醸し出す命令であります。浮動小数とSIMD（スカラー扱い）レジスタに対するロード、ストア命令の「一翼を担う」LDUR/STUR命令です。似たアドレシングモードはLDR/STRでも使えるのだけれども、ちょっと違うんだと。Armの八方美人的体質の成せる技？あれば使ってしまうの道理かと。

“ぐだぐだ低レベルプログラミング(121)ARM64(AArach64)LDUR/STUR” の続きを読む

2023-06-142023-06-21

ぐだぐだ低レベルプログラミング(120)ARM64(AArach64)Floatのストア#1

Joseph Halfmoon

ロードあればストアあり。前回、前々回と浮動小数とSIMD（スカラー）のロード命令(LDR)を練習してみました。今回は対になるストア命令(STR)の練習です。ほぼ同様なアドレシングモードが使用できますが、唯一PC相対だけはありません。PC相対で指定できるのは”.TEXT”セグメントと解釈されるのでストアは対象外っと。

“ぐだぐだ低レベルプログラミング(120)ARM64(AArach64)Floatのストア#1” の続きを読む

2023-06-072023-06-14

ぐだぐだ低レベルプログラミング(119)ARM64(AArach64)Floatのロード#2

Joseph Halfmoon

前回より浮動小数点レジスタおよびSIMDレジスタのスカラーに関するメモリからのロード命令の練習を始めました。何度も書いているようにA64の命令も多すぎなら、アドレシング・モードも多すぎ（個人の感想です。）下手をするとオペランドのビット幅のバリエーションが多い分、整数ロード命令より組み合わせ多いんでないの。

“ぐだぐだ低レベルプログラミング(119)ARM64(AArach64)Floatのロード#2” の続きを読む

2023-05-312023-06-07

ぐだぐだ低レベルプログラミング(118)ARM64(AArach64)Floatのロード#1

Joseph Halfmoon

ようやく浮動小数の「スカラー演算」命令をあらかた舐めたので次はSIMD命令と思いました。しかし「浮動小数およびSIMDの」ロード・ストア命令の練習を挟んでおきたいと思います。ロード、ストア無にはSIMDの威力も半減以下と。ロード、ストア命令自体は以前やった整数のロード、ストアの以下同文。それでもいろいろありすぎA64。
“ぐだぐだ低レベルプログラミング(118)ARM64(AArach64)Floatのロード#1” の続きを読む

2023-05-242023-05-31

ぐだぐだ低レベルプログラミング(117)ARM64(AArach64)FCSEL

Joseph Halfmoon

前回FCMP命令を練習したので「そこへの道が開いた」のがFCSEL命令であります。比較結果（条件フラグ）に基づいて「ソース１」をデスティネーションに書き込むのか「ソース２」を書き込むのか実行するもの。C言語の３項演算子みたいなものですが、肝心の条件比較は先行する命令、FCMPかCMP（整数比較）などにお任せです。
“ぐだぐだ低レベルプログラミング(117)ARM64(AArach64)FCSEL” の続きを読む

2023-05-172023-05-24

ぐだぐだ低レベルプログラミング(116)ARM64(AArach64)FCMP

Joseph Halfmoon

今回はFCMP、浮動小数点数の比較命令です。前回のFMAX同様NaN(Not a Number)が絡んできます、メンドクセー。しかしそれ以前にフェイント一発かまされてます。比較結果は条件フラグに反映されるのですが、FPSR（浮動小数ステータス）に条件フラグが存在するのに、PSTATEの条件フラグに反映です。おっと。
“ぐだぐだ低レベルプログラミング(116)ARM64(AArach64)FCMP” の続きを読む

2023-05-102023-05-17

ぐだぐだ低レベルプログラミング(115)ARM64(AArach64)FMAX, FMIN

Joseph Halfmoon

今回は２つのソースオペランドのうち大きい方を求めるFMAXと小さい方を求めるFMINです。でもね、この命令それほどシンプルでもありません。メンドクセー奴、NaN(Not a Number)がからんでくるから。２命令FMAXとFMAXNMの差はNaNのとりあつかい次第。NaNにあまり深入りせずにお楽に行きたいです。
“ぐだぐだ低レベルプログラミング(115)ARM64(AArach64)FMAX, FMIN” の続きを読む

2023-05-032023-05-10

ぐだぐだ低レベルプログラミング(114)ARM64(AArach64)FABS他

Joseph Halfmoon

今回はFABS「他」などと省略してしまいましたが、残りはFNEGとFSQRTです。絶対値(FABS)に符号反転(FNEG)そして平方根(FSQRT)です。いずれもソース一つをとって結果ひとつをデスティネーションに返すもの。例によってARMv8.0に半精度はないので、単精度と倍精度のみ。お楽？ “ぐだぐだ低レベルプログラミング(114)ARM64(AArach64)FABS他” の続きを読む

2023-04-262023-05-03

ぐだぐだ低レベルプログラミング(113)ARM64(AArach64)積和演算４種の違い

Joseph Halfmoon

前回、浮動小数の積和演算はfused演算だということで、fused演算とそうでない計算の微妙な差を味わいました。今回は残りの積和演算命令を一気にやってみます。というか４つ並べて実行してその差をみるとようやく４個ある意味が良く分かるから。A64の命令多すぎるからさっさとやりたいというのも心の底にあり？ “ぐだぐだ低レベルプログラミング(113)ARM64(AArach64)積和演算４種の違い” の続きを読む

2023-04-192023-04-26

ぐだぐだ低レベルプログラミング(112)ARM64(AArach64)積和は”fused”

Joseph Halfmoon

今回から浮動小数の積和演算に入ります。「掛けた結果を足しこむ」積和演算は、積分というかコンボリューションというか、信号処理かAIか、近代的な各種アルゴリズムで多用される演算です。何万回どころか何億回も。そのような計算を高速化してくれる積和演算命令ですが、普通に掛けてから足すのとは結果が微妙に違うことがあると。ホントか？
“ぐだぐだ低レベルプログラミング(112)ARM64(AArach64)積和は”fused”” の続きを読む

2023-04-122023-04-19

ぐだぐだ低レベルプログラミング(111)ARM64(AArach64)FRINTx

Joseph Halfmoon

前回、前々回と浮動小数点レジスタと整数レジスタの間での整数/固定小数点数変換をエクササイズしてきました。しかし今回は浮動小数点レジスタ間での「整数変換」です。フォーマット上は浮動小数、でも中身は整数ピッタンコの値というやつ。またまたメンドイ「丸め」が登場して命令ニーモニック数が激増。A64ホントに命令多いな。 “ぐだぐだ低レベルプログラミング(111)ARM64(AArach64)FRINTx” の続きを読む

2023-04-052023-04-12

ぐだぐだ低レベルプログラミング(110)ARM64(AArach64)SCVTF、UCVTF

Joseph Halfmoon

前回まで浮動小数点数を整数または固定小数点数に変換するFCVT命令群を練習してきました。今回は逆、整数または固定小数点数を浮動小数点数に変換するSCVTF（符合付整数から）、UCVTF（符合無整数から）命令です。そんなん簡単じゃろう、と思うと意外とメンドイ奴らであります。元は整数なのに「丸め」が関係してくる、どゆこと？
“ぐだぐだ低レベルプログラミング(110)ARM64(AArach64)SCVTF、UCVTF” の続きを読む

2024年4月
月	火	水	木	金	土	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30