ぐだぐだ低レベルプログラミング(105)ARM64(AArach64)FMOV

FMOV
Joseph Halfmoon

今回はFMOV命令です。浮動小数点数の転送命令。浮動小数点といっても何の変換操作もなし、単なるビットパターンのコピーです。命令はたった一つFMOV。しかしこれが意外に面倒デス。今回でも組み合わせが多いのに、ターゲットマシンが半精度を使える機種だったらもっとやらないといけなかったです。頭文字Fの命令にチョロイのはいない。
“ぐだぐだ低レベルプログラミング(105)ARM64(AArach64)FMOV” の続きを読む

ぐだぐだ低レベルプログラミング(104)ARM64(AArach64)FABS、FSQRT他

fabsnegsqrtResults
Joseph Halfmoon

今回はFloating-point arithmetic(one source)のカテゴリを一気にやります。といっても3命令、FABS、FNEG、FSQRTです。例外とか「コマケー話」を避けていれば浮動小数点の演算そのものは素直で分かりやすい?です。そのうちメンドイ話もやらんといかんですが、今回は無し。平穏無事。。 “ぐだぐだ低レベルプログラミング(104)ARM64(AArach64)FABS、FSQRT他” の続きを読む

ぐだぐだ低レベルプログラミング(103)ARM64(AArach64)FSUB、FMUL他

FP_SUB_EC
Joseph Halfmoon

前回はFADD命令をさわり、ARMv8p0には半精度浮動小数点型が無かったというお間抜け発覚。今回はFADD以外のFloating-point arithmetic (two sources)の残りFSUB, FMUL, FNMUL, FDIVであります。まあ、以下同文っていう感じなんでありますが。単精度と倍精度。

“ぐだぐだ低レベルプログラミング(103)ARM64(AArach64)FSUB、FMUL他” の続きを読む

ぐだぐだ低レベルプログラミング(102)ARM64(AArach64)FADDと半精度

fpError
Joseph Halfmoon

前回、浮動小数点レジスタのお名前一覧など図にしておったので半精度浮動小数が使える、と頭から信じておりました。しかし今回気づきました。これがArmv8でもv8.2からの拡張であることを。つまり手元のラズパイ4のCortex-A72(Armv8p0)では使えないようです。トホホ。ということで倍精度、単精度のみの練習とな。 “ぐだぐだ低レベルプログラミング(102)ARM64(AArach64)FADDと半精度” の続きを読む

ぐだぐだ低レベルプログラミング(101)ARM64(AArach64)SIMD&FPレジスタ

VregistersNames
Joseph Halfmoon

前回までで「特権なし」で楽しく使える分岐命令はだいたい網羅したので、今回から「懸案」のSIMD命令、FP命令に入っていきたいと思います。新たなレジスタファイルが登場します。Vレジスタとな。まあ、X86_64ほど複雑怪奇ではないものの、それなりに込み入ってます。今回は冒頭の画像1枚描いて力尽きました。 “ぐだぐだ低レベルプログラミング(101)ARM64(AArach64)SIMD&FPレジスタ” の続きを読む

ぐだぐだ低レベルプログラミング(100)ARM64(AArach64)、レジスタ間接分岐

ubEC
Joseph Halfmoon

今回はレジスタ間接分岐命令をエクササイズしてみます。といって一族命令には今までも「お世話」にはなっとります。LR(リンクレジスタ、X30)に向かって分岐するRET命令もレジスタ間接分岐命令と原理的には同じもの。レジスタ間接分岐では論理絶対番地でどこへでも飛べますが、とび先番地には気を付けないと。
“ぐだぐだ低レベルプログラミング(100)ARM64(AArach64)、レジスタ間接分岐” の続きを読む

ぐだぐだ低レベルプログラミング(99)ARM64(AArach64)、所謂call、ret

topOfasmFunc
Joseph Halfmoon

今回はいわゆるCALL命令をエクササイズしてみます。A64的にはBL命令ですが。またいままで見て見ぬフリ?をしてきていたスタックポインタも登場、だいたいA64でPUSH/POPするのはどしたらよいのでしょうか?32ビットのArmとはだいぶ違う感じ。ここを乗り越えるとA64のABIが見えてくる。ホントか? “ぐだぐだ低レベルプログラミング(99)ARM64(AArach64)、所謂call、ret” の続きを読む

ぐだぐだ低レベルプログラミング(98)ARM64(AArach64)、条件分岐CBNZ族

cbzEC
Joseph Halfmoon

前回は条件フラグを「見て」飛ぶ一般的な条件分岐命令B.condでした。しかし思い起こせばRISC-Vでは条件フラグが無く、「その場」でレジスタの内容を判断して飛ぶ命令ばかりでした。A64でもそういう命令が無いわけではないです。今回はフラグを使わずレジスタの内容で分岐するCBNZ命令一族について実習してみます。

“ぐだぐだ低レベルプログラミング(98)ARM64(AArach64)、条件分岐CBNZ族” の続きを読む

ぐだぐだ低レベルプログラミング(97)ARM64(AArach64)、条件分岐B.cond

bcondEC
Joseph Halfmoon

前回までロードストア命令を実習してきました。まだまだロードストアあるのですが別件実習してからの方がよさそうな奴らばかりなので一たんお休み。今回から分岐命令に入りたいと思います。最初は条件分岐命令です。どのプロセッサも「似たようなもん」ですが、条件の組み合わせを全部通すのはメンドイです。

“ぐだぐだ低レベルプログラミング(97)ARM64(AArach64)、条件分岐B.cond” の続きを読む

ぐだぐだ低レベルプログラミング(96)ARM64(AArach64)、ロードストア命令その7

str2URencode
Joseph Halfmoon

さらっとニーモニックを一通り撫でるつもりでも命令多すぎArmです。アドレッシングモードはロード命令でやったし、データサイズは幅だけだからなどと言い訳を言って、大幅に手を抜きました、ハイ。今回はストア命令の「落穂ひろい」編であります。微妙にロードとは非対称だけれども大体はあるのだ、ストアにも。 “ぐだぐだ低レベルプログラミング(96)ARM64(AArach64)、ロードストア命令その7” の続きを読む

ぐだぐだ低レベルプログラミング(95)ARM64(AArach64)、ロードストア命令その6

strEC
Joseph Halfmoon

今回からストア命令に入ります。前回までのロード命令に比べるとお楽です。ロード命令で既にやったからということで面倒なアドレシングモードをパスしてしまったせいもあります。しかし何と言っても符合について考える必要ないのがうれしいです。ストアするときはデータ幅さえ指定すりゃよいと。 “ぐだぐだ低レベルプログラミング(95)ARM64(AArach64)、ロードストア命令その6” の続きを読む

ぐだぐだ低レベルプログラミング(94)ARM64(AArach64)、ロードストア命令その5

ldpEC
Joseph Halfmoon

今回扱うLDP命令には、デスティネーションが2つあります。といって驚いちゃいけません。32ビットのArm命令(A32)には任意本数のレジスタをスポポンと1命令で出し入れするLDM/STMなどという命令まであったことに比べれば、A64は「抑え気味」です。でも言いたくなります。それでもRISCかよ?と。 “ぐだぐだ低レベルプログラミング(94)ARM64(AArach64)、ロードストア命令その5” の続きを読む

ぐだぐだ低レベルプログラミング(93)ARM64(AArach64)、ロードストア命令その4

ldurEncode
Joseph Halfmoon

今回はイミディエイト・オフセットで同じアドレスを指すのに2通りの命令がある話。一つはスケールド12ビット、もう一つはスケール無9ビット。12ビットあればいいじゃん、と思わないこともないのですが、心の広いArm様です。アン・アラインドなアクセスはお勧めしないけれど一律禁止ではありません。よってスケールしない命令も必要と。

“ぐだぐだ低レベルプログラミング(93)ARM64(AArach64)、ロードストア命令その4” の続きを読む

ぐだぐだ低レベルプログラミング(92)ARM64(AArach64)、ロードストア命令その3

ldr3_EC
Joseph Halfmoon

A64のロード命令をさらっています。元より組み合わせを網羅しようなどとは考えておらず「ありがちな」例を「通り一遍」なでるだけのつもりなのですが、Armは命令数が多いっす。ロードだけでもどんだけ?今回は、前回積み残しのアドレシングモードを使ってみます。POST/PRE-indexみたいな「複雑な」奴らも登場。 “ぐだぐだ低レベルプログラミング(92)ARM64(AArach64)、ロードストア命令その3” の続きを読む