ぐだぐだ低レベルプログラミング(108)ARM64(AArach64)FCVTxy、整数変換

fcvt2Result
Joseph Halfmoon

前回は単精度と倍精度の間のフォーマット変換を行うFCVT命令でした。同じ命令が丸めモードの設定で動作が変わるので厄介でした。今回のFCVTxy命令群(xyのところはいろいろ)は、浮動小数点数を整数に変換するもの。丸めモードフラグには関係なしと喜んだら、かえって組み合わせが増えているでないの?もうメンドくてやりきれない?
“ぐだぐだ低レベルプログラミング(108)ARM64(AArach64)FCVTxy、整数変換” の続きを読む

ぐだぐだ低レベルプログラミング(107)ARM64(AArach64)FCVT

fcvt_asm
Joseph Halfmoon

今回はたった1命令、FCVTをエクササイズしてみます。練習に使っているArm Cortex-A72は半精度浮動小数のサポートが無く、以前残念に思ってましたが、今回は無くて良かった、という感じです。単精度があったら組み合わせは3倍、やめてくれです。前回登場のFPCRレジスタのRMビットが活躍します。
“ぐだぐだ低レベルプログラミング(107)ARM64(AArach64)FCVT” の続きを読む

ぐだぐだ低レベルプログラミング(106)ARM64(AArach64)FPSR/FPCR

A64_FPCR_FPSR
Joseph Halfmoon

何時までも見て見ぬふりもできないので今回はFPSRとFPCRを調べてみたいと思います。命令ニーモニックではありませぬ。フローティングポイントステータスレジスタとコントロールレジスタ、「メンドイ」浮動小数の例外やら非数(NaN)などの制御とそのステータスを保持するもの。今回はレジスタのビットの配置から。 “ぐだぐだ低レベルプログラミング(106)ARM64(AArach64)FPSR/FPCR” の続きを読む

ぐだぐだ低レベルプログラミング(105)ARM64(AArach64)FMOV

FMOV
Joseph Halfmoon

今回はFMOV命令です。浮動小数点数の転送命令。浮動小数点といっても何の変換操作もなし、単なるビットパターンのコピーです。命令はたった一つFMOV。しかしこれが意外に面倒デス。今回でも組み合わせが多いのに、ターゲットマシンが半精度を使える機種だったらもっとやらないといけなかったです。頭文字Fの命令にチョロイのはいない。
“ぐだぐだ低レベルプログラミング(105)ARM64(AArach64)FMOV” の続きを読む

ぐだぐだ低レベルプログラミング(104)ARM64(AArach64)FABS、FSQRT他

fabsnegsqrtResults
Joseph Halfmoon

今回はFloating-point arithmetic(one source)のカテゴリを一気にやります。といっても3命令、FABS、FNEG、FSQRTです。例外とか「コマケー話」を避けていれば浮動小数点の演算そのものは素直で分かりやすい?です。そのうちメンドイ話もやらんといかんですが、今回は無し。平穏無事。。 “ぐだぐだ低レベルプログラミング(104)ARM64(AArach64)FABS、FSQRT他” の続きを読む

オプション沼(7) gccに-staticオプション、できたファイルはデカいのよ。

lddTestStatic
Joseph Halfmoon

前回はリンクの手前で止める-cオプションでした。今回はリンクするのだけれど、普段あまり使わない「スタティック・リンク」の -static オプションです。普段のベアメタルな組み込み開発なら「スタティック・リンク」ですが、わざわざオプション付けたりしないしな~。使う局面は極めて限定的かと。知らんけど。 “オプション沼(7) gccに-staticオプション、できたファイルはデカいのよ。” の続きを読む

ぐだぐだ低レベルプログラミング(103)ARM64(AArach64)FSUB、FMUL他

FP_SUB_EC
Joseph Halfmoon

前回はFADD命令をさわり、ARMv8p0には半精度浮動小数点型が無かったというお間抜け発覚。今回はFADD以外のFloating-point arithmetic (two sources)の残りFSUB, FMUL, FNMUL, FDIVであります。まあ、以下同文っていう感じなんでありますが。単精度と倍精度。

“ぐだぐだ低レベルプログラミング(103)ARM64(AArach64)FSUB、FMUL他” の続きを読む

ぐだぐだ低レベルプログラミング(102)ARM64(AArach64)FADDと半精度

fpError
Joseph Halfmoon

前回、浮動小数点レジスタのお名前一覧など図にしておったので半精度浮動小数が使える、と頭から信じておりました。しかし今回気づきました。これがArmv8でもv8.2からの拡張であることを。つまり手元のラズパイ4のCortex-A72(Armv8p0)では使えないようです。トホホ。ということで倍精度、単精度のみの練習とな。 “ぐだぐだ低レベルプログラミング(102)ARM64(AArach64)FADDと半精度” の続きを読む

オプション沼(5) gccに-Sオプションつけて、アセンブラ出力を愛でてみる

optS_EC
Joseph Halfmoon

今回は gcc の -S オプションを使ってみます。「もっとも狭義の」コンパイル、アセンブリ言語ソース生成までで処理を止めるもの。コンパイラのお仕事を途中で止めておくオプションでも -c はよく使うとおもいますが、-Sはあまり使わない気がします(個人の感想デス。)アセンブリ言語ソースを読まねばいられない人は別にして。

“オプション沼(5) gccに-Sオプションつけて、アセンブラ出力を愛でてみる” の続きを読む

ぐだぐだ低レベルプログラミング(101)ARM64(AArach64)SIMD&FPレジスタ

VregistersNames
Joseph Halfmoon

前回までで「特権なし」で楽しく使える分岐命令はだいたい網羅したので、今回から「懸案」のSIMD命令、FP命令に入っていきたいと思います。新たなレジスタファイルが登場します。Vレジスタとな。まあ、X86_64ほど複雑怪奇ではないものの、それなりに込み入ってます。今回は冒頭の画像1枚描いて力尽きました。 “ぐだぐだ低レベルプログラミング(101)ARM64(AArach64)SIMD&FPレジスタ” の続きを読む