前回はBCD補正命令のうち、アンパックドBCD数を扱うASCII ADJUST一族について練習しました。アンパックドあればパックドあり、今回はDECIMAL ADJUSTです。一族といっても2命令だけ。DAAとDAS。しかしDAAこそは御先祖の8ビット機(8080/8085)から受け継ぐ伝統の?命令であります。
“ぐだぐだ低レベルプログラミング(187)x86(16bit)、DECIMAL ADJUST族” の続きを読む
ぐだぐだ低レベルプログラミング(186)x86(16bit)、ASCII ADJUST一族
x86命令には「BCD補正命令」なる一族あり、その中でもパックドBCD数を扱うDAA命令は御先祖の8ビット機(8080/8085)でも存在した伝統の命令です。しかしx86ではアンパックドBCD数を扱うための頭文字にAを頂く命令どもが追加されております。強力?でも今となっては盲腸みたいなもん?どうなん?
ぐだぐだ低レベルプログラミング(185)x86(16bit)、シフト、ローテイト練習(86)
前回はx86命令(16bit)のうち「8086レベル」のシフト、ローテイト命令の動作を復習。コマケーところがメンドイものどもでした。前回は実機(実際はQEMUのエミュレーションだけれども)での動作確認をしなかったので、今回はデバッガで動かしながらの動作確認です。メンドイのでサラっと流していくぜ。いいのか?
ぐだぐだ低レベルプログラミング(184)x86(16bit)、シフト、ローテイト(86のね)
前回は、MUL(掛け算)命令。今回はレジスタやメモリの中のビットをシフトしたりローテイトしたりする命令について調査。全8種類(実際は7種類)もあり。「フツーの」RISCはこの系統の命令種類をこれほどもってません。それにキャリーフラグが影響うけること多いなど動作もクセ強。御先祖の8ビットの血統を色濃く受け継いでおると。
“ぐだぐだ低レベルプログラミング(184)x86(16bit)、シフト、ローテイト(86のね)” の続きを読む
ぐだぐだ低レベルプログラミング(183)x86(16bit)、MULのオペランドは1個?
前回はADD、SUBなどの算術演算命令、AND、ORなどの論理演算命令8種が「ほぼほぼ」以下同文ということを確認しました。でも算術演算といえば加減乗除というくらいで、乗除はどうなってんの?そこで今回は乗算命令MULを見ていきます。「何かと何かを掛ける」命令のハズなのに、アセンブラのオペランドは1個だけ。なして?
ぐだぐだ低レベルプログラミング(182)x86(16bit)、ADD以下同文?微妙に非対称?
前回、x86の16ビット命令セットからADD命令を練習。実はADDが分かれば、ADC、AND、XOR、OR、SBB、SUB、CMPの残り7命令も「ほぼほぼ以下同文」てことで理解できます。でも「ほぼほぼ」って何だ?そこで、この辺でCISCらしいx86のオペコードエンコーディングを復習。ほんとメンドクセーんだが、これ。 “ぐだぐだ低レベルプログラミング(182)x86(16bit)、ADD以下同文?微妙に非対称?” の続きを読む
ぐだぐだ低レベルプログラミング(181)x86(16bit)、ADDオペランド何でもありすぎ
前回から元祖x86、16bitCPU、8086/8088の命令セットの復習を始めました。うん十年ぶり。忘れてます。しかしArmとかRISC-Vとかの後に改めて8086の命令をみると確かに複雑、CISCだからあたりまえか。今回は整数足し算、ADD命令を練習してみます。命令にとれるオペランドがいろいろありすぎ、何でもあり?
ぐだぐだ低レベルプログラミング(180)x86(16bit)、INC/DECにCISCを見?
さて前回よりx86の最初のステップ、16ビットモードに入りました。いままでRISC-V、ArmとRISC系(Armはそれにしちゃ命令多過ぎだが)を練習してきましたが、今回からは「バリバリの」CISCデス。それほど意識することはないけれども、違いは確実にあるので気づいたところから見ていきます。 “ぐだぐだ低レベルプログラミング(180)x86(16bit)、INC/DECにCISCを見?” の続きを読む
ぐだぐだ低レベルプログラミング(179)x86、16/32/64bit、整数レジスタの発展?
長らく練習してきたArmを終え(まだ他所でやるケド)、今回からx86に入ります。Armの命令多過ぎなどと文句を垂れてきましたが、x86の命令「もっと」多過ぎ、死ぬまでに舐め終わらない気がします。そのうえ屋上屋を重ねる拡張により「古い16ビット命令」は「64ビット機では練習しずらく」なってます。どうするの?
ぐだぐだ低レベルプログラミング(178)ARM64(AArach64)オプショナル命令確認
前回「表引き」命令を練習した後も練習すべき「SIMDのデータ処理命令は尽きまじ」などと思っておったお惚け老人です。しかしマニュアルをよく見てみれば、残り2つのカテゴリのうち一つは ARMv8.3、もう一つは ARMv8.0だけれども「optional」でした。ラズパイ4機で該当の「optional」使えるのか?
ぐだぐだ低レベルプログラミング(177)ARM64(AArach64)SIMD 表引き命令群
今回は「表引き」命令群です。「群」といっても2命令だけ。SIMD(ベクトル)ソースレジスタのバイト要素をインデックスとして、複数のSIMDレジスタを「バイト・テーブル」としてアクセスし、引いた結果をデスティネーションのSIMDレジスタに書き込むという命令です。1度に最大16個の表引きをできるもの。単純だけれど強力?
ぐだぐだ低レベルプログラミング(176)ARM64(AArach64)SIMD ペア操作群2
前回はベクトルレジスタ2個の隣接要素どうし演算、ベクトルレジスタ1個分(半分の長さ)に縮める「ペアワイズ」操作のうち整数演算の命令5つを練習。今回は残りの「ペアワイズ」操作命令5個を練習してみます。今度は浮動小数点命令ね。やっぱりADDとMAX、MIN操作なのだけれどもNANの扱いでMAX、MINは各2命令あり。
“ぐだぐだ低レベルプログラミング(176)ARM64(AArach64)SIMD ペア操作群2” の続きを読む
ぐだぐだ低レベルプログラミング(175)ARM64(AArach64)SIMD ペア操作群1
前回まで「ベクトル横断」命令群を練習してました。ベクトルにつまった要素を縮約処理して1個のスカラーにまとめてしまうもの。しかし、スカラーにまでまとめる前にもう一手間あるんじゃないすか、というのが今回のペア操作です。複数SIMDレジスタにまたがる長大なベクトルを隣接要素どうしで処理して半分の長さに縮めるもの。
“ぐだぐだ低レベルプログラミング(175)ARM64(AArach64)SIMD ペア操作群1” の続きを読む
ぐだぐだ低レベルプログラミング(174)ARM64(AArach64)SIMD FMAXV
前回から「Across Vector」、SIMDレジスタに並ぶ各要素を横断的に処理(縮約)して1個のスカラー値を得る命令を練習してます。今回はFMAXVとその一族です。浮動小数要素のMAXおよびMINを求める命令ですが2命令づつあります。同じMAXとる命令でもNaNの扱いで2種類に分かれるっと。メンドクセー奴だよ。
“ぐだぐだ低レベルプログラミング(174)ARM64(AArach64)SIMD FMAXV” の続きを読む