ぐだぐだ低レベルプログラミング(250)x86(32bit)、オペランドサイズプリフィクス

Joseph Halfmoon

前回、３２ビット世界突入とほぼほぼ同時に、中の人は手術モード突入。愛してやまない、などと言いながらアセンブラなど吹き飛んでしまいました。ようやく体調戻りつつあり。さっさと練習しないと冗談抜きで「死ぬまでに」ｘ８６舐め終わることは難しいっす。でも６４ビットのＳＩＭＤまで行くとなるととんでもない命令数っす。気が遠くなるよ。

※「ぐだぐだ低レベルプログラミング」投稿順indexはこちら

※実機動作確認には以下を使用させていただいております。

- Windows 11 PC (i5-1235U)
- Microsoft (R) Macro Assembler Version 14.33.31630.0
- WinDbg 1.2511.21001.0

「見えない」プリフィックス、OPSとADS

ｘ８６にプリフィックスと呼ぶ前置バイトあり。命令のオペコードに先立ってプリフィクスを置くことで動作がいろいろと変わります。皆さまよ～く御存じのところでは、ストリング系命令に付加することで繰り返しを制御するREP系プリフィックス、使用するセグメントを変更するためのセグメント系プリフィックス、バスサイクルにLOCKをかけるためのLOCKプリフィックスなどあるかと。

今回とりあげさせていただくのは、

- オペランド・サイズ・プリフィックス、OPS
- アドレス・サイズ・プリフィックス、ADS

の２種のプリフィックスであります。ただし上記２つのプリフィックスをプログラマが明示的に記述することは、まず滅多にない、と申し上げておきます。ｘ８６の３２ビット世界では頻繁に使われているプリフィックスなのですが、アセンブラの方で勝手に出し入れしてくれているので、意識する必要なし。多分、知らなくてもプログラム書くのに問題もなし。

フツーの３２ビットプロセッサ

まずは、ｘ８６でない、フツーの３２ビット・マイクロプロセッサでの汎用レジスタとそこにバイト長８ビット、ハーフワード長１６ビット、ワード長３２ビットの数値を格納するときのレイアウトをみてみましょう。

相手がRISCでもCISCでもかまいませぬ。汎用レジスタは８本、１６本、３２本くらいのどれかであるのがフツー。そしてその中の１本の汎用レジスタの使い方をみるとこんな感じ。

ワード長（３２ビット）は、汎用レジスタ（３２ビット）の全体を使い、ハーフワード（１６ビット）はレジスタのLSB側の１６ビットを使い、バイト（８ビット）はレジスタのLSB側の８ビットを使うっと。

単純明快、一目瞭然であります。

ｘ８６の「ひねくれた」配置

さて肝心のｘ８６のバイト、ワード（ｘ８６では１６ビットをワードと呼びます）、ダブルワード（ｘ８６では３２ビットをダブルワードと呼びます）の格納の仕方が以下に。

ｘ８６の場合、「汎用レジスタ」は８本ということになってます。汎用というわりにはレジスタの使用方法にクセがあるけれども、ここではそれは言いますまい。１６ビット長のレジスタ名が基本であります。

AX、CX、DX、BX、SP、BP、SI、DI

お気づきの通り、A、B、C、Dではなく、A、C、D、Bと並べるのがｘ８６のタシナミというもんです。１６ビット８本ね。これが３２ビットレジスタとしては

EAX、ECX、EDX、EBX、ESP、EBP、ESI、EDI

頭にEをつければよろしいと。例えば３２ビットレジスタEAXの下１６ビットがAX、３２ビットレジスタESIの下１６ビットがSIです。

ここまでは他の３２ビットマシンどもと同等。しかし８ビットとなるとこの関係がガラガラと崩れます。

AL、DL、CL、BL、AH、DH、CH、BH

８ビットとしても８本のレジスタがあるのですが、ALはEAXの下８ビット、これは良いとして、AHはEAXのビット８からビット１５です。ALの上ね。AHとALを合わせるとAXになるっと。一方、SP、BP、SI、DIにはバイトアクセスは提供されてません。

このような「ひねくれた」配置になるのは御先祖の８ビットマシンとの互換性を切に考えた初代の８０８６の御威光であります。

ｘ８６の機械語エンコードもひねくれとる

この初代８０８６の呪いというか、既定方針はその後のｘ８６に暗い影？を投げかけてます。基本ｘ８６はオペランドの幅を切り替えるのに１ビットしか使えないエンコード構造だったからです。８０８６から８０２８６までは１６ビット機だったので、８ビットと１６ビットを切り替えられればＯＫ。しかし３２ビットの８０３８６にいたって、どうやって３２ビット幅をエンコードするのか問題が出てしまいました。

そこで登場したのがオペランド・サイズ・プリフィックスです。これをつけたら３２ビット、いえいえ、そんな単純な方法をとるｘ８６ではありません。そんなことすると一律に３２ビットの命令コードがプリフィックスだらけになって水ブクレ。そこで考えられたのは

プリフィックスでデフォルト設定をヒックリ返す

という御約束です。デフォルト設定は２種。

1. オペランドは３２ビットと８ビット、アドレス（オフセット部分）は３２ビット
2. オペランドは１６ビットと８ビット、アドレス（オフセット部分）は１６ビット

つまりデフォルト設定が、１の状態で１６ビットのオペランドを扱いたかったとき、オペランド・サイズ・プリフィックスをつけると１６ビット処理ができる。一方２の状態で３２ビットのオペランドを扱いたかったときは、オペランド・サイズ・プリフィックスをつけることで３２ビット処理ができると。同じ機械語オペコードがあっても、そのコンテキストで意味が違うという荒業であります。

さてそのデフォルト設定がどこにあるのか、というとカレントのコード・セグメント・デスクリプタの属性の中のＤビットであります。この値が１なら３２ビット、０なら１６ビットです。

というわけで今でもｘ８６は底の奥底でセグメンテーション機構の呪縛に囚われておるのです。まあ、知らなくてもコードは書けるケド。

なお、オペランド・サイズ・プリフィックスは整数データの幅によって今でも頻繁に使われてます（アセンブラが勝手に生成してくれる。）しかし、アドレス・サイズ・プリフィックスの方はまず使われないのではないかと。これは２８６式の１６ビット、６４Ｋサイズのセグメントを使いたいときに使うものだからです。そんなセグメント使わんずら。

オペランド・サイズ・プリフィックスの説明で１回終わってしまった。先は遠い。

ぐだぐだ低レベルプログラミング(249)x86(32bit)、MLとWinDbgを使いたい　へ戻る

ぐだぐだ低レベルプログラミング(251)x86(32bit)、コントロール・レジスタ　へ進む

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28