AIの片隅で(34) Googleの生成AI、Gemini、A64のアセンブラを書いて

s1_ERROR
Joseph Halfmoon

別件シリーズでアセンブラ書いたりしてます。今回はGemini様にアセンブラを書いてもらおうと試みました。「A64のアセンブラで長さ16のfloat型ベクトルの内積を求めるプログラムを作って」とプロンプトに入力。「作って」は下さるのですが、Pythonのプログラムをお願いした時のような、切れがないです(個人の感想です。)
“AIの片隅で(34) Googleの生成AI、Gemini、A64のアセンブラを書いて” の続きを読む

ぐだぐだ低レベルプログラミング(157)ARM64(AArach64)SIMD 要素毎MUL

elemEC
Joseph Halfmoon

前回、SIMDレジスタの全要素に、別なSIMDレジスタの1要素を乗じる形の命令を練習しました。この「全要素に他方の一要素を共通で掛け算」する系統の命令は実に33種あり(前回の3種含む)、忘却力の老人が覚えきれるものではありませぬ。そこで今回は一覧表を作って「整理」してみたのだけれど、ダメだ、こんがらがる。。。

“ぐだぐだ低レベルプログラミング(157)ARM64(AArach64)SIMD 要素毎MUL” の続きを読む