PMADDWD - 壓縮乘法與加法

操作碼

指令

說明

0F F5 /r

PMADDWD mm, mm/m64

mm 中的壓縮字乘以 mm/m64 中的壓縮字。將一對 32 位結果相加,並作為雙字儲存到 mm

66 0F F5 /r

PMADDWD xmm1, xmm2/m128

xmm1 中的壓縮字整數乘以 xmm2/m128 中的壓縮字整數,並將相鄰的雙字結果相加。

說明

將目標運算元(第一個運算元)中的各個有符號字乘以源運算元(第二個運算元)中相應的有符號字,產生臨時的有符號雙字結果。接著,將相鄰的雙字結果相加,並存儲到目標運算元。例如,源運算元與目標運算元中相應的低位字 (15-0) 和 (31-16) 相乘,然後將雙字結果相加,並存儲到目標暫存器的低位雙字 (31-0)。其它成對相鄰的字執行相同的操作。(圖 3-6 顯示使用 64 位運算元時此操作的情況)。源運算元可以是 MMX™ 技術暫存器或 64 位記憶體位置,也可以是 XMM 暫存器或 128 位記憶體位置。目標運算元可以是 MMX 或 XMM 暫存器。

PMADD 指令只在一種情況下會進行舍位:操作的同一組 4 個字全部為 8000H。在這種情況下,結果通過舍位變成 80000000H。

圖 3-6. PMADDWD 執行模型

操作

PMADDWD instruction with 64-bit operands:
DEST[31..0] (DEST[15..0] * SRC[15..0]) + (DEST[31..16] * SRC[31..16]);
DEST[63..32] (DEST[47..32] * SRC[47..32]) + (DEST[63..48] * SRC[63..48]);

PMADDWD instruction with 128-bit operands:
DEST[31..0] (DEST[15..0] * SRC[15..0]) + (DEST[31..16] * SRC[31..16]);
DEST[63..32] (DEST[47..32] * SRC[47..32]) + (DEST[63..48] * SRC[63..48]);
DEST[95..64) (DEST[79..64) * SRC[79..64)) + (DEST[95..80) * SRC[95..80));
DEST[127..96) (DEST[111..96) * SRC[111..96)) + (DEST[127..112) * SRC[127..112));

英特爾(R) C++ 編譯器等價內部函式

PMADDWD __m64 _mm_madd_pi16(__m64 m1, __m64 m2)

PMADDWD __m128i _mm_madd_epi16 ( __m128i a, __m128i b)

影響的標誌

無。

保護模式異常

#GP(0) - 如果記憶體運算元有效地址超出 CS、DS、ES、FS 或 GS 段限制。(僅限 128 位操作)。如果記憶體運算元未對齊 16 位元組邊界,不論是哪一段。

#SS(0) - 如果記憶體運算元有效地址超出 SS 段限制。

#UD - 如果 CR0 中的 EM 設定為 1。(僅限 128 位操作)。如果 CR4 中的 OSFXSR 是 0。(僅限 128 位操作)。如果 CPUID 功能標誌 SSE-2 為 0。

#NM - 如果 CR0 中的 TS 設定為 1。

#MF(僅限 64 位操作)- 如果存在未決的 x87 FPU 異常。

#PF(錯誤程式碼) - 如果發生頁錯誤。

#AC(0)(僅限 64 位操作)- 如果啟用對齊檢查並在目前特權級別為 3 時進行未對齊的記憶體引用。

實地址模式異常

#GP(0)(僅限 128 位操作)- 如果記憶體運算元未對齊 16 位元組邊界,不論是哪一段。如果運算元的任何部分出現在 0 到 FFFFH 的有效地址空間之外。

#UD - 如果 CR0 中的 EM 設定為 1。(僅限 128 位操作)。如果 CR4 中的 OSFXSR 是 0。(僅限 128 位操作)。如果 CPUID 功能標誌 SSE-2 為 0。

#NM - 如果 CR0 中的 TS 設定為 1。

#MF(僅限 64 位操作)- 如果存在未決的 x87 FPU 異常。

虛 8086 模式異常

與“實地址模式”中的異常相同。

#PF(錯誤程式碼) - 頁錯誤。

#AC(0)(僅限 64 位操作)- 如果在啟用對齊檢查的情況下進行未對齊的記憶體引用。

數值異常

無。