PMADDWD - 壓縮乘法與加法

操作碼	指令	說明
0F F5 /r	PMADDWD mm, mm/m64	將 mm 中的壓縮字乘以 mm/m64 中的壓縮字。將一對 32 位結果相加，並作為雙字儲存到 mm。
66 0F F5 /r	PMADDWD xmm1, xmm2/m128	將 xmm1 中的壓縮字整數乘以 xmm2/m128 中的壓縮字整數，並將相鄰的雙字結果相加。

說明

將目標運算元（第一個運算元）中的各個有符號字乘以源運算元（第二個運算元）中相應的有符號字，產生臨時的有符號雙字結果。接著，將相鄰的雙字結果相加，並存儲到目標運算元。例如，源運算元與目標運算元中相應的低位字 (15-0) 和 (31-16) 相乘，然後將雙字結果相加，並存儲到目標暫存器的低位雙字 (31-0)。其它成對相鄰的字執行相同的操作。（圖 3-6 顯示使用 64 位運算元時此操作的情況）。源運算元可以是 MMX™ 技術暫存器或 64 位記憶體位置，也可以是 XMM 暫存器或 128 位記憶體位置。目標運算元可以是 MMX 或 XMM 暫存器。

PMADD 指令只在一種情況下會進行舍位：操作的同一組 4 個字全部為 8000H。在這種情況下，結果通過舍位變成 80000000H。

圖 3-6. PMADDWD 執行模型

操作

PMADDWD instruction with 64-bit operands:
DEST[31..0] (DEST[15..0] * SRC[15..0]) + (DEST[31..16] * SRC[31..16]);
DEST[63..32] (DEST[47..32] * SRC[47..32]) + (DEST[63..48] * SRC[63..48]);

PMADDWD instruction with 128-bit operands:
DEST[31..0] (DEST[15..0] * SRC[15..0]) + (DEST[31..16] * SRC[31..16]);
DEST[63..32] (DEST[47..32] * SRC[47..32]) + (DEST[63..48] * SRC[63..48]);
DEST[95..64) (DEST[79..64) * SRC[79..64)) + (DEST[95..80) * SRC[95..80));
DEST[127..96) (DEST[111..96) * SRC[111..96)) + (DEST[127..112) * SRC[127..112));

英特爾(R) C++ 編譯器等價內部函式

PMADDWD __m64 _mm_madd_pi16(__m64 m1, __m64 m2)

PMADDWD __m128i _mm_madd_epi16 ( __m128i a, __m128i b)

影響的標誌

無。

保護模式異常

#GP(0) - 如果記憶體運算元有效地址超出 CS、DS、ES、FS 或 GS 段限制。（僅限 128 位操作）。如果記憶體運算元未對齊 16 位元組邊界，不論是哪一段。

#SS(0) - 如果記憶體運算元有效地址超出 SS 段限制。

#UD - 如果 CR0 中的 EM 設定為 1。（僅限 128 位操作）。如果 CR4 中的 OSFXSR 是 0。（僅限 128 位操作）。如果 CPUID 功能標誌 SSE-2 為 0。

#NM - 如果 CR0 中的 TS 設定為 1。

#MF（僅限 64 位操作）- 如果存在未決的 x87 FPU 異常。

#PF(錯誤程式碼) - 如果發生頁錯誤。

#AC(0)（僅限 64 位操作）- 如果啟用對齊檢查並在目前特權級別為 3 時進行未對齊的記憶體引用。

實地址模式異常

#GP(0)（僅限 128 位操作）- 如果記憶體運算元未對齊 16 位元組邊界，不論是哪一段。如果運算元的任何部分出現在 0 到 FFFFH 的有效地址空間之外。

#UD - 如果 CR0 中的 EM 設定為 1。（僅限 128 位操作）。如果 CR4 中的 OSFXSR 是 0。（僅限 128 位操作）。如果 CPUID 功能標誌 SSE-2 為 0。

#NM - 如果 CR0 中的 TS 設定為 1。

#MF（僅限 64 位操作）- 如果存在未決的 x87 FPU 異常。

虛 8086 模式異常

與“實地址模式”中的異常相同。

#PF(錯誤程式碼) - 頁錯誤。

#AC(0)（僅限 64 位操作）- 如果在啟用對齊檢查的情況下進行未對齊的記憶體引用。

數值異常

無。