操作碼 |
指令 |
說明 |
0F F5 /r |
PMADDWD mm, mm/m64 |
將 mm 中的壓縮字乘以 mm/m64 中的壓縮字。將一對 32 位結果相加,並作為雙字儲存到 mm。 |
66 0F F5 /r |
PMADDWD xmm1, xmm2/m128 |
將 xmm1 中的壓縮字整數乘以 xmm2/m128 中的壓縮字整數,並將相鄰的雙字結果相加。 |
將目標運算元(第一個運算元)中的各個有符號字乘以源運算元(第二個運算元)中相應的有符號字,產生臨時的有符號雙字結果。接著,將相鄰的雙字結果相加,並存儲到目標運算元。例如,源運算元與目標運算元中相應的低位字 (15-0) 和 (31-16) 相乘,然後將雙字結果相加,並存儲到目標暫存器的低位雙字 (31-0)。其它成對相鄰的字執行相同的操作。(圖 3-6 顯示使用 64 位運算元時此操作的情況)。源運算元可以是 MMX™ 技術暫存器或 64 位記憶體位置,也可以是 XMM 暫存器或 128 位記憶體位置。目標運算元可以是 MMX 或 XMM 暫存器。
PMADD 指令只在一種情況下會進行舍位:操作的同一組 4 個字全部為 8000H。在這種情況下,結果通過舍位變成 80000000H。
PMADDWD instruction with 64-bit operands:
DEST[31..0] (DEST[15..0] * SRC[15..0]) + (DEST[31..16] * SRC[31..16]);
DEST[63..32] (DEST[47..32] * SRC[47..32]) + (DEST[63..48] * SRC[63..48]);
PMADDWD instruction with 128-bit operands:
DEST[31..0] (DEST[15..0] * SRC[15..0]) + (DEST[31..16] * SRC[31..16]);
DEST[63..32] (DEST[47..32] * SRC[47..32]) + (DEST[63..48] * SRC[63..48]);
DEST[95..64) (DEST[79..64) * SRC[79..64)) + (DEST[95..80) * SRC[95..80));
DEST[127..96) (DEST[111..96) * SRC[111..96)) + (DEST[127..112) * SRC[127..112));
PMADDWD __m64 _mm_madd_pi16(__m64 m1, __m64 m2)
PMADDWD __m128i _mm_madd_epi16 ( __m128i a, __m128i b)
無。
#GP(0) - 如果記憶體運算元有效地址超出 CS、DS、ES、FS 或 GS 段限制。(僅限 128 位操作)。如果記憶體運算元未對齊 16 位元組邊界,不論是哪一段。
#SS(0) - 如果記憶體運算元有效地址超出 SS 段限制。
#UD - 如果 CR0 中的 EM 設定為 1。(僅限 128 位操作)。如果 CR4 中的 OSFXSR 是 0。(僅限 128 位操作)。如果 CPUID 功能標誌 SSE-2 為 0。
#NM - 如果 CR0 中的 TS 設定為 1。
#MF(僅限 64 位操作)- 如果存在未決的 x87 FPU 異常。
#PF(錯誤程式碼) - 如果發生頁錯誤。
#AC(0)(僅限 64 位操作)- 如果啟用對齊檢查並在目前特權級別為 3 時進行未對齊的記憶體引用。
#GP(0)(僅限 128 位操作)- 如果記憶體運算元未對齊 16 位元組邊界,不論是哪一段。如果運算元的任何部分出現在 0 到 FFFFH 的有效地址空間之外。
#UD - 如果 CR0 中的 EM 設定為 1。(僅限 128 位操作)。如果 CR4 中的 OSFXSR 是 0。(僅限 128 位操作)。如果 CPUID 功能標誌 SSE-2 為 0。
#NM - 如果 CR0 中的 TS 設定為 1。
#MF(僅限 64 位操作)- 如果存在未決的 x87 FPU 異常。
與“實地址模式”中的異常相同。
#PF(錯誤程式碼) - 頁錯誤。
#AC(0)(僅限 64 位操作)- 如果在啟用對齊檢查的情況下進行未對齊的記憶體引用。
無。