英特爾® 調優助手主題阻塞的儲存轉發

由於對齊問題,儲存無法轉發到載入,這會導致等於管道長度的暫停。備註:使用 Microsoft 或英特爾的最新編譯器通常可以減少或消除這些型別的事件。
對於採用“超執行緒技術”的系統或多處理器系統,估計的影響代表總計處理器時間影響(系統上所有邏輯/物理處理器之和),而不是“實際執行”時間影響。因此,在採用“超執行緒技術”的系統或多處理器系統上,很可能會看到細節的時間影響大於對負載實際執行時間的影響。請注意,在單處理器系統上,處理器時間與實際執行時間相同。
英特爾(R) 奔騰(R) 4 處理器能夠取得高效能的方法之一是,樂觀地假設有一種能實現更佳效能的條件。它實現這點的方法之一是預測分支的結果,並且在分支得到解析之前,憑推測沿一條路徑執行。另一種方法是無序執行某些記憶體操作。有些記憶體相關的效能監視事件同時統計推測性操作以及非推測性操作,因此產生的計數比不統計推測性操作時的更大。無序執行記憶體操作會導致更多的推測性操作(計為事件),這可能會導致計數比未發生此推測時獲得的計數值更大。例如,考慮處理器試圖憑推測無序執行載入的情況。假設由於程式碼正在進行指針跟蹤,且處理器還沒有獲得正確的地址,因此處理器的載入地址還是錯誤的。如果載入導致儲存轉發衝突,則“失效的 MOB 載入重發”事件遞增。由於推測的緣故,這裡會發生“失效的 MOB 載入重發”事件,而如果沒有推測,則不會發生此事件。從體系結構的角度看,此種推測是統計過量的情況。即使在沒有推測時指令不會遇到儲存轉發衝突,但由於推測活動,指令也會報告說遇到儲存轉發衝突。事實上,它是微體系結構級發生的事件的精確表示:此指令確實導致了儲存轉發衝突。

 
 
計數器相關性:

此細節與以下效能計數器函式相關:

儲存轉發效能影響 = ((失效的 MOB 載入重發*50)/時鐘訊號)*100
較低值:
0.2
較高值:
2

在“儲存轉發效能影響”較高時,此細節具有實質性意義。

建議: