對於優化程式碼與數據記憶體訪問,最重要的建議如下:
對齊數據,注意數據佈局與堆疊對齊問題。
啟用儲存轉發。
將程式碼與數據放在單獨的頁上。
增強數據區域性。
使用預取與快取能力控制指令。
增強程式碼區域性並對齊分支目標。
利用寫入組合。
在奔騰(R) 4 處理器上,對齊與轉發問題是最常見的長延遲來源。
如需有關詳細資訊,請參閱最新的優化手冊。