快科技6月25日消息,英特爾軟件工程師Lili Cui近日發現,對GCC編譯器通用x86調優進行一行代碼修改,不僅能提升自家處理器性能,也能讓AMD最新架構顯著受益。
該修改將通用調優表中的分支預測錯誤成本參數,從原有的COSTS_N_INSNS(2)上調至COSTS_N_INSNS(2)+3,使編譯器在代碼生成時更重視分支預測失敗的性能損失。
![]()
現代CPU普遍采用更深的流水線架構以提升主頻,分支預測錯誤會導致流水線排空,造成數十個時鐘周期的性能損失,因此適當提高該參數能優化代碼布局策略。
測試數據顯示,這項修改在SPEC CPU 2017測試套件中,為英特爾Granite Rapids帶來12.7%的性能提升,AMD Zen 5架構同樣實現12.1%的性能增益。
該測試基于544.nab_r核酸構建器測試用例,這是一款分子動力學模擬相關的計算密集型基準程序,分支預測對其性能影響較為顯著。
需要注意的是,該優化僅適用于依賴通用x86/x86_64調優的編譯場景,對于使用-march=native等特定CPU架構優化的用戶不產生額外影響。
目前這一改動已正式合并進入GCC Git主線倉庫,將隨明年發布的GCC 17穩定版正式推出,成為新版編譯器的重要性能優化之一。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.