文/觀察者網 呂棟
“在我余承東的字典里,沒有第二,只有第一。”6月12日下午在華為開發者大會(HDC 2026)上,華為常務董事、產品投資評審委員會(IRB)主任、終端BG董事長余承東說道。
他在現場除了發布HarmonyOS 7操作系統外,還宣布華為將推出開源盤古openPangu 2.0大模型,包括openPangu 2.0 Pro,總參數量5050億,激活參數量180億;以及openPangu 2.0 Flash,總參數量920億,激活參數量60億。
余承東表示,AI算力現在非常緊缺,openPangu做到了昇騰算力親和,單卡吞吐率領先業界主流模型,時延表現也更好,能在昇騰算力上跑出更高效率。
他透露,openPangu計劃6月30日把七大組件陸續開源上線,業界開源的主要是模型結構、模型權重、技術報告和推理代碼等四項,而華為還多開源了三項,包括預訓練代碼、后訓練代碼、訓推算子,“讓大家使用昇騰、使用盤古大模型更高效、更易用”。
![]()
圖源:華為
“很多人可能會問,你發布的這個盤古大模型是5050億參數的,而美國廠家發布的幾十T參數的模型,為什么華為沒有萬億和幾十萬億的大模型?”余承東說。
他接著解釋,首先美國企業有幾十萬卡、上百萬卡等更高性能的算力資源,而華為把昇騰算力大量支持了國內企業的需要,自己留的卡的數量非常有限,還不能滿足去訓練幾十萬億參數的大模型。
第二個原因,算力成本高、內存價格大漲,業界非常重視大模型推理時的吞吐率和時延,華為開發幾百B參數的模型運行起來會更高效,也能帶來成本的降低。
“當然我們如果有了足夠的算力,我們也會訓練更大的模型,然后進行蒸餾,把模型蒸餾小一點再用,未來隨著算力產能供應的增長,我們增加這方面的能力。”余承東說道。
很多人可能會好奇,余承東之前主要負責華為終端業務,怎么會突然講起了盤古大模型?
這是因為他去年9月被任命為華為產品投資評審委員會(IRB)主任,負責對華為重大戰略方向的資源投入、項目立項及預算審批進行關鍵決策,核心任務是帶領華為在人工智能(AI)領域取得全球領先地位,被內部視為“打贏AI關鍵戰役”的核心領導人。
當前,阿里通義、騰訊混元、字節豆包、百度文心等各種國產大模型百花齊放,數據狂奔、模型狂卷,中國AI競爭已全面進入“大模型軍備賽”的白熱化階段,各大互聯網公司均不甘落后。
分析人士對觀察者網表示,此次人事任命凸顯華為將AI置于未來十年發展的核心地位,通過IRB機制確保戰略資源向AI領域高強度傾斜。余承東的權責擴展,標志著華為AI戰略進入資源整合與攻堅落地階段,其能否復刻終端業務的成功,將成為觀察華為AI全球競爭力的關鍵窗口。
![]()
余承東
余承東并不是首次負責盤古大模型。據他講述,2021年4月他曾經負責華為云幾個月,“我代表華為云發布了全中國第一個大模型。當時不僅全中國,全世界都不知道大模型為何物的時候,我們就發布了盤古大模型,是這個行業的絕對先驅者。”
“去年國慶節前夕,公司又讓我來負責這個大模型。我想我會帶領團隊一路趕超,在我余承東的字典里,沒有第二,只有第一。”但他也坦承,走向世界第一的挑戰非常大,還要等算力資源趕上來,追趕和超越都需要時間。
余承東在現場還進行了人才招募:“中國培養了非常多的優秀人才,AI人才的資源中國也是非常強的,華為雖然給不了互聯網公司的億級年收入,但我們仍然能匯聚一批優秀的人才。歡迎全中國的優秀人才加入盤古團隊,來一起來做全世界最好的盤古大模型。”
他最后做了一個預告,今年秋天30B參數的端側盤古大模型,將在麒麟手機芯片上運行,“云側是昇騰親和,端側是麒麟親和,模型吞吐率有5倍以上的提升。”
本文系觀察者網獨家稿件,未經授權,不得轉載。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.