網易首頁 > 網易號 > 正文申請入駐

「第37手」到通向AGI，Demis Hassabis總結DeepMind十年科學征程

2026-03-11 16:28:04　來源: ScienceAI

河北舉報

分享至

編輯丨coisini

十年前，Google DeepMind 的 AI 系統 AlphaGo 首次在復雜的圍棋比賽中擊敗世界冠軍 —— 這一里程碑式的成就，比許多專家預測的時間提前了整整十年。

這一突破標志著人工智能現代紀元的開啟。憑借一招驚世駭俗的「第 37 手」，AlphaGo 展現了人工智能的潛力，預示著 Google DeepMind 已經掌握了攻克現實世界科學難題的技術，并持續指引著他們構建通往通用人工智能（AGI）系統的道路。

在 AlphaGo 獲勝十周年之際，Google DeepMind 首席執行官兼創始人 Demis Hassabis 發表長文，總結了 DeepMind 在過去十年間取得的進展，并展望了 AGI 的未來。

「我們相信，AGI 將成為人類歷史上最具有深遠意義的技術發明，更是推動科學、醫學和生產力進步的終極工具」，Demis Hassabis 說道。

ScienceAI 對文章主要內容進行了不改變原意的編譯、整理，內容如下。

創意的火花

2016 年，逾兩億觀眾見證了 AlphaGo 與圍棋世界冠軍李世石在首爾的巔峰對決。第二局中 AlphaGo 那步載入史冊的「第 37 手」，因其反常規的落子方式，讓專業解說員最初都誤以為是程序出錯。但這步棋最終成為勝負手 —— 經過約百回合的博弈，這枚棋子恰恰落在決勝位置，助 AlphaGo 鎖定勝局。這不僅展現了驚人的前瞻性，更彰顯了 AI 系統突破人類專家模仿的局限、開創全新策略格局的能力。

圍棋因其極高的復雜度，一直是人工智能研究的試金石。棋盤上的可能局面多達 10 的 170 次方種 —— 遠超可觀測宇宙中的原子總數。

為了攻克這一難題，AlphaGo 結合使用了深度神經網絡與先進的搜索和強化學習技術 —— 這是 DeepMind 開創的人工智能方法。

AlphaGo 通過學習人類專家的棋局來構建圍棋走法模型，隨后通過數百萬次自我對弈持續強化致勝策略，不斷提升水平。該系統會篩選出最具潛力的行棋路徑，并從這些經過精簡的走法中選出最有可能引導它走向勝利的一手。

繼 AlphaGo 之后，我們開發了 AlphaGo Zero，它從完全隨機的對弈開始學習，最終成為有史以來最強的圍棋選手之一。隨后，我們進一步將其通用化，打造了 AlphaZero，該系統從零開始自學，掌握了包括圍棋、國際象棋和將棋在內的所有雙人完全信息博弈。除了游戲規則，AlphaZero 沒有任何先驗知識，它能在數小時內自學精通國際象棋，不僅擊敗了頂尖人類棋手，還戰勝了當時最專業的國際象棋程序如 Stockfish。即便國際象棋在這些程序的輔助下已被深入剖析，但就像在圍棋中一樣，AlphaZero 仍然能夠構想出新穎有趣的策略。

這進一步印證了我在首爾獲勝那一刻就篤信的想法 —— 這項技術已經準備好應用于我們真正的目標：加速科學突破。

我認為 AlphaGo 帶來的最大啟示，就是它精準地預演了人工智能時代 —— 證明這并非遙遠模糊的未來，而是已然叩響現實大門的變革。它就像一張「來自未來的路線圖」，向人類清晰地昭示著世界即將發生怎樣的變遷。

催化科學突破

通過證明其能夠駕馭圍棋棋盤上巨大的搜索空間，AlphaGo 展示了人工智能幫助我們更好地理解物理世界巨大復雜性的潛力。我們首先著手嘗試解決蛋白質折疊問題，這是一個預測蛋白質三維結構的 50 年重大挑戰，對于理解疾病和開發新藥至關重要。

2020 年，我們最終憑借 AlphaFold 2 系統攻克了這一長期存在的科學難題。以此為基礎，我們解析了科學界已知的所有 2 億多種蛋白質的結構，并將它們免費開放給科學家，存儲在一個開源數據庫中。

如今，全球超過 300 萬研究人員正在使用 AlphaFold 數據庫來加速他們從瘧疾疫苗到塑料降解酶等眾多重要領域的研究工作。而在 2024 年，能夠代表整個 AlphaFold 團隊，與 John Jumper 共同獲得諾貝爾化學獎，是我畢生的榮幸。

自 AlphaGo 獲勝以來，我們已將其開創性方法應用于許多科學領域，包括：

數學推理：作為 AlphaGo 架構最直接的后繼者，AlphaProof 結合使用語言模型與 AlphaZero 的強化學習和搜索算法，學會了證明形式化的數學命題，與 AlphaGeometry 2 一起，成為了首個在國際數學奧林匹克競賽中達到獎牌標準（銀牌）的系統，證明了 AlphaGo 的方法能夠解鎖高級數學推理能力，并為我們最強大的通用模型奠定了基礎。
算法發現：就像 AlphaGo 在游戲中搜索最佳走法一樣，我們的編碼智能體 AlphaEvolve 在計算機代碼的空間中探索，以發現更高效的算法。它也有自己的「第 37 手」時刻：它發現了一種新穎的矩陣乘法方式（支撐幾乎所有現代神經網絡的基礎數學運算）。如今，AlphaEvolve 正被應用于從數據中心優化到量子計算等一系列問題的測試。
科學合作：我們正將 AlphaGo 開創的搜索和推理原則整合到一個「AI co-scientist」中。通過讓多個智能體對科學觀點和假設進行「辯論」，該系統能夠進行識別數據模式和解決復雜問題所需的嚴謹思考。在帝國理工學院進行的驗證研究中，它分析了數十年的文獻，并獨立得出了關于抗菌素耐藥性的假設，而這一假設是研究人員花費多年時間進行實驗開發和驗證才得出的。

我們還利用人工智能更好地理解基因組、推進聚變能源研究、改進天氣預報等等。

盡管我們的科學模型令人印象深刻，但它們高度專業化。要實現創造無限清潔能源或攻克當前尚無法理解的疾病等根本性突破，我們需要通用人工智能系統，去發現不同學科領域之間的底層結構和聯系，并像最頂尖的科學家那樣，幫助我們提出新的假設。

智能的未來

要實現真正通用的人工智能，它需要理解物理世界。我們從一開始就構建了多模態的 Gemini，使其不僅能理解語言，還能理解音頻、視頻、圖像和代碼，從而建立起一個世界模型。

為了在這些不同模態之間進行思考和推理，最新的 Gemini 模型運用了我們在 AlphaGo 和 AlphaZero 上開創的一些技術。

下一代人工智能系統還需要能夠調用專門的工具。例如，如果一個模型需要了解某種蛋白質的結構，它可以使用 AlphaFold 來完成。

我們認為，Gemini 的世界模型、AlphaGo 的搜索和規劃技術，以及專用 AI 工具的使用這三者的結合，將被證明對實現 AGI 至關重要。

真正的創造力是一個通用人工智能系統需要展現的關鍵能力。「第 37 手」讓我們得以一窺人工智能跳出固有思維模式的潛力，但真正原創性的發明需要更多的東西。它不僅需要像 AlphaGo 那樣出色地構想出新穎的圍棋策略，更需要實際創造出一種像圍棋一樣深邃、優美、值得鉆研的博弈。

在 AlphaGo 傳奇性勝利十年后的今天，我們的終極目標已近在眼前。最初在「第 37 手」中閃現的創意火花，催化了一系列突破，這些突破如今正匯聚在一起，鋪平通向 AGI 的道路，并開啟一個科學發現的新黃金時代。

原文鏈接：https://deepmind.google/blog/10-years-of-alphago/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.