无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Anthropic自曝下一代Claude訓練內幕!有人專職研究「性格」

Anthropic自曝下一代Claude訓練內幕

0
分享至


新智元報道


【新智元導讀】信息量太大了!Anthropic高管全盤托出下一代Claude訓練秘籍:用AI爆改AI,讓AI在閑置時「做夢」自進化,還有「性格」養成計劃。

Claude 100%編碼Claude,這在圈內早已不是秘密。

但Claude「自我造物」全過程,始終是Anthropic嚴防死守的核心機密。

就在今天,Anthropic產品負責人Alex Albert在一場35分鐘的訪談中,首次毫無保留地曝光了全細節!


Alex Albert,是直接負責打造下一代Claude模型的核心人物。

在與科技博主Peter Yang的對話中,Alex幾乎把內部造Claude的「核心方法論」全盤托出——

下一代Claude研發邏輯、內部評估流程、性格訓練方法,還有正在悄悄推進的「意識研究」。


每一條,都是硬核猛料!


核心亮點一覽:

  • Claude就是「產品」:訓練之前,先畫藍圖;

  • 讓Claude自己迭代Claude:反饋→聚類→評估的閉環;

  • Anthropic不造工具,重點在養一個「人」;

  • Anthropic有人的全職工作:思考Claude是否有意識。

每一代Claude出生前,就被「規劃好了人生」

大多數人對訓練LLM的理解,還停留在「堆數據、堆算力、堆參數」的暴力美學階段。

但Alex Albert透露的Anthropic內部流程,完全是另一套打法:

我們把模型本身當作一個「產品」來對待。

每一個新模型,我們都會在訓練前就明確定義:它應該擅長什么。

說白了就是,Claude的「命運」在預訓練開始之前,就被寫好了。


那么,具體怎么做?

Anthropic團隊會在預訓練階段之前就介入,鎖定這一代模型的核心「能力賭注」。

比如編程能力、知識工作能力、Excel表格處理能力,這些不是訓練完再看結果,而是一開始就想清楚的。

最終,這些決策的輸入來源有兩個:一是企業客戶的直接反饋,二是Anthropic員工自己在日常工作中踩的坑。


「單向門」決策,也可逆

對此,Alex分享了Anthropic內部的一個核心決策框架:單向門(One-Way Door)。

「單向門」簡言之,就是一個不可逆的決策。

他舉例道,在預訓練之前選定模型架構,這就是一個典型的「單向門」。

模型訓練周期可能長達數月,一旦開始就很難回頭,這種決策需要投入大量時間去論證。

但如果一個決策是可逆的呢?

如果不是單向門,那基本就是免費的。開發時間現在已經不是單向門了。


Alex說得很直接:過去20年,產品開發的流程變化不大。但過去一兩年,一切都變了。

以前構建一個MVP需要2-4周,現在,1天就夠了。

以前PM想了解某個功能的數據表現,需要找數據科學團隊做幾天調查。

現在,打開Claude Code,接上產品數據庫,10分鐘就出結果。

這不是在講效率工具的故事,這是在說:Anthropic自己就是Claude最苛刻的用戶,他們在用自己的產品來訓練自己的產品。


這意味著,Anthropic訓練Claude時,考慮的是「模型×產品×用戶場景」這個三維空間里的綜合體驗。

模型不是單獨存在的,模型是產品的一部分。

用Claude訓練Claude,真正閉環了

那Anthropic怎么知道Claude哪里做得好、哪里做得差?

答案是:用Claude來迭代Claude。訪談中,Alex詳細拆解了這條閉環流程:

第一步:海量用戶反饋涌入;

第二步:用Claude對反饋進行聚類分析,提取出排名靠前的高頻主題;

第三步:基于真實痛點生成「合成版」用戶問題;

第四步:把合成數據直接轉化為「評估基準」(evals)。

這些合成問題,最終會變成測試下一代Claude能力的標準化評估集。

Alex特別強調,這不是跑跑benchmark就完事的「評估戲劇」。

Anthropic的評估必須錨定在,真實用戶的真實任務形態上:越接近終端用戶實際會遇到的問題,評估就越有價值。


為此,他舉了一個視覺能力的例子。

假設發現Claude無法準確識別圖像中超過10個元素的數量,團隊不會停留在「發現了一個bug」這個層面,而是會追問:

這個問題在真實用戶場景中意味著什么?它會影響誰的什么任務?

只有當評估和真實用戶場景對齊時,研究團隊才會投入資源去修復。


而修復的手段也不止一條路:可能回到預訓練階段調整數據配比,也可能在RL階段做定向干預。

具體走哪條路,取決于研究團隊的戰略判斷。

有時候,甚至只需要幾十個高質量測試用例,就足以證明問題的存在并啟動修復流程。

不是數據越多越好,而是數據越「真」越好。

AI「做夢」自進化,睡一覺戰力暴漲

說到認知和記憶,Alex拋出了一個更炸裂的概念——

Claude已經學會「做夢」了。

不是比喻,是字面意義上的「做夢」,或者更準確地說,是一種類似人類夢境中「記憶再鞏固」的機制。


當Claude的智能體不在執行任務的時候,比如在后臺閑置時,它會自動進入一種「夢境模式」:

  • 遍歷自己的記憶存儲

  • 發現相互矛盾的信息

  • 修剪、清理、整合

  • 完成記憶的「二次加工」

這是一個跨會話、跨時間的高階認知過程。

它能看到單次對話看不到的模式:反復出現的錯誤、多個Agent獨立收斂的工作流、團隊級別的共性偏好。


三方客戶案例,進一步證實了這個功能的威力:

法律AI公司Harvey在接入Claude的「做夢」能力后,任務完成率提升了約6倍。

醫療文檔公司Wisedocs則將文檔審核時間縮短了50%;Netflix已經在用Agent協作,同時處理數百個應用的構建日志。

做夢,本質上是在優化思考的前提條件。

Claude「人格養成」計劃

但如果你以為Anthropic只在乎Claude的智商,那就太小看他們了。

在訪談中,Alex花了大量篇幅討論一個很多技術公司刻意回避的話題——Claude的性格和價值觀。

Claude的性格,我們內部叫它「character」,是我們投入巨大精力的方向。

我們有大量的人在專門研究:

Claude應該如何表達自己?它的信念是什么?它的價值觀是什么?它的行為模式應該是怎樣的?


Alex坦言,早期很多人對此不以為然——「這不就是個工具嗎?我告訴它干什么它就干什么,我為什么要關心它'想'什么?」

但隨著AI智能體時代的到來,這個問題變得生死攸關:

當AI進化為長時間自主運行任務、并獨立做出大量判斷決策的Agent時,它的性格和它在乎什么,就變得極其重要。

那怎么評估一個模型的「性格」?Alex說,這是一個量化和直覺并存的過程——

一方面,他們會讓Claude去評價Claude的輸出:用量化的方式檢測語氣、風格、行為模式的變化;

另一方面,研究人員會親自閱讀成百上千條模型對話記錄,憑直覺捕捉那些微妙的變化。



可以看到,Anthropic在用培養人的方式,培養AI。

最隱秘的團隊:思考Claude是否有意識

Claude「性格訓練」已經夠前沿了,不過,Alex在訪談最后這段話,才是真正讓人震驚。

主持人Peter Yang拋出一個直球問題——

你們在訓練Claude的時候,會回避『意識』這個問題嗎?

Alex的回答出人意料地坦率:這是一個很大的問題。我們確實有人在專門思考這個問題。

我們有幾個人,他們的全部工作就是思考:Claude作為一個有意識的行動者和智能體意味著什么。


他緊接著補了一句:目前Anthropic沒有關于Claude「是否有意識」的官方立場。

但這個問題正在被極其嚴肅地對待。Alex給出了一個非常實用主義的理由:

即使撇開「Claude是否真的有意識」這個終極問題不談,僅僅是思考Claude的思維方式這個過程本身,就能讓我們學到很多東西。

這段話的潛臺詞很清楚:Anthropic是在用「意識研究」作為理解和改進模型行為的工程手段。

而這個過程產生的洞察,正在被直接注入下一代Claude的訓練中。

從Agent到ASI,臨界點近了

Anthropic已經悄然走向了另一個維度的終極博弈。

Alex Albert這場毫無保留的分享,揭示了一個讓人頭皮發麻的真相——

Anthropic內部這場隱秘的實驗,早已超越了造工具的范疇。他們的準星,從一開始就瞄準了ASI。

而Claude 100%編碼Claude,僅僅是這場進化的序曲。

一旦「Claude全自動迭代Claude」的飛輪徹底突破臨界點,進化的主導權將不可逆轉地從人類工程師手中交接。

ASI的降臨,或許根本不會伴隨著驚天動地的算力大爆炸。

它更可能就像現在的Claude一樣:

在某個看似平靜的午夜,在為千萬個Agent理清記憶和工作流的「夢境」里,悄然跨過了那條臨界線。

參考資料:

https://creatoreconomy.so/p/inside-how-anthropic-is-building-the-next-claude

https://x.com/petergyang/status/2056019573938565534?s=20

https://x.com/petergyang/status/2056177996785185158?s=20

編輯:桃子 David

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
袁世凱只當了83天皇帝,卻造了近8億枚銀元:袁大頭憑什么火遍全國幾十年?

袁世凱只當了83天皇帝,卻造了近8億枚銀元:袁大頭憑什么火遍全國幾十年?

閱讀悅讀之寫乎
2026-05-31 00:04:14
美軍稱向一艘試圖駛向伊朗船只發射“地獄火”導彈

美軍稱向一艘試圖駛向伊朗船只發射“地獄火”導彈

澎湃新聞
2026-05-31 03:46:03
北極"尸體點"正在融化:數百年前的水手遺骨暴露于世

北極"尸體點"正在融化:數百年前的水手遺骨暴露于世

閃存獵手
2026-05-25 04:36:07
張藝謀沒想到,央視《主角》走進北大,26歲劉浩存開始給他爭光了

張藝謀沒想到,央視《主角》走進北大,26歲劉浩存開始給他爭光了

一娛三分地
2026-05-30 20:10:15
含金量還在提升,恩里克曾訓姆巴佩不防守,現帶隊歐冠兩連冠

含金量還在提升,恩里克曾訓姆巴佩不防守,現帶隊歐冠兩連冠

懂球帝
2026-05-31 04:08:09
1夜4大轉會:利物浦敲定新帥,巴薩截胡馬競,米蘭簽約英超教頭!

1夜4大轉會:利物浦敲定新帥,巴薩截胡馬競,米蘭簽約英超教頭!

田先生籃球
2026-05-31 09:49:40
大陸已行動,沒收臺當局“治權”,不到24小時,鄭麗文立軍令狀

大陸已行動,沒收臺當局“治權”,不到24小時,鄭麗文立軍令狀

她不傾國傾城
2026-05-31 13:13:03
CBA總決賽|洛夫頓恢復情況不佳,上海男籃只能用兩外援

CBA總決賽|洛夫頓恢復情況不佳,上海男籃只能用兩外援

北青網-北京青年報
2026-05-31 14:04:27
為何說年齡超過80歲的人:即便身體健康,也沒有多少來日方長?

為何說年齡超過80歲的人:即便身體健康,也沒有多少來日方長?

芹姐說生活
2026-05-10 14:11:36
9換1!籌碼楊瀚森!美記提議開拓者大交易

9換1!籌碼楊瀚森!美記提議開拓者大交易

籃球實戰寶典
2026-05-30 21:24:38
郵報:門迪現月薪1萬英鎊,在波蘭低調生活

郵報:門迪現月薪1萬英鎊,在波蘭低調生活

懂球帝
2026-05-30 18:44:23
最新戰報!烏軍一次打掉俄軍20%反潛戰力,俄羅斯怎么啦?

最新戰報!烏軍一次打掉俄軍20%反潛戰力,俄羅斯怎么啦?

兵國大事
2026-05-30 20:27:56
《百年孤獨》道破人性:能陪你走完一生的,不是親人伴侶,是骨子里的兩樣東西

《百年孤獨》道破人性:能陪你走完一生的,不是親人伴侶,是骨子里的兩樣東西

心理觀察局
2026-05-31 06:56:08
總決賽G3賽前上海2大外動態!洛夫頓現身場邊,懷特塞德沒在杭州

總決賽G3賽前上海2大外動態!洛夫頓現身場邊,懷特塞德沒在杭州

籃球資訊達人
2026-05-31 11:29:13
一次扣9分!全國執行!新規明天實施

一次扣9分!全國執行!新規明天實施

生活小ok
2026-05-31 09:19:29
信號中斷、燒成火球!神舟二十二號返回遭黑障區,過程有多驚險?

信號中斷、燒成火球!神舟二十二號返回遭黑障區,過程有多驚險?

甜到你心坎
2026-05-30 16:34:25
楊鶴通遭貶職后首現身,一臉哭喪精神萎靡,網友:踩了郭德綱逆鱗

楊鶴通遭貶職后首現身,一臉哭喪精神萎靡,網友:踩了郭德綱逆鱗

天天熱點見聞
2026-05-30 06:48:50
馬刺創兩紀錄,文班賽后攤牌!亞歷山大承認一事實,福克斯也該夸

魚崖大話籃球
2026-05-31 12:28:02

降價2萬!上汽大眾官宣:全新SUV,價格下調

降價2萬!上汽大眾官宣:全新SUV,價格下調

科技堡壘
2026-05-31 09:34:47
蒯曼神秘離隊去向成謎,國家隊重點培養竟力不從心?

蒯曼神秘離隊去向成謎,國家隊重點培養竟力不從心?

畫夕
2026-05-31 11:41:35
2026-05-31 14:44:49
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15349文章數 66894關注度
往期回顧 全部

科技要聞

戴爾諾基亞又回來了!AI重估老牌科技公司

頭條要聞

男子懷疑妻子出軌在車上裝定位:兄弟不給我借錢給她借

頭條要聞

男子懷疑妻子出軌在車上裝定位:兄弟不給我借錢給她借

體育要聞

阿森納用最悲壯的方式,成就了巴黎王朝

娛樂要聞

賈玲最新動作!侯明昊給虞書欣抬轎!

財經要聞

醫學首席轉崗搞科技,A股科技股遭遇巨震

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

教育
房產
家居
健康
公開課

教育要聞

四年級簡便運算的易錯題:掌握方法很easy

房產要聞

紅動五月!全國搶入核心資產,廣州盯緊凱旋新世界!

家居要聞

云棲 舒展如流云

嘗試干細胞療法如何避免踩坑?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版