无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

像梁文峰一樣誠實

0
分享至

「不誘于譽,不恐于誹,率道而行,端然正己。」

原話出自《荀子·非十二子》,這次被 DeepSeek 放到發布稿的結尾。

《非十二子》本身就不是一篇溫吞的文章。荀子在里面逐一批評當時有影響力的學說和人物,甚至連儒家內部的子思、孟子也沒有放過。

所謂“非十二子”,不是簡單地否定別人,而是在一個思想市場極度熱鬧、各種聲音都試圖爭奪解釋權的時候,重新辨認什么是真正可靠的道路。

梁文鋒當然不是想批評別人,他甚至連對外講兩句都沒興趣。這只是一種自我說明,和自我道路的確認。

外界 care 我們,但我們不 TM care。

過去一段時間,DeepSeek 處在一種很特殊的位置上。

V4 遲遲沒有發布,又不斷被各種融資、延期、人才流動的猜測包圍。

AGI 夢想在前,贊譽、質疑、情緒和輿論,全是噪聲。

外界可以有很多評價,但最后能回應一切的,還是模型和產品。

這也是梁文鋒和 DeepSeek 特別的地方。他們身上有一種少見的理想主義,但這種理想主義不是輕飄飄的口號,而是非常工程化、非常具體的東西:模型做強,成本打低,上下文擴張,Agent 能力補上,把真實使用體驗擺到用戶面前。

而且還很誠實。

理想主義的人不一定誠實。

比如馬斯克顯然有理想主義,星際移民和通用 AGI 都在射程之內。但馬斯克顯然不夠誠實。對于今天模型圈的人來說,誠實是個更加稀缺的品質。

今天新模型發布后,你已經很難直接獲得關于模型能力的相對客觀的評價了。你看到一堆跑分和基準測試,跟實際體驗是兩個東西。

DeepSeek 文章里給出了他們內部的真實體驗判斷:目前 DeepSeek-V4 已成為公司內部員工使用的 Agentic Coding 模型,據評測反饋使用體驗優于 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距。

相當清楚,一目了然,基本鎖死外部野生評測員的補位空間。

所以我建議所有模型廠商,模型發布的時候,除了那批已經沒啥人看的跑分,都加上自己內部蓋戳認證的真實印象。

這個東西很關鍵。

因為 Agentic Coding 不是考試題。模型在一個榜單里多拿幾分,和你真的把它放進一個代碼倉庫里,讓它讀需求、看文件、改代碼、跑測試、修 bug、繼續迭代,是兩回事。

真實體驗里有很多 benchmark 很難覆蓋的東西。任務一長就丟失目標,用著用著就忘掉前面的約束,改我不讓它改的文件,真的讓人抓狂。

所以 DeepSeek 這段話不是覺得自己很強,不是benchmark說我很強,而是它給了一個非常接近真實用戶語言的坐標。

強在哪里,接近誰,和誰還有差距,說得很明白。這種表達其實比“全面超越某某模型”高級得多,也有用得多。

具體聊下模型。

1M上下文

現在很多模型的默認上下文還是256K這個級別。對普通聊天來說,這已經很長了。但對 Agent 任務來說,其實經常不夠。vibe coding的時候,或者跑個龍蝦跑匹馬的時候,模型需要在一個很長的任務過程中持續保留信息。

很多時候模型任務失敗,不是它單點智力不夠,而是因為工作記憶不夠。

它前面讀過的東西,后面就忘了;用戶一開始強調的要求,做著做著丟了;項目結構剛理解完,改到第三輪又開始漂移。上下文不夠的時候,Agent 很容易變成一個短視的執行器,很難跑完整個任務。

1M 上下文的意義就在這里。它讓模型更像一個能長時間工作的協作者。

嚴格來說,這還不是參數意義上的“持續學習”,因為模型權重沒有更新。

但從產品體驗上講,它已經接近一種上下文內的持續學習:模型可以在同一個任務窗口里不斷吸收資料、用戶反饋、歷史決策和中間產物,然后把這些東西帶到后面的推理和執行里。

未來很多 AI 應用不會是“我問一句,你答一句”,而是“我給你一個目標,你陪我把一件復雜的事做完”。這時候上下文就是模型的工作臺,也是它的短期記憶。上下文越長,模型越有機會從單輪工具變成持續協作系統。

為了更好地支持長上下文,DeepSeek 重新處理了 Transformer 最昂貴的那一層東西:注意力。



傳統注意力的問題大家都知道,它越往長上下文走,成本越不講道理。因為模型不是把前文當成一篇文章粗略掃一眼,而是每生成一個位置,都要和前面大量位置建立關系。上下文長度擴大以后,計算和顯存壓力會以非常陡的方式上升。

V4 的思路是把“看上下文”這件事拆得更細。它不再要求模型在所有層里都用同一種方式平鋪直敘地看完整歷史,而是讓不同注意力模塊承擔不同尺度的記憶任務。

一部分模塊負責做比較細的壓縮和篩選:先把連續的小段 token 整理成更緊湊的記憶單元,再讓當前位置只去關注其中最相關的一部分。

另一部分模塊則負責更粗尺度的全局感知,把更長的一段歷史壓成更少的記憶節點,然后在這些節點之間做相對完整的關聯。它犧牲了一些局部細節,但換來的是對超長歷史的整體把握。

這個方向我覺得非常 DeepSeek。

因為 DeepSeek 過去兩年最關鍵的技術氣質,一直不是“堆大”,而是“稀疏化”,是降成本。

V2、V3 的 MoE 是參數層面的稀疏化:模型總容量很大,但每個 token 只調用一部分專家,所以能力上去,成本沒有按同等比例爆炸。

V4 這次更進一步,把稀疏化推進到了上下文本身:不是所有歷史 token 都以同等分辨率進入注意力,而是經過壓縮、篩選、分層之后,再被模型使用。

所以這次 1M 上下文,我覺得不能只當成一個產品賣點。

它更像是 DeepSeek 技術路線的一次延伸:先用 MoE 解決“模型容量和推理成本”的矛盾,再用新的注意力結構解決“上下文長度和計算成本”的矛盾。前者讓大模型變得更便宜,后者讓長任務變得更可行。

API價格



DeepSeek 去年之所以能掀起那么大的轟動,不只是因為它強,也不只是因為它便宜,而是它讓所有人第一次非常強烈地意識到:強和便宜原來可以同時成立。

這件事對行業心理的沖擊很大。因為過去大家默認頂級模型就是貴的,低價模型往往就要在能力上做妥協。但 DeepSeek 把這個默認前提打穿了。便宜但不好用,不會改變行業;強但太貴,也只能服務少數場景。但又強價格又低,就會改變成本結構,成本一動上面的生態就會跟著動。

拿公開 API 價格粗略看一下。deepseek-v4-pro的價格基本跟最新發布的kimi-k2.6一致,前者在緩存未命中情況下更貴,輸出則更便宜一點。

不過k2.6價格是256K的上下文長度,而deepseek-v4-pro則是1M的上下文。按照之前小米MiMo token plan的計費規則,從256k到1m上下文增長,API價格要翻倍。

而且這里需要看到下面灰色的補充信息。目前受限于高端算力,Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。

說明當前Pro版本的價格是被刻意調高,因為推力算力還沒有跟上。未來Pro版本價格大幅下調,不排除在現有價格的基礎上對折甚至再對折。

國產算力齊活

之前一直有傳聞,說 DeepSeek-V4 這次沒有按照行業慣例,把早期適配優先權交給英偉達,而是先給了華為等國產芯片廠商。

當時這個說法聽起來還有點像江湖傳聞,因為大模型行業過去的默認流程就是圍著 CUDA 轉。模型廠商發新模型之前,先讓英偉達這些硬件和軟件生態的核心玩家提前適配,確保模型一上線就能在主流 GPU 上跑得又快又穩。

現在看來,國產全棧AI基本齊活了。

上面我們提到,DeepSeek 自己在發布稿里寫了,受限于高端算力,目前 Pro 的服務吞吐十分有限,預計下半年昇騰 950 超節點批量上市后,Pro 的價格會大幅下調。

華為計算公眾號也說,昇騰一直同步支持 DeepSeek 系列模型,這次通過雙方芯模技術緊密協同,實現昇騰超節點全系列產品支持 DeepSeek V4 系列模型。昇騰 CANN 還安排了 DeepSeek V4 昇騰首發直播。

CUDA 的優勢不是英偉達某一張卡很強,而是模型、框架、算子庫、開發工具、部署經驗、工程人才,全都圍著它長了很多年。你要從 CUDA 遷到 CANN,大量底層算子、精度對齊、通信、調度、推理服務都要能跑通,而且要跑得足夠好。

DeepSeek-V4 能在昇騰超節點上作為重要服務底座跑起來,這對國產算力是一次非常關鍵的驗收。DeepSeek 的性價比不是憑空來的,它背后一定要有算力供給。

如果永遠依賴昂貴、受限、供給不穩定的外部 GPU,再強的模型也很難長期維持低價。國產算力如果能接上,DeepSeek 才有可能繼續把“強模型 + 低價格”這件事往下打。

所以這件事我覺得可以說是 DeepSeek-V4 里最硬的產業信號之一:模型有了,長上下文有了,Agent 能力有了,API 有了,現在連國產算力底座也開始接上了。

閉環開始形成。

DeepSeek 負責把模型能力和成本曲線打出來,華為昇騰負責把高端推理算力和超節點供給接上,CANN 負責補國產軟件棧,開發者和 Agent 產品負責把需求跑起來。

為什么 DeepSeek-V4 這次發布很振奮。

它不是一個孤零零的模型更新,而是把很多原本分散的線索接到了一起:梁文鋒的理想主義,DeepSeek 的誠實表達,1M 上下文,Agent 能力,低價 API,昇騰超節點,國產算力放量。

每一個單獨看都重要,但合在一起,才是真正讓人興奮的地方。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
大瓜!南寧女子街頭撕碎“丈夫”面具,原來他在福建有老婆有孩子

大瓜!南寧女子街頭撕碎“丈夫”面具,原來他在福建有老婆有孩子

火山詩話
2026-06-14 05:46:36
李連杰一家三口拜見仁波切,64歲利智許久不見,顏值回春如昔日!

李連杰一家三口拜見仁波切,64歲利智許久不見,顏值回春如昔日!

娛樂團長
2026-06-02 15:09:12
嫁豪門5年生下4胎!如今30歲住杭州豪華別墅,專屬團隊貼身伺候

嫁豪門5年生下4胎!如今30歲住杭州豪華別墅,專屬團隊貼身伺候

小正說娛樂
2026-06-09 15:24:26
老年單身女人最難熬的日子是什么?67歲阿姨感慨:不是寂寞孤單

老年單身女人最難熬的日子是什么?67歲阿姨感慨:不是寂寞孤單

熱心柚子姐姐
2026-06-11 08:32:00
兩起特大安全事故發生后,多名涉事官員被迅速查處。

兩起特大安全事故發生后,多名涉事官員被迅速查處。

樂天WMQ
2026-06-13 16:19:04
300433,以并購切入空芯光纖賽道

300433,以并購切入空芯光纖賽道

新浪財經
2026-06-13 22:36:51
浙江女子過年回家炫耀70萬存款,隔天表姑全家跪地借60萬治病,她不想借,但所有人都說親戚一場,不能見死不救…

浙江女子過年回家炫耀70萬存款,隔天表姑全家跪地借60萬治病,她不想借,但所有人都說親戚一場,不能見死不救…

背包旅行
2026-06-13 15:40:27
正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

健康科普365
2026-05-09 21:05:04
老人10萬元定期存單在手,存款卻不見了? 法院:銀行提交證據證實其掛失后取出存款

老人10萬元定期存單在手,存款卻不見了? 法院:銀行提交證據證實其掛失后取出存款

極目新聞
2026-06-13 22:12:45
伊朗用中國導彈擊落美國F-15戰機,引發美中關系動蕩,深度分析

伊朗用中國導彈擊落美國F-15戰機,引發美中關系動蕩,深度分析

黑鷹觀軍事
2026-06-12 16:10:40
耿同學再立功,上海大學院長遭免職,曾托人問耿同學能否私下解決

耿同學再立功,上海大學院長遭免職,曾托人問耿同學能否私下解決

漢史趣聞
2026-06-13 08:50:16
法網奪冠后興奮“消逝得太快”,安德烈耶娃已開始規劃草地賽季

法網奪冠后興奮“消逝得太快”,安德烈耶娃已開始規劃草地賽季

綠茵狂熱者
2026-06-13 01:01:49
重溫了4次《傲慢與偏見》才明白:當男人頻繁貶低你的價值、質疑你的判斷、讓你不斷自我懷疑時,聰明女人堅持做這兩件事奪回主動權

重溫了4次《傲慢與偏見》才明白:當男人頻繁貶低你的價值、質疑你的判斷、讓你不斷自我懷疑時,聰明女人堅持做這兩件事奪回主動權

心理觀察局
2026-06-14 07:07:07
夜夜求歡!50歲妻子苦不堪言: 本分妻設局灌醉保姆助丈夫性侵

夜夜求歡!50歲妻子苦不堪言: 本分妻設局灌醉保姆助丈夫性侵

深夜探案館
2026-06-11 01:48:36
臺灣自媒體人吳東昇:翔安機場年底通航,我們臺灣人都很期待

臺灣自媒體人吳東昇:翔安機場年底通航,我們臺灣人都很期待

海峽導報社
2026-06-13 22:46:15
太戲劇化!國際職業殺手潛入愛爾蘭,暗殺途中出車禍,死了……

太戲劇化!國際職業殺手潛入愛爾蘭,暗殺途中出車禍,死了……

愛爾蘭華人圈
2026-06-12 20:03:32
高考剛結束就往醫院跑?大廳走廊擠滿女生,家長無奈:根本攔不住

高考剛結束就往醫院跑?大廳走廊擠滿女生,家長無奈:根本攔不住

奇思妙想草葉君
2026-06-11 21:08:40
哈登在休斯頓被捕的更多細節曝光

哈登在休斯頓被捕的更多細節曝光

本澤體育
2026-06-14 06:48:27
女人不管年紀多大,“正式場合”打扮切記:裙不配運動鞋、發盤起

女人不管年紀多大,“正式場合”打扮切記:裙不配運動鞋、發盤起

時尚穿搭生活館
2026-06-07 23:51:07
3年2.2億!曝三方交易啊!杰倫布朗或換字母哥

3年2.2億!曝三方交易啊!杰倫布朗或換字母哥

籃球實戰寶典
2026-06-13 20:48:21
2026-06-14 07:43:01
象先志 incentive-icons
象先志
專注互聯網、電商,聚焦產業、核心,洞察前沿、趨勢
182文章數 14關注度
往期回顧 全部

藝術要聞

廣州再建一座“小蠻腰”?190米,頂著個球,2027年見!

頭條要聞

伊朗官員:目前版本伊美諒解備忘錄“比之前的更好”

頭條要聞

伊朗官員:目前版本伊美諒解備忘錄“比之前的更好”

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋全網!

財經要聞

梁文鋒向左,楊植麟向右

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

房產
本地
健康
公開課
軍事航空

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

本地新聞

AK劉彰邂逅河北南大港濕地

老人、小孩、孕婦,吃粽子有啥風險

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:美伊協議周日簽 還有終極手段

無障礙瀏覽 進入關懷版