无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek-R1持續(xù)震撼硅谷:躋身競技榜前三,創(chuàng)始人梁文鋒采訪被“拿放大鏡”看

0
分享至

“神秘東方力量”DeepSeek給硅谷帶來的影響,還在不斷泛起漣漪——

剛剛,DeepSeek-R1躋身大模型競技榜前三

以開源、便宜20倍的“身價(jià)”與ChatGPT-4o(2024.11.20)并列。

在復(fù)雜提示詞/風(fēng)格控制榜單上,R1位列第一。

目前結(jié)果來看,它在各個維度上都保持領(lǐng)先。

在衡量模型編程開發(fā)能力的WebDev分榜上,R1位列第二,與閉源的Claude 3.5 Sonnet相差不到40分。

網(wǎng)友實(shí)測體驗(yàn)表示,確實(shí)如此,R1在30場battle中只輸了4、5次。

另一邊,硅谷對DeepSeek的好奇不減。

畢竟,它可是一個“副業(yè)”。

創(chuàng)始人梁文鋒的中文采訪更是被翻譯成英文,“拿著放大鏡”逐字認(rèn)真閱讀。

他提出的觀點(diǎn)也被總結(jié)成箴言,在互聯(lián)網(wǎng)上流傳。

“真正的差距不是1年或2年,而在于是原創(chuàng)還是模仿。”

圖靈獎得主LeCun也為DeepSeek做出中肯評價(jià):

這幫人是一群有點(diǎn)理想化的“技術(shù)狂”,他們堅(jiān)信自己能搞出通用人工智能(AGI),而且他們確實(shí)有這個資源和天賦。我真是太喜歡他們了!

值得一提的是,同為開源領(lǐng)域代表的Meta剛剛公布了2025年在AI領(lǐng)域的布局計(jì)劃:650億美元,投算力、投人才。

有爆料稱,Meta內(nèi)部已經(jīng)因?yàn)镈eepSeek感到恐慌。

1

“他們讓OpenAI一次又一次看清自己”

所以,在硅谷視角里,他們更關(guān)心DeepSeek的哪些信息?

最首要的莫過于,DeepSeek如何賺錢。

挖到的信息有點(diǎn)出乎意料,或許DeepSeek還沒想賺錢的事。

控股DeepSeek的是幻方量化,他們有一批頂級科學(xué)家,有充裕的算力資源,DeepSeek其實(shí)是一個“副產(chǎn)物”。

在2023年末我就聽說他們在做DeepSeek。即使在當(dāng)時(shí)的中國,還沒有人把他們當(dāng)回事。

其次,為何DeepSeek能成功。梁文鋒在2023年5月2024年7月接受暗涌的兩次采訪,也被老外扒出來了。

他們最關(guān)心的五個方面分別是:

1、創(chuàng)新第一性原則:與其他致力于快速商業(yè)化的中國AI公司不同,DeepSeek專注于基礎(chǔ)的AGI研究和創(chuàng)新。他們認(rèn)為,中國必須從全球人工智能發(fā)展的“搭便車者”轉(zhuǎn)變?yōu)椤柏暙I(xiàn)者”。梁文鋒說,創(chuàng)新不完全是商業(yè)驅(qū)動的,還需要好奇心和創(chuàng)造欲。

2、革命性架構(gòu):DeepSeek V2中采用的新型MLA(多頭潛在注意力機(jī)制)架構(gòu),把顯存占用降到了過去最常用的MHA架構(gòu)的5%-13%,實(shí)現(xiàn)了成本大幅降低。它的推理成本僅為Llama 370B的1/7、GPT-4 Turbo的1/70。

這并不是為了挑起一場價(jià)格戰(zhàn)——他們只是在“成本上稍微有點(diǎn)利潤”來定價(jià)。這種創(chuàng)新架構(gòu)繼續(xù)應(yīng)用于V3和R1模型中。

3、獨(dú)特的公司文化和人才戰(zhàn)略:DeepSeek保持著一個完全自下而上的組織結(jié)構(gòu),為研究人員提供無限的計(jì)算資源,優(yōu)先看創(chuàng)造熱情而不是證書。他們的突破性創(chuàng)新來自年輕的本土人才——中國本土的應(yīng)屆畢業(yè)生和年輕技術(shù)人才,而非海外招聘。

4、致力于開源:盡管行業(yè)開始趨向于閉源模型(OpenAI和Mistral),DeepSeek仍致力于開源,并認(rèn)為開源對于建立一個強(qiáng)大的技術(shù)生態(tài)系統(tǒng)至關(guān)重要。梁文鋒認(rèn)為,在顛覆性技術(shù)面前,閉源形成的護(hù)城河是短暫的。

他們的真正價(jià)值在于建立一個具備創(chuàng)新能力的組織。

5、底層計(jì)算挑戰(zhàn):盡管擁有足夠的資金和技術(shù),DeepSeek也面臨來自底層計(jì)算的挑戰(zhàn)和壓力。目前公司還沒有新的融資計(jì)劃。梁文鋒認(rèn)為,面臨的主要制約因素不是資金,而是高端算力的使用權(quán),這些芯片對于訓(xùn)練先進(jìn)AI模型至關(guān)重要。

除此之外,采訪中的諸多細(xì)節(jié)也被網(wǎng)友認(rèn)真品味。

原文中,梁文鋒被問道:怎么看待做量化同時(shí)做大量基礎(chǔ)研發(fā),不燒錢嗎?

他回答:一件激動人心的事,或許不能單純用錢衡量。就像家里買鋼琴,一來買得起,二來是因?yàn)橛幸蝗杭庇谠谏厦鎻椬鄻非娜恕?/p>

海外網(wǎng)友感慨:

這幫人是一群有點(diǎn)理想化的“技術(shù)狂”,他們堅(jiān)信自己能搞出通用人工智能(AGI),而且他們確實(shí)有這個資源和天賦。我真是太喜歡他們了!

此外也避免不了一些對比:

梁文鋒展現(xiàn)出一種完全不同的心態(tài),他們的成功當(dāng)之無愧,我也很期待看到他們一次又一次讓“OpenAI”認(rèn)清自己。

當(dāng)然放眼AI領(lǐng)域的整體發(fā)展,能夠看到DeepSeek,對于所有人而言或許都是興奮的。

盡管我忍不住覺得他們有點(diǎn)天真,畢竟在商業(yè)化上他們有點(diǎn)“自斷后路”。但看到一個團(tuán)隊(duì)堅(jiān)持理想并取得成功,確實(shí)讓人覺得很欣慰。

隨著R1的驚艷亮相,DeepSeek正在兌現(xiàn)自己所說的一切。拓寬技術(shù)邊界、堅(jiān)持開源、專注于技術(shù)開發(fā)……

那么,DeepSeek是如何走到現(xiàn)在的呢?

2

用AI做量化,再回到AI

梁文鋒本碩均就讀于浙江大學(xué)信息與電子工程學(xué)專業(yè)。

2008年,梁文鋒畢業(yè),開始帶領(lǐng)團(tuán)隊(duì)使用機(jī)器學(xué)習(xí)等技術(shù)探索全自動量化交易。

當(dāng)時(shí)量化在國內(nèi)還是個新鮮概念,能否賺錢是個未知數(shù)。2010年滬深300股指期貨推出,量化投資迎來春天。據(jù)公開信息顯示,梁文鋒團(tuán)隊(duì)正是乘上這股東風(fēng),很快自營資金超過5億元。

與此同時(shí),深度學(xué)習(xí)浪潮的齒輪開始轉(zhuǎn)動,人工智能率先在硅谷爆發(fā)。

2015年,梁文鋒與校友共同創(chuàng)立幻方量化。僅僅1年后,他們就推出了旗下第一個AI模型,第一份由深度學(xué)習(xí)生成的交易倉位上線執(zhí)行,使用GPU進(jìn)行計(jì)算。

2017年,幻方量化宣稱實(shí)現(xiàn)投資策略全面AI化。

2018年,幻方量化確立AI為公司的主要發(fā)展方向。

AI加持下,幻方量化旗下基金回報(bào)率遠(yuǎn)超同期滬深300指數(shù)。2019年,資金管理規(guī)模突破百億元。

2019年,梁文鋒在當(dāng)年的金牛獎頒獎儀式上,發(fā)表主題演講《一名程序員眼里中國量化投資的未來》,這是他少見的公開演講。

演講全文的確充滿“程序員視角”:

量化公司是沒有基金經(jīng)理的,基金經(jīng)理就是一堆服務(wù)器。人來做投資決策的時(shí)候,它是一種藝術(shù),要憑感覺。程序來決策的時(shí)候,它是一種科學(xué),它有最優(yōu)解。

也是這一年,幻方量化開始大規(guī)模布局AI算力,搭建起“螢火一號”集群。2021年,“螢火二號”落成。這樣的算力基建,成為如今DeepSeek快速奔跑的底層支撐。

2021年,幻方量化成為國內(nèi)首家突破千億規(guī)模的的量化私募大廠,被稱為國內(nèi)量化私募“四大天王”之一。

值得一提的是,在幻方量化的官網(wǎng)上,AI基礎(chǔ)科學(xué)研究始終占據(jù)重要位置,包括在大模型浪潮前。

幻方量化曾表示,多年以來,該公司堅(jiān)持把營收的大部分投入人工智能領(lǐng)域,建設(shè)領(lǐng)先的AI硬件基礎(chǔ)設(shè)施,進(jìn)行大規(guī)模的研究,探索人類未知的奧秘。

我們相信幾乎所有的創(chuàng)新都是從大膽嘗試和點(diǎn)滴積累中孕育而來。

2023年,幻方量化將下場做大模型的獨(dú)立新組織命名為深度求索,并強(qiáng)調(diào)將專注于做真正人類級別的人工智能。

目標(biāo)不是復(fù)刻ChatGPT,而是研究和揭秘AGI的更多未知信息。

DeepSeek的故事也就開始于這一刻。

一個80后程序員在攪動中國量化市場后,完成資金積累,組建起年輕蓬勃的團(tuán)隊(duì),似乎又回到了他原本的起點(diǎn)、回到AI,但產(chǎn)生的能量正在全球掀起駭浪。

3

One More Thing

值得一提的是,幻方量化還長期向慈善機(jī)構(gòu)捐贈,官網(wǎng)披露公司員工“一只平凡的小豬”個人捐助 1.38 億元,支持 15 家慈善機(jī)構(gòu)的 23 個公益項(xiàng)目,在全國范圍內(nèi)幫助弱勢群體,促進(jìn)社會的公平和發(fā)展。

爆料消息稱,這個員工就是梁文鋒本人。

參考鏈接:
[1]https://www.reddit.com/r/LocalLLaMA/comments/1i6dlvj/inside_deepseeks_bold_mission_ceo_liang_wenfeng/
[2]https://www.threads.net/@yannlecun/post/DFNvN3euNEV?xmt=AQGzPcW8Rr7oXT6-rHIoKzBNL5x2PNnaprvJBL6uIhgoQA
[3]https://finance.eastmoney.com/a/202501223304127161.html
[4]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg

轉(zhuǎn)自公眾號:量子位

圖文網(wǎng)絡(luò),侵刪

粉絲福利領(lǐng)取

近期,公眾號收集了科研指導(dǎo)、編程學(xué)習(xí)、科學(xué)哲學(xué)、科學(xué)史、數(shù)學(xué)和物理科普書、中醫(yī)書籍、文學(xué)著作、升學(xué)就業(yè)相關(guān)資料等資源大禮包,點(diǎn)擊了解詳情

點(diǎn)擊資源推文頁,領(lǐng)取方式在文末

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
妻子出軌后我選擇離婚,20年后,她兒子拿著份親子鑒定來找我

妻子出軌后我選擇離婚,20年后,她兒子拿著份親子鑒定來找我

千秋文化
2026-06-13 20:02:52
世界杯戰(zhàn)報(bào):再爆大冷預(yù)警世界第6苦戰(zhàn)2-2第87,日本很難很難了

世界杯戰(zhàn)報(bào):再爆大冷預(yù)警世界第6苦戰(zhàn)2-2第87,日本很難很難了

金風(fēng)說
2026-06-25 07:37:09
鄭麗文再次對統(tǒng)一問題表態(tài)!

鄭麗文再次對統(tǒng)一問題表態(tài)!

果媽聊娛樂
2026-06-25 12:17:32
原來她早已離世!自己一個人定墓園和壽衣,3200萬遺產(chǎn)全給姐姐

原來她早已離世!自己一個人定墓園和壽衣,3200萬遺產(chǎn)全給姐姐

小椰的奶奶
2026-06-25 11:01:21
被逼入絕境?紹伊古當(dāng)面向中方提了兩件事,俄羅斯希望中國能成全

被逼入絕境?紹伊古當(dāng)面向中方提了兩件事,俄羅斯希望中國能成全

丁丁鯉史紀(jì)
2026-06-25 17:13:58
美股科技股走勢分化 美光科技收漲超15% 蘋果大跌6%領(lǐng)跌“科技七巨頭”

美股科技股走勢分化 美光科技收漲超15% 蘋果大跌6%領(lǐng)跌“科技七巨頭”

財(cái)聯(lián)社
2026-06-26 04:28:03
全線下跌,超20萬人爆倉

全線下跌,超20萬人爆倉

每日經(jīng)濟(jì)新聞
2026-06-26 00:32:07
造成3死1傷!福建福州市發(fā)生一起較大中毒窒息事故,調(diào)查評估報(bào)告發(fā)布:1人獲刑三年,8人被給予黨紀(jì)政務(wù)處分;因員工盲目施救造成傷亡擴(kuò)大

造成3死1傷!福建福州市發(fā)生一起較大中毒窒息事故,調(diào)查評估報(bào)告發(fā)布:1人獲刑三年,8人被給予黨紀(jì)政務(wù)處分;因員工盲目施救造成傷亡擴(kuò)大

臺州交通廣播
2026-06-25 14:38:17
2002 年李春平世紀(jì)騙局內(nèi)情曝光:所謂百億遺產(chǎn)繼承權(quán)全是謊言

2002 年李春平世紀(jì)騙局內(nèi)情曝光:所謂百億遺產(chǎn)繼承權(quán)全是謊言

磊子講史
2026-06-23 17:22:32
臺灣不愿意“一國兩制”,王毅外長霸氣回應(yīng),那就滿足你們!

臺灣不愿意“一國兩制”,王毅外長霸氣回應(yīng),那就滿足你們!

荊楚寰宇文樞
2026-06-24 23:05:42
新中國第一個被罷免的省長,出獄后下海經(jīng)商,晚年過得如何?

新中國第一個被罷免的省長,出獄后下海經(jīng)商,晚年過得如何?

歷史圖鑒
2026-06-25 22:32:54
你們都是什么時(shí)候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

你們都是什么時(shí)候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

夜深愛雜談
2026-02-21 21:37:02
安徽15歲女孩在一網(wǎng)紅景點(diǎn)拍照時(shí)墜湖身亡,前一天剛參加中考,事后網(wǎng)上仍有人推薦前往打卡,官方:事發(fā)地是廢棄礦坑

安徽15歲女孩在一網(wǎng)紅景點(diǎn)拍照時(shí)墜湖身亡,前一天剛參加中考,事后網(wǎng)上仍有人推薦前往打卡,官方:事發(fā)地是廢棄礦坑

大象新聞
2026-06-25 22:53:26
你們再這么清醒下去,娛樂圈遲早要掛掉!

你們再這么清醒下去,娛樂圈遲早要掛掉!

走讀新生
2026-06-23 17:32:04
黃一鳴48小時(shí)崩盤 兩場官司全輸賬號遭封禁 私生女流量徹底反噬

黃一鳴48小時(shí)崩盤 兩場官司全輸賬號遭封禁 私生女流量徹底反噬

手工制作阿殲
2026-06-26 03:15:22
7天期限已過,澤連斯基宣布好消息,為900萬人性命,普京暫避鋒芒

7天期限已過,澤連斯基宣布好消息,為900萬人性命,普京暫避鋒芒

李健政觀察
2026-06-25 17:37:46
離開11年后,央視名嘴低調(diào)隱居北京,如今二婚21年無兒無女很瀟灑

離開11年后,央視名嘴低調(diào)隱居北京,如今二婚21年無兒無女很瀟灑

素衣讀史
2026-06-25 21:56:52
烏克蘭只是幌子,真正的目標(biāo)已經(jīng)落入圈套

烏克蘭只是幌子,真正的目標(biāo)已經(jīng)落入圈套

半路友人之他
2026-06-26 00:51:00
聽過最恐怖的故事是什么 看網(wǎng)友講述 我身上的汗毛倒豎人間地獄啊

聽過最恐怖的故事是什么 看網(wǎng)友講述 我身上的汗毛倒豎人間地獄啊

侃神評故事
2026-06-25 11:02:06
A股:中央五部門聯(lián)合出手,釋放出重磅信號,明日將迎來更大行情

A股:中央五部門聯(lián)合出手,釋放出重磅信號,明日將迎來更大行情

云鵬敘事
2026-06-26 00:00:07
2026-06-26 05:24:49
天地生人 incentive-icons
天地生人
科技
875文章數(shù) 4620關(guān)注度
往期回顧 全部

科技要聞

存儲成本壓力山大!蘋果罕見全球提價(jià)

頭條要聞

女孩在網(wǎng)紅景點(diǎn)拍照時(shí)墜湖身亡 前一天剛參加中考

頭條要聞

女孩在網(wǎng)紅景點(diǎn)拍照時(shí)墜湖身亡 前一天剛參加中考

體育要聞

世界杯最動人一吻:我若離世 你就改嫁吧

娛樂要聞

這國產(chǎn)劇太裝了,居然還熱播第一?

財(cái)經(jīng)要聞

又有紙尿褲送檢后被檢測出甲酰胺!

汽車要聞

老板們的新座駕!65萬元起,尊界V800/V680開啟預(yù)訂

態(tài)度原創(chuàng)

本地
房產(chǎn)
數(shù)碼
藝術(shù)
公開課

本地新聞

2026世界杯全勤太難?這份保姆級攻略請收好

房產(chǎn)要聞

城市精英集體出手!科學(xué)城這一現(xiàn)象級熱銷紅盤,憑何成為共識之選?

數(shù)碼要聞

徠卡SL3-P全畫幅相機(jī)發(fā)布:售45000元 1.76億像素超高分辨率

藝術(shù)要聞

稅務(wù)局大樓能是這樣?5個立方體扭40度,高171米!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版