網易首頁 > 網易號 > 正文申請入駐

“日本最強AI”光速塌房，都怪中國DeepSeek太強？

2026-03-19 16:24:26　來源: 藍字計劃

廣東舉報

分享至

作者｜Hayward

原創首發｜藍字計劃

連日本人自己都繃不住了。

3月17日，日本科技公司樂天高調發布了新一代AI大模型Rakuten AI 3.0，宣稱是日本最大、性能最強的AI大模型。

這款模型來頭不小：一方面，它背后有日本經濟產業省支持的GENIAC項目站臺，算是“國家隊”級別的大模型；另一方面，它還擁有一個相當唬人的標簽，7000億參數。

這什么概念？

哪怕按更具體的口徑來看，它的總參數規模也有671B，依然屬于當前開源模型里的第一梯隊，和DeepSeek V3坐一桌。

背靠日本國內最大靠山，參數又非常突出，對于這款模型的發布，樂天底氣十足，連“（日本）國產模型的逆襲”都喊出來了。

但是，日本網友還沒來得及為Rakuten AI 3.0開香檳，一場來自開源社區的技術打假就給他們澆了一盆冷水。

這款號稱“日本最強、性能最強”的大模型，竟然是咱們中國開源大模型，DeepSeek-V3的日語“套殼版”。

日本的榮光，卻出身不良

和絕大多數的打假“后知后覺”不同，Rakuten AI 3.0的吹牛行為甚至挺不過一個下午。

就在模型出來的幾個小時里，開源社區的大神們就發現，這款加上了非常多牛逼限定詞的AI大模型，有貓膩。

甚至樂天都沒有過多的“掩飾”，因為Rakuten AI 3.0赫然在Hugging Face上的config.json文件里寫著：

model_type: deepseek_v3

architectures: DeepseekV3ForCausalLM

這就相當于明牌告訴大家，這款模型的底層架構來自DeepSeek V3。

當然，DeepSeek V3作為一款開源模型，被學習、借鑒、使用來作為模型架構也正常不過，畢竟這就是開源的初心；

但Rakuten AI 3.0的問題在于，在發布的時候它絲毫沒有提及使用了DeepSeek V3的架構，還搬出了“自主研發”“日本最強”“日本最大”等限定詞，看上去真的是由樂天從0到1，自主鼓搗出來的大模型。

這也是開源社區最不滿的地方：這款模型在上傳的時候，沒有充分保留DeepSeek原有的歸屬/許可證聲明；直到被社區抓包之后，才悄悄地補上了NOTICE文件。

樂天的這種做法，顯然是違背了開源精神，“需要保留原許可證和歸屬”的要求。

在使出這一招“亡羊補牢”之后，別說路人，連日本網友都好感都敗光了。對于這款模型，日本網友都評論基本都是：

“GENIAC項目花納稅人的錢，就做個DeepSeek的日語fine-tune版？”

“自稱日本最大高性能，卻是中國的日語版。”

那么這款模型的性能怎么樣呢？

根據樂天官方陸續公布的數據，Rakuten AI 3.0的紙面成績其實相當能打。

像Japanese MT-Bench這樣的日語綜合基準，它已經跑贏了GPT-4o；而在日本文化理解、敬語表達、商務郵件、報告寫作、文檔分析這些更偏本土語境的任務里，表現也明顯很強。

再加上它雖然總參數接近7000億，但因為用了MoE稀疏架構，單次推理實際激活的參數并不高，成本還能被壓到相當前沿閉源模型的10%左右。

也就是說，這模型不只是“成績好看”，而且用起來還非常省錢。

但熟悉大模型的人一眼就看出了：這些不都是DeepSeek本來的優勢嗎？

是的，畢竟是一款基于DeepSeek-V3架構、再做日語數據微調和本土化優化的大模型，Rakuten AI 3.0的表現越是厲害，就越是能證明DeepSeek厲害，這也是X上相當一部分日本網友破防的點：

“日本政府用了納稅人的錢來支持你們，你們卻用來證明中國的DeepSeek牛逼？”

估計梁文鋒看到這出戲，做夢都得笑醒。

司空見慣的“抄襲”

但是，日本的網友們可能也有點“失憶癥”了，畢竟從日本AI大模型的發展歷程來看，抄襲，或者優雅點說：“套殼”，不是常態嗎？

Rakuten AI 3.0可不是第一個使用了別家大模型架構作為基座的日本模型。

一個典型例子，是日本AI公司ABEJA在2025年4月左右推出的小型日語專精推理模型：ABEJA QwQ 32b。

光看這個名字，其實就已經名牌了。

畢竟連QwQ這個阿里千問系最標志性的前綴，它都懶得改。

而實際情況也差不多。

這款模型的底座，本來就是Qwen2.5 + QwQ-32B，ABEJA做的事情，說白了就是先拿千問模型做日語持續預訓練，再把推理能力整合進去，最后補一輪日語強化和微調。

本質上，它和樂天這次的路數并沒有什么不同：都是拿中國開源大模型當基座，再靠本土數據和場景去做一層“日本化”包裝。

只不過，ABEJA至少沒有把自己演成什么從0到1橫空出世的“日本最強原創模型”。

它不但把底座和訓練路徑寫清楚，連阿里那邊都沒有介意，阿里巴巴官方X賬號甚至還專門轉發慶祝，大意就是：ABEJA做的日語推理模型，成績已經超過了GPT-4o。

同樣是“套殼”，ABEJA當然也談不上多原創，只不過人家至少沒有一邊踩著別人的底座，一邊還忙著擦腳印。

除了ABEJA和樂天，不少日本公司其實也大體走的是這條路。

像Lightblue、ELYZA這些做日語模型的玩家，底下是Qwen、Llama等現成底座，有的也會結合DeepSeek、Mistral這類強模型能力做本土化，上面再糊一層更懂日本企業文檔、客服語料、敬語語境、制造業日志的數據，把它調成一個“更會說日本話、更會干日本活”的版本。

日經新聞網之前曾報道過，“「AIモデルスコア」で日本企業が開発した上位10モデルのうち、新興ABEJA（アベジャ）のモデルなど計6種がディープシークやQwenを基盤に開発されていた。”

翻譯過來，就是現在日本公司推出的前10大模型里，有6個都是基于DeepSeek或Qwen進行二次開發。

其實，這在AI圈本來也不算是什么原則性問題，全球AI行業現在本來就是這么玩的。

美國也好，歐洲也好，中國也好，別說二三線團隊了，很多一線團隊其實也在走這條路：拿Qwen做推理增強，拿DeepSeek做蒸餾和本地部署，拿Llama做行業版，拿Mistral做輕量化和邊緣場景。

畢竟，從頭訓練一個前沿基座，燒掉的是天文數字級別的算力、資金和人才；但如果你已經有了一個足夠強的開源底座，真正決定你能不能跑出來的，反而是后面的數據、場景和落地能力。

所以，樂天這次的“炎上”，本質不是因為“抄襲”而觸犯天條，而是干得太不體面了。

一邊吃著開源模型的紅利，一邊又拼命把自己往“自主研發”“日本最強”“日本最大”上靠；一邊站在DeepSeek的肩膀上，一邊又不愿把這件事說透，甚至連許可證和歸屬都都悄悄藏起來。

別人套殼，至少套得坦坦蕩蕩；樂天套殼，卻偏偏還想演成“全靠自己”。

又或許，樂天這次“不體面”的背后，折射出的，只是整個日本科技領域已經落后于世界的冰山一角。

日本IT業，失落的30年

1990年，隨著經濟泡沫被刺破，整個日本都仿佛被按下了暫停鍵。

股價暴跌、地價跳水、不良債權爆發、銀行惜貸、企業連鎖倒閉……整個日本經濟像多米諾骨牌一樣接連崩塌，正式跌入“平成不況”，并由此開啟了失落的10年、20年，乃至30年。

而在這樣的背景下，日本IT行業的軌跡，也幾乎成了這場長期停滯的縮影。

關于日本的“笑話”大家已經看到非常多了：

都2024年了，日本政府居然還在和軟盤“決戰到天明”。

直到去年6月，日本數字廳才終于廢掉了1034條還要求用軟盤等介質提交材料的規定，只剩下一條和汽車回收有關的規定沒處理完。

在AI、大模型、云計算都已經卷到天上的年代，日本政府居然還在認真討論“軟盤要不要退役”這種問題。

傳真機也差不多。

這些年外界老拿“日本還在用傳真”開涮，聽上去像段子，結果很多時候還真不是段子。

日本文部科學省自己給出的“教育DX”（DX，Digital Transformation，數字轉型）目標里，甚至把“原則上廢止學校之間通過傳真機往來和蓋章”單獨列成了KPI；而且這個目標之所以要專門寫出來，恰恰是因為現實里它遠遠沒有完成。

說白了，如果一個國家的教育系統到了2024年還要把“別再傳真、別再蓋章”寫成數字化改革目標，那它的問題顯然不是某個軟件沒裝好那么簡單了。

更尷尬的是，日本自己其實也不是沒意識到問題。

無論是成立數字廳，還是高調對軟盤、傳真“宣戰”，都說明日本政府很清楚自己在數字化這件事上慢了半拍。

可問題在于，知道歸知道，改起來卻總像在沼澤地里跑步：

一邊是官僚系統的慣性，一邊是紙質文件、印章文化、老舊流程的路徑依賴，再疊上高齡化和IT人才短缺，最后就變成了一個很別扭的局面：

大家都知道該變，但誰都沒辦法一下子把舊時代連根拔掉。

就連日本自己的政策討論里，也長期把數字人才不足當成結構性問題來看；經產省更早前的測算里，到2030年日本IT人才缺口最高可接近45萬人。

但程序員不夠，怎么辦？

從官方和產業界的表態來看，他們顯然也在把生成式AI當成另一條捷徑：既然程序員不夠，那就盡量讓更多懂業務的人，直接通過自然語言下指令，把需求更快變成代碼、文檔和系統。

所以，Rakuten AI 3.0這件事，理應是整個2026，日本AI圈的一個里程碑式事件。

因為它更像是日本IT困境的一次濃縮展示：政府給資源，企業拿補貼，嘴上喊著“日本最強”“本土自研”，結果掀開蓋子一看，底下還是DeepSeek V3。

這當然不說明日本公司不會做AI，也不說明日本沒有技術實力。

但卻反映了，那個曾經靠電子消費品、半導體、工業產品征服世界的日本，在今天這場由軟件、數據、云和大模型主導的新技術競賽里，已經很難再靠自己完整定義游戲規則了。

連最想證明“日本也有自己的旗艦大模型”的關鍵時刻，最后都得站在中國開源模型的肩膀上，這才是整件事最扎心的地方。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

VLMgineer讓大模型自己「發明工具」，從設計到使用全自動

機器之心Pro 2026-03-20 14:15:17
0 跟貼 0
國產AI高考708分，這款模型靠什么成為「屏蔽生」？

機器之心Pro 2026-06-26 14:56:46
0 跟貼 0

大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0

SemiAnalysis：美國電網容量2027年或轉負，AI數據中心被迫走向"自備電源"時代

華爾街見聞官方 2026-06-27 00:20:04
0 跟貼 0
福州話與日語為啥如此相近？

人類文明之光 2026-06-26 04:19:39
120 跟貼 120

140萬印軍真能一周踏平中國？

秋別離 2026-06-25 02:27:53
4 跟貼 4

日語對漢語的影響有多大？

人類文明之光 2026-06-26 04:17:27
86 跟貼 86
韓國女生，媽媽第一次到中國旅行，來杭州體驗當茶農的一天？

澀會小阿敏 2026-06-25 03:24:59
0 跟貼 0

不會說日語就“滾回去”？

東京在線 2026-06-23 18:15:41
21 跟貼 21
日本終于察覺到局勢不對勁

一飲山河 2026-06-24 16:32:34
0 跟貼 0
誰會造中國第一艘核航母？一份公告，撕開大連與江南的迷霧

雅兒姐在遛彎 2026-06-27 02:11:01
0 跟貼 0
恭喜乒壇名將33歲嫁給韓國工作的中國教練

各生歡喜者 2026-06-27 01:11:06
1 跟貼 1
大事不妙，日本這個舉動等于和大鵝宣戰了！

秋別離 2026-06-27 02:03:19
0 跟貼 0
中國最繁華的十個大都市

雪蓮073 2026-06-26 08:39:09
1 跟貼 1
OpenAI又動了數億人的默認模型：沒更聰明，卻更黏你

新智元 2026-06-27 06:03:26
0 跟貼 0
西方軍事專家曾言：“只有盧旺達心里清楚，中國才最強超級大國”

陌上桃花開的 2026-06-26 09:30:16
0 跟貼 0
DeepSeek 告別小而美：500億融資到手后，先招一倍的人

鈦媒體APP 2026-06-26 11:30:22
1 跟貼 1
中國最強火炮震撼亮相！PLZ-05：國產重炮王！中國陸軍

愛歌唱的叮當貓 2026-06-25 13:16:33
12 跟貼 12
美日扎堆軍演挑釁，央視亮出東風17

相思賦予誰a 2026-06-26 13:26:08
0 跟貼 0
中國立場堅定不退讓，相關談判已正式終止！

陽光小筑Sunny 2026-06-27 01:26:22
0 跟貼 0
一場5-0，讓韓國徹底崩潰！更不能接受的是，亞洲全幫倒忙連送5

越嶺尋蹤 2026-06-27 05:36:24
1 跟貼 1
德國輸球，竟完成對韓國的“間接復仇”

瀟湘晨報 2026-06-26 10:27:25
7004 跟貼 7004
頂級推理這一塊，過程全錯答案全對

墨水影視 2026-06-25 08:25:47
1 跟貼 1
員工將擴編一倍！DeepSeek急招：所有部門都要

新浪財經 2026-06-26 09:45:51
1 跟貼 1
俄方警告無果，日本卷入俄烏沖突，中方硬氣表態：必須堅決反對！

把喜歡都給他 2026-06-27 05:00:39
0 跟貼 0
偷運稀土被逮個正著！日本技術員大連栽跟頭，被中方當場依法拘留

仙味少女心 2026-06-27 05:15:28
0 跟貼 0
感覺男朋友的日語不是好道學的

反套路小劇場 2026-06-24 01:02:34
0 跟貼 0
外網看中國滯空導彈越南網友：中國，美國，其他國家都沒這個實力

強哥說數碼 2026-06-26 13:34:12
0 跟貼 0
中國罕見譴責烏克蘭！已嚴肅表態，澤連斯基別把中國真惹毛了！

悅心知足 2026-06-27 05:22:17
0 跟貼 0
賽場上的一跪，是遺憾還是不甘？日本選手賽后情緒失控！

溫哥華保潔張姐 2026-06-27 00:34:41
0 跟貼 0
四大AI預測佛得角vs沙特：豆包和Deepseek結果截然不同

懂球帝 2026-06-26 17:20:57
44 跟貼 44
委內瑞拉震后24小時：美軍艦船馳援災區，中國就地開展搶險救援

李健政觀察 2026-06-27 05:30:44
0 跟貼 0
四大AI預測埃及vs伊朗：千問Deepseek支持埃及，豆包猜平局

懂球帝 2026-06-26 17:20:57
1 跟貼 1
價格大漲！有網友曬單：去年不到7000，今年12000了

南方都市報 2026-06-26 09:53:31
2744 跟貼 2744
河北高速集團京雄分公司成功研發“大模型”一體機科技創新成果轉化再加速

金臺資訊 2026-06-26 20:57:10
0 跟貼 0
中泰證券王芳：大模型的快速發展和供應鏈短缺有利于AI行業高資本開支的持續

財聯社 2026-06-26 17:40:25
0 跟貼 0
鄔敏煒：服務500余萬銀發客戶上海銀行用自然語言交互填平數字鴻溝

財聯社 2026-06-26 06:55:00
0 跟貼 0
美澳菲南海再聯演，日本首次正式加入藏著什么信號？

老表是個手藝人 2026-06-27 05:34:37
0 跟貼 0
日本花10億美元仿制F-16，美國卻扣下最關鍵的代碼

多多愛探索 2026-06-27 01:39:51
0 跟貼 0
當你的系統沒壞，但業務已經在表格和聊天里流浪了

報錯免疫體 2026-06-27 01:14:35
0 跟貼 0

藍字計劃

記錄智能時代的每一次浪潮！前沿科技捕手，AI產品深度洞察。

274文章數 3887關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

房產

手機

健康

時尚

手機 / 數碼

房產 / 家居

“日本最強AI”光速塌房，都怪中國DeepSeek太強？

拿了500億的梁文鋒，只挖地基，不信銷售

世界杯：塞內加爾5-0十人伊拉克 蓋伊世界波雙響

世界杯：塞內加爾5-0十人伊拉克 蓋伊世界波雙響

我在世界杯的每次奔跑，都為了證明你沒看錯

玥兒不回北京，馬筱梅解釋后媽身份

"索具龍頭"領大額罰單

11.99萬起 捷途自由者7 PLUS/山海T1四驅版上市

態度原創

“人永遠不知道自己的天賦技能點被隨機點到哪了”

全國高考大放水，300分就能上本科！論上岸率，海南沒輸過！

榮耀X80 Pro Max正式開售，更多大電池新機在路上

“無糖湯圓”是否隱藏著健康陷阱？

殯葬專業，我可以干一輩子

世界杯：塞內加爾5-0十人伊拉克蓋伊世界波雙響

世界杯：塞內加爾5-0十人伊拉克蓋伊世界波雙響

11.99萬起捷途自由者7 PLUS/山海T1四驅版上市