无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

不聯(lián)網(wǎng)的AI,殺瘋了...

0
分享至

最近科技圈和資本市場(chǎng)同時(shí)被一個(gè)叫做chatjimmy.ai的新物種刷屏了,初次徹底震驚了我。

在沒(méi)有英偉達(dá)高性能AI芯片的加持,這家硅谷初創(chuàng)公司Taalas就讓旗下大模型跑出了每秒1.5萬(wàn)到1.7萬(wàn)個(gè)Token

這是什么概念?傳統(tǒng)的大模型每秒是跑一到兩千的Token,速度是它的1/10不到,

人話說(shuō)就是,你把一道極其復(fù)雜的數(shù)學(xué)題發(fā)過(guò)去,傳統(tǒng)的AI模型還擱那一個(gè)勁思考呢,而它下一秒就羅列了好幾種解法給你看:


這個(gè)升級(jí)幅度,就好比是從算盤(pán)升級(jí)到計(jì)算器, 又是一個(gè)跨越式的進(jìn)步。

那這個(gè)技術(shù)邏輯是怎么實(shí)現(xiàn)的呢?

最大的不同就是它把大模型的幾十億參數(shù)直接刻入硅片里面,

過(guò)去的芯片算力很強(qiáng),但大模型和芯片之間數(shù)據(jù)需要傳輸,所以要借助HBM(顯存)來(lái)搬運(yùn),甚至可以說(shuō)90%的電量和時(shí)間都浪費(fèi)在了路上,

好比一個(gè)天才面對(duì)一個(gè)復(fù)雜問(wèn)題,一秒鐘就給出了答案,但寄郵件卻耗費(fèi)了大量的時(shí)間。

而現(xiàn)在大模型就內(nèi)嵌在芯片自身,它直接拋棄了昂貴的HBM顯存,數(shù)據(jù)不需要搬運(yùn)了,因?yàn)椤坝?jì)算即存儲(chǔ),存儲(chǔ)即計(jì)算”,于是一下就節(jié)省出大量的資源。

這就和淘寶出來(lái)后,直接對(duì)接工廠發(fā)貨,省去了實(shí)體店、中間商、庫(kù)存一樣。

那問(wèn)題來(lái)了,如果要把大模型繪制在芯片上,模型豈不是被定死,那一旦老的模型失效要迭代,芯片豈不是就廢了?

這也是過(guò)去大家都不敢這么搞的原因,因?yàn)槟P偷炝耍覍iT繪制一個(gè)大模型芯片的成本也很高,動(dòng)輒上億美金。

但如今隨著Transformer語(yǔ)言的普及,大語(yǔ)言模型越來(lái)越成熟,那么這種商業(yè)路徑成了可能。

而這次Taalas就是做了一個(gè)全自動(dòng)的硅片編譯器,可以實(shí)現(xiàn)自動(dòng)給芯片電路編碼,從而大幅提高效率降低成本。

效率方面,Taalas宣稱把“大模型”轉(zhuǎn)化為“定制芯片”的周期,可以從過(guò)去的一年降低到兩個(gè)月。

成本方面,由于它拋棄了昂貴的HBM芯片,加上GPU用的普遍是H100芯片,如果換到大模型專用芯片上,只需要使用價(jià)格僅為1/20的6nm芯片就可以搞定運(yùn)算。

這種情況即便是出了新的更強(qiáng)大模型,它也可以直接報(bào)廢掉,換一個(gè)新的芯片就完事。

另外,估計(jì)有人也會(huì)好奇,這種綁定芯片的大模型,會(huì)不會(huì)因?yàn)闆](méi)法更新迭代,導(dǎo)致知識(shí)永遠(yuǎn)停留在出廠那一天?

實(shí)際上大模型刻入芯片,只是模型本身的迭代不能進(jìn)行了,就好比一個(gè)IQ180的人不能繼續(xù)進(jìn)化到IQ200,但它的邏輯推理能力,知識(shí)檢索能力依舊頂級(jí)。

而且刻入芯片之后,訪問(wèn)大模型雖然不需要聯(lián)網(wǎng)了,但它本身依然是具有聯(lián)網(wǎng)能力的,依然可以找到最新的信息去學(xué)習(xí),分析并且解決。

這就導(dǎo)致面對(duì)緊急突發(fā)狀況的時(shí)候,它的響應(yīng)速度遠(yuǎn)超過(guò)去的大模型,有更好的使用場(chǎng)景。

1、智能駕駛領(lǐng)域,當(dāng)汽車在馬路上突發(fā)緊急事件,有些復(fù)雜的問(wèn)題根本無(wú)法解決~

比如前面臨時(shí)修路了,原本的實(shí)線被磨掉了,交警拿著指揮棒示意你逆行繞過(guò)障礙物,傳統(tǒng)的自動(dòng)駕駛芯片擅長(zhǎng)的是快速識(shí)別圖像,但對(duì)這種需要快速邏輯推理的場(chǎng)景是無(wú)能無(wú)力的。

這種情況它根本等不起把數(shù)據(jù)打包傳給阿里云、亞馬遜等云端大模型來(lái)反饋結(jié)果,它需要的是和人類一樣,低于1毫秒的“本能邏輯推理反射”。

2、高頻量化領(lǐng)域,可以在宏觀對(duì)沖金融里開(kāi)“外掛”

在處理宏觀新聞、財(cái)報(bào)、非農(nóng)數(shù)據(jù)時(shí),美聯(lián)儲(chǔ)鮑威爾的講話文稿剛一發(fā)布,芯片就能以17000Token/秒的速度,在零點(diǎn)幾毫秒內(nèi)瞬間“吞下”幾萬(wàn)字的報(bào)告,立刻得出“鷹派/鴿派”的定性,并轉(zhuǎn)化為做多/做空大宗商品或股指期貨的信號(hào)。

3、軍工領(lǐng)域,這種無(wú)需聯(lián)網(wǎng)、固化在物理硬件里的高智商芯片,是武器系統(tǒng)唯一的最佳選擇。

哪怕是處在斷網(wǎng)的“信息孤島”,它還是能憑著出廠時(shí)被賦予的龐大參數(shù),獨(dú)立進(jìn)行極速的戰(zhàn)術(shù)分析和保密決策。

...................

當(dāng)然,我們也要關(guān)注這個(gè)背后長(zhǎng)遠(yuǎn)看一些潛在的利空,

最近一年,以三星、美光,SK海力士為首的三大HBM存儲(chǔ)巨頭股價(jià)狂飆,底層邏輯都靠一個(gè)支撐:“AI的盡頭是算力,算力的盡頭是HBM”。

如果chatjimmy.ai這種“無(wú)HBM化”的芯片普及,甚至形成燎原之勢(shì),對(duì)這三大巨頭絕對(duì)不僅僅是“有影響”,而是巨大的估值邏輯破壞。

另一方面,以前云計(jì)算借助AI推理全面收取過(guò)路費(fèi)的模式,也可能會(huì)被打上一個(gè)問(wèn)號(hào)。

畢竟如果人人的手機(jī)、汽車都有這種AI大模型芯片,絕大多數(shù)日常問(wèn)題在本地0.1秒就免費(fèi)解決了。

真正需要傳到云端、花錢去求ChatGPT或Gemini這種復(fù)雜模型來(lái)解答的流量,可能連20%都不到。

不過(guò)對(duì)于資金布局在這些方向的人來(lái)說(shuō),明白危機(jī)的同時(shí),也別太過(guò)于焦慮了。

因?yàn)槎唐趤?lái)說(shuō)它能寫(xiě)入的模型水平還是有限的,也就是目前僅限幾十億參數(shù)的初中生智商水平,距離真正頂級(jí),動(dòng)輒上百萬(wàn)億參數(shù)模型還為之尚遠(yuǎn)。

也就是它五到十年內(nèi)的使用場(chǎng)景更多還只是在一些特定的領(lǐng)域,尤其是對(duì)于一些對(duì)“斷網(wǎng)、低延遲、絕對(duì)隱私”有極端要求的垂直領(lǐng)域——比如我前面提到的智能駕駛、軍工系統(tǒng)、或者是金融量化高頻交易。

但拉長(zhǎng)來(lái)看,技術(shù)進(jìn)步的速度確實(shí)是難以估量的,誰(shuí)又知道哪天這些頂級(jí)模型寫(xiě)入芯片之后,每個(gè)人的設(shè)備終端都擁有了頂級(jí)離線AI,世界又會(huì)演變成什么夸張的模樣。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
劉青山和張子善一起貪污171.6億舊人民幣,放到現(xiàn)在能值多少錢

劉青山和張子善一起貪污171.6億舊人民幣,放到現(xiàn)在能值多少錢

歷史人文2
2026-06-26 07:00:03
員工因體味大被公司開(kāi)除,HR還發(fā)了個(gè)“流汗尬笑”的表情,當(dāng)事人委屈稱:我工作認(rèn)真業(yè)績(jī)好,馬上就轉(zhuǎn)正了

員工因體味大被公司開(kāi)除,HR還發(fā)了個(gè)“流汗尬笑”的表情,當(dāng)事人委屈稱:我工作認(rèn)真業(yè)績(jī)好,馬上就轉(zhuǎn)正了

大象新聞
2026-06-26 14:08:12
都說(shuō)這是場(chǎng)默契球,可挪威法國(guó)偏要刺刀見(jiàn)紅

都說(shuō)這是場(chǎng)默契球,可挪威法國(guó)偏要刺刀見(jiàn)紅

小皷拍客在北漂
2026-06-26 11:21:09
逆市走紅!“老登股”凈利預(yù)增超23倍,股價(jià)一度漲停

逆市走紅!“老登股”凈利預(yù)增超23倍,股價(jià)一度漲停

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-06-26 11:16:05
7月10日起,演員表要寫(xiě)真名了!成龍劉德華六小齡童全得括號(hào)備注

7月10日起,演員表要寫(xiě)真名了!成龍劉德華六小齡童全得括號(hào)備注

美美賺錢
2026-06-24 17:24:05
林志穎捂了12年的kimi,首次公開(kāi)正面照,網(wǎng)友:這臉,判若倆人……

林志穎捂了12年的kimi,首次公開(kāi)正面照,網(wǎng)友:這臉,判若倆人……

可讀
2026-06-25 23:21:52
新中國(guó)第一個(gè)被罷免的省長(zhǎng),出獄后下海經(jīng)商,晚年過(guò)得如何?

新中國(guó)第一個(gè)被罷免的省長(zhǎng),出獄后下海經(jīng)商,晚年過(guò)得如何?

歷史圖鑒
2026-06-25 22:32:54
澳大利亞+日本出線!世界杯小組第3形勢(shì):剩5個(gè)名額,韓國(guó)下滑2位

澳大利亞+日本出線!世界杯小組第3形勢(shì):剩5個(gè)名額,韓國(guó)下滑2位

小火箭愛(ài)體育
2026-06-26 13:01:31
深圳最牛街道突然“涼了”?房東慌了

深圳最牛街道突然“涼了”?房東慌了

地產(chǎn)一品塘
2026-06-26 08:00:32
有意思!名記曝出倫納德續(xù)約條件:馬刺、猛龍二選一!

有意思!名記曝出倫納德續(xù)約條件:馬刺、猛龍二選一!

運(yùn)籌帷幄的籃球
2026-06-26 17:10:12
徹底翻車!鄭麗文公開(kāi)推翻訪陸表態(tài)

徹底翻車!鄭麗文公開(kāi)推翻訪陸表態(tài)

果媽聊娛樂(lè)
2026-06-26 07:27:51
避開(kāi)巴西卻遇“最強(qiáng)小組第二”,不敗荷蘭“惦記”點(diǎn)球大戰(zhàn)

避開(kāi)巴西卻遇“最強(qiáng)小組第二”,不敗荷蘭“惦記”點(diǎn)球大戰(zhàn)

澎湃新聞
2026-06-26 12:54:31
金價(jià),持續(xù)下跌!工行、建行公告:即將關(guān)閉,盡快賣出或平倉(cāng)

金價(jià),持續(xù)下跌!工行、建行公告:即將關(guān)閉,盡快賣出或平倉(cāng)

魯中晨報(bào)
2026-06-25 21:55:03
“多人將兩女子關(guān)鐵籠游街”?湖南汨羅:擺拍,策劃組織者何某被刑拘,龔某某等8人被行拘

“多人將兩女子關(guān)鐵籠游街”?湖南汨羅:擺拍,策劃組織者何某被刑拘,龔某某等8人被行拘

環(huán)球網(wǎng)資訊
2026-06-26 07:37:06
曾干涸了40多年的第二大內(nèi)流河,為何如今又有水了?

曾干涸了40多年的第二大內(nèi)流河,為何如今又有水了?

夢(mèng)在深巷aqa
2026-06-26 13:39:10
西方人突然發(fā)現(xiàn),中國(guó)人對(duì)兩次世界大戰(zhàn)理解,似乎與他們不一樣?

西方人突然發(fā)現(xiàn),中國(guó)人對(duì)兩次世界大戰(zhàn)理解,似乎與他們不一樣?

甜到你心坎
2026-06-26 03:13:42
51歲貝克漢姆臉頰突然飽滿,被指“微調(diào)”了,梅西疑似做得更多

51歲貝克漢姆臉頰突然飽滿,被指“微調(diào)”了,梅西疑似做得更多

譯言
2026-06-26 09:28:31
百萬(wàn)網(wǎng)紅黃一鳴賬號(hào)被封禁,作品全部清空,此前囂張網(wǎng)暴女素人

百萬(wàn)網(wǎng)紅黃一鳴賬號(hào)被封禁,作品全部清空,此前囂張網(wǎng)暴女素人

四斤
2026-06-25 10:08:29
辣眼睛!山東一業(yè)主在家沒(méi)穿衣褲,被鄰居偷拍張貼在電梯間公示

辣眼睛!山東一業(yè)主在家沒(méi)穿衣褲,被鄰居偷拍張貼在電梯間公示

火山詩(shī)話
2026-06-26 16:48:05
有哪一瞬間你對(duì)女朋友徹底失望?

有哪一瞬間你對(duì)女朋友徹底失望?

阿康四歲啦
2026-06-26 11:45:24
2026-06-26 17:19:00
思哲與創(chuàng)富 incentive-icons
思哲與創(chuàng)富
全網(wǎng)同名,N億基金主理人,簽約財(cái)經(jīng)作者,擅長(zhǎng)行業(yè)熱點(diǎn)、資產(chǎn)配置、基金投資;著《指數(shù)基金定投精進(jìn)指南》
612文章數(shù) 1275關(guān)注度
往期回顧 全部

科技要聞

美國(guó)政府要求OpenAI分批發(fā)布GPT-5.6

頭條要聞

朝鮮領(lǐng)導(dǎo)層重大調(diào)整:"反腐少將"被查 趙甬元被"召回"

頭條要聞

朝鮮領(lǐng)導(dǎo)層重大調(diào)整:"反腐少將"被查 趙甬元被"召回"

體育要聞

三球換里德:森林狼和黃蜂誰(shuí)更癲?!

娛樂(lè)要聞

劉嘉玲想放棄梁朝偉,沒(méi)有自理能力

財(cái)經(jīng)要聞

懸在科技頭上的達(dá)摩克利斯之劍

汽車要聞

老板們的新座駕!65萬(wàn)元起,尊界V800/V680開(kāi)啟預(yù)訂

態(tài)度原創(chuàng)

數(shù)碼
游戲
藝術(shù)
旅游
公開(kāi)課

數(shù)碼要聞

Rokid AR眼鏡亮相:驍龍至尊空間計(jì)算協(xié)處理器,空間+ AI雙攝

動(dòng)作肉鴿獨(dú)游《夢(mèng)之形》夏促開(kāi)啟限時(shí)史低折扣,手游版預(yù)約上線TapTap

藝術(shù)要聞

470米!重慶“第一高樓”夢(mèng)斷?上架拍賣!

旅游要聞

老一輩都聽(tīng)過(guò)的滇王故事,一座古廟串聯(lián)起整個(gè)消失的古滇王國(guó)!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版