亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大模型的有腦和無腦

0
分享至



2022年底,ChatGPT橫空出世。

那段時(shí)間,全世界都在討論它。寫詩、寫代碼、做數(shù)學(xué)題、分析財(cái)報(bào)、辯論哲學(xué)——它什么都能接住,什么都能聊出個(gè)所以然。推理能力、語義理解、邏輯分析,讓人驚掉下巴。

人們說:大模型有腦。太有腦了。

這個(gè)判斷沒錯(cuò)。大模型確實(shí)有腦。它是一個(gè)智商極高、知識極廣、反應(yīng)極快的存在。你給它一個(gè)問題,它給你一個(gè)答案。你給它一個(gè)難題,它給你一個(gè)思路。你給它一個(gè)模糊的描述,它能猜出你想說什么。

這是大模型的“有腦”一面。

但大模型還有"無腦"另一面,不是罵它。是客觀描述。

一、有腦:推理與語義

大模型的有腦,體現(xiàn)在兩個(gè)核心能力上。

第一,推理能力。

你給它一個(gè)邏輯題,它能一步一步推出來。你給它一個(gè)因果關(guān)系不明確的問題,它能幫你拆解出可能的路徑。你給它一個(gè)A和B的矛盾,它能找出矛盾點(diǎn)在哪里。

這不是背答案。它沒見過你的問題,但它能推。這是真正的推理能力。雖然這個(gè)推理和人腦的推理機(jī)制不同,但效果上,它確實(shí)能完成從前提推導(dǎo)出結(jié)論的過程。

第二,語義理解。

你說“預(yù)算有點(diǎn)緊”,另一人說“資源不太夠”,大模型知道你們在說同一件事。它不認(rèn)字面,認(rèn)意思。它能把不同的話、不同的詞、不同的表達(dá)方式,歸結(jié)到同一個(gè)語義空間里。

這是大模型最核心的能力。它不是關(guān)鍵詞匹配,而是真正的“理解”——雖然這個(gè)理解和人的理解不一樣,但它能跨過詞語的表象,捕捉到你真正想說的東西。

這兩樣加在一起,構(gòu)成了大模型的“有腦”。它像一個(gè)通才型的天才,什么都能聊,什么都能接,什么都能給你一個(gè)像模像樣的回答。

二、無腦:無狀態(tài)與無記憶

但有腦的另一面,是無腦。

大模型有推理能力,但它沒有目標(biāo)。你讓它推什么它就推什么,它不會(huì)自己說“我覺得你應(yīng)該先推這個(gè)”。

大模型有語義理解,但它沒有身份。它不知道“我是誰”,不知道“我在和誰說話”,不知道“我們之前聊過什么”。每一次對話,對它來說都是第一次。

大模型有海量知識,但它沒有記憶。不是“記性不好”,是根本沒有“記憶”這個(gè)概念。你關(guān)掉對話框,它就忘了。你說了什么、你關(guān)心什么、你是什么樣的人——這些信息在對話結(jié)束的那一刻,就消失了。

更準(zhǔn)確地說,大模型是一個(gè)“無狀態(tài)函數(shù)”。

你可以想象一下:森林里有一只猴子。你叫它一聲,它跳過來,按照你的指令做了一件事,然后跳走了。下一個(gè)叫它的人,它不認(rèn)識,它按照新的指令做新的事。它不記得上一只猴子跟它說了什么,也不關(guān)心下一只猴子是誰。

大模型就是這只猴子。它跳過來、跳過去,響應(yīng)每一個(gè)調(diào)用者的每一個(gè)請求。響應(yīng)完了,飄走,下一個(gè)調(diào)用來了,再跳過去。

這就是大模型的“無腦”一面。你說它有腦,對。你說它無腦,也對。它是同一個(gè)東西的兩面。這個(gè)“有腦又無腦”的特征,是大模型最根本的特征。理解了這一點(diǎn),就理解了所有AI產(chǎn)品的底層邏輯。

三、微調(diào):給大模型裝“專業(yè)腦”

有人會(huì)問:那微調(diào)呢?微調(diào)之后的大模型,是不是就不一樣了?

是的。微調(diào)是另一條路。

微調(diào)是什么?是用特定領(lǐng)域的數(shù)據(jù),對預(yù)訓(xùn)練的大模型做進(jìn)一步訓(xùn)練。比如,用海量的醫(yī)療數(shù)據(jù)微調(diào),大模型就變成了“醫(yī)療大模型”;用法律數(shù)據(jù)微調(diào),它就變成了“法律大模型”。

微調(diào)改變的是大模型的“能力邊界”。微調(diào)之后的大模型,在特定領(lǐng)域的知識和能力會(huì)大幅提升。它知道醫(yī)療術(shù)語、診斷邏輯、治療方案;它知道法律條文、判例邏輯、訴訟流程。

從這個(gè)意義上說,微調(diào)讓大模型長出了“專業(yè)腦”。它不再是那個(gè)“什么都懂一點(diǎn)但不深”的通才,而是變成了一個(gè)在特定領(lǐng)域有深度的專家。

但微調(diào)解決的是“專業(yè)能力”問題,不是“記憶”問題。

微調(diào)之后的大模型,知道你的公司叫什么、你的產(chǎn)品是什么、你的行業(yè)有什么特點(diǎn)。但它仍然記不住昨天你跟它說了什么。它仍然是無狀態(tài)的,仍然每次對話都是從頭開始。

微調(diào)改的是模型的權(quán)重,不是模型的架構(gòu)。架構(gòu)決定了它是無狀態(tài)的,這個(gè)改不了。所以,微調(diào)和不微調(diào)的大模型,在“記憶”這個(gè)維度上沒有區(qū)別。它們都無腦——不是笨,是記不住。

四、長上下文:更大的工作內(nèi)存,但不是長記憶

2024年到2025年,大模型行業(yè)有一個(gè)重要進(jìn)展:上下文窗口的大幅擴(kuò)展。從最初的幾千年,到幾萬、幾十萬,甚至百萬級別。你可以一次性把一本書、一份年報(bào)、一個(gè)完整項(xiàng)目的所有文檔都塞進(jìn)去。

這解決了一個(gè)真實(shí)的問題:單次對話內(nèi)的連貫性。2023年的大模型,聊長了會(huì)忘記前面說了什么,因?yàn)樯舷挛拇翱谔 ,F(xiàn)在這個(gè)問題基本解決了。但長上下文解決的是“這次對話能裝多少東西”,不是“下次對話還記得你”。你把一個(gè)項(xiàng)目的全部資料塞進(jìn)上下文,大模型在這次對話中可以基于這些資料回答問題。但對話結(jié)束,關(guān)掉頁面,下次再來,這些資料就沒有了。你得重新塞一遍。

長上下文是“更大的工作內(nèi)存”,不是“長期存儲(chǔ)”。它讓一次對話能處理更多信息,但它不解決“跨對話的記憶”問題。你上個(gè)月跟它聊過什么,它不記得。你半年前做過什么決定,它不知道。你的管理風(fēng)格、你的戰(zhàn)略底線——這些東西,長上下文幫不了你。

所以,長上下文解決的是單次對話內(nèi)的連貫性,這個(gè)很重要。但它和跨對話的記憶是兩回事——前者讓一次聊天不跑偏,后者讓每次聊天都認(rèn)得你。兩者都需要,但解決的是不同的問題。

五、記憶系統(tǒng):讓大模型從“無腦”變“持續(xù)有腦”

那怎么解決“記不住”的問題?

答案不在大模型本身,在大模型外面。

行業(yè)里有一個(gè)基本共識:大模型本身不做長期記憶。記憶要放在外面。什么叫放在外面?就是在調(diào)用大模型的時(shí)候,把歷史對話、用戶信息、上下文狀態(tài),一起打包塞給大模型。大模型看到這些信息,就知道“哦,之前聊過這些”,然后基于這些信息做推理。

這不是大模型在記憶,是外部系統(tǒng)在記憶,然后喂給大模型。

這套外部系統(tǒng),一般被稱為“記憶系統(tǒng)”或“記憶層”。它要做什么?

第一,記住用戶是誰。

每一次用戶進(jìn)來,系統(tǒng)要知道他的身份、他的歷史、他的偏好。這不是一句“你好,xxx”就完了,而是要能夠把用戶的所有歷史數(shù)據(jù)——對話、決策、結(jié)論——關(guān)聯(lián)到同一個(gè)身份下。這叫用戶體系。沒有這個(gè),所有的記憶都是散的。

第二,記住用戶說了什么。

不是記流水賬。如果只是把每一句話原封不動(dòng)存下來,那叫日志,不叫記憶。真正的記憶,是要提取出用戶的思維軌跡——他是怎么分析問題的,他傾向于哪種解決方案,他在什么情況下會(huì)猶豫。這叫語義記憶。它需要把對話內(nèi)容轉(zhuǎn)化為可檢索、可理解、可推理的結(jié)構(gòu)化信息。

第三,記住時(shí)間線。

管理不是單點(diǎn)決策,是連續(xù)選擇。你今天做的決定,是基于三個(gè)月前的判斷。你現(xiàn)在的糾結(jié),可能半年前就有過苗頭。一個(gè)好的記憶系統(tǒng),要把用戶的每一次決策都放在時(shí)間軸上看。你什么時(shí)候啟動(dòng)了一個(gè)項(xiàng)目,中間在哪拐了彎,什么節(jié)點(diǎn)做出了關(guān)鍵判斷——這些要串起來。這叫時(shí)間記憶。

第四,記住用戶的“底色”。

這是最深的一層。經(jīng)過長期的使用,記憶系統(tǒng)要能慢慢“長”出一個(gè)東西——用戶的行為模式、決策偏好、風(fēng)險(xiǎn)容忍度、戰(zhàn)略底線。這些東西不是用戶說一遍就能記住的,需要長期的使用、不斷的校準(zhǔn)。而且,用戶自己可能都說不清楚自己的“底色”,需要通過行為來反推。這叫戰(zhàn)略記憶。

有了這四層記憶,大模型就不再是“無腦”的了。因?yàn)樗看伪徽{(diào)用時(shí),外部系統(tǒng)會(huì)把所有相關(guān)的記憶都喂給它。它看到的不只是用戶當(dāng)前的問題,還有用戶的歷史、用戶的身份、用戶的底色。

它給出的回答,就不再是通用的、泛泛而談的,而是針對這個(gè)人、這個(gè)場景、這個(gè)階段的具體情況。這就是“持續(xù)有腦”——不是大模型自己有腦,是外部記憶系統(tǒng)讓它看起來有腦,而且是有針對性的腦。

六、對管理者特別重要

講到這里,你可能會(huì)問:這套東西,對普通人也適用啊,為什么特別提管理者?因?yàn)楣芾碚叩墓ぷ鳎袔讉€(gè)特點(diǎn),對記憶的要求特別高。這是CerebrateX作為AI管理專家,成為領(lǐng)導(dǎo)力神器必須回答的。

第一,長周期。

一個(gè)戰(zhàn)略決策的影響,可能持續(xù)一年、三年、五年。一個(gè)項(xiàng)目的生命周期,可能跨越多個(gè)季度。管理者在這么長的時(shí)間跨度里,很容易忘記當(dāng)初為什么那么定、中間經(jīng)歷了什么調(diào)整、自己當(dāng)時(shí)是怎么判斷的。

記憶系統(tǒng)可以把這些全部串起來。當(dāng)你迷失在復(fù)雜的推演中,它可以告訴你:你當(dāng)初的出發(fā)點(diǎn)是什么,你是從哪一步開始偏離的。當(dāng)你做一個(gè)新決策時(shí),它可以告訴你:你三個(gè)月前做過一個(gè)類似的判斷,當(dāng)時(shí)的邏輯是什么,結(jié)果怎么樣。

第二,高密度。

管理者每天要處理大量信息。市場數(shù)據(jù)、團(tuán)隊(duì)反饋、客戶需求、競爭對手動(dòng)向——這些東西交織在一起,很容易讓人信息過載。人腦的短期記憶容量是有限的,塞多了就會(huì)漏。

記憶系統(tǒng)可以幫你記住那些“不需要時(shí)刻在腦子里但需要時(shí)能調(diào)出來”的信息。你不用費(fèi)力去記,你只需要知道,需要的時(shí)候它能給你。

第三,一致性要求高。

管理者的最大敵人之一,是前后矛盾。今天說A,明天說B,團(tuán)隊(duì)會(huì)混亂。但管理者也是人,會(huì)有情緒波動(dòng)、會(huì)有短期壓力、會(huì)有信息盲區(qū)。在這些情況下,很容易做出與自己一貫原則相悖的決定。

記憶系統(tǒng)可以在這里扮演“校準(zhǔn)器”的角色。當(dāng)你要做一個(gè)與自己過往邏輯不一致的決定時(shí),它會(huì)提醒你:你之前不是這么想的,現(xiàn)在變了嗎?如果變了,是因?yàn)槭裁矗咳绻麤]變,你為什么又要這么做?

這就是為什么“記憶”對管理者來說,不只是“方便”,而是“必要”。沒有記憶,就很難保持一致性。而一致性,是領(lǐng)導(dǎo)力的根基之一。

七、最后

大模型有腦。這一點(diǎn),所有人都知道。

大模型無腦。這一點(diǎn),很多人沒有意識到。

微調(diào)給它裝了專業(yè)腦,長上下文給它擴(kuò)大了工作內(nèi)存。但這兩樣,都沒有解決那個(gè)根本問題:它記不住你。長上下文讓一次對話不跑偏,但跨對話的記憶,是另一回事。

真正讓大模型從“無腦”變“持續(xù)有腦”的,是外面那套記憶系統(tǒng)。用戶體系、語義記憶、時(shí)間記憶、戰(zhàn)略記憶——四層疊加,才能讓大模型在每一次對話中都知道你是誰、記得你說過什么、理解你的底色、校準(zhǔn)你的判斷。

這件事,技術(shù)上很難。它需要從底層架構(gòu)開始設(shè)計(jì),需要大量的研發(fā)投入,需要長期的迭代打磨。不是接個(gè)API、套個(gè)殼就能搞定的。

我們團(tuán)隊(duì)在做這件事,產(chǎn)品名叫CerebrateX,因?yàn)樯鲜隹剂坎拍軌蜃龅降恼嬲俺掷m(xù)有腦”,從而把這個(gè)戰(zhàn)略定位變成現(xiàn)實(shí):領(lǐng)導(dǎo)力神器:AI管理專家CerebrateX。同時(shí),也幫助您真正理解了,AI產(chǎn)品的護(hù)城河,不在大模型(因?yàn)榇竽P涂梢噪S需切換,沒有忠誠),而在記憶。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
王嘉爾在多倫多開演唱會(huì),發(fā)現(xiàn)觀眾席揮舞中國國旗,立即伸手接過跑回舞臺(tái)高舉,全場歡呼沸騰

王嘉爾在多倫多開演唱會(huì),發(fā)現(xiàn)觀眾席揮舞中國國旗,立即伸手接過跑回舞臺(tái)高舉,全場歡呼沸騰

觀威海
2026-04-16 10:20:05
年輕人為什么寧愿跑單也不進(jìn)廠?廣州藍(lán)寶書數(shù)據(jù)很刺眼:送外賣15萬,工人才6萬

年輕人為什么寧愿跑單也不進(jìn)廠?廣州藍(lán)寶書數(shù)據(jù)很刺眼:送外賣15萬,工人才6萬

風(fēng)向觀察
2026-04-17 16:36:41
國際油價(jià)暴跌

國際油價(jià)暴跌

閃電新聞
2026-04-18 00:28:01
炸裂,19歲男子在KTV遭三名女子輪流侵犯,導(dǎo)致下體永久性創(chuàng)傷!

炸裂,19歲男子在KTV遭三名女子輪流侵犯,導(dǎo)致下體永久性創(chuàng)傷!

黯泉
2026-04-17 14:19:02
太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

橙星文娛
2026-04-17 13:19:56
被嘲笑了4年的俄羅斯突然發(fā)現(xiàn),美軍只打了1個(gè)月,就比它還拉胯

被嘲笑了4年的俄羅斯突然發(fā)現(xiàn),美軍只打了1個(gè)月,就比它還拉胯

阿器談史
2026-04-16 15:16:19
這條吃相難看的新聞,每一行都寫滿了諷刺

這條吃相難看的新聞,每一行都寫滿了諷刺

胖胖說他不胖
2026-04-17 09:30:26
極大反差:中國人暴跌55%,日本外國游客又創(chuàng)新高,俄羅斯人增26%

極大反差:中國人暴跌55%,日本外國游客又創(chuàng)新高,俄羅斯人增26%

壹只灰鴿子
2026-04-15 22:41:48
中國駐英國使館發(fā)言人就英媒稱伊朗部署中國衛(wèi)星監(jiān)視美國駐中東基地事答記者問

中國駐英國使館發(fā)言人就英媒稱伊朗部署中國衛(wèi)星監(jiān)視美國駐中東基地事答記者問

界面新聞
2026-04-17 07:13:08
爺爺生前錄音贈(zèng)孫女109萬元遺產(chǎn),六個(gè)姑姑不服要求平分,法院:錄音無效,重新分配,患小兒麻痹癥姑姑拿大頭

爺爺生前錄音贈(zèng)孫女109萬元遺產(chǎn),六個(gè)姑姑不服要求平分,法院:錄音無效,重新分配,患小兒麻痹癥姑姑拿大頭

魯中晨報(bào)
2026-04-17 17:00:03
恒大集團(tuán)許家印牽連的7個(gè)女人

恒大集團(tuán)許家印牽連的7個(gè)女人

地產(chǎn)微資訊
2026-04-17 14:12:40
以色列發(fā)動(dòng)大規(guī)模空襲

以色列發(fā)動(dòng)大規(guī)模空襲

中國經(jīng)濟(jì)網(wǎng)
2026-04-17 17:46:03
中方全面斷供開始,高市真慌了,岸田文雄重新出山,30國代表赴日

中方全面斷供開始,高市真慌了,岸田文雄重新出山,30國代表赴日

影孖看世界
2026-04-17 16:48:54
特朗普:美國將獲得伊朗所有核“塵埃”

特朗普:美國將獲得伊朗所有核“塵埃”

界面新聞
2026-04-17 22:16:29
零食包裝上寫著“勿忘國恥是每個(gè)中國人的出廠設(shè)置”,廠家回應(yīng):這是老板的情懷,希望傳達(dá)正能量

零食包裝上寫著“勿忘國恥是每個(gè)中國人的出廠設(shè)置”,廠家回應(yīng):這是老板的情懷,希望傳達(dá)正能量

極目新聞
2026-04-17 09:51:27
“見過最廉價(jià)的兜底”,一份山姆燒雞,讓低認(rèn)知母子淪為全網(wǎng)笑柄

“見過最廉價(jià)的兜底”,一份山姆燒雞,讓低認(rèn)知母子淪為全網(wǎng)笑柄

妍妍教育日記
2026-04-15 09:30:09
烏克蘭拆解俄軍導(dǎo)彈:確認(rèn)朝鮮制造,焊接技術(shù)落后50年仍在實(shí)戰(zhàn)

烏克蘭拆解俄軍導(dǎo)彈:確認(rèn)朝鮮制造,焊接技術(shù)落后50年仍在實(shí)戰(zhàn)

桂系007
2026-04-17 16:34:16
一條煙、一瓶酒,2026年5月起,連茶葉盒都得過紀(jì)檢這道關(guān)

一條煙、一瓶酒,2026年5月起,連茶葉盒都得過紀(jì)檢這道關(guān)

周哥一影視
2026-04-17 19:29:59
“媽,我可能出不去了……”菏澤00后小伙打電話給母親留完遺言,在火海濃煙中仗義救人!

“媽,我可能出不去了……”菏澤00后小伙打電話給母親留完遺言,在火海濃煙中仗義救人!

菏澤日報(bào)
2026-04-17 11:29:24
訪華結(jié)束,蘇林搭上回國火車,臨走前向中國借飛機(jī),越南打破慣例

訪華結(jié)束,蘇林搭上回國火車,臨走前向中國借飛機(jī),越南打破慣例

影孖看世界
2026-04-18 01:50:05
2026-04-18 04:04:49
沈素明
沈素明
AI科普作家,管理專家,領(lǐng)導(dǎo)力神器AI管理專家CerebrateX.com創(chuàng)始人。
375文章數(shù) 376關(guān)注度
往期回顧 全部

科技要聞

7家頭部平臺(tái)被罰沒35.97億元

頭條要聞

知情人:伊朗為霍爾木茲海峽通行設(shè)定三個(gè)條件

頭條要聞

知情人:伊朗為霍爾木茲海峽通行設(shè)定三個(gè)條件

體育要聞

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財(cái)經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

又快又穩(wěn)的開掛動(dòng)力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

本地
健康
時(shí)尚
公開課
軍事航空

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

今日熱點(diǎn):許光漢否認(rèn)和周子瑜戀情;郝熠然與誠實(shí)一口終止合作……

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美宣布黎以停火10天 以方稱不會(huì)撤軍

無障礙瀏覽 進(jìn)入關(guān)懷版