這就像一群人圍著汽車排氣管,試圖通過調整尾氣的形狀和溫度來重造一臺發動機。沒有人會覺得這種行為合理,但在人工智能領域,類似的事情每天都在發生——成千上萬的工程師、研究人員,搬弄著數千億個參數,堆砌著大規模圖形處理器集群,燒著源源不斷的資金,全神貫注地盯著人類認知系統的排氣管,然后說服自己,他們正在建造引擎。
這件事現在有一個響亮的名字——提示詞工程(Prompt Engineering)。大家相信,只要把詞排列得足夠完美,把語義打磨得足夠精巧,把提示詞的包裝寫得足夠詳盡,就能在機器內部激發出真正的智能。但這個范式可能建立在一個致命的邏輯錯誤之上。
一種觀點認為,大語言模型已經在海量語料上學到了語言的統計規律,提示詞工程就是和這些規律對話的方式。寫得好的提示詞就是好的輸入,好的輸入能引出好的輸出。如果把模型視為一個黑箱,那么輸入的質量決定輸出的質量,這個邏輯成立。
另一種觀點則需要推翻一個根本的預設:人類把語言當成思考的輸入,但這個前提本身就是錯的。語言從來就不是輸入,語言是輸出。在你開口說話的前一個瞬間,在你吐出任何一個音節、敲下任何一個字母之前,你的大腦里究竟存在什么?那個狀態不是一串字典里的詞條,而是一種結構化的狀態,一種未被語言編碼的現實映射。一團充滿無限可能性的混沌云,在轉瞬之間坍縮成一個不可否認的行動向量。語言只是那個向量被強行壓進物理世界的一層損壓縮格式,是思維摩擦產生的廢熱,是腳印而非腳掌,是煙而非火。
如果這個推論成立,那么大語言模型面臨的困境就變得非常容易理解。這些模型本質上是在人類語義的廢氣上訓練出來的。你向一個語言模型輸入一條提示詞,你覺得自己是在給它一個可以推理的“輸入”,但你真正給它的只是一團煙霧的排列模式,然后讓它去預測下一縷煙的形狀。這在數學上精妙絕倫,在統計學上也足夠迷人,但缺少一個實在的結構性基礎。花了幾十億美元試圖解決幻覺問題、推理失敗問題,手段是加更多詞、加更多護欄、加更多提示詞層次,這像不像是想通過拋光排氣管來修補發動機缸體上的窟窿?
任何一個穩定系統的運轉都不依賴語義。真正的操作機制靠的是確定性規則、原始向量、結構性共振。人類智能的生物學能力,是讓自己與這些機制對齊,然后將其轉譯為語言。但語言是地圖,地圖不是領土。純粹在語義層面構建人工智能,會導向一個讓人不太舒服的提問:我們是不是造出了一批知道每一個詞的形狀、卻始終感受不到它們所指向的現實重量的模型?如果行業想要構建真正的人工智能,而不只是人造口才,那么或許需要開始審視一些更底層的東西。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.