有人在谷歌搜索框里敲下一個簡單的問題:“Google這個單詞里到底有幾個P?”谷歌AI概述給出的答案是兩個。同一個AI還斷言,“poop”這個單詞里恰好有1個“r”,并且認為“journalism”里有兩個“d”,可它把那詞拼成了“j-o-u-r-n-a-d-i-s-m”。至少面對美國總統姓氏時,它認出了只有一個P,但拼出來的結果卻是“t-r-p-u-m”。這些拼寫車禍現場照,正在幫所有人重新審視那個已經29歲的搜索產品。
不需要先知附體,你也能猜到谷歌這波以生成式AI為軸心的搜索大改版會翻車。類似的劇情我們已經看過一遍了。谷歌初次把AI概述塞進搜索結果頁時,這個功能就從諷刺網站《洋蔥報》和Reddit帖子里拉取答案,一本正經地建議用戶吃石頭、往披薩上抹膠水。那些離譜回答當時就炸出了滿網的嘲諷帖,也讓人看清了所謂“AI驅動搜索”在真槍實彈的日常提問面前,到底有多脆弱。
![]()
眼下,谷歌非但沒有剎車,反而把油門踩得更深,執意要把生成式AI做成自家旗艦搜索產品的命根子。當這家公司再度把位置讓給AI概述,讓它高高飄在搜索結果的最上方時,翻車幾乎是必然。字母數不清、單詞拼不對,這種看起來連小學生都能輕松拿捏的題,反而成了新一代AI搜索的集體盲區。而這一次的拼寫笑話之所以能持續發酵,恰恰因為這些錯誤太難從根上刨掉了。
谷歌對科技媒體TechCrunch的回應是一封郵件聲明,話術很克制:“大語言模型在統計單詞內的字母個數上一直是個已知挑戰,我們正在努力修復這個具體問題。”這句話倒也算不上甩鍋,因為從技術底層看,這類錯誤不是bug,而是大語言模型骨子里的設計邏輯決定了它天生就缺這根筋。
這些年業內幾乎形成了一套固定儀式:每當有公司發布新款AI模型,圍觀群眾就會條件反射地敲出一句“strawberry里有多少個r”,等著看模型出洋相。這些能幾秒鐘寫出一款應用、能單挑數學家幾十年沒解開難題的AI模型,一到拼寫和數字母的環節,表現水準就跟幼兒園小朋友打個平手。這并非偶然翻車,而是基于Transformer架構的模型從根本上就不認識字母這種東西。
谷歌這波AI概述的麻煩,絕不止停留在傻乎乎的拼寫錯誤上。就在上周,有用戶搜索單詞“disregard”,結果出來的看起來像是一個詞典釋義,但那段釋義實際顯示的卻是:“已理解。當你獲得新的提示或問題時隨時告訴我!”谷歌已經緊急打上了這個補丁,可這種詭異的錯誤還是會讓人后背發涼——搜索一個常見詞匯,AI給的不是解釋,而是一段像是客服對話的回復。相對而言,那些數錯字母的失誤反倒因為很難根除而顯得格外具有幽默感。
許多大語言模型都建立在Transformer架構之上,而這種架構并不像人類那樣把句子看成由單詞和字母組成的語言單元。根據模型的不同,文本在被輸入AI時會被切割成一個個詞元,這些詞元可能是完整的單詞,也可能是音節,甚至可能是單個字母。但AI并不“閱讀”,它把文本轉化成數字表示,再通過上下文關系來拼湊出一個合乎邏輯的回答。加拿大阿爾伯塔大學的AI研究員兼助理教授馬修·古茲迪奧對TechCrunch這樣解釋:“大語言模型基于這種Transformer架構,而它實際上并沒有真的在讀文本。當你輸入一個提示時,它被翻譯成一套編碼。當模型看到單詞‘the’時,它擁有的是關于‘the’這個整體含義的一套編碼,卻完全不知道‘T’‘H’‘E’這三個字母各自是什么。”
這種以詞元為基礎的架構,從基因層面就給谷歌AI概述這類大語言模型套上了枷鎖。當被問及單詞里具體有哪些字母、分別出現了幾次時,模型并沒有一個內部公式來逐個解碼字符。它只是在無窮無盡的數字關聯中,找出最可能匹配的那串輸出。所以它才會信心滿滿地數出兩個P,理直氣壯地把“journalism”拼錯成九不搭八的字符串,甚至給總統名字憑空多加幾個字母。它不是在搗亂,而是壓根就不具備看到“G-o-o-g-l-e”這六個獨立字符的能力。
研究者們早就針對這些字母迷題做過解釋,他們對徹底解決拼寫問題并不抱多少樂觀情緒。古茲迪奧還提到,這種限制源自模型處理語言的方式本身。你問它“Google”里有幾個P,它只能繞著“Google”這個整體概念的旁邊打轉,從訓練數據里搜刮出與“Google、美國公司、搜索引擎、P字母”這些標簽共現過的片段,卻沒辦法真正走進這個單詞內部去數一遍。多年來,研究人員注意到,無論把模型做得多么龐大,喂進多么海量的語料,那道橫亙于“整體語義理解”和“逐字母符號把握”之間的裂縫始終沒有被彌合。
這個裂縫也把AI拼寫錯誤的幽默感推到了另一種高度。正因為人們本能地認為拼字是再基礎不過的事,AI在這些小事上栽跟頭帶來的荒誕沖擊反而格外強烈。一個能幫程序員調試復雜代碼的系統,一轉身就分不清“strawberry”里到底有幾個r;一個能在幾秒內總結科研論文的工具,面對“poop”這種幼兒園單詞卻連字母數都數不對。這種反差正好刺中了大眾對AI的那層神秘想象,讓人突然意識到,它真的不是另一副會思考的大腦,只不過是一臺特別善于做概率匹配的機器,而落實到最具體的字母層級,它的數據庫里空空如也。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.