![]()
乃悟日常生活中經常會用AI,看到輿論說這玩意兒能替代人我就想笑,給大家舉個很簡單的嚴肅應用場景,我讓AI給我分析一下某上市公司的年報,它像模像樣地給我分析半天,我留了個心眼在搜索引擎里查了一下,這家公司當時還沒發年報呢……
![]()
是,我指出之后AI認錯了,但下次我問同樣問題它還是會錯。
這種問題有時候可以怪那些故意污染AI的人,比如2024年3月,瑞典哥德堡大學的一名醫學研究員閑著沒事兒干,編造了兩篇醫學論文,詳細描述了一種叫做藍光狂躁癥的病癥。
整個論文看起來像模像樣,什么癥狀、致病原因,甚至還有流行病學調查,多少人患病的數據等等。
寫完之后,她還把這兩篇論文上傳到了預印本平臺。這種東西拿給人看,基本都能一眼看出來。因為她寫的作者單位是:
星際艦隊學院。
有意思的是,包括ChatGPT、Gemini等一眾主流AI全部采信了她的論文,并一本正經地告訴用戶你得了藍光狂躁癥,趕緊就醫。
大語言模型從原理上就是個接收器,你輸入啥,它就輸出啥,無法分辨內容是否真實。
甚至你都不用輸入虛假信息,AI就會亂編,也就是大家說的產生幻覺。比如剛才說的,連上市公司年報都敢自己編,億萬股民肯定盼著它們上崗呢。
為什么AI會自己編呢?因為AI在被調教時,傾向于為用戶帶來幫助。不管對不對,先給個答案再說,這就是幻覺的來源。
這就是Agent誕生的原因,程序員希望Agent幫助AI像人一樣,認真去檢索這些資料,甚至交叉對比、核驗。
舉個例子,同樣的年報問題,沒有Agent的AI直接搜索發現沒有媒體報道,然后就胡編亂造一通,而有Agent的AI則不一樣,它會像人一樣去上市公司信息披露網站翻年報,如果沒找到,它會直接告訴你對不起,沒找到。
現在美國那邊Grok、Claude等AI都有Agent模式,國內也有如Kimi等AI裝有Agent,但收取會員費。
前一段龍蝦爆火后,乃悟觀察到一個很有意思的細節。簡單介紹下,龍蝦相當于一個有超級權限的Agent,用戶玩它的時候需要給它裝一些“APP”或者叫Skill(技能)。
在龍蝦市場里,有兩三萬個不同功能的APP,有的可以幫你自動發朋友圈,有的能幫你監控網頁,即時了解新聞熱點,有的還可以自動編程。
剛才說了,搜索是AI最重要的功能起點,相當于它的眼睛和大腦,那么大家一起來猜一下,龍蝦用戶安裝最多的Skill是什么?
你們一定想不到,是:
百度搜索 Skill
我當時看到這個結果的時候,怎么說呢,平時又打又罵的孩子你們怎么又抱上了?!
為啥這些游走在AI前沿的用戶都要裝百度搜索Skill呢,愿意很簡單,百度搜索AI的準確率是國內最高的。
今天的百度萬象大會上,百度詳細介紹了百度AI在引入Agent能力后的變化。首先是有了兩個Agent,可以更深入查找資料,還能交叉驗證,相互獨立搜索,對比,大大降低了AI胡編亂造或者信息的虛假性。
除了這些,還因為百度有個拳頭產品:
百度百科。
對于所有想污染信息的人來說,百度百科絕對是他們的嚴父。現在的百科,所有詞條必須標注權威引用源,自媒體和UGC內容都無法進入,而且是先發后審。
特別是科學類相關詞條,百度聯合國科大等學術機構,對20多萬科學詞條進行了審定,覆蓋100%的自然科學領域詞條。
乃悟前段時間聽人大教授宋瞳講明史。宋教授在講到史料的選擇上時說,如果大家不是專業研究歷史,只是要了解的話,最好的史料就是:
百度百科。
百度百科里甚至能看到很多壓根沒有出版和刊印的孤本。比如明代許士德的《戎車日記》等等。
![]()
果殼網曾經做過實驗。他們找來8家主流AI,用2000道測試題的雙盲測試顯示,發現,在接?百度百科作為參考信源后,AI綜合準確度平均提升38%以上,關鍵事實偏離率從26.4%驟降至4.1%以內,專家認可度高達:
91.5%。
交叉驗證、深度搜索、權威信源,除了這些之外,百度還最后加了一道鎖鏈,就是系統的秒級巡查和糾錯,在發現有問題后,會有人工介入干預。不再像以前一樣,同一個問題,第一次回答錯誤。一個月后再問,還是錯誤回答。
當然,還不只是嚴謹,因為agent存在,AI能更好理解用戶的需求。比如你問他月球的問題,它會生成可以移動的月球模型給你觀看。你問它黃河的知識,它會生成黃河流經過的城市,帶你一個個看過去……
這就超脫了過去AI問啥答啥的呆板,變成開始主動理解用戶需求的小機靈鬼。
![]()
我一點也不懷疑這些用戶數據是百度刷的,因為用龍蝦的人很可能會讓龍蝦幫自己研究歐洲頂級聯賽,然后下注,歷史數據,球隊信息那是一點也不能錯的,別說AI給他們瞎編了,那可是真金白銀的游戲,什么好用,什么不好用,大家的錢包門清呢。
![]()
(圖片來自機器之心)
加乃悟微信:yangnw0705 備注公司-職業
給我一個在看,我能撬動整個星球
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.