无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

AI五下,不如百度一下

0
分享至





作者|西西弗柿

編輯|無心插柳柳橙汁


你們知道演員劉美含嘛,就是當年《巴啦啦小魔仙》里演黑魔仙嚴莉莉的那個。

因為她確實太漂亮了,很多人三觀跟著五官走,還衍生出一系列“可惡的美琪美雪”之類的梗。

最近,我刷到了她的一個日常分享視頻,劉美含在給一部古裝劇配音,臺詞里有個詞,叫「鑄幣坊」,她覺得這個「坊」字念什么有點拿不準。

正常流程,問問AI就好。不查不要緊,一查徹底把她整懵了。

她先開百度AI,fáng,二聲。

再開DeepSeek,fāng,一聲。

然后打開其他兩個AI,也都是一聲。

最后大家都沒轍了,她經紀人用新華詞典查了一遍,才終于確認,正確讀音就是fáng,二聲。

百度笑到了最后。

隨橙想呢,AI信口雌黃的當下,才知道“百度一下”老輩子的含金量。

年少不知百度好,錯把AI當成寶,過去,是我對度娘說話聲音太重了。



一場實驗

讓AI可信度的差距無所遁形


無獨有偶,也是最近,果殼網發了一篇調研文章,題目叫《左手幻覺,右手投毒,普通人憑什么相信AI?》

TA們做了一件事,找來8家主流AI產品,出了2000道測試題,做雙盲對比測試,測信源對準確度的影響。

核心發現是,當AI接入百度百科作為參考信源之后,綜合準確度平均提升了38%以上,關鍵事實偏離率從26.4%驟降到4.1%以內,專家認可度高達91.5%。



你想想這個數字,26.4%是什么概念,意思是在沒有錨定可信信源的情況下,大概四道題里就有一道的關鍵事實是偏的,要不含糊其辭,要不是信息過時,要不就是直接編的。

然后,接入百度百科之后,降到4.1%。

我看到這個結果的時候,腦子里第一反應是,這無意間回答了一個根本性的問題,AI的答案質量,到底取決于什么?

答案是,取決于它在生成之前,用了什么信源。

果殼的雙盲測試還發現了一些具體的案例,挺有代表性的。

涵蓋的場景包括醫療,藥物相互作用,華法林是怎么跟別的藥物相互作用的,這是高決策風險場景,答案不對可能真的出事。

包括航天,阿爾忒彌斯2號繞月軌道的具體數據,這是對時效性要求極高的信息,訓練截止日期之后發生的事,模型如果只憑記憶回答,大概率是空白或者錯誤。

包括時政,張雪摩托車奪冠,這是一條很具體的新聞,模型知不知道、知道得準不準,很見分曉。

這幾個類型加在一起,基本上把AI最容易出問題的場景覆蓋得差不多了,時效問題、專業知識問題、具體事實核查問題,都有。

接入百度百科之后,這幾類場景下的表現,用測評報告里的說法,是“回答準確性與全面性大幅提升”。

那么,百度到底給AI吃了什么,讓TA準確率直線up?底層架構是什么?憑什么同樣是訓AI,百度的答案比別人可信?



百度揭開了謎底


正好,最近百度在北京開了創作者大會,AI權威性,恰恰是這場大會的核心議題之一。

創作者大會上,百度搜索產品負責人做了一個演講,把整個技術架構擺出來講了一遍。



大部分對話式AI的工作邏輯是,你問一個問題,它調用大語言模型,模型根據訓練的時候學到的內容,生成一個回答。

問題就出在這里,模型訓練是有截止時間的,訓練數據本身也不一定都是對的,更別說GEO這種專門給AI下毒的黑產了,315晚會剛曝光過,幾十塊錢寫幾篇軟文,幾天之內就能讓某個虛假信息成為AI的標準答案,整條黑灰產業鏈,已經相當成熟了。

所以如果模型是直接從腦子里回憶出答案,那這個答案里有多少水分,你真的不知道。

百度的做法是,不讓模型直接回憶。

在AI API基礎接口之上,疊了兩層Agent。

第一層叫需求規劃Agent,先把你的問題拆解成更細的子需求,然后去抓多維度的權威信息,不是問一個問題就直接打包成答案,而是先把問題掰開揉碎,搞清楚你到底想問什么、需要哪幾個維度的信息。

第二層叫組織生成Agent,對不同信源進行篩選、校驗、總結,確認之后,再交付一個「完成式」答案。

什么叫「完成式」答案?就是不是草稿,是最終版。不是模型直接從腦子里輸出,而是先把素材都核對過一遍,再組織生成。

這個區別,可能乍一看不那么直覺,但想一想就明白了。就像你讓一個助理給你寫報告,一種做法是助理直接憑自己的記憶寫,另一種是助理先去查閱最新的權威資料,核對之后再寫。哪個更靠譜,不用說。

這是架構層的邏輯,但只有這一層還不夠。

在這套架構上面,百度還疊了三道過濾閘門。

第一道,來源準入。不是所有信息源都能進候選池,只有權威專業領域、時效性強的信源,才有資格被參考。自媒體、UGC內容,先審后發,機審加人工雙重把關,不是直接入庫的。

第二道,多信源交叉驗證。同一個結論,必須有多個可信來源同時支撐才會被采用。一個來源說的算不了數,得好幾個來源指向同一個結論,才行。

第三道,秒級巡檢兜底。有一套內部自動巡檢系統在實時監測,一旦內容有偏差,立刻人工介入,重新生產。

我自己看這三道閘門的時候,覺得第三道是最讓人有安全感的那個,因為它回答的是另一個問題。

前兩道回答的是「怎么保證答案一開始是對的」,第三道回答的是「萬一出了錯,有沒有人來管」。

大多數對話式AI,你現在去問,它大概率是沒有這個兜底的。出了錯就出了錯,等著下一輪訓練或者人工反饋,慢慢修。

但百度這邊是秒級響應,一旦發現偏差,立刻人工介入。

這是一套大多數純生成式AI不具備的平臺級治理能力。

說到底,AI信任問題,既是架構問題,也是治理問題,二者缺一不可。



知識的地基

是怎么打起來的


那回到更源頭的地方,好的答案,原材料從哪來?

這就必須說到百度百科了。

很多人對百度百科的印象可能還停留在「哦那個大家都能編輯的百科」,但現在的百度百科,其實在做一件非常底層但非常重要的事,為AI時代的知識可信度打地基。

來看幾個數字。

詞條總量突破3000萬,覆蓋5種語言,包括英、法、日、俄、西班牙語。

累計貢獻用戶超810萬,但UGC內容不是直接入庫的,先審后發,機審和人工審核雙重把關。



熱點內容,分鐘級響應,每秒鐘會誕生一個新版本詞條。

更重要的是它的權威性建設,有一個叫「繁星計劃」的東西,聯合國科大、中科院、北大等頭部機構,匯集了超過10萬名專業專家,共建了超過100萬條專業詞條。自然科學垂類,專業詞條覆蓋率100%,超過20萬條科學詞條經過嚴苛審定。



然后還有一個人機協同的模式,百度百科跟北大公共衛生學院有合作,AI負責出初稿,然后交給碩博老師審核認證,單條詞條的創作效率提升了500%。

機器負責快,知識的最后一道閘門,捏在人手里。

這句話是百度創作者大會演講里說的,我覺得是整場大會里信息密度最高的一句話。

它其實說的是一種選擇,一種姿態。在大家都在比誰的AI生成速度更快、誰的參數規模更大、誰的幻覺更少的時候,百度在說,最關鍵的那道門,我們讓人來把守。

正因如此,百度搜索Skill成了全球下載量第一的搜索引擎官方技能插件。信息權威性這件事上,市場反映得很直白,大多數人心里是有桿秤的,就算沒專門做過測評,用多了,感覺出來了。

順著上面的再說一個,百度創作者大會上還有一個細節,我覺得挺有意思的。

百度搜索最近上線了交互式組件,就是打開某些搜索結果頁,你可以直接上手操作。可以拖動太陽系模型,看行星之間的真實距離,不是圖片,是可以操作的3D模型,拖一下,那個尺度感是完全不同的。



可以順著黃河的地圖點下去,一個城市一個城市地看它流經的地方。

可以把一個分子結構拆開,看內部構成,不是圖示,是可以轉動、可以分解的。

可以親手試試小孔成像的物理原理,調節小孔的大小,看成像的變化。

這個我覺得有趣的地方在于,它改變的不是信息本身,而是接收信息的方式。

從前搜索是被動的,你拿到一份材料,你讀完,你可能理解了,可能沒理解,材料本身不知道你理解了沒有。

交互式的搜索,是你去做這件事,而不是看這件事。

小孔成像,如果你只是讀一遍文字,可能五分鐘后就忘了。如果你自己動手調一遍,感受過那個成像變化,這個知識會跟你待更久。

給你準信兒,還要讓你真正懂它。

這兩件事,都挺難的。




很多年前,艾略特在詩劇《巖石》中發出震耳發聵的“靈魂三問”:

我們迷失于生活中,生命在哪里? 我們迷失于信息中,知識在哪里? 我們迷失于知識中,智慧在哪里?

誠如所言,AI時代,信息的獲取變快了,但信息的可信度反而變成了一個需要重新建立的問題。大家獲得了更多的答案,卻不得不同時應付更多的哪個答案是對的。

這個焦慮的根源,果殼的文章說得很準,AI幻覺是架構問題,GEO投毒是治理問題,二者疊加,構成了一個系統性的可信度危機。

架構問題需要架構層的解法,治理問題需要治理層的解法,你不能指望靠某一個單點突破,把這兩個問題都解決。

百度這次創作者大會展示的,是一套同時在兩個層面都有解法的體系,雙層Agent加三道過濾,是架構層的;秒級巡檢加人工介入,是治理層的;繁星計劃加人機協同,是長期的知識生產質量保障。

這不是某一個技術亮點,而是一個系統。

你如果只做架構層,答案快,但出了錯沒人管。

你如果只做治理層,知道錯了,但信源本身就不穩。

二者缺一不可。我理解的AI時代的信任,不是“這個AI說的肯定是對的”,而是“這個AI說的有跡可查、有人兜底、有機制保障”。

說得清、查得到、有人管。這才是這個時代,一個AI產品能給用戶的真正確定性。

知識的最后一道閘門,捏在人手里。

這句話的含金量,仍在上升啊。







特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
泰緬邊境又炸了!妙瓦底倒了,更血腥的“KK園區2.0”正在崛起

泰緬邊境又炸了!妙瓦底倒了,更血腥的“KK園區2.0”正在崛起

小小科普員
2026-06-25 16:06:40
2.6萬名中國學生用AI寫作業30個月后,成績單驚現恐怖倒掛:考試分數暴跌24%

2.6萬名中國學生用AI寫作業30個月后,成績單驚現恐怖倒掛:考試分數暴跌24%

紫京講談
2026-06-24 14:45:29
印度人擠爆深圳了

印度人擠爆深圳了

深圳客
2026-06-26 10:53:38
曾3-2擊敗巴西?伊東純也:友誼賽和世界杯完全是兩回事

曾3-2擊敗巴西?伊東純也:友誼賽和世界杯完全是兩回事

懂球帝
2026-06-26 13:05:08
百萬網紅黃一鳴賬號被封禁,作品全部清空,此前囂張網暴女素人

百萬網紅黃一鳴賬號被封禁,作品全部清空,此前囂張網暴女素人

四斤
2026-06-25 10:08:29
60歲以后,存款超過這三個數,那么恭喜您,你已經超過了大多數人

60歲以后,存款超過這三個數,那么恭喜您,你已經超過了大多數人

貓叔東山再起
2026-06-26 09:45:11
多艘船通過運河,中巴爆發新爭端,我大使斬釘截鐵,不許撕毀契約

多艘船通過運河,中巴爆發新爭端,我大使斬釘截鐵,不許撕毀契約

策前論
2026-06-26 13:44:36
普京:烏克蘭是前線撐不住才打俄本土

普京:烏克蘭是前線撐不住才打俄本土

桂系007
2026-06-23 23:10:03
iPhone 18 Pro Max曝光:靈動島暴瘦35,蘋果正面設計四年首變

iPhone 18 Pro Max曝光:靈動島暴瘦35,蘋果正面設計四年首變

小柱解說游戲
2026-06-25 02:56:49
A股:今天跌破4030了,下周一,股市可能要這樣走了!

A股:今天跌破4030了,下周一,股市可能要這樣走了!

明心
2026-06-26 15:10:13
世界杯32強淘汰賽:巴西vs日本 日本球員發話:不管對手是誰 目標奪冠

世界杯32強淘汰賽:巴西vs日本 日本球員發話:不管對手是誰 目標奪冠

新英體育
2026-06-26 11:04:45
為什么不能干涉他人的因果?網友:有些事兒說不清楚

為什么不能干涉他人的因果?網友:有些事兒說不清楚

阿康四歲啦
2026-06-26 11:05:34
“李思潼畢業發言”,沖上熱搜

“李思潼畢業發言”,沖上熱搜

南方都市報
2026-06-26 12:32:22
CCTV5直播!2026美國大滿貫國乒參賽名單、賽程以及央視直播表

CCTV5直播!2026美國大滿貫國乒參賽名單、賽程以及央視直播表

好乒乓
2026-06-26 15:01:56
王菲低調登西安城墻!隨行人員氣場不凡,疑似解鎖秦腔非遺新身份

王菲低調登西安城墻!隨行人員氣場不凡,疑似解鎖秦腔非遺新身份

魔都姐姐雜談
2026-06-26 15:38:11
朝陽群眾又立新功!網紅印度餐廳上午爆火下午涼透,老板直接遣返

朝陽群眾又立新功!網紅印度餐廳上午爆火下午涼透,老板直接遣返

愛下廚的阿釃
2026-06-26 13:54:08
替女上司擋災縫15針,第二天被開除,收拾東西時她突然叫住我

替女上司擋災縫15針,第二天被開除,收拾東西時她突然叫住我

千秋文化
2026-06-23 20:03:54
3-1!1-1!世界杯死亡之組大結局:3隊攜手出線 日本vs巴西

3-1!1-1!世界杯死亡之組大結局:3隊攜手出線 日本vs巴西

葉青足球世界
2026-06-26 09:00:18
19歲網紅“鐘美美”被波士頓大學錄取引爭議,網友到底在“酸”什么?

19歲網紅“鐘美美”被波士頓大學錄取引爭議,網友到底在“酸”什么?

新民周刊
2026-06-25 16:19:30
轟25+11!中國女籃20歲1米86混血前鋒崛起:偶像是李夢

轟25+11!中國女籃20歲1米86混血前鋒崛起:偶像是李夢

李喜林籃球絕殺
2026-06-26 16:54:04
2026-06-26 19:23:00
超前實驗室 incentive-icons
超前實驗室
前沿科技,超前觀察? ——『超前實驗室』
13文章數 3關注度
往期回顧 全部

科技要聞

拿了500億的梁文鋒,只挖地基,不信銷售

頭條要聞

已有19支隊伍晉級32強 盤點世界杯小組出線形勢

頭條要聞

已有19支隊伍晉級32強 盤點世界杯小組出線形勢

體育要聞

我在世界杯的每次奔跑,都為了證明你沒看錯

娛樂要聞

玥兒不回北京,馬筱梅解釋后媽身份

財經要聞

懸在科技頭上的達摩克利斯之劍

汽車要聞

老板們的新座駕!65萬元起,尊界V800/V680開啟預訂

態度原創

旅游
親子
藝術
教育
公開課

旅游要聞

霸榜澳洲人亞洲度假地的日本,正被擠下榜首

親子要聞

科普|備孕第一步:讀懂身體“悄悄話”

藝術要聞

王羲之的7個兒子,只有他學到了父親書法的神韻,水平不輸王獻之

教育要聞

全程免費!面向河南等省高一高二學生,海軍工程大學夏令營開始報名

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版