央視前兩天報了一條消息,看完我愣了好一會兒。
新一代AI換臉技術,只需要一張照片,就能在實時視頻通話中完成換臉。延遲是毫秒級的。表情跟得上,嘴型對得上,頭動、眨眼、皺眉,全都自然到你盯著看都不一定能發現問題。
一張照片。實時的。毫秒級。
![]()
我反復確認了三遍,不是預先錄好的視頻,不是后期處理的素材,是正在進行的視頻通話里,對面那個人的臉,可以是任何人的臉
這事兒的恐怖程度,很多人可能還沒反應過來。
這不是科幻片的橋段
兩三年前DeepFake剛出來的時候,大家的反應更多是獵奇。換臉視頻糊得一塌糊涂,光線一變臉就扭曲,嘴巴和聲音永遠差那么零點幾秒。那時候大家覺得,哦,挺好玩的,但一眼就能看出來是假的。
后來AI語音合成跟上了。去年有不少案例,騙子用AI克隆家人的聲音打電話,說急事要轉賬,有人真的被騙走了幾十萬上百萬。那時候大家開始慌了,但還留著一個底線的安全感。
- 沒事,打個視頻確認一下就行了。視頻總不能造假吧?
現在這條底線也沒了。
你想想這個場景。你媽給你打視頻電話,畫面里就是她的臉,她的表情,她說話的節奏,她跟你聊了兩分鐘家常,然后說最近身體不太好,需要一筆錢做檢查。你會懷疑嗎?
大概率不會。
因為我們幾千年來建立的信任體系,最底層的一條就是「眼見為實」。聲音可以模仿,文字可以偽造,但一個活生生的人出現在你面前,臉對臉地跟你說話,這是人類認知系統里最后的錨點。
現在這個錨點被拔掉了。
造假這件事,一直在升級
回頭看,這條路走得其實挺清晰的。
![]()
九十年代Photoshop普及,修個照片就能上報紙頭條,鬧出過不少假新聞。后來大家學聰明了,開始看EXIF信息、查像素邊緣,各種鑒偽工具跟上來了。
再后來是音頻。錄音剪輯、變聲器、AI語音合成,一步步迭代。每次造假技術升級,檢測手段就追著跑,追上了,消停一陣子,然后新的造假方式又冒出來。
這是一個螺旋。造假,防偽,再造假,再防偽。
但這次不太一樣。
之前每次升級,至少有一個「退路」。照片假了看視頻,音頻假了打視頻。每次都還有一個更高維度的驗證方式兜底。
實時視頻換臉把這個退路堵死了。你往哪退?總不能說,以后確認身份得線下見面,還得捏一下對方的臉看看是不是硅膠面具吧。
說到硅膠面具……算了不展開了,再說就成恐怖片了。
誰在開心,誰在倒霉
有意思的是,圍繞這個技術,不同人的利益完全不一樣。
造假者是最直接的受益方。詐騙門檻斷崖式下降,以前搞一個換臉視頻要專業設備、要算力、要時間,現在一張照片加一個工具就夠了。勒索、造謠、偽造證據、生成不雅內容,每一條都是真金白銀的灰色產業。
平臺方的處境很微妙。一方面它們在技術競賽里推動著這些能力的進步,另一方面又不得不承擔內容審核的壓力。這里面的矛盾,大家都心知肚明,我就不多說了。
普通人是最慘的。隱私風險加大了,財產風險加大了,但最要命的是一個隱性成本的飆升——信任成本
以后每接一個視頻電話,你腦子里可能都要先閃過一個念頭,這人是真的嗎?
跟朋友、跟家人、跟同事,每一次視頻溝通都多了一層懷疑。這種懷疑不需要真的遇到騙子才產生,光是「知道這個技術存在」就夠了。
這才是最大的傷害。
法律和技術檢測呢?
坦率講,跟不上。
現在的監管框架還在處理上一代的問題。AI生成內容的標注、深度偽造的法律認定、受害者的舉證責任……每一項都還在討論階段。而技術這邊,毫秒級換臉意味著實時檢測的難度是指數級上升的,你總不能讓每個視頻通話都先過一遍AI鑒偽系統吧。就算能,延遲和隱私問題又是新的坑。
有人可能會說,以前每次技術升級,最后不都追上了嗎?
沒錯。但追上的那段空窗期里,倒霉的都是普通人。
![]()
而且這次的空窗期可能格外長,因為生成式AI的進化速度,和之前任何一代造假技術都不在一個量級上。PS迭代是按年算的,DeepFake迭代是按月算的,現在這些實時換臉模型的迭代,按周算都不夸張。
檢測技術跑得再快,它的邏輯是「找破綻」。但當破綻越來越少、越來越細微,找破綻這件事本身就在逼近極限。
真正讓人不安的,不是技術
我一直在想,為什么這條新聞讓我的不適感比以往任何一次AI進步的新聞都強。
不是因為它能騙錢。騙錢的手段一直都有,電信詐騙也不是新鮮事。
是因為它動搖的東西太根本了。
人和人之間的信任,是一層一層搭起來的。文字信任、聲音信任、面對面的信任。每一層都對應著一種確認「對方是真人」的方式。現在這些層一層層被擊穿,我們在認知上就會進入一種很難受的狀態。
心理學上有個說法叫「基本信任感」,是人格發展最早期形成的東西。嬰兒通過和養育者的互動建立起「世界大體上是安全的、可預測的」這個基本假設。所有后續的社會關系都建立在這個假設之上。
- 當眼見不再為實,這個假設就裂了一條縫。
你不需要真的被騙過,光是「你看到的任何人臉都可能不是本人」這個認知,就足以改變你和整個世界打交道的方式。
更警惕。更懷疑。更疲憊。
這種狀態有個很難聽的名字,叫泛化的不信任。原本只需要對陌生來電保持警惕,現在連熟人視頻都要打問號。信任的默認值從「先相信」變成了「先懷疑」。
一個社會的信任默認值一旦翻轉,所有的交易成本、溝通成本、情感成本都會飆升。這筆賬沒人算得過來。
我沒有解決方案
寫到這里我得老實說,我不知道怎么辦。
有人說靠技術反制,搞數字水印、搞活體檢測、搞區塊鏈身份認證。這些方向都對,但哪個都不是短期能鋪開的。有人說靠法律嚴懲,判例確實在出,但立法永遠是事后的。有人說靠教育,讓大家提高防范意識。這話沒錯,但你讓一個六十多歲的老人去判斷視頻通話里的子女是不是AI生成的,這現實嗎?
我能想到的最誠實的建議,可能就是跟家人約一個暗號。一個只有你們知道的詞,或者一個奇怪的問題,視頻通話里先確認一下。
很土。但可能有用。
AI越真,世界越假。
當連視頻通話都不能信了,我們丟掉的不是某一項技術的可靠性,是人和人之間那層薄薄的、脆弱的、本來就不太經得起折騰的信任。
昨天刷到一條評論,有個人說,“以后我媽給我打視頻,我得先讓她轉三個圈我才信是她。”
底下一堆哈哈哈。
![]()
但笑完之后,沒人接話了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.