AI之戰(zhàn),終于打到了“署名權(quán)”這一層。
2026年3月13日,Encyclopaedia Britannica(大英百科全書(shū),以下簡(jiǎn)稱大英百科) 與 Merriam-Webster (韋氏詞典)在紐約曼哈頓聯(lián)邦地區(qū)法院起訴 OpenAI,指控其未經(jīng)授權(quán)使用近10萬(wàn)篇百科與詞典內(nèi)容訓(xùn)練模型,并在回答中近乎逐字復(fù)現(xiàn)原文。原告同時(shí)主張,ChatGPT會(huì)把錯(cuò)誤甚至幻覺(jué)內(nèi)容歸因給大英百科或韋氏詞典。
這不是一場(chǎng)普通的AI版權(quán)案
從表面看,這起訴訟仍屬于近兩年AI內(nèi)容訴訟潮的一部分,訓(xùn)練階段是否未經(jīng)授權(quán)使用作品,輸出階段是否構(gòu)成復(fù)現(xiàn),商業(yè)上是否替代原網(wǎng)站流量。 但大英百科這次不只是說(shuō):你用了我的內(nèi)容,還在說(shuō),你用了我的名字。
這就讓案件從“版權(quán)使用邊界之爭(zhēng)”,進(jìn)一步轉(zhuǎn)向“知識(shí)權(quán)威能否被AI借名調(diào)用”之爭(zhēng)。
對(duì)內(nèi)容行業(yè)來(lái)說(shuō),版權(quán)當(dāng)然重要;但對(duì)百科、詞典這類知識(shí)品牌而言,來(lái)源可信度和品牌署名權(quán)威,同樣是核心資產(chǎn)。
第一條戰(zhàn)線:訓(xùn)練階段,近10萬(wàn)篇內(nèi)容是否構(gòu)成未經(jīng)授權(quán)復(fù)制
根據(jù)路透等報(bào)道,原告稱 OpenAI 非法使用了近10萬(wàn)篇 Britannica 與 Merriam-Webster 的文章、詞條和定義,用于訓(xùn)練 GPT 系列模型。
這類內(nèi)容與普通網(wǎng)頁(yè)信息不同。
百科條目、詞典釋義、編輯體系、條目編排、表達(dá)方式,本身就具有穩(wěn)定的商業(yè)價(jià)值和版權(quán)屬性。原告的核心邏輯也因此非常明確:
不是零散引用,不是個(gè)別摘錄,而是系統(tǒng)性、規(guī)模化、商業(yè)化地吸收進(jìn)模型訓(xùn)練流程。
如果法院未來(lái)認(rèn)可這種主張,訓(xùn)練階段的“合理使用”抗辯空間,至少在高質(zhì)量、結(jié)構(gòu)化、可替代性強(qiáng)的知識(shí)內(nèi)容上,可能會(huì)被進(jìn)一步壓縮。
這也是為什么百科和詞典類原告,比一般媒體原告更容易把爭(zhēng)點(diǎn)壓到“作品體系整體被吸收”這一層。這個(gè)判斷,是基于本案起訴路徑作出的分析。
第二條戰(zhàn)線:輸出階段,模型到底是在“學(xué)習(xí)”還是在“記住”
本案另一項(xiàng)重要指控,是 ChatGPT 輸出與大英百科 原文“逐字相同或高度近似”的內(nèi)容。相關(guān)媒體在報(bào)道時(shí)都提到,訴狀附有 ChatGPT 輸出與原文近乎逐字對(duì)應(yīng)的示例。
這正是當(dāng)前AI版權(quán)案里最危險(xiǎn)、也最核心的問(wèn)題,
模型究竟是在抽象學(xué)習(xí),還是在可觸發(fā)條件下對(duì)原文進(jìn)行近似復(fù)現(xiàn)?
如果后續(xù)程序中,這部分證據(jù)被法院認(rèn)為足以證明“記憶化”或可歸責(zé)的近似復(fù)制,那么案件的重心就不再只是“訓(xùn)練時(shí)碰過(guò)沒(méi)有”,而會(huì)變成,
你最終生成出來(lái)的東西,是否已經(jīng)回到了版權(quán)法最傳統(tǒng)的禁區(qū)——復(fù)制。
對(duì)大模型公司來(lái)說(shuō),這一層風(fēng)險(xiǎn)比單純“訓(xùn)練數(shù)據(jù)來(lái)源爭(zhēng)議”更實(shí)在。
因?yàn)橛?xùn)練階段還可以辯論技術(shù)中間過(guò)程、統(tǒng)計(jì)抽象、轉(zhuǎn)換性使用;但一旦輸出端出現(xiàn)成段近似復(fù)現(xiàn),法院看到的就不再是抽象技術(shù),而是一個(gè)更直觀的問(wèn)題——用戶拿到的,是不是原告作品的替代品。
第三條戰(zhàn)線:RAG不是避風(fēng)港,反而可能變成新風(fēng)險(xiǎn)點(diǎn)
原告還把矛頭指向了 RAG,也就是檢索增強(qiáng)生成工作流,稱 OpenAI 在回答中直接調(diào)用大英百科內(nèi)容來(lái)補(bǔ)充輸出。路透報(bào)道中明確提到,原告訴求覆蓋了訓(xùn)練使用、輸出復(fù)現(xiàn),以及讓 ChatGPT 借助其內(nèi)容直接回答用戶問(wèn)題所造成的損害。
這部分為什么值得警惕?
因?yàn)橛?xùn)練爭(zhēng)議還可以說(shuō)是“過(guò)去式”的數(shù)據(jù)吸收;RAG則更像“現(xiàn)在式”的內(nèi)容調(diào)用。訓(xùn)練階段的爭(zhēng)議,圍繞的是模型成長(zhǎng)過(guò)程;RAG階段的爭(zhēng)議,圍繞的是模型當(dāng)下正在用誰(shuí)的內(nèi)容回答問(wèn)題。
如果法院未來(lái)對(duì)這一路徑持嚴(yán)格態(tài)度,那影響就不只是 OpenAI 一家。
大量“搜索+生成”“知識(shí)庫(kù)+回答”“外部?jī)?nèi)容實(shí)時(shí)檢索+整合輸出”的AI產(chǎn)品,都要重新審視幾個(gè)問(wèn)題,有沒(méi)有授權(quán),調(diào)用邊界在哪里,引用和替代之間的線畫(huà)在哪。
換句話說(shuō),本案真正可能外溢的,不只是版權(quán)法邏輯,而是整個(gè)AI信息架構(gòu)的合規(guī)成本。
這起案件最有辨識(shí)度的地方,不在版權(quán),而在商標(biāo)與來(lái)源標(biāo)注。
過(guò)去很多AI爭(zhēng)議,焦點(diǎn)都在作品有沒(méi)有被抓取、答案有沒(méi)有過(guò)度相似。
而大英百科這次在問(wèn)的是:
誰(shuí)有資格說(shuō) “according to Britannica?”
對(duì)百科和詞典來(lái)說(shuō),內(nèi)容當(dāng)然重要,但真正稀缺的,是被社會(huì)長(zhǎng)期承認(rèn)的可信來(lái)源身份。
如果AI生成了錯(cuò)誤內(nèi)容,卻掛上大英百科的名字,那損害的就不只是某個(gè)條目的點(diǎn)擊量,而是品牌所代表的知識(shí)權(quán)威。
從法律路徑看,這種打法也更有延展性。
版權(quán)問(wèn)題常常會(huì)落入合理使用、轉(zhuǎn)換性利用、訓(xùn)練必要性的激烈爭(zhēng)論;
但一旦進(jìn)入“虛假來(lái)源標(biāo)注”“錯(cuò)誤歸因”、“品牌背書(shū)被挪用”的框架,訴訟的直覺(jué)張力更強(qiáng),陪審團(tuán)或法官也更容易理解其損害邏輯。
被替代的不只是文章,還有流量入口
大英百科認(rèn)為 ChatGPT 直接生成答案,削弱了用戶訪問(wèn)其網(wǎng)站的必要性,從而“蠶食”原本屬于其平臺(tái)的流量、廣告與訂閱價(jià)值。
這也是內(nèi)容行業(yè)與AI平臺(tái)沖突不斷升級(jí)的底層現(xiàn)實(shí)。
過(guò)去搜索引擎至少還會(huì)把流量導(dǎo)回網(wǎng)站;現(xiàn)在生成式AI越來(lái)越像“答案終點(diǎn)站”,用戶在對(duì)話框里拿到結(jié)論,就不再去原頁(yè)面。
最后,用戶記住的是AI,原始內(nèi)容提供者反而被留在后臺(tái)。
對(duì)于媒體、百科、詞典、數(shù)據(jù)庫(kù)這類機(jī)構(gòu)來(lái)說(shuō),這不只是版權(quán)收益受損,而是入口地位被改寫(xiě)。
誰(shuí)控制答案分發(fā),誰(shuí)就更接近下一代知識(shí)基礎(chǔ)設(shè)施。
這也是大英百科這類老牌知識(shí)機(jī)構(gòu)必須出手的真正原因。
OpenAI的回應(yīng)與這案子的真正看點(diǎn)
路透援引 OpenAI 發(fā)言人表態(tài)稱,ChatGPT 有助于提升創(chuàng)造力、科學(xué)發(fā)現(xiàn)和日常效率,其模型基于公開(kāi)可用數(shù)據(jù)訓(xùn)練,并以合理使用原則為依據(jù)。
這當(dāng)然是AI公司目前最標(biāo)準(zhǔn)、也最核心的抗辯框架。
但大英百科案的看點(diǎn)恰恰在于,它試圖把爭(zhēng)議從“公開(kāi)可用數(shù)據(jù)能否訓(xùn)練”轉(zhuǎn)向三個(gè)更難回避的問(wèn)題:
第一,模型是否會(huì)近似復(fù)現(xiàn)原文。
第二,RAG或其他調(diào)用機(jī)制是否構(gòu)成對(duì)版權(quán)內(nèi)容的實(shí)時(shí)利用。
第三,AI能否把錯(cuò)誤內(nèi)容歸在知名知識(shí)品牌名下。
前兩個(gè)問(wèn)題,AI行業(yè)過(guò)去兩年已經(jīng)在打;
第三個(gè)問(wèn)題,才是這案子真正的新變量。
知產(chǎn)力判斷
如果說(shuō)過(guò)去的AI版權(quán)訴訟,爭(zhēng)的是“數(shù)據(jù)能不能喂模型”;
那么這起案件,爭(zhēng)的已經(jīng)是:答案能不能掛我的名。
從這個(gè)意義上看,大英百科起訴OpenAI,不只是一次版權(quán)維權(quán)。
它更像是傳統(tǒng)知識(shí)機(jī)構(gòu)對(duì)AI時(shí)代“來(lái)源秩序”的一次反擊。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.