網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

大英百科起訴OpenAI：答案你寫(xiě)，憑什么署我的名

2026-03-18 08:30:03　來(lái)源: 知產(chǎn)力

北京舉報(bào)

分享至

AI之戰(zhàn)，終于打到了“署名權(quán)”這一層。
2026年3月13日，Encyclopaedia Britannica（大英百科全書(shū)，以下簡(jiǎn)稱大英百科）與 Merriam-Webster （韋氏詞典）在紐約曼哈頓聯(lián)邦地區(qū)法院起訴 OpenAI，指控其未經(jīng)授權(quán)使用近10萬(wàn)篇百科與詞典內(nèi)容訓(xùn)練模型，并在回答中近乎逐字復(fù)現(xiàn)原文。原告同時(shí)主張，ChatGPT會(huì)把錯(cuò)誤甚至幻覺(jué)內(nèi)容歸因給大英百科或韋氏詞典。

這不是一場(chǎng)普通的AI版權(quán)案

從表面看，這起訴訟仍屬于近兩年AI內(nèi)容訴訟潮的一部分，訓(xùn)練階段是否未經(jīng)授權(quán)使用作品，輸出階段是否構(gòu)成復(fù)現(xiàn)，商業(yè)上是否替代原網(wǎng)站流量。但大英百科這次不只是說(shuō)：你用了我的內(nèi)容，還在說(shuō)，你用了我的名字。

這就讓案件從“版權(quán)使用邊界之爭(zhēng)”，進(jìn)一步轉(zhuǎn)向“知識(shí)權(quán)威能否被AI借名調(diào)用”之爭(zhēng)。
對(duì)內(nèi)容行業(yè)來(lái)說(shuō)，版權(quán)當(dāng)然重要；但對(duì)百科、詞典這類知識(shí)品牌而言，來(lái)源可信度和品牌署名權(quán)威，同樣是核心資產(chǎn)。

第一條戰(zhàn)線：訓(xùn)練階段，近10萬(wàn)篇內(nèi)容是否構(gòu)成未經(jīng)授權(quán)復(fù)制

根據(jù)路透等報(bào)道，原告稱 OpenAI 非法使用了近10萬(wàn)篇 Britannica 與 Merriam-Webster 的文章、詞條和定義，用于訓(xùn)練 GPT 系列模型。

這類內(nèi)容與普通網(wǎng)頁(yè)信息不同。
百科條目、詞典釋義、編輯體系、條目編排、表達(dá)方式，本身就具有穩(wěn)定的商業(yè)價(jià)值和版權(quán)屬性。原告的核心邏輯也因此非常明確：
不是零散引用，不是個(gè)別摘錄，而是系統(tǒng)性、規(guī)模化、商業(yè)化地吸收進(jìn)模型訓(xùn)練流程。

如果法院未來(lái)認(rèn)可這種主張，訓(xùn)練階段的“合理使用”抗辯空間，至少在高質(zhì)量、結(jié)構(gòu)化、可替代性強(qiáng)的知識(shí)內(nèi)容上，可能會(huì)被進(jìn)一步壓縮。
這也是為什么百科和詞典類原告，比一般媒體原告更容易把爭(zhēng)點(diǎn)壓到“作品體系整體被吸收”這一層。這個(gè)判斷，是基于本案起訴路徑作出的分析。

第二條戰(zhàn)線：輸出階段，模型到底是在“學(xué)習(xí)”還是在“記住”

本案另一項(xiàng)重要指控，是 ChatGPT 輸出與大英百科原文“逐字相同或高度近似”的內(nèi)容。相關(guān)媒體在報(bào)道時(shí)都提到，訴狀附有 ChatGPT 輸出與原文近乎逐字對(duì)應(yīng)的示例。

這正是當(dāng)前AI版權(quán)案里最危險(xiǎn)、也最核心的問(wèn)題，
模型究竟是在抽象學(xué)習(xí)，還是在可觸發(fā)條件下對(duì)原文進(jìn)行近似復(fù)現(xiàn)？

如果后續(xù)程序中，這部分證據(jù)被法院認(rèn)為足以證明“記憶化”或可歸責(zé)的近似復(fù)制，那么案件的重心就不再只是“訓(xùn)練時(shí)碰過(guò)沒(méi)有”，而會(huì)變成，
你最終生成出來(lái)的東西，是否已經(jīng)回到了版權(quán)法最傳統(tǒng)的禁區(qū)——復(fù)制。

對(duì)大模型公司來(lái)說(shuō)，這一層風(fēng)險(xiǎn)比單純“訓(xùn)練數(shù)據(jù)來(lái)源爭(zhēng)議”更實(shí)在。
因?yàn)橛?xùn)練階段還可以辯論技術(shù)中間過(guò)程、統(tǒng)計(jì)抽象、轉(zhuǎn)換性使用；但一旦輸出端出現(xiàn)成段近似復(fù)現(xiàn)，法院看到的就不再是抽象技術(shù)，而是一個(gè)更直觀的問(wèn)題——用戶拿到的，是不是原告作品的替代品。

第三條戰(zhàn)線：RAG不是避風(fēng)港，反而可能變成新風(fēng)險(xiǎn)點(diǎn)

原告還把矛頭指向了 RAG，也就是檢索增強(qiáng)生成工作流，稱 OpenAI 在回答中直接調(diào)用大英百科內(nèi)容來(lái)補(bǔ)充輸出。路透報(bào)道中明確提到，原告訴求覆蓋了訓(xùn)練使用、輸出復(fù)現(xiàn)，以及讓 ChatGPT 借助其內(nèi)容直接回答用戶問(wèn)題所造成的損害。

這部分為什么值得警惕？
因?yàn)橛?xùn)練爭(zhēng)議還可以說(shuō)是“過(guò)去式”的數(shù)據(jù)吸收；RAG則更像“現(xiàn)在式”的內(nèi)容調(diào)用。訓(xùn)練階段的爭(zhēng)議，圍繞的是模型成長(zhǎng)過(guò)程；RAG階段的爭(zhēng)議，圍繞的是模型當(dāng)下正在用誰(shuí)的內(nèi)容回答問(wèn)題。

如果法院未來(lái)對(duì)這一路徑持嚴(yán)格態(tài)度，那影響就不只是 OpenAI 一家。
大量“搜索+生成”“知識(shí)庫(kù)+回答”“外部?jī)?nèi)容實(shí)時(shí)檢索+整合輸出”的AI產(chǎn)品，都要重新審視幾個(gè)問(wèn)題，有沒(méi)有授權(quán)，調(diào)用邊界在哪里，引用和替代之間的線畫(huà)在哪。
換句話說(shuō)，本案真正可能外溢的，不只是版權(quán)法邏輯，而是整個(gè)AI信息架構(gòu)的合規(guī)成本。

這起案件最有辨識(shí)度的地方，不在版權(quán)，而在商標(biāo)與來(lái)源標(biāo)注。

過(guò)去很多AI爭(zhēng)議，焦點(diǎn)都在作品有沒(méi)有被抓取、答案有沒(méi)有過(guò)度相似。
而大英百科這次在問(wèn)的是：
誰(shuí)有資格說(shuō) “according to Britannica？”

對(duì)百科和詞典來(lái)說(shuō)，內(nèi)容當(dāng)然重要，但真正稀缺的，是被社會(huì)長(zhǎng)期承認(rèn)的可信來(lái)源身份。
如果AI生成了錯(cuò)誤內(nèi)容，卻掛上大英百科的名字，那損害的就不只是某個(gè)條目的點(diǎn)擊量，而是品牌所代表的知識(shí)權(quán)威。

從法律路徑看，這種打法也更有延展性。
版權(quán)問(wèn)題常常會(huì)落入合理使用、轉(zhuǎn)換性利用、訓(xùn)練必要性的激烈爭(zhēng)論；
但一旦進(jìn)入“虛假來(lái)源標(biāo)注”“錯(cuò)誤歸因”、“品牌背書(shū)被挪用”的框架，訴訟的直覺(jué)張力更強(qiáng)，陪審團(tuán)或法官也更容易理解其損害邏輯。

被替代的不只是文章，還有流量入口
大英百科認(rèn)為 ChatGPT 直接生成答案，削弱了用戶訪問(wèn)其網(wǎng)站的必要性，從而“蠶食”原本屬于其平臺(tái)的流量、廣告與訂閱價(jià)值。

這也是內(nèi)容行業(yè)與AI平臺(tái)沖突不斷升級(jí)的底層現(xiàn)實(shí)。
過(guò)去搜索引擎至少還會(huì)把流量導(dǎo)回網(wǎng)站；現(xiàn)在生成式AI越來(lái)越像“答案終點(diǎn)站”，用戶在對(duì)話框里拿到結(jié)論，就不再去原頁(yè)面。

最后，用戶記住的是AI，原始內(nèi)容提供者反而被留在后臺(tái)。

對(duì)于媒體、百科、詞典、數(shù)據(jù)庫(kù)這類機(jī)構(gòu)來(lái)說(shuō)，這不只是版權(quán)收益受損，而是入口地位被改寫(xiě)。
誰(shuí)控制答案分發(fā)，誰(shuí)就更接近下一代知識(shí)基礎(chǔ)設(shè)施。
這也是大英百科這類老牌知識(shí)機(jī)構(gòu)必須出手的真正原因。

OpenAI的回應(yīng)與這案子的真正看點(diǎn)

路透援引 OpenAI 發(fā)言人表態(tài)稱，ChatGPT 有助于提升創(chuàng)造力、科學(xué)發(fā)現(xiàn)和日常效率，其模型基于公開(kāi)可用數(shù)據(jù)訓(xùn)練，并以合理使用原則為依據(jù)。

這當(dāng)然是AI公司目前最標(biāo)準(zhǔn)、也最核心的抗辯框架。
但大英百科案的看點(diǎn)恰恰在于，它試圖把爭(zhēng)議從“公開(kāi)可用數(shù)據(jù)能否訓(xùn)練”轉(zhuǎn)向三個(gè)更難回避的問(wèn)題：

第一，模型是否會(huì)近似復(fù)現(xiàn)原文。
第二，RAG或其他調(diào)用機(jī)制是否構(gòu)成對(duì)版權(quán)內(nèi)容的實(shí)時(shí)利用。
第三，AI能否把錯(cuò)誤內(nèi)容歸在知名知識(shí)品牌名下。

前兩個(gè)問(wèn)題，AI行業(yè)過(guò)去兩年已經(jīng)在打；
第三個(gè)問(wèn)題，才是這案子真正的新變量。

知產(chǎn)力判斷

如果說(shuō)過(guò)去的AI版權(quán)訴訟，爭(zhēng)的是“數(shù)據(jù)能不能喂模型”；
那么這起案件，爭(zhēng)的已經(jīng)是：答案能不能掛我的名。

從這個(gè)意義上看，大英百科起訴OpenAI，不只是一次版權(quán)維權(quán)。
它更像是傳統(tǒng)知識(shí)機(jī)構(gòu)對(duì)AI時(shí)代“來(lái)源秩序”的一次反擊。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.