亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

《紐約時報》起訴了OpenAI和微軟哪些侵權(quán)行為?

0
分享至

近日,《紐約時報》在紐約南區(qū)法院起訴微軟和OpenAI,訴狀稱:被告未經(jīng)許可使用大量版權(quán)文章訓(xùn)練人工智能模型,開發(fā)與《紐約時報》競爭的產(chǎn)品,賺取了豐厚的利潤,《紐約時報》試圖與被告達成協(xié)議,保障內(nèi)容使用的公平價值,但未達成解決方案。被告聲稱行為屬于“合理使用”,但實際并不具備“轉(zhuǎn)換性”。《紐約時報》要求其停止侵權(quán)、恢復(fù)原狀、賠償損失。今天和大家聊聊,微軟和OpenAI對《紐約時報》有哪些侵權(quán)行為,以及根據(jù)我國法律,這些行為應(yīng)如何定性。

一、訓(xùn)練素材侵權(quán)

因為《紐約時報》文章的質(zhì)量非常高,所以其網(wǎng)站內(nèi)容被作為了ChatGPT的訓(xùn)練數(shù)據(jù)來源。OpenAI承認,與其他低質(zhì)量來源的內(nèi)容相比,包括來自《紐約時報》在內(nèi)的高質(zhì)量內(nèi)容,對于訓(xùn)練GPT 模型來說更重要、更有價值。訴狀稱微軟和 OpenAI在訓(xùn)練大模型時使用了《紐約時報》作品,并且其多個產(chǎn)品中包含了《紐約時報》的作品。

OpenAI的GPT-2的訓(xùn)練數(shù)據(jù)集包括一個名為WebText的 OpenAI內(nèi)部語料庫,其中有Reddit社交網(wǎng)絡(luò)用戶發(fā)布的 4500 萬個鏈接的文本內(nèi)容,這些是公認的高質(zhì)量網(wǎng)絡(luò)內(nèi)容。WebText數(shù)據(jù)集的鏈接被OpenAI通過網(wǎng)絡(luò)抓取,其中包含了大量《紐約時報》內(nèi)容。《紐約時報》的NYTimes.com 域名是WebText數(shù)據(jù)集中數(shù)量最多的 15 個域名”之一,并被列為WebText 數(shù)據(jù)集中第五個“頂級域”,擁有333,160個條目。

在GPT-3中權(quán)重最高的用于訓(xùn)練的數(shù)據(jù)集Common Crawl中,《紐約時報》網(wǎng)站域名www.nytimes.com域名是最具代表性的專有來源之一(排名第三,僅次于維基百科和美國專利文獻數(shù)據(jù)庫),Common Crawl數(shù)據(jù)集包含至少 1600 萬條獨特的內(nèi)容記錄來自《紐約時報》的 News、Cooking、Wirecutter和 The Athletic等板塊。

根據(jù) Common Crawl, WebText和 WebText2訓(xùn)練數(shù)據(jù)集估算,被告可能完整使用了數(shù)百萬份《紐約時報》擁有版權(quán)的作品來訓(xùn)練 GPT 模型,且沒有任何向《紐約時報》提供許可或其他補償。

例如,2019年,《紐約時報》發(fā)表了一篇榮獲普利策獎的關(guān)于紐約市出租車行業(yè)掠奪性貸款的系列文章。歷時18個月的調(diào)查包括600次訪談、100余條記錄請求、大規(guī)模數(shù)據(jù)分析、審核數(shù)千頁內(nèi)部銀行記錄和其他文件,最終導(dǎo)致犯罪調(diào)查,以及促成新法律以防止未來的濫用行為。OpenAI在創(chuàng)作過程中沒有發(fā)揮任何作用,但只需很少的提示,其產(chǎn)品就會逐字背誦其中的大部分內(nèi)容。

在訴狀中,《紐約時報》的訴訟請求除了要求法院判令被告賠償損失外,還要求恢復(fù)原狀、以及法律或衡平法允許的任何其他救濟永久禁止被告從事非法、不公平和侵權(quán)行為、銷毀所有 GPT 或其他大型語言模型以及包含《紐約時報》內(nèi)容的訓(xùn)練素材。筆者認為,對被告方OpenAI和微軟而言,恢復(fù)原狀和銷毀訓(xùn)練素材的訴求如果被法院支持,會是一個麻煩,但不至于導(dǎo)致ChatGPT崩潰或者停擺。

雖然ChatGPT的訓(xùn)練素材的記憶方式和傳統(tǒng)的電腦復(fù)制、粘貼、存儲內(nèi)容的過程有一定區(qū)別,而且人工智能服務(wù)機構(gòu)對此也諱莫如深,但從網(wǎng)上泄露的內(nèi)容看,有些技術(shù)漏洞可以導(dǎo)致輸入一次提示詞,ChatGPT就會向使用者反饋原始的訓(xùn)練素材,說明其也是存在存儲區(qū)的[i],所以哪怕法院判決刪除侵權(quán)素材、恢復(fù)原狀,OpenAI和微軟應(yīng)該也可以通過刪除存儲的爭議內(nèi)容來履行判決。

二、必應(yīng)ChatGPT插件截取網(wǎng)站流量

微軟通過與OpenAI合作,將OpenAI的GPT商業(yè)化,并將其與自己的必應(yīng)搜索相結(jié)合。2023年5月,微軟和 OpenAI推出了Browse with Bing,這是一個 ChatGPT插件,其可以通過必應(yīng)搜索引擎訪問互聯(lián)網(wǎng)上的最新內(nèi)容。必應(yīng)聊天和Browse with Bing 結(jié)合了ChatGPT-4 模仿人類表達的能力,必應(yīng)用戶可以直接閱讀搜索結(jié)果中的《紐約時報》文章自然語言摘要內(nèi)容,從而無需訪問《紐約時報》自己的網(wǎng)站。

不同于傳統(tǒng)搜索引擎只顯示網(wǎng)頁摘要,必應(yīng)搜索引擎頁面上的“合成”搜索結(jié)果可以直接回答用戶查詢,并且可能將《紐約時報》報道中廣泛的內(nèi)容進行釋義和直接引用。對于《紐約時報》而言,這種方式實際意味著替代,用戶無需訪問其網(wǎng)站就可以使用他們的內(nèi)容,這將導(dǎo)致商業(yè)利益受損。

由于互聯(lián)網(wǎng)的興起,傳統(tǒng)媒體如《紐約時報》的紙質(zhì)版內(nèi)容已經(jīng)被嚴重打擊了,這使得他們損失了報紙訂閱費用和廣告收入。所以不得已,他們在網(wǎng)站上推出了付費墻,也就是少部分內(nèi)容免費或者每月少量內(nèi)容免費,要多閱讀就要付費。這里面有兩部分收入,免費閱讀的廣告收入以及收費閱讀的訂閱收入。

傳統(tǒng)的搜索引擎的搜索結(jié)果一般只顯示兩到三行文章的報紙網(wǎng)站摘要內(nèi)容,用戶要閱讀還是要打開報紙網(wǎng)站,所以能和付費墻兼容。但必應(yīng)聊天和 Browse with Bing這兩個功能的出現(xiàn)使平衡被打破。用戶無需訪問網(wǎng)站就能獲得他們的內(nèi)容會使他們拿不到廣告收入以及收費閱讀的訂閱收入,這也是他們起訴的重要原因。

除了復(fù)制《紐約時報》新聞媒體內(nèi)容外,必應(yīng)ChatGPT插件和瀏覽器使用 Bing for ChatGPT 時,還會顯示《紐約時報》Wirecutter(意為“鋼絲鉗”)板塊內(nèi)容的大量摘錄或釋義提示。該板塊的記者以完全的編輯獨立性和誠信,在長達數(shù)十年的時間里每年花費數(shù)千小時研究和測試產(chǎn)品,以確保只推薦最好的產(chǎn)品。這些建議在呈現(xiàn)給讀者時,包括被介紹的產(chǎn)品在購物網(wǎng)站的直接鏈接,用戶購買后,《紐約時報》公司也會有收益。

但必應(yīng)的ChatGPT插件有效截取了Wirecutter 的精華部分直接呈現(xiàn)給用戶,這會降低用戶訪問到《紐約時報》原始來源的動力。減少Wirecutter 文章的流量,進而減少附屬鏈接的流量,最終導(dǎo)致《紐約時報》的收入損失。比如通過訪問必應(yīng)的ChatGPT插件,用戶已經(jīng)了解 Wirecutter推薦的最好的無繩真空吸塵器,以及這些建議的基礎(chǔ),沒有理由訪問原始文章并點擊其網(wǎng)站內(nèi)的鏈接。這樣,被告的人工智能產(chǎn)品通過不公平競爭,奪取了《紐約時報》的商業(yè)機會。

根據(jù)我國法律,如果搜索引擎提供的內(nèi)容實質(zhì)性替代了原始網(wǎng)站,涉嫌構(gòu)成著作權(quán)侵權(quán),《紐約時報》在美國也就微軟必應(yīng)搜索引擎的類似行為起訴,說明根據(jù)美國法律,這個行為也涉嫌侵權(quán)。

三、人工智能的幻覺造成誤導(dǎo)

訴狀稱,ChatGPT將“幻覺”定義為一種機器的現(xiàn)象,如聊天機器人,產(chǎn)生看似真實的感官體驗,不符合任何現(xiàn)實世界的輸入。被告的GPT模型將自信地提供信息,而不是說“我不知道”,這些信息在最好的情況下是不完全準(zhǔn)確的,在最壞的情況下,是明顯錯誤的(但無法識別)。而用戶會很難區(qū)分“幻覺”和真實的輸出。

例如,在回答請求提供《紐約時報》文章,題為“亞馬遜內(nèi)部在傷痕累累的工作場所中爭奪大創(chuàng)意”的第六段時,必應(yīng)的ChatGPT插件Bing Chat自信地聲稱要復(fù)制第六段。如果其真的這樣做了,它會已實施侵犯版權(quán)行為。但Bing Chat完全捏造了一個段落。

用戶給了Bing Chat《紐約時報》一篇名為“有益心臟健康的飲食方式”的鏈接,要求其摘錄出“15種最有益心臟健康的食物”, BingChat向用戶列舉了15種有益心臟健康的食物,還包括適量的紅酒。事實上《紐約時報》的文章并沒有列出這 15 種食品中的 12 種。而且《紐約時報》的最新報道得出的結(jié)論是,紅酒不利于心臟健康。

此外,訴狀還列舉了ChatGPT捏造了不少健康領(lǐng)域的文章。筆者認為,如果人工智能提供的服務(wù)出現(xiàn)幻覺,就會提供虛構(gòu)的事實,在法律上,以虛構(gòu)的事實描述他人的,涉嫌誹謗,也就是名譽侵權(quán),損害了《紐約時報》的聲譽。ChatGPT作為人工智能沒有人格,所以無法負責(zé),應(yīng)當(dāng)負責(zé)的是其服務(wù)提供者OpenAI和微軟。

最后,《紐約時報》作為一家老牌的很有影響力的媒體,本次其起訴OpenAI和微軟,在業(yè)界引發(fā)了很大反響,說明雖然生成式人工智能還是新生事物,但重量級媒體已經(jīng)關(guān)注其破壞行業(yè)秩序的問題了。事實上,除了此案,美國發(fā)生了很多對于生成式人工智能的維權(quán)案件,筆者寫過的就包括小說作者維權(quán)的《《權(quán)力的游戲》作者起訴ChatGPT侵權(quán),AI訓(xùn)練要不要獲得著作權(quán)人的授權(quán)?》、軟件開發(fā)者維權(quán)的《用GitHub上的開源代碼訓(xùn)練人工智能違法嗎?》、唱片產(chǎn)業(yè)版權(quán)人維權(quán)的《環(huán)球唱片起訴人工智能引擎Claude案有哪些法律看點?》、以及綜合性的《AI生成的作品受版權(quán)保護嗎?我與ChatGPT各抒己見》等,大家有興趣也可以看看。

本文作者:游云庭,上海大邦律師事務(wù)所高級合伙人,知識產(chǎn)權(quán)律師。本文僅代表作者觀點。

[i] https://blog.csdn.net/richerg85/article/details/134940746

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
李想怒噴日產(chǎn)的背后,藏著“增程帝國”崩塌的無能為力

李想怒噴日產(chǎn)的背后,藏著“增程帝國”崩塌的無能為力

少數(shù)派報告Report
2026-04-19 09:17:16
外媒終于承認:中東一打仗才發(fā)現(xiàn),美國這三大支柱,離倒也不遠了

外媒終于承認:中東一打仗才發(fā)現(xiàn),美國這三大支柱,離倒也不遠了

南宗歷史
2026-04-20 01:12:34
面多加水,水多加面?外媒痛批:電車3噸重,填鴨式造車不可取!

面多加水,水多加面?外媒痛批:電車3噸重,填鴨式造車不可取!

少數(shù)派報告Report
2026-04-17 07:03:05
連入三球,吉布斯-懷特職業(yè)生涯首次上演帽子戲法

連入三球,吉布斯-懷特職業(yè)生涯首次上演帽子戲法

懂球帝
2026-04-19 22:47:08
輸給湖人后,火箭揪出最大“水貨”!杰倫-格林離隊真的太冤了

輸給湖人后,火箭揪出最大“水貨”!杰倫-格林離隊真的太冤了

兵哥籃球故事
2026-04-19 15:21:32
恒大超級蛀蟲劉永灼:甚至比許家印還能攬財,狂燒千億終落法網(wǎng)

恒大超級蛀蟲劉永灼:甚至比許家印還能攬財,狂燒千億終落法網(wǎng)

小曙說娛
2026-04-19 00:27:45
經(jīng)紀人霍汶希評論區(qū)翻車了!因張敬軒風(fēng)波,網(wǎng)友毫不留情面的怒批

經(jīng)紀人霍汶希評論區(qū)翻車了!因張敬軒風(fēng)波,網(wǎng)友毫不留情面的怒批

小徐講八卦
2026-04-19 11:17:33
吃相太難看!莫氏雞煲爆火后,惡心一幕出現(xiàn),終走上呆呆妹的老路

吃相太難看!莫氏雞煲爆火后,惡心一幕出現(xiàn),終走上呆呆妹的老路

以茶帶書
2026-04-15 17:30:12
6個家庭天塌了!成都面包車追尾致6死5傷,原因公布,真相太氣人

6個家庭天塌了!成都面包車追尾致6死5傷,原因公布,真相太氣人

奇思妙想草葉君
2026-04-18 23:52:46
特朗普:將很快公開涉UFO文件,“非常有趣,令人著迷”!奧巴馬:外星人真實存在,但我沒見過

特朗普:將很快公開涉UFO文件,“非常有趣,令人著迷”!奧巴馬:外星人真實存在,但我沒見過

揚子晚報
2026-04-19 08:06:22
徐湖平幾近葬送臺北故宮文物回歸之路

徐湖平幾近葬送臺北故宮文物回歸之路

雪中風(fēng)車
2026-04-19 08:36:53
6月1日起,私家車跑順風(fēng)車不用辦營運證,放心跑

6月1日起,私家車跑順風(fēng)車不用辦營運證,放心跑

劉哥談體育
2026-04-19 21:47:47
勇士會成為冤大頭嗎?庫里甚至40歲還要拿7100萬美元!

勇士會成為冤大頭嗎?庫里甚至40歲還要拿7100萬美元!

歷史第一人梅西
2026-04-19 16:06:28
懸殊的7-2!丁俊暉接近會師趙心童,6-4到6-10,中國出局首人確定

懸殊的7-2!丁俊暉接近會師趙心童,6-4到6-10,中國出局首人確定

小火箭愛體育
2026-04-19 20:41:49
英超保級隊11場狂攬5勝:冬窗7換5的重組邏輯

英超保級隊11場狂攬5勝:冬窗7換5的重組邏輯

賽場名場面
2026-04-19 19:16:18
女子吐槽“老公養(yǎng)的盆栽”,太丑了,網(wǎng)友:不懂,別亂說話

女子吐槽“老公養(yǎng)的盆栽”,太丑了,網(wǎng)友:不懂,別亂說話

觀察鑒娛
2026-04-19 16:03:01
一夜暴跌25%!小馬哥最怕的事還是發(fā)生了:年輕人正在從騰訊溜走

一夜暴跌25%!小馬哥最怕的事還是發(fā)生了:年輕人正在從騰訊溜走

潮鹿逐夢
2026-03-21 11:54:42
雷軍挑戰(zhàn)成功!小米新SU7行駛1313公里只充1次電,連續(xù)直播15個小時,多名車友一路跟隨

雷軍挑戰(zhàn)成功!小米新SU7行駛1313公里只充1次電,連續(xù)直播15個小時,多名車友一路跟隨

極目新聞
2026-04-17 22:41:31
曼城vs阿森納半場數(shù)據(jù):控球率60%-40%,射門8-3射正2-1

曼城vs阿森納半場數(shù)據(jù):控球率60%-40%,射門8-3射正2-1

懂球帝
2026-04-20 00:22:46
王晶曝陳百強真正死因,64歲何超瓊顏面盡失

王晶曝陳百強真正死因,64歲何超瓊顏面盡失

君笙的拂兮
2026-03-22 03:44:36
2026-04-20 02:03:00
游云庭律師 incentive-icons
游云庭律師
互聯(lián)網(wǎng)法律評論
153文章數(shù) 189關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類紀錄!300臺機器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤東漲粉百萬!內(nèi)娛隔空掀桌第一人

財經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

房產(chǎn)
家居
數(shù)碼
健康
公開課

房產(chǎn)要聞

官宣簽約最強城更!海口樓市,突然殺入神秘房企!

家居要聞

法式線條 時光靜淌

數(shù)碼要聞

華為新機發(fā)布前瞻:闊折疊X Max+影像旗艦Pura 90,都沒懸念了

干細胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版