![]()
4 月 7 日消息,有訴訟稱蘋果使用了包含數(shù)百萬條 YouTube 視頻的數(shù)據(jù)集訓(xùn)練 AI 模型。據(jù)科技媒體 MacRumors 發(fā)現(xiàn),Ted Entertainment、Matt Fisher 和 Golfholics 三個(gè) Youtube 頻道共同提起了一樁集體訴訟,指控蘋果繞過 YouTube 的反爬蟲防護(hù)措施,下載了數(shù)百萬條視頻。
訴訟文件顯示,蘋果研究團(tuán)隊(duì)曾發(fā)表一篇名為《STIV:可擴(kuò)展文本與圖像條件視頻生成》的研究論文,文中提及團(tuán)隊(duì)使用名為 Panda-70M 的數(shù)據(jù)集,訓(xùn)練該論文所述的視頻生成模型。
據(jù)了解,Panda-70M 數(shù)據(jù)集相當(dāng)于一份地圖或索引文件,通過網(wǎng)址、視頻標(biāo)識(shí)符和時(shí)間戳定位特定 YouTube 視頻及片段。單條 YouTube 視頻可被拆分為多個(gè)片段,每個(gè)片段均作為獨(dú)立訓(xùn)練樣本。提取任意片段均需單獨(dú)訪問 YouTube 原視頻并截取指定段落,該過程中每獲取一個(gè)片段,就構(gòu)成一次獨(dú)立的規(guī)避行為。
原告方稱其內(nèi)容在該數(shù)據(jù)集中出現(xiàn)超 500 次,希望代表“所有處境相同的其他權(quán)利人”發(fā)起集體訴訟。
簡(jiǎn)言之,原告方認(rèn)為,即便該數(shù)據(jù)集僅提供視頻鏈接,但蘋果涉嫌繞過 YouTube 反爬蟲保護(hù)機(jī)制,下載并使用視頻原內(nèi)容訓(xùn)練其 AI 模型。
據(jù)此,原告方要求由陪審團(tuán)審理全部訴求,并提出以下主張:
1. 認(rèn)定本案為集體訴訟,指定原告及原告方律師代表全體集體訴訟成員;
2. 判定被告故意規(guī)避 YouTube 為保護(hù)原告及集體訴訟成員視聽內(nèi)容設(shè)立的版權(quán)保護(hù)系統(tǒng);
3. 依據(jù)《美國法典》第 17 編第 1203 條,主張法定賠償(單次侵權(quán)按法律最高限額賠付)、禁令救濟(jì)以及律師費(fèi)與訴訟成本;
4. 依據(jù)《美國法典》第 17 編、第 28 編及法院固有職權(quán),申請(qǐng)公平救濟(jì)措施以防范或制止原告及集體訴訟成員受版權(quán)保護(hù)內(nèi)容遭侵權(quán),包括頒布臨時(shí)及永久禁令,要求被告及其高管、代理人、雇員、律師、董事、繼承人、受讓人、被許可方,以及所有協(xié)同參與相關(guān)行為的主體,立即停止侵權(quán),或停止促成、協(xié)助、縱容、推動(dòng)、鼓勵(lì)、誘導(dǎo)、實(shí)質(zhì)性參與原告及集體訴訟成員依據(jù)聯(lián)邦法律享有的專屬權(quán)利侵權(quán)行為,附件 A、B、C 所列內(nèi)容亦包含在內(nèi);
5. 申請(qǐng)法院就對(duì)被告作出的所有金錢賠償判決,按法律最大限度判令支付判決前及判決后利息;
6. 申請(qǐng)法院裁定其他合理且正當(dāng)?shù)木葷?jì)措施。
訴訟還指出,蘋果的行為“不僅違法,而且是對(duì)內(nèi)容創(chuàng)作者群體的喪盡天良的攻擊,這些內(nèi)容被用來推動(dòng)價(jià)值數(shù)萬億美元的生成式人工智能產(chǎn)業(yè),卻沒有得到任何補(bǔ)償”。
除蘋果外,原告方還對(duì)亞馬遜與 OpenAI 提起集體訴訟,指控兩家公司同樣在自身 AI 模型訓(xùn)練過程中使用了 Panda-70M 數(shù)據(jù)集。
這起訴訟最鋒利的一點(diǎn)在于,它繞開了長期爭(zhēng)論的模糊地帶,比如合理使用,直接切入一個(gè)更明確的法律問題:是否“繞過技術(shù)保護(hù)措施”(anti-bot / DRM)。
原告援引《美國法典》第17編第1203條,本質(zhì)上是在說:不是你“用了我的內(nèi)容”,而是你“繞過反爬蟲保護(hù)機(jī)制去使用我的內(nèi)容”。
此外,版權(quán)的沖突早已從文本,升級(jí)到了視頻。相比文本,視頻可用于訓(xùn)練多模態(tài)模型,其商業(yè)轉(zhuǎn)化更直接,可直接變成廣告等內(nèi)容的生成。
訴訟中提到,每一個(gè)片段都需要單獨(dú)訪問原視頻并截取,這意味著不是一次性下載,而是持續(xù)、系統(tǒng)性的抓取行為,從法律視角看,更接近“規(guī)模化規(guī)避”。
這類訴訟真正的威脅,不在賠多少錢,而在于是否會(huì)觸發(fā)“訓(xùn)練數(shù)據(jù)合規(guī)化”的連鎖反應(yīng)。當(dāng)AI公司還在討論模型能力時(shí),創(chuàng)作者已經(jīng)把問題拉回原點(diǎn):這些能力,究竟建立在誰的內(nèi)容之上,以及是否付過代價(jià)。
來源: MacRumors
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.