在人工智能引發的版權風暴中,學術出版界也正式下場。近日,旗下擁有《柳葉刀》、《細胞》等刊物的科學出版巨頭愛思唯爾(Elsevier)與其它四家出版社聯合起訴Meta公司及其CEO馬克·扎克伯格,指控其在開發AI大模型過程中,未經授權復制和使用大量受版權保護的書籍、教材和學術論文。
這是大型科學出版商首次就AI訓練數據問題起訴科技公司。其他起訴者包括阿歇特出版集團(Hachette)、麥克米倫(Macmillan)、圣智學習(Cengage Learning)、麥格勞·希爾(McGraw Hill)四家出版集團以及一名暢銷書作家斯科特·圖羅(Scott Turow)。
這些原告指控Meta在開發“Llama”AI大語言模型時,進行了“歷史上最嚴重的版權侵權行為之一”。起訴書中指出,為了在AI軍備競賽中搶占先機,Meta不僅使用了包含數十億網頁的網絡抓取數據集,還從Sci-Hub、LibGen等備受爭議的盜版網站上下載并傳播了數百萬本受版權保護的書籍和付費學術期刊文章。此外,Meta還被指控刪除了作品中的版權聲明與作者信息,以掩蓋數據來源。
原告方披露的Meta內部郵件顯示,Meta曾考慮過與出版商簽署合法的授權協議,但在扎克伯格的主導下,公司最終放棄了談判,轉而直接使用盜版數據庫。盡管內部員工曾對其中的法律和倫理風險提出過明確擔憂,相關計劃依然被強行推進。
《自然》雜志在今天的一篇報道中指出,對于AI公司而言,學術文獻和研究論文作為高質量的語料,能夠極大提升大模型在科學領域的準確性。然而,學術界對此的態度卻頗為微妙。有研究人員認為,許多學者其實并不排斥自己的論文被用于訓練AI,他們更在意的是生成式AI在輸出時是否剽竊了作者的寫作風格,或者無法提供正確的引用信息。
與此同時,科學出版商在這場博弈中正展現出雙重姿態——一方面在法庭上強硬維權,另一方面又在私下與科技巨頭達成利潤豐厚的數據許可協議。《自然》援引一名研究者的觀點指出,這種限于出版商與大型AI公司之間的獨家交易,可能會進一步壟斷數據資源,導致致力于構建開源模型的開發者和獨立科研人員難以獲取高質量的論文。
面對出版商的猛烈攻勢,Meta發言人予以否認,并表示將積極應對訴訟。Meta的核心辯護理由依然是美國版權法中的“合理使用”原則,強調使用受版權保護的材料訓練AI屬于“變革性創新”。
近年來,圍繞AI模型訓練的法律爭議已成為科技界的常態。2025年,AI公司Anthropic就曾為平息作家的集體版權訴訟,同意支付高達15億美元達成和解。
Meta在2025年6月與作家理查德·卡德雷等人的官司中獲得階段性勝利。當時美國法院裁定,由于原告未能充分證明AI生成的內容對原創作品市場造成了實質性損害,因此Meta的訓練行為暫落入“合理使用”的范疇。但判決也強調,強調若未來能證明AI對原創市場形成替代效應,侵權訴求依然成立。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.