一名圖書作者指控 Meta 非法下載大量盜版電子書,用于訓(xùn)練其 AI 模型。
泄露的電子郵件表明,Meta 承認(rèn)下載了有爭(zhēng)議的 LibGen 數(shù)據(jù)集,其中包含數(shù)千萬(wàn)本盜版書籍。
根據(jù)法庭文件,Meta 通過安娜檔案(Annas Archive)下載了至少 81.7TB 的數(shù)據(jù),其中 35.7TB 來自 Z-Library 和 LibGen。Meta 還被指控從 LibGen 額外下載了 80.6TB 的數(shù)據(jù)。
作者聲稱,Meta 的行為構(gòu)成了非法下載,而這些數(shù)字可能只是其盜版行為的一小部分。
作者估計(jì),這些盜版電子書庫(kù)可能僅占 Meta 盜版版權(quán)作品總量的 0.008%,表明其盜版的規(guī)模可能遠(yuǎn)超目前所揭露的。
電子郵件還顯示,Meta 員工意識(shí)到其行為的法律風(fēng)險(xiǎn)。2023 年 4 月,Meta 的研究工程師尼古拉·巴什科夫在郵件中表示:“用公司的筆記本電腦下載 BT 感覺不妥?!?/p>
到 2023 年 9 月,巴什科夫加大了抗議力度,并咨詢了法律團(tuán)隊(duì)。他指出,使用 Torrent 意味著對(duì)文件進(jìn)行“播種”,即對(duì)外共享內(nèi)容,在法律上是不允許的。
但 Meta 仍決定繼續(xù),并試圖通過將數(shù)據(jù)集下載到非 Meta 服務(wù)器來避免被追溯的風(fēng)險(xiǎn)。
(舉報(bào))