圖書出版商尋求加入谷歌人工智能版權之爭
週四,主要圖書出版商阿歇特圖書集團和聖智學習集團提交動議,要求介入去年針對谷歌提起的集體訴訟。 該訴訟指控這家科技巨頭策劃了“歷史性的版權侵權”來構建其 Gemini 平台。
這抱怨加州聯邦法院提起的訴訟指控谷歌“選擇竊取原告和集體訴訟成員的大量內容來訓練其人工智能模型”,而不是獲得適當的許可,並在開發的“每個階段”都進行了蓄意侵權。
合併案件最初是已提交2023 年,一些作者提起集體訴訟,指控谷歌複製書籍來訓練其生成式人工智能模型,這是一起擬議的版權集體訴訟。
出版商聲稱,谷歌從盜版網站下載書籍,然後在人工智能訓練過程中反复複製這些書籍,首先複製到計算機內存中,然後復製到人工智能係統可以讀取的格式中,最後復製到每個新模型版本的訓練集中。
訴訟稱,谷歌的 C4 訓練數據集包含從 Z-LibrARy(一個盜版資源庫)抓取的受版權保護的作品,當局已從中查獲了 350 多個網站和域名。
出版商指出,這些書籍是從 b-ok.org(一個 Z-Library 域名,現在顯示聯邦查封通知)以及 OceanofPDF 和 WeLib(另一個擁有大量未經授權的受版權保護內容的網站)複製而來的。
起訴書指出,C4 數據集包含來自至少 28 個網站的作品,這些網站被美國政府認定為盜版和假冒產品的市場。
投訴中寫道:“版權符號 (©) 在 C4 數據集中出現了超過 2 億次”,並指出谷歌涉嫌排除“政策聲明”和“使用條款”警告,但卻包含了“大量受版權保護的作品、盜版作品以及從付費牆後獲取的作品”。
出版商指控谷歌從 Scribd.com 等付費圖書館複製作品,規避了合法的許可協議。
當被問及這種做法時,非營利數據集提供商 Common Crawl 據稱採取了“責怪受害者”的心態,宣稱“如果你不想讓你的內容出現在互聯網上,你就不應該把它放到互聯網上。”
訴訟稱,Gemini 現在生產的產品“替代了受版權保護的作品”,包括逐字複製品、詳細摘要和“抄襲原創作品創意元素的仿製品”。
解密已與穀歌和出版商的法律顧問取得聯繫。
人工智能與出版商
谷歌同時應對反壟斷訴訟彭斯克媒體公司就其人工智能概述功能提出抗議,這家科技巨頭聲稱,顯示人工智能生成的摘要構成“合法的產品改進,而不是反競爭行為”。
出版商尋求法定賠償、禁止進一步侵權的禁令,以及要求谷歌銷毀所有未經授權的作品副本並披露哪些書籍被用於訓練 Gemini 的命令。
此次介入動議是在一系列作者於2023年對人工智能公司提起的版權訴訟之後提出的,這些訴訟中,聯邦法官做出了一些部分勝訴的判決。 元和人類學法院裁定,他們使用受版權保護的書籍來訓練模型屬於版權法規定的合理使用,但批評這些公司保留了永久的盜版書籍庫。