Anthropic 在 AI 訓練數據版權案中取得部分勝利
人工智能公司 AnthrOPic 在有關人工智能公司如何使用受版權保護的材料來訓練其模型的版權糾紛中贏得了關鍵的法律勝利,但這場鬥爭遠未結束。
美國地區法官威廉·阿爾蘇普 (William Alsup) 發現 AnthroPIc 使用受版權保護的書籍來訓練其人工智能聊天機器人克勞德根據美國版權法,這屬於“合理使用”,裁決週一晚些時候。
美國地區法官威廉·阿爾蘇普 (William Alsup) 在裁決中表示:“就像任何渴望成為作家的讀者一樣,AnthroPic 的法學碩士課程的培訓目的不是為了赶超、複製或取代作品,而是為了突破困境,創造出一些不同的東西。”
但法官還指責這家由亞馬遜和谷歌支持的公司建立並維護了一個龐大的盜版書籍“中央圖書館”,稱其這一行為明顯侵犯了版權。
版權法中“無豁免”
該案於去年 8 月由作家 Andrea Bartz、Charles Graeber 和 Kirk WALlace Johnson 提起,被指控人類使用從 Library Genesis 和 Pirate Library Mirror 等臭名昭著的網站下載的數百萬本盜版書籍來構建 Claude。
該訴訟尋求賠償和永久禁令,指控 Anthropic“通過竊取數十萬本受版權保護的書籍建立了價值數十億美元的業務”,以訓練其人工智能模型系列 Claude。
阿爾蘇普表示,人工智能訓練可以“極具變革性”,並指出克勞德的成果並不是複製或重新整理作者的作品,而是生成與原文“正交”的新文本。
法庭記錄顯示,Anthropic 下載了至少 700 萬本盜版書籍,包括每位作者的作品副本,以組建其圖書館。
內部電子郵件顯示,Anthropic 的聯合創始人試圖避免授權書籍的“法律/實踐/商業障礙”,而員工們則將目標描述為創建一個“世界上所有書籍”的數字收藏,並“永久”保存。
“然而,版權法並沒有為人工智能公司提供任何豁免,”阿爾蘇普說,並指出,如果允許維護一個永久的被盜作品庫——即使只有一部分用於培訓——也會“摧毀學術出版市場”。
威廉·阿爾蘇普 (William Alsup) 法官的裁決是美國聯邦法院首次做出的實質性裁決,該裁決直接分析並適用合理使用原則,具體針對使用受版權保護的材料來訓練生成式人工智能模型。
法院區分了直接用於人工智能訓練的副本(被視為合理使用)和保留的盜版副本,現在將受到進一步的法律訴訟,包括潛在的損害賠償。
人工智能版權案件
雖然已經提起了多起訴訟(包括針對 OpENAI、元 等公司的備受矚目的案件),但這些案件仍處於早期階段,駁回動議尚待審理或調查仍在進行中。
OPEnAI 和 Meta兩家公司都面臨著來自作者團體的訴訟,指控他們的版權作品在未經同意的情況下被利用來訓練 ChatGPT 和 LLaMA 等大型語言模型。
《紐約時報》起訴OpenAI和微軟2023 年,指控他們未經許可使用數百萬份《紐約時報》文章來開發人工智能工具。
Reddit 最近還起訴了 Anthropic,指控其破壞了 Reddit 平台儘管聲稱已經停止訓練,但還是進行了超過 100,000 次訓練克勞德。