Anthropic 被控在歌詞訴訟中引用人工智能“幻覺”
亞馬遜支持的公司 人擇的一名人工智能專家被指控在一份法庭文件中引用了一篇偽造的學術文章,該文件旨在為該公司辯護,反對該公司未經許可使用受版權保護的歌詞訓練其人工智能模型的指控。
該文件由 AnthrOPic 數據科學家 Olivia Chen 提交,是該公司對環球音樂集團、Concord、ABKCO 和其他主要出版商提起的 7500 萬美元訴訟的法律回應的一部分。
這 出版商聲稱在 2023 年的訴訟中,AnthroPIc 非法使用了數百首歌曲的歌詞來訓練其 Claude 語言模型,其中包括碧昂絲、滾石樂隊和海灘男孩的歌曲。
陳氏宣言引用了一篇文章美國統計學家旨在支持 AnthroPic 的論點,即克勞德只在極少數特定條件下複製受版權保護的歌詞,根據路透社 報告.
在周二於聖何塞舉行的聽證會上,原告律師馬特·奧本海姆 (Matt OpPEnheim) 稱該引文是“完全捏造的”,但他表示,他不相信陳故意編造,只是她很可能使用克勞德本身來生成來源。
Anthropic 的律師 Sy Damle 告訴法庭,陳的錯誤似乎是錯誤引用,而不是捏造,同時批評原告在訴訟程序後期才提出這個問題。
每路透社美國地方法院法官蘇珊·範庫倫 (Susan van Keulen) 表示,這個問題“非常嚴重”,並指出“漏開傳票和人工智能產生的幻覺之間存在著天壤之別”。
她拒絕了立即質詢陳的請求,但命令 Anthropic 在周四之前正式回應這一指控。
Anthropic 沒有立即回應解密請求評論。
法庭上的人類學
針對 Anthropic 的訴訟於 2023 年 10 月提起,原告指控 Anthropic 的 Claude 模型接受了大量受版權保護的歌詞的訓練,並根據需求進行複制。
他們要求賠償損失、公開訓練集並銷毀侵權內容。
Anthropic 回應2024 年 1 月,否認其係統旨在輸出受版權保護的歌詞。
報告稱,任何此類複製行為都是“罕見的錯誤”,並指責出版商沒有提供任何證據證明普通用戶遇到了侵權內容。
2024 年 8 月,該公司受到另一起訴訟這次是來自作家安德里亞·巴茨 (Andrea Bartz)、查爾斯·格雷伯 (Charles Graeber) 和柯克·華萊士·約翰遜 (Kirk WALlace Johnson),他們指責 Anthropic 使用盜版書籍訓練克勞德。
GenAI 和版權
該案件是針對生成人工智能公司日益增長的強烈反對的一部分,這些公司被指控未經同意將受版權保護的材料輸入訓練數據集。
OpENAI 面臨多重訴訟來自喜劇演員莎拉·西爾弗曼、作家協會和《紐約時報》指控該公司未經許可或授權使用受版權保護的書籍和文章來訓練其 GPT 模型。
元被命名為類似的訴訟原告聲稱其 LLaMA 模型是使用來自盜版數據集的未經授權的文學作品進行訓練的。
與此同時,今年 3 月,OpenAI 和谷歌敦促特朗普政府放鬆對人工智能訓練的版權限制,並在即將出台的美國“人工智能行動計劃”的正式提案中稱其為創新的障礙。
在英國,一項允許人工智能公司在未經許可的情況下使用受版權保護作品的政府法案本周遭遇阻礙,此前上議院支持一項修正案要求人工智能公司披露其模型中使用的受版權保護的材料。