Reddit 起訴 Perplexity AI,指控其“工業規模”數據盜竊
社交媒體平台 Reddit 週三在聯邦法院起訴 perplexity AI,指控這家人工智能公司及其數據合作夥伴策劃了一項“工業規模”的計劃來抓取該平台的用戶生成內容。
Reddit 聲稱其他被告:SerpAPI、Oxylabs 和 AWM Proxy 開發並銷售專門用於破壞保護其內容的安全措施的工具,從而能夠從搜索結果中大規模抓取 Reddit 數據。
據稱,這些工具的目的是繞過兩層保護:首先,逃避 Reddit 自己的反抓取系統;其次,繞過谷歌的控制,直接從其搜索引擎結果中提取 Reddit 內容。
這些數據公司以“數據抓取服務提供商”的身份運營,並“繞過谷歌的技術控制措施,在未經授權的情況下自動訪問幾乎三十億搜索引擎結果頁面”,訴訟讀。
Reddit 聲稱,即使在 2024 年 5 月收到停止侵權函後,PErplexity 仍將這三家公司的數據用於其答案引擎。
Perplexity 的一位代表做出了回應並分享了完整回复,發佈在 Reddit 上。
Perplexity 故意在 Reddit 上發布了其回應,“以說明一個簡單的觀點:這是一個任何人都可以訪問的公共 Reddit 鏈接,但根據 Reddit 訴訟的邏輯,如果你以任何方式引用它,他們也可能會起訴你,”該代表告訴解密.
Perplexity 將這起訴訟描述為“當公共數據成為上市公司商業模式的重要組成部分時會發生的悲慘例子”。
“Reddit 認為這是他們的權利。但這與開放的互聯網背道而馳,”Perplexity 表示。
SerpAPi 的一位代表告訴解密他們沒有收到 Reddit 就此事提供的任何“溝通或服務”,並補充說他們“強烈反對 Reddit 的指控”,並打算尋求法律途徑。
Oxylabs 首席治理和戰略官 Denas GrybausKAS 表示:“任何公司都不應聲稱擁有不屬於自己的公共數據。這可能只是為了以高價出售相同的公共數據。”解密在一封電子郵件聲明中。
格里包斯卡斯表示,Reddit 同樣“沒有嘗試與 OxylABs 對話”。
解密已聯繫 Reddit、Google 和 AWM Proxy 徵求意見,如果他們回應,我們將更新本文。
法律糾紛
視頻搜索和內容智能平台 Oriane 的公共事務律師兼戰略合作夥伴總監 Andrew Rossow 表示,在這種情況下,法院首先需要審查 Reddit 等平台的服務條款是否“明確涉及人工智能訓練、數據抓取和商業使用”。 解密.
羅索解釋說,如果用戶同意“授予平台對其內容的廣泛、永久、免版稅許可”的條款,該許可“通常會管理用戶與平台之間的關係”。
但他補充說,它不會“自動授予人工智能公司許可”來做同樣的事情,除非條款允許該平台“為此目的再授權或出售數據”。
他解釋說,法院必須“區分用戶對其表達(帖子文本)的版權和對內容進行數據挖掘(提取模式、事實和語言模型)的用途”。
儘管如此,羅索認為,LLM(大語言模型)背後的所謂“知識”是“數百萬用戶的時間、精力和創造性表達的產物”。
Rossow 認為:“將人類生成的內容視為免費、原始、無差別的資源是一種勞動剝削,會貶低在線貢獻的價值。”他補充說,人工智能公司需要“尊重數字公民身份和社區規範”,因為這些是“他們所攝取的數字公共空間的隱性和顯性規則”。