BTCC / BTCC Square / CryptopolitanDE /
Reddit enthüllt: Perplexity beim Daten-Scraping auf frischer Tat ertappt

Reddit enthüllt: Perplexity beim Daten-Scraping auf frischer Tat ertappt

Published:
2025-10-26 00:10:04
16
2

Reddit behauptet, dass Perplexität beim Scraping von Daten auf frischer Tat ertappt wurde

Die KI-Branche steht Kopf: Reddit-User decken auf, dass Perplexity AI offenbar Daten ohne Erlaubnis gescrapt hat. Ein klassischer Fall von 'Move fast and break things' – bis die Regulierungsbehörden zuschlagen.

Wie ein digitaler Detektiv hat die Community Beweise für das Vorgehen gesammelt. Die Enthüllung könnte rechtliche Konsequenzen nach sich ziehen – und wirft Fragen über die Ethik im KI-Wettrennen auf.

Während die Tech-Giganten sich in der Grauzone bewegen, warten Crypto-Investoren schon auf den nächsten Skandal, der den Markt zum Beben bringt. Denn wo Daten fließen, folgen früher oder später auch Tokenisierungs-Fantasien.

Reddit-Falle deckt mutmaßlichen Datendiebstahl auf  

Reddit hat Klage gegen Perplexity eingereicht, ein 20 Milliarden Dollar schweres KI-Unternehmen, und wirft dem Unternehmen vor, über seine Plattform illegal Daten zu sammeln. Laut Gerichtsdokumenten, die am Mittwoch bei einem Bundesgericht in Manhattan eingereicht wurden, erklärte Reddit, Perplexity habe die Anweisung, seine Inhalte nicht zu scrapen, ignoriert und weiterhin Reddit-Daten verwendet, um KI-Antworten zu generieren.

In der Klage heißt es, Reddit habe Perplexity ausdrücklich daran gehindert, seine Daten zu sammeln. Die „Antwortmaschine“ des KI-Unternehmens lieferte jedoch weiterhin Ergebnisse mit Reddit-Inhalten. „Der Anstieg war somatic , dass ein externer Beobachter die Hypothese aufstellte, er Sei auf den Lizenzvertrag von Perplexity mit Reddit zurückzuführen“, heißt es in der Klage. „In Wahrheit besteht keine Lizenz zwischen Perplexity und Reddit.“

Um seinen Verdacht zu beweisen, entwickelte Reddit einen raffinierten digitalen Test. Es erstellte einen „Fallen“-Beitrag, der nur von der Google-Suchmaschine gefunden werden konnte. Google hat mit Reddit einen legitimen Lizenzvertrag für Inhalte abgeschlossen, sodass Unternehmen ohne einen solchen Vertrag keinen Zugriff auf den Beitrag haben sollten.

Das Unternehmen beschrieb es als das Online-Äquivalent einer „markierten Rechnung“. Wenn das System von Perplexity den Inhalt dieses versteckten Posts reproduzieren würde, wüsste Reddit, dass es seine Sicherheitsvorkehrungen umgangen hat, möglicherweise indem es Daten über die Suchergebnisse von Google, die sogenannten SERPs, abgerufen hat.

Innerhalb weniger Stunden tauchte der angeblich private Testbeitrag in den Antworten auf, die vom KI-Tool von Perplexity generiert wurden. 

„Perplexity hätte diesen Reddit-Inhalt nur dann erhalten und in seiner ‚Antwortmaschine‘ verwenden können, wenn es und/oder seine Mitangeklagten die SERPs von Google durchsucht hätten“, heißt es in der Klage.

Reddit nannte in der Klage drei Data-Scraping-Unternehmen: Oxylabs UAB, AWM Proxy und SerpApi. Ihnen wurde vorgeworfen, Perplexity dabei geholfen zu haben, unbefugten Zugriff auf Reddit-Beiträge zu erlangen, oder Reddit-Daten an Perplexity verkauft zu haben.

Reddits Vorwürfe zurückgewiesen 

die Vorwürfe von Reddit zurückgewiesen . Unternehmenssprecher Jesse Dwyer erklärte, Perplexity werde „keine Bedrohung der Offenheit und des öffentlichen Interesses tolerieren“. Das Unternehmen erklärte nach Einreichung der Klage in einem Reddit-Beitrag außerdem, dass es „keine KI-Modelle anhand von Inhalten trainiere“.

Auch Vertreter der anderen in der Klage genannten Unternehmen gaben Erklärungen ab. Ein Sprecher von SerpApi erklärte, das Unternehmen werde sich vor Gericht „energisch verteidigen“. Denas Grybauskas, Chief Governance and Strategy Officer von Oxylabs, äußerte sich schockiert und enttäuscht. Oxylabs SEI „schon immer ein Pionier und Branchenführer in der öffentlichen Datenerfassung gewesen und werde dies auch weiterhin bleiben“.

Im August gab Cloudflare, ein Internet-Infrastrukturunternehmen, bekannt, einen ähnlichen Test durchgeführt zu haben, um zu prüfen, ob Perplexity die Regeln für das Web-Crawling einhält. Cloudflare gab an, Seiten mit Code erstellt zu haben, der den Bots von Perplexity den Zugriff auf diese Seiten untersagte. Dennoch stellte Cloudflare fest, dass die Crawler des KI-Unternehmens die gesperrten Seiten besuchten.

Matthew Prince, CEO von Cloudflare, machte Schlagzeilen, indem er das Verhalten von Perplexity mit dem von „nordkoreanischen Hackern“ verglich. 

Einige angeblich „seriöse“ KI-Unternehmen agieren eher wie nordkoreanische Hacker. Es ist an der Zeit, sie beim Namen zu nennen, bloßzustellen und zu blockieren. https://t.co/vqMzGRHZPf

— Matthew Prince 🌥 (@eastdakota) 4. August 2025

„Einige angeblich ‚seriöse‘ KI-Unternehmen verhalten sich eher wie nordkoreanische Hacker“, schrieb Prince auf X. „Es ist Zeit, sie beim Namen zu nennen, bloßzustellen und sie strikt zu blockieren.“ In der Klage von Reddit wurden Prince‘ Bemerkungen als Teil der Argumentation zitiert.

Möchten Sie Ihr Projekt den führenden Köpfen der Krypto-Welt vorstellen? Stellen Sie es in unserem nächsten Branchenbericht vor, in dem Daten auf Wirkung treffen.

|Square

Holen Sie sich die BTCC-App und beginnen Sie Ihre Krypto-Reise

Starten Sie noch heute Scannen Sie, um Teil von mehr als 100 Millionen Nutzern zu werden

Haftungsausschluss: Die auf dieser Website veröffentlichten Artikel stammen aus öffentlichen Netzwerken und dienen ausschließlich der Übermittlung von Brancheninformationen. Sie stellen keine offizielle Position von BTCC dar. Die Urheberrechte verbleiben bei den jeweiligen Autoren. Sollten Sie Urheberrechtsverletzungen oder fragwürdige Inhalte feststellen, kontaktieren Sie uns bitte unter [email protected], damit wir dies gesetzeskonform behandeln können. BTCC übernimmt keine ausdrückliche oder stillschweigende Garantie für die Richtigkeit, Aktualität oder Vollständigkeit der wiedergegebenen Informationen und lehnt jede Haftung für direkte oder indirekte Schäden ab, die aus der Nutzung dieser Informationen entstehen. Alle Inhalte dienen lediglich als Referenz für Branchenrecherchen und stellen keine Anlage-, Rechts- oder Geschäftsempfehlung dar. BTCC übernimmt keine Haftung für Handlungen, die auf Grundlage dieser Informationen vorgenommen werden.