Victoire juridique pour Anthropic : un juge américain valide l’utilisation de livres protégés par le droit d’auteur

Anthropic, la startup d'IA qui défie les géants de la tech, vient de marquer un point crucial. Un tribunal fédéral américain a statué que son utilisation de livres sous copyright ne constitue pas une violation de la loi. Une décision qui pourrait faire jurisprudence dans l'univers tumultueux de l'apprentissage automatique.
Les éditeurs traditionnels grinceront des dents, mais les investisseurs en tech souriront – surtout ceux qui parient sur le mépris des règles comme stratégie de croissance. Après tout, en matière de droit d'auteur, l'innovation a toujours eu un train d'avance sur la régulation.
Cette décision intervient alors que le débat sur l'utilisation des données protégées pour entraîner les IA fait rage. Anthropic prouve une fois de plus que dans la course à l'IA, mieux vaut demander pardon que permission. Les actionnaires apprécieront, les auteurs un peu moins.
Et comme toujours, les seuls véritables perdants dans cette histoire sont probablement les créateurs originaux – mais qui compte vraiment les dollars perdus quand les valorisations des startups atteignent des sommets ?
Mais anthropic a également dépassé les limites juridiques
La décision est venue lundi tard du juge de district américain William Alsup à San Francisco, qui a constaté que la formation d'Anthropic sur son modèle d'IA en utilisant les œuvres des auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson qualifie une utilisation équitable.
Cette doctrine, qui permet une utilisation limitée du contenu protégé par le droit d'auteur sans autorisation, a joué un rôle central dans la décision d'Alsup, l'un des premiers à s'attaquer à une utilisation équitable à l'ère de l'IA générative.
"Comme tout lecteur qui aspire à être écrivain, les modèles d'Anthropic (grands modèles de langue) formés sur les œuvres de ne pas courir à l'avance et de les reproduire ou de les supplanter - mais pour tourner un corner dur et créer quelque chose de différent", a écrit Alsup.
Alors que Alsup s'est rangé du côté de l'anthropic concernant son utilisation des livres pour la formation de l'IA, il était clair que la société avait dépassé les limites juridiques lorsqu'elle a stocké plus de 7 millions de titres piratés dans ce qu'il a appelé une «bibliothèque centrale». Cela, a déclaré le juge, n'a pas connu une utilisation équitable.
Un procès est prévu pour décembre pour déterminer quels dommages, le cas échéant, Anthropic doit aux auteurs. En vertu de la loi sur le droit d'auteur américain, les dommages-intérêts pour violation volontaire peuvent atteindre 150 000 $ par travail.
Anthropic n'a pas encore commenté publiquement la décision, mais le résultat divise l'affaire en deux: la partie d'entraînement est protégée, et le stockage ne l'est pas.
Le cas anthropique pourrait-il signaler une victoire pour l'industrie de l'IA?
L'affaire fait partie d'une vague de poursuites des auteurs et des médias ciblant des sociétés comme Openai, Meta et Microsoft sur la façon dont ils construisent leurs systèmes d'IA. La question au cœur: ces entreprises devraient-elles être autorisées à utiliser du matériel protégé par le droit d'auteur, souvent sans consentement, à développer des outils qui, à certains égards, rivalisent avec les créateurs d'origine?
La décision d'Alsup donne un coup de pouce aux développeurs de l'IA, dont beaucoup soutiennent que leurs modèles produisent un nouveau contenu transformateur et ne devraient pas être obligés de payer tous les titulaires de droit d'auteur dont le travail a été utilisé en cours de route.
"Comme tout lecteur espérant devenir écrivain, les modèles d'Anthropic ont été formés sur ces livres pour ne pas les copier, mais pour créer quelque chose de complètement nouveau."
Alsup.
Anthropic avait déclaré au tribunal que la copie des livres était essentielle pour étudier les styles d'écriture et les éléments non culpytables ex-trac, comme la structure et le ton, pour aider son IA à créer un nouveau contenu.
L'entreprise a fait valoir que ce type d'apprentissage renforce réellement la créativité humaine, ce que la loi sur le droit d'auteur est censée encourager.
Mais Alsup a également critiqué anthropic pour la collecte de copies numériques piratées des livres. Bien que l'entreprise ait insisté sur la source du matériel, ALSUP était en désaccord surtronGly.
Dans sa décision, il a déclaré: "Cette ordonnance doute que tout incapacité accusée puisse jamais répondre à son fardeau d'expliquer pourquoi le téléchargement des copies source à partir de sites de pirate qu'il aurait pu acheter ou autrement accessibles était lui-même raisonnablement nécessaire à toute utilisation équitable ultérieure."
Essentiellement, bien que l'utilisation finale puisse être protégée, la façon dont Anthropic a mis la main sur le matériau ne l'était pas. Cette distinction pourrait façonner la façon dont les entreprises d'IA recueillent des données de formation à l'avenir et potentiellement encourager l'approvisionnement de données plus éthique, ou du moins légal.
Avec plus de poursuites en droit d'auteur aligné contre les entreprises de l'IA, cette décision pourrait établir une précédente dent . L'essai de décembre décidera désormais de savoir si l'approche d'Anthropic pour stocker le contenu mérite des sanctions financières et, dans l'affirmative, à quel point elles devraient être abruptes.
Clai de différence de fil : l'outil secret que les projets de crypto utilisent pour obtenir une couverture médiatique garantie