Reddit poursuit Perplexity et d'autres pour grattage de données afin de former le système d'IA

Reddit a poursuivi mercredi la startup d’IA Perplexity et trois sociétés de grattage de données, alléguant qu’elles avaient collecté et revendu des publications Reddit sans autorisation.

Selon la plainte déposée devant le tribunal fédéral de Manhattan, Oxylabs, AWMProxy et SerpApi ont récupéré les données Reddit via les résultats de recherche Google, et Perplexity les a achetées auprès d’au moins l’un des fournisseurs.

Le procès affirme que les accusés ont masqué leur identité, caché leur emplacement et déguisé des web scrapers pour contourner les mesures de sécurité de Reddit. Reddit affirme avoir surpris Perplexity « en flagrant délit » en utilisant des marqueurs numériques pour confirmer que la startup d’IA accédait au contenu récupéré, et que l’entreprise a ignoré un avertissement de cesser et de s’abstenir concernant l’utilisation commerciale de ses données.

« En fait, les citations de Perplexity sur Reddit ont été multipliées par quarante après que Reddit lui a dit d’arrêter », indique la plainte. « En tant que client annoncé de SerpApi, il ne fait aucun doute que Perplexity obtient ses données Reddit illicites. »

Roxy Young sur l'approche à trois niveaux de Reddit pour un engagement authentique.

Le contenu de Reddit est devenu un atout recherché pour les entreprises d’IA, qui s’appuient sur des ensembles de données massifs pour former des modèles et obtenir des résultats pertinents. La société a concédé ses données sous licence à OpenAI et à Google, mais engage des poursuites judiciaires contre les entreprises qui, selon elle, utilisent ses actifs sans autorisation, à la suite d’un procès similaire contre Anthropic plus tôt cette année.

« Les sociétés d’IA sont engagées dans une course aux armements pour un contenu humain de qualité, et cette pression a alimenté une économie de ‘blanchiment de données’ à l’échelle industrielle », a déclaré Ben Lee, directeur juridique de Reddit, dans un communiqué. « Les accusés Oxylabs, AWMProxy et SerpApi, allant d’un scraper lituanien à un ancien botnet russe, sont des exemples classiques. Perplexity est un client volontaire d’au moins un de ces scrapers, choisissant d’acheter des données volées plutôt que de conclure un accord légal avec Reddit lui-même. «

SerpApi et Oxylabs ont tous deux pris connaissance du procès grâce à la demande de commentaires d’ADWEEK et ont nié tout acte répréhensible.

« Nous sommes fortement en désaccord avec les allégations de Reddit et avons l’intention de nous défendre vigoureusement devant les tribunaux », a déclaré Ryan Schafer, directeur du succès client chez SerpApi.

Denas Grybauskas, directeur de la gouvernance et de la stratégie d’Oxylabs, a également envoyé une déclaration : « Oxylabs a toujours été et continuera d’être un pionnier et un leader de l’industrie dans la collecte de données publiques, et elle n’hésitera pas à se défendre contre ces allégations.

Jeanne Michelet

Jeanne est une journaliste de 27 ans qui se passionne pour le cinéma et la culture pop. Elle adore dévorer des séries Netflix et se tenir au courant des dernières news sur les célébrités du moment. Jeanne a toujours été intéressée par l’écriture, et elle aime travailler comme journaliste car cela lui permet de partager sa passion pour la narration avec les autres.

Pages: 1 2