Reddit fa causa antropico rispetto ai dati di AI raschiatura | Intelligenza-Artificiale

Reddit sta accusando l'antropico di costruire i suoi modelli Claude AI sul retro degli utenti di Reddit, senza permesso e senza pagarlo.

Chiunque usi Reddit, anche un bot che strappa Web, accetta l'accordo utente del sito. Tale accordo è chiaro: non puoi semplicemente prendere i contenuti dal sito e utilizzarli per i tuoi prodotti commerciali senza un accordo scritto. Reddit afferma che i robot di Antropic hanno fatto esattamente questo per anni, raschiando enormi quantità di conversazioni e posti per addestrare e migliorare Claude.

Ciò che rende questa causa particolarmente piccante è il modo in cui va dopo la reputazione di Antropi. Antropico ha lavorato duramente per marchiarsi come la società di intelligenza artificiale etica e affidabile, il “cavaliere bianco” del settore. La causa, tuttavia, chiama queste affermazioni altro che “espedienti di marketing vuoti”.

Ad esempio, Reddit indica una dichiarazione del luglio 2024 in cui Antropico ha affermato di aver impedito ai suoi robot di strisciare Reddit. La causa afferma che questo era “falso”, sostenendo che i suoi tronchi hanno catturato i robot di Antropi cercando di accedere al sito più di centomila volte nei mesi seguenti.

Ma non si tratta solo di battibecchi aziendali; coinvolge direttamente la privacy dell'utente. Quando elimini un post o un commento su Reddit, ti aspetti che se ne vada. Reddit ha accordi ufficiali di licenza con altri grandi giocatori di intelligenza artificiale come Google e apertoE queste offerte includono misure tecniche per garantire che quando un utente elimina il contenuto, lo fa anche l'azienda AI.

Secondo la causa di Reddit, Antropic non ha tale accordo e ha rifiutato di inserirne uno. Ciò significa che se la loro intelligenza artificiale è stata addestrata su un post che in seguito ha eliminato, quel contenuto potrebbe ancora essere cotto nella base di conoscenza di Claude, ignorando efficacemente la tua scelta di rimuoverlo. La causa include anche uno screenshot in cui Claude stesso ammette che non ha un modo reale di sapere se i dati di Reddit su cui è stato addestrato sia stato successivamente eliminato da un utente:

Lo screenshot da un tribunale che presentava la causa dell'antropica Claude ammette di non sapere se i dati di Reddit raschiati sono stati successivamente eliminati.

Allora, cosa vuole Reddit? Non si tratta solo di denaro, anche se stanno chiedendo danni per cose come un aumento dei costi del server e le spese di licenza persa. Stanno chiedendo al tribunale un'ingiunzione di costringere Antropico a smettere di utilizzare immediatamente qualsiasi dati Reddit.

Inoltre, Reddit vuole vietare l'antropico di vendere o licenza qualsiasi prodotto creato utilizzando tali dati. Ciò significa che stanno chiedendo a un giudice di togliere efficacemente Claude dal mercato.

Questo caso forza una domanda difficile: essere “disponibile al pubblico” su Internet il contenuto è gratuito per qualsiasi società prendere e monetizzare? Reddit sta sostenendo una società “no” e il risultato potrebbe cambiare le regole per il modo in cui l'IA è sviluppata da qui in poi.

(Foto di Brett Jordan)

Vedi anche: Affrontare le allucinazioni: MIT Spout insegna all'IA ad ammettere quando è all'oscuro

Vuoi saperne di più sull'intelligenza artificiale e sui big da parte dei leader del settore? Guardare AI e Big Data Expo si svolge ad Amsterdam, in California e a Londra. L'evento completo è co-localizzato con altri eventi principali tra cui Conferenza di automazione intelligente, Blockx, Settimana di trasformazione digitaleE Cyber Security & Cloud Expo.

Esplora altri prossimi eventi tecnologici aziendali e webinar alimentati da TechForge Qui.

Fonte: www.artificialintelligence-news.com