Azienda

Pubblicato

Annuncio del nostro nuovo metodo di filigrana per testo e video generati dall'intelligenza artificiale e di come stiamo portando SynthID nei principali prodotti Google

Gli strumenti di intelligenza artificiale generativa – e le grandi tecnologie di modello linguistico dietro di essi – hanno catturato l’immaginazione del pubblico. Dall'aiuto nelle attività lavorative al miglioramento della creatività, questi strumenti stanno rapidamente diventando parte di prodotti utilizzati da milioni di persone nella loro vita quotidiana.

Queste tecnologie possono essere estremamente vantaggiose, ma man mano che diventano sempre più popolari, aumenta il rischio che le persone causino danni accidentali o intenzionali, come la diffusione di disinformazione e phishing, se i contenuti generati dall’intelligenza artificiale non vengono correttamente identificati. Ecco perché l'anno scorso abbiamo lanciato SynthIDil nostro nuovo toolkit digitale per il watermarking dei contenuti generati dall'intelligenza artificiale.

Oggi ci stiamo espandendo Le capacità di SynthID per applicare la filigrana al testo generato dall'intelligenza artificiale nel file App Gemini ed esperienza webe ingresso video Vedoil nostro modello video generativo più capace.

SynthID per testo è progettato per integrare i modelli di generazione di testo AI più ampiamente disponibili e per l'implementazione su larga scala, mentre SynthID per video si basa sul nostro metodo di filigrana di immagini e audio per includere tutti i fotogrammi nei video generati. Questo metodo innovativo incorpora una filigrana impercettibile senza influire sulla qualità, accuratezza, creatività o velocità del processo di generazione di testo o video.

SynthID non è la soluzione miracolosa per identificare i contenuti generati dall'intelligenza artificiale, ma è un elemento importante per lo sviluppo di strumenti di identificazione dell'intelligenza artificiale più affidabili e può aiutare milioni di persone a prendere decisioni informate su come interagiscono con i contenuti generati dall'intelligenza artificiale. Entro la fine dell'estate, prevediamo di rendere SynthID open source per la filigrana del testo, in modo che gli sviluppatori possano creare con questa tecnologia e incorporarla nei loro modelli.

Come funziona la filigrana del testo

I modelli linguistici di grandi dimensioni generano sequenze di testo quando viene dato un suggerimento del tipo “Spiegami la meccanica quantistica come se avessi cinque anni” o “Qual è il tuo frutto preferito?”. Gli LLM prevedono quale token molto probabilmente ne segue un altro, un token alla volta.

I token sono gli elementi costitutivi utilizzati da un modello generativo per l'elaborazione delle informazioni. In questo caso possono essere un singolo carattere, una parola o parte di una frase. A ogni possibile token viene assegnato un punteggio, che rappresenta la probabilità percentuale che sia quello giusto. È più probabile che vengano utilizzati token con punteggi più alti. Gli LLM ripetono questi passaggi per costruire una risposta coerente.

SynthID è progettato per incorporare filigrane impercettibili direttamente nel processo di generazione del testo. Lo fa introducendo informazioni aggiuntive nella distribuzione dei token al momento della generazione, modulando la probabilità che i token vengano generati, il tutto senza compromettere la qualità, l'accuratezza, la creatività o la velocità della generazione del testo.

SynthID regola il punteggio di probabilità dei token generati da un modello linguistico di grandi dimensioni.

Il modello finale di punteggi per entrambe le scelte delle parole del modello combinato con i punteggi di probabilità corretti è considerato la filigrana. Questo modello di punteggi viene confrontato con il modello di punteggi previsto per il testo con e senza filigrana, aiutando SynthID a rilevare se uno strumento AI ha generato il testo o se potrebbe provenire da altre fonti.

Un pezzo di testo generato da Gemini con la filigrana evidenziata in blu.

I vantaggi e i limiti di questa tecnica

SynthID per la filigrana del testo funziona meglio quando un modello linguistico genera risposte più lunghe e in diversi modi, ad esempio quando viene richiesto di generare un saggio, una sceneggiatura teatrale o variazioni su un'e-mail.

Funziona bene anche con alcune trasformazioni, come ritagliare parti di testo, modificare alcune parole e fare leggere parafrasi. Tuttavia, i suoi punteggi di affidabilità possono essere notevolmente ridotti quando un testo generato dall’intelligenza artificiale viene completamente riscritto o tradotto in un’altra lingua.

La filigrana del testo SynthID è meno efficace nelle risposte a suggerimenti concreti perché ci sono meno opportunità di regolare la distribuzione dei token senza influire sull'accuratezza fattuale. Ciò include suggerimenti come “Qual è la capitale della Francia?” o domande in cui è prevista poca o nessuna variazione, come “recitare una poesia di William Wordsworth”.

Molti strumenti di rilevamento dell’intelligenza artificiale attualmente disponibili utilizzano algoritmi per l’etichettatura e l’ordinamento dei dati, noti come classificatori. Questi classificatori spesso funzionano bene solo per compiti particolari, il che li rende meno flessibili. Quando lo stesso classificatore viene applicato a diversi tipi di piattaforme e contenuti, le sue prestazioni non sono sempre affidabili o coerenti. Ciò può portare a un'etichettatura errata del testo, che può causare problemi, ad esempio, in cui il testo potrebbe essere erroneamente identificato come generato dall'intelligenza artificiale.

SynthID funziona in modo efficace da solo, ma può anche essere combinato con altri approcci di rilevamento dell'intelligenza artificiale per offrire una migliore copertura tra tipi di contenuti e piattaforme. Sebbene questa tecnica non sia progettata per impedire direttamente ad avversari motivati ​​come cyberattaccanti o hacker di causare danni, può rendere più difficile l’utilizzo dei contenuti generati dall’intelligenza artificiale per scopi dannosi.

Come funziona la filigrana video

All'I/O di quest'anno lo abbiamo annunciato Vedoil nostro modello video generativo più capace. Sebbene le tecnologie di generazione di video non siano così ampiamente disponibili come quelle di generazione di immagini, sono in rapida evoluzione e diventerà sempre più importante aiutare le persone a sapere se un video è generato da un'intelligenza artificiale o meno.

I video sono composti da singoli fotogrammi o immagini fisse. Quindi abbiamo sviluppato una tecnica di watermarking ispirata al nostro strumento SynthID per immagini. Questa tecnica incorpora una filigrana direttamente nei pixel di ogni fotogramma video, rendendolo impercettibile all'occhio umano, ma rilevabile per l'identificazione.

Dare alle persone la possibilità di sapere quando interagiscono con i media generati dall'intelligenza artificiale può svolgere un ruolo importante nel prevenire la diffusione della disinformazione. A partire da oggi, tutti i video generati da Veo su VideoFX sarà filigranato da SynthID.

SynthID per la filigrana video contrassegna ogni fotogramma di un video generato

Portare SynthID nel più ampio ecosistema AI

La tecnologia di filigrana del testo di SynthID è progettata per essere compatibile con la maggior parte dei modelli di generazione di testo AI e per adattarsi a diversi tipi di contenuto e piattaforme. Per contribuire a prevenire un diffuso uso improprio dei contenuti generati dall'intelligenza artificiale, stiamo lavorando per portare questa tecnologia nell'ecosistema dell'intelligenza artificiale più ampio.

Quest'estate, stiamo pianificando di pubblicare ulteriori informazioni sulla nostra tecnologia di filigrana del testo in un documento di ricerca dettagliato e renderemo open source la filigrana del testo SynthID attraverso il nostro aggiornamento Toolkit di intelligenza artificiale generativa responsabileche fornisce indicazioni e strumenti essenziali per creare applicazioni IA più sicure, in modo che gli sviluppatori possano creare con questa tecnologia e incorporarla nei loro modelli.

Fonte: deepmind.google

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *