Il nuovo strumento aiuta a filigranare e identificare le immagini sintetiche create da Imagen
Le immagini generate dall’intelligenza artificiale stanno diventando ogni giorno più popolari. Ma come identificarli meglio, soprattutto quando sembrano così realistici?
Oggi, in collaborazione con GoogleNuvolastiamo lanciando una versione beta di SynthIDuno strumento per la filigrana e l’identificazione delle immagini generate dall’intelligenza artificiale. Questa tecnologia incorpora una filigrana digitale direttamente nei pixel di un’immagine, rendendola impercettibile all’occhio umano, ma rilevabile per l’identificazione.
SynthID viene rilasciato a un numero limitato di IA del vertice clienti che utilizzano Immagineuno dei nostri ultimi modelli di conversione testo-immagine che utilizza il testo di input per creare immagini fotorealistiche.
Le tecnologie di intelligenza artificiale generativa si stanno evolvendo rapidamente e le immagini generate dal computer, note anche come “immagini sintetiche”, stanno diventando sempre più difficili da distinguere da quelle che non sono state create da un sistema di intelligenza artificiale.
Sebbene l’intelligenza artificiale generativa possa sbloccare un enorme potenziale creativo, presenta anche nuovi rischi, come consentire ai creatori di diffondere informazioni false, sia intenzionalmente che involontariamente. Essere in grado di identificare i contenuti generati dall’intelligenza artificiale è fondamentale per consentire alle persone di sapere quando interagiscono con i media generati e per aiutare a prevenire la diffusione della disinformazione.
Ci impegniamo a mettere in contatto le persone con informazioni di alta qualità e a sostenere la fiducia tra creatori e utenti in tutta la società. Parte di questa responsabilità è fornire agli utenti strumenti più avanzati per identificare le immagini generate dall’intelligenza artificiale in modo che le loro immagini – e anche alcune versioni modificate – possano essere identificate in un secondo momento.
Google Cloud è il primo fornitore di servizi cloud a offrire uno strumento per creare immagini generate dall’intelligenza artificiale in modo responsabile e identificarle con sicurezza. Questa tecnologia è radicata nel nostro approccio allo sviluppo e all’implementazione di un’intelligenza artificiale responsabile ed è stata sviluppata da Google DeepMind e perfezionata in collaborazione con Google Research.
SynthID non è infallibile contro le manipolazioni estreme delle immagini, ma fornisce un approccio tecnico promettente per consentire a persone e organizzazioni di lavorare in modo responsabile con i contenuti generati dall’intelligenza artificiale. Questo strumento potrebbe anche evolversi insieme ad altri modelli e modalità di intelligenza artificiale oltre alle immagini come audio, video e testo.
Nuovo tipo di filigrana per le immagini AI
Le filigrane sono disegni che possono essere sovrapposti alle immagini per identificarle. Dalle impronte fisiche sulla carta al testo traslucido e ai simboli visti oggi sulle foto digitali, si sono evoluti nel corso della storia.
Le filigrane tradizionali non sono sufficienti per identificare le immagini generate dall’intelligenza artificiale perché vengono spesso applicate come un timbro su un’immagine e possono essere facilmente modificate. Ad esempio, le filigrane trovate nell’angolo di un’immagine possono essere ritagliate con tecniche di modifica di base.
Trovare il giusto equilibrio tra impercettibilità e robustezza alle manipolazioni delle immagini è difficile. Anche le filigrane altamente visibili, spesso aggiunte come uno strato con un nome o un logo nella parte superiore di un’immagine, presentano sfide estetiche per scopi creativi o commerciali. Allo stesso modo, alcune filigrane impercettibili sviluppate in precedenza possono andare perse attraverso semplici tecniche di modifica come il ridimensionamento.
Abbiamo progettato SynthID in modo che non comprometta la qualità dell’immagine e consenta alla filigrana di rimanere rilevabile, anche dopo modifiche come l’aggiunta di filtri, la modifica dei colori e il salvataggio con vari schemi di compressione con perdita, più comunemente utilizzati per i JPEG.
SynthID utilizza due modelli di deep learning, per il watermarking e l’identificazione, che sono stati addestrati insieme su una serie diversificata di immagini. Il modello combinato è ottimizzato su una serie di obiettivi, tra cui l’identificazione corretta del contenuto con filigrana e il miglioramento dell’impercettibilità allineando visivamente la filigrana al contenuto originale.
Approccio robusto e scalabile
SynthID consente ai clienti Vertex AI di creare immagini generate dall’intelligenza artificiale in modo responsabile e di identificarle con sicurezza. Sebbene questa tecnologia non sia perfetta, i nostri test interni dimostrano che è accurata rispetto a molte manipolazioni comuni delle immagini.
L’approccio combinato di SynthID:
- Filigrana: SynthID può aggiungere una filigrana impercettibile alle immagini sintetiche prodotte da Imagen.
- Identificazione: Scansionando un’immagine per la sua filigrana digitale, SynthID può valutare la probabilità che un’immagine venga creata da Imagen.
Questo strumento fornisce tre livelli di confidenza per interpretare i risultati dell’identificazione della filigrana. Se viene rilevata una filigrana digitale, è probabile che parte dell’immagine sia generata da Imagen.
SynthID contribuisce all’ampia gamma di approcci per l’identificazione dei contenuti digitali. Uno dei metodi più utilizzati per identificare i contenuti è tramite i metadati, che forniscono informazioni su chi lo ha creato e quando. Queste informazioni vengono memorizzate con il file immagine. Le firme digitali aggiunte ai metadati possono quindi mostrare se un’immagine è stata modificata.
Quando le informazioni sui metadati sono intatte, gli utenti possono facilmente identificare un’immagine. Tuttavia, i metadati possono essere rimossi manualmente o addirittura persi quando i file vengono modificati. Poiché la filigrana di SynthID è incorporata nei pixel di un’immagine, è compatibile con altri approcci di identificazione delle immagini basati sui metadati e rimane rilevabile anche quando i metadati vengono persi.
Qual è il prossimo?
Per creare contenuti generati dall’intelligenza artificiale in modo responsabile, ci impegniamo a sviluppare approcci sicuri, protetti e affidabili in ogni fase del processo: dalla generazione e identificazione delle immagini all’alfabetizzazione mediatica e alla sicurezza delle informazioni.
Questi approcci devono essere robusti e adattabili man mano che i modelli generativi avanzano e si espandono ad altri mezzi. Ci auguriamo che la nostra tecnologia SynthID possa funzionare insieme a un’ampia gamma di soluzioni per creatori e utenti in tutta la società e continuiamo a far evolvere SynthID raccogliendo feedback dagli utenti, migliorandone le capacità ed esplorando nuove funzionalità.
SynthID potrebbe essere ampliato per l’utilizzo su altri modelli di intelligenza artificiale e siamo entusiasti del potenziale di integrarlo in più prodotti Google e di renderlo disponibile a terze parti nel prossimo futuro, consentendo a persone e organizzazioni di lavorare in modo responsabile con i contenuti generati dall’intelligenza artificiale.
Nota: il modello utilizzato per produrre immagini sintetiche in questo blog potrebbe essere diverso dal modello utilizzato su Imagen e Vertex AI.