MidJourney V7: Generazione di immagini di AI rapida | Intelligenza-Artificiale

Midjourney ha annunciato la versione Alpha del suo modello di generazione di immagini V7 per i test da parte della comunità AI. Il nuovo modello racchiude miglioramenti nella comprensione del testo, la qualità dell'immagine e la coerenza delle caratteristiche.

“V7 è un modello straordinario. È molto più intelligente con le istruzioni di testo, le istruzioni dell'immagine sembrano fantastiche, la qualità dell'immagine è notevolmente più alta con belle trame e corpi, mani e oggetti di ogni tipo hanno una coerenza significativamente migliore su tutti i dettagli”, ha spiegato Midjourney.

Un'innovazione chiave in V7 è l'attivazione predefinita della personalizzazione del modello. Gli utenti devono inizialmente sbloccare questa funzione, un processo che richiede circa cinque minuti. Questa personalizzazione può essere attivata o disattivata in qualsiasi momento ed è destinata a migliorare significativamente la capacità dell'IA di interpretare i desideri degli utenti e le preferenze estetiche. Midjourney ritiene che questa funzionalità abbia un nuovo punto di riferimento per la comprensione dell'intento dell'utente.

MidJourney sta anche introducendo una funzione accanto al modello di generazione di immagini V7 chiamato “Draft Mode”, che promette di generare immagini dieci volte più veloce e a metà del costo.

Questa maggiore velocità ha permesso a Midjourney di implementare una “modalità conversazionale” unica sulla sua interfaccia web. Gli utenti possono ora istruire il sistema a apportare modifiche, come la sostituzione di un gatto con un gufo o la modifica dell'ora del giorno in notte, e l'IA regolerà automaticamente il prompt e avvierà una nuova attività di generazione di immagini.

La modalità di bozza incorpora anche la funzionalità di input vocale. Premendo il pulsante del microfono, gli utenti possono articolare verbalmente le loro idee e osservare le immagini mentre vengono generate in tempo reale:

Screenshot della funzionalità di input vocale in modalità di bozza quando si utilizza il modello di generazione di immagini AI MidJourney V7.

Midjourney ritiene che la modalità bozza offra un metodo senza precedenti per raffinare i concetti creativi. Se un'immagine generata è allettante, gli utenti possono selezionare le opzioni “migliora” o “variare” per reinserirla a piena qualità. Mentre le immagini di bozze sono di qualità inferiore rispetto alla modalità standard, il loro comportamento e le caratteristiche estetiche rimangono coerenti.

Il modello di generazione di immagini V7 di MidJourney sarà inizialmente disponibile in due modalità di velocità: turbo e rilassati. La modalità di velocità standard è attualmente in fase di ulteriore ottimizzazione e dovrebbe essere rilasciata a breve. Midjourney ha chiarito che i lavori turbo costeranno il doppio di un lavoro standard, mentre i progetti di posti di lavoro costeranno la metà dell'importo.

La società ha anche fornito aggiornamenti su altre funzionalità. Funzionalità come upscaling, editing e retexturing torneranno inizialmente all'utilizzo del modello V6, con aggiornamenti previsti per il futuro. La funzionalità per Mood Board e SREF è attualmente operativa e le prestazioni dovrebbero migliorare con gli aggiornamenti successivi.

Guardando al prossimo futuro, Midjourney ha delineato un programma di sviluppo attivo. Gli utenti possono aspettarsi nuove funzionalità per due a due settimane per i prossimi 60 giorni. Una funzione significativa imminente sarà una nuova capacità di riferimento di caratteri V7 e oggetti.

Infine, Midjourney ha consigliato agli utenti che V7 è un modello completamente nuovo con i propri punti di forza e potenziali punti deboli. Incoraggiano la sperimentazione e il feedback sulle sue capacità, ricordando agli utenti che potrebbe richiedere diverse tecniche di suggerimento rispetto alle versioni precedenti.

(Credito immagine: MidJourney)

Vedi anche: Tony Blair Institute AI Copyright Report SPARKS BACKLASH

Vuoi saperne di più sull'intelligenza artificiale e sui big da parte dei leader del settore? Guardare AI e Big Data Expo si svolge ad Amsterdam, in California e a Londra. L'evento completo è co-localizzato con altri eventi principali tra cui Conferenza di automazione intelligente, Blockx, Settimana di trasformazione digitaleE Cyber Security & Cloud Expo.

Esplora altri prossimi eventi tecnologici aziendali e webinar alimentati da TechForge Qui.

Fonte: www.artificialintelligence-news.com