Google ha svelato il suo ultimo modello di intelligenza artificiale, Gemini 1.5, che presenta quella che l’azienda chiama una finestra di contesto “sperimentale” da un milione di token.
La nuova funzionalità consente a Gemini 1.5 di elaborare passaggi di testo estremamente lunghi – fino a un milione di caratteri – per comprenderne contesto e significato. Ciò fa impallidire i precedenti sistemi di intelligenza artificiale come Claude 2.1 e GPT-4 Turbo, che raggiungono rispettivamente un massimo di 200.000 e 128.000 token:
“Gemini 1.5 Pro raggiunge un richiamo quasi perfetto su attività di recupero di contesti lunghi in tutte le modalità, migliora lo stato dell’arte nel QA di documenti lunghi, nel QA di video lunghi e nell’ASR di contesti lunghi, e corrisponde o supera quello di Gemini 1.0 Ultra prestazioni all’avanguardia in un’ampia gamma di parametri di riferimento”, hanno affermato i ricercatori di Google un documento tecnico (PDF).
L’efficienza dell’ultimo modello di Google è attribuita alla sua innovativa architettura Mixture-of-Experts (MoE).
“Mentre un Transformer tradizionale funziona come un’unica grande rete neurale, i modelli MoE sono divisi in reti neurali ‘esperte’ più piccole”, ha spiegato Demis Hassabis, CEO di Google DeepMind.
“A seconda del tipo di input fornito, i modelli MoE imparano ad attivare selettivamente solo i percorsi esperti più rilevanti nella sua rete neurale. Questa specializzazione migliora enormemente l’efficienza del modello.”
Per dimostrare la potenza della finestra di contesto del token da 1 milione, Google ha mostrato come Gemini 1.5 potesse importare l’intera trascrizione del volo Apollo 11 da 326.914 token e quindi rispondere accuratamente a domande specifiche al riguardo. Quando richiesto, riassumeva anche i dettagli chiave di un film muto da 684.000 gettoni.
Google inizialmente fornisce agli sviluppatori e alle imprese l’accesso gratuito a un’anteprima limitata di Gemini 1.5 con una finestra di contesto da un milione di token. Una versione generale da 128.000 token per il pubblico arriverà in seguito, insieme ai dettagli sui prezzi.
Per ora, la capacità di un milione di token rimane sperimentale. Ma se manterrà le sue promesse iniziali, Gemini 1.5 potrebbe stabilire un nuovo standard per la capacità dell’intelligenza artificiale di comprendere testi complessi del mondo reale.
Gli sviluppatori interessati a testare Gemini 1.5 Pro possono iscrizione nello Studio AI. Google afferma che i clienti aziendali possono contattare il team dell’account Vertex AI.
(Credito immagine: Google)
Guarda anche: Amazon forma 980 milioni di LLM con parametri con “capacità emergenti”
Vuoi saperne di più sull’intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell’intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. L’evento completo è collocato in contemporanea con altri eventi importanti, tra cui BlockX, Settimana della trasformazione digitaleE Fiera sulla sicurezza informatica e sul cloud.
Esplora altri prossimi eventi e webinar sulla tecnologia aziendale forniti da TechForge Qui.
Fonte: www.artificialintelligence-news.com