Gemini 2.5: Aggiornamenti alla nostra famiglia di modelli di pensiero | Intelligenza-Artificiale

Indice contenuti

Oggi siamo entusiasti di condividere gli aggiornamenti a tutti i livelli della nostra famiglia di modelli Gemini 2.5:

Gemini 2.5 Pro è generalmente disponibile e stabile (nessuna modifica rispetto all’anteprima 06-05)

Gemini 2.5 Flash è generalmente disponibile e stabile (nessuna modifica rispetto all’anteprima 05-20, vedere gli aggiornamenti sui prezzi di seguito)

Gemini 2.5 Flash-Lite è ora disponibile in anteprima

I modelli Gemini 2.5 sono modelli pensanti, in grado di ragionare attraverso i propri pensieri prima di rispondere, con conseguente miglioramento delle prestazioni e maggiore precisione. Ciascun modello ha il controllo sul budget di riflessione, offrendo agli sviluppatori la possibilità di scegliere quando e quanto il modello “pensa” prima di generare una risposta.

Panoramica della nostra famiglia di modelli pensanti Gemini 2.5

Presentazione di Gemini 2.5 Flash-Lite

Oggi presentiamo in anteprima Flash-Lite 2.5 con la latenza e il costo più bassi della famiglia di modelli 2.5. È progettato come aggiornamento conveniente rispetto ai nostri precedenti modelli Flash 1.5 e 2.0. Offre inoltre prestazioni migliori nella maggior parte delle valutazioni e un tempo inferiore per il primo token, ottenendo allo stesso tempo una decodifica di token più elevati al secondo. Questo modello è ottimo per attività ad alto rendimento come la classificazione o il riepilogo su larga scala.

Gemini 2.5 Flash-Lite è un modello di ragionamento che consente il controllo dinamico del budget pensante con un parametro API. Poiché Flash-Lite è ottimizzato in termini di costi e velocità, il “pensiero” è disattivato per impostazione predefinita, a differenza degli altri nostri modelli. 2.5 Flash-Lite supporta anche tutti i nostri strumenti nativi come Grounding con Ricerca Google, Esecuzione codice e Contesto URL oltre alla chiamata di funzioni.

Benchmark per Gemini 2.5 Flash-Lite

Aggiornamenti a Gemini 2.5 Flash e prezzi

Nel corso dell’ultimo anno, i nostri team di ricerca hanno continuato a spingersi oltre la frontiera di Pareto con le nostre serie di modelli Flash. Quando è stato inizialmente annunciato 2.5 Flash, non avevamo ancora finalizzato le funzionalità per 2.5 Flash-Lite. Abbiamo anche lanciato con un prezzo “pensante” e “non pensante”, che ha creato confusione tra gli sviluppatori.

Con il lancio della versione stabile di Gemini 2.5 Flash (che è la stessa anteprima del modello 05-20 che abbiamo reso disponibile al Google I/O) e le incredibili prestazioni di 2.5 Flash, stiamo aggiornando i prezzi per 2.5 Flash:

$ 0,30 / 1 milione di token di input (*in aumento rispetto a $ 0,15 di input)

Token di output da $ 2,50 / 1 milione (*in calo rispetto a $ 3,50 di output)

Abbiamo eliminato la differenza di prezzo tra pensiero e non pensiero

Abbiamo mantenuto un unico livello di prezzo indipendentemente dalla dimensione del token di input

Anche se ci impegniamo a mantenere prezzi coerenti tra le versioni di anteprima e quelle stabili per ridurre al minimo le interruzioni, si tratta di una modifica specifica che riflette l’eccezionale valore di Flash, offrendo comunque il miglior costo per intelligenza disponibile.

E con Gemini 2.5 Flash-Lite, ora disponiamo di un’opzione ancora più economica (con o senza riflessione) per casi d’uso sensibili ai costi e alla latenza che richiedono meno intelligenza del modello.

Aggiornamenti sui prezzi per la nostra famiglia Gemini Flash

Se utilizzi Gemini 2.5 Flash Preview 04-17, i prezzi di anteprima esistenti rimarranno in vigore fino alla sua deprecazione prevista il 15 luglio 2025, momento in cui l’endpoint del modello verrà disattivato. Puoi passare al modello generalmente disponibile “gemini-2.5-flash” o passare alla versione 2.5 Flash-Lite Preview come opzione a costo inferiore.

Crescita continua di Gemini 2.5 Pro

La crescita e la domanda di Gemini 2.5 Pro continuano ad essere le più ripide tra tutti i nostri modelli che abbiamo mai visto. Per consentire a più clienti di basarsi su questo modello in produzione, stiamo rendendo stabile la versione 06-05 del modello, con lo stesso prezzo di frontiera di Pareto di prima.

Ci aspettiamo che i casi in cui hai bisogno della massima intelligenza e della maggior parte delle capacità siano quelli in cui vedrai Pro brillare, come le attività di codifica e di agente. Gemini 2.5 Pro è il cuore di molti degli strumenti di sviluppo più amati.

I migliori strumenti per sviluppatori che utilizzano Gemini 2.5 Pro, tra cui Cursor, Bolt, Cline, Cognition, Windsurf, GitHub, Lovable, Replit e Zed Industries

I migliori strumenti per sviluppatori che utilizzano Gemini 2.5 Pro

Se utilizzi 2.5 Pro Preview 05-06, il modello rimarrà disponibile fino al 19 giugno 2025, dopodiché verrà disattivato. Se utilizzi 2.5 Pro Preview 06-05, puoi semplicemente aggiornare la stringa del modello in “gemini-2.5-pro”.

Non vediamo l’ora di vedere ancora più domini beneficiare dell’intelligenza di 2.5 Pro e non vediamo l’ora di condividere di più sulla scalabilità oltre Pro nel prossimo futuro.

Fonte: deepmind.google