
Oggi siamo entusiasti di condividere gli aggiornamenti su tutta la linea della nostra famiglia modello Gemini 2.5:
- Gemini 2.5 Pro è generalmente disponibile e stabile (nessuna variazione dall'anteprima 06-05)
- Gemini 2.5 Flash è generalmente disponibile e stabile (nessuna modifica dall'anteprima 05-20, consultare gli aggiornamenti dei prezzi di seguito)
- Gemini 2.5 Flash-Lite è ora disponibile in anteprima
I modelli Gemini 2.5 sono modelli pensanti, in grado di ragionare attraverso i loro pensieri prima di rispondere, con conseguenti prestazioni migliorate e una migliore precisione. Ogni modello ha il controllo del budget di pensiero, dando agli sviluppatori la possibilità di scegliere quando e quanto il modello “pensa” prima di generare una risposta.
Panoramica della nostra famiglia di modelli di pensiero Gemini 2.5
Presentazione di gemelli 2.5 flash-lite
Oggi stiamo introducendo 2,5 flash-lite in anteprima con la latenza e il costo più bassi nella famiglia modello 2.5. È progettato come un aggiornamento economico rispetto ai nostri precedenti modelli flash 1.5 e 2.0. Offre anche prestazioni migliori nella maggior parte degli evali e il tempo inferiore al primo token raggiungendo anche token più alti al secondo decodifica. Questo modello è ottimo per attività ad alto rendimento come classificazione o riepilogo su larga scala.
Gemini 2.5 Flash-Lite è un modello di ragionamento, che consente il controllo dinamico del budget di pensiero con un parametro API. Poiché Flash-Lite è ottimizzato per il costo e la velocità, il “pensiero” è spento per impostazione predefinita, a differenza dei nostri altri modelli. 2.5 Flash-Lite supporta anche tutti i nostri strumenti nativi come la messa a terra con la ricerca di Google, l'esecuzione del codice e il contesto URL oltre alla chiamata delle funzioni.
Parametri di riferimento per gemelli 2.5 flash-lite
Aggiornamenti a Gemini 2.5 Flash e prezzi
Nell'ultimo anno, i nostri team di ricerca hanno continuato a spingere la frontiera di Pareto con la nostra serie di modelli Flash. Quando è stato inizialmente annunciato 2,5 Flash, non avevamo ancora finalizzato le capacità per 2,5 Flash-Lite. Abbiamo anche lanciato con un “pensiero” e “prezzo non pensiero”, che ha portato alla confusione degli sviluppatori.
Con la versione stabile di Gemini 2.5 Flash lanciando (che è la stessa anteprima del modello 05-20 che abbiamo reso disponibile su Google I/O) e le incredibili prestazioni di 2.5 Flash, stiamo aggiornando i prezzi per 2,5 Flash:
- Token di input $ 0,30 / 1 m (*in aumento da $ 0,15)
- Token di uscita $ 2,50 / 1m (*in basso da $ 3,50)
- Abbiamo rimosso la differenza di prezzo e non-pensiero
- Abbiamo mantenuto un livello a prezzo singolo indipendentemente dalla dimensione del token di input
Mentre ci impegniamo a mantenere prezzi coerenti tra anteprima e versioni stabili per ridurre al minimo l'interruzione, si tratta di una regolazione specifica che riflette il valore eccezionale di Flash, offrendo comunque il miglior costo per intelligenza disponibile.
E con Gemini 2.5 Flash-Lite, ora abbiamo un'opzione di costo ancora più bassa (con o senza pensare) per casi d'uso sensibili ai costi e alla latenza che richiedono meno intelligenza del modello.
Aggiornamenti dei prezzi per la nostra famiglia Gemini Flash
Se si utilizza l'anteprima di Gemini 2.5 Flash 04-17, i prezzi di anteprima esistenti rimarranno in vigore fino a quando la sua prevista deprecazione il 15 luglio 2025, a quel punto, l'endpoint del modello verrà disattivato. È possibile passare al modello generalmente disponibile “Gemini-2.5-Flash” o passare all'anteprima di 2,5 flash-lite come opzione a basso costo.
Continua crescita di Gemini 2.5 Pro
La crescita e la domanda di Gemini 2.5 Pro continuano ad essere la più ripida di tutti i nostri modelli che abbiamo mai visto. Per consentire a più clienti di basarsi su questo modello in produzione, stiamo realizzando la versione 06-05 del modello stabile, con lo stesso prezzo di frontiera di Pareto di prima.
Ci aspettiamo che i casi in cui hai bisogno della più alta intelligenza e la maggior parte delle capacità siano dove vedrai Pro Shine, come codifica e compiti agenti. Gemini 2.5 Pro è al centro di molti degli strumenti per sviluppatori più amati.
Strumenti per sviluppatori migliori che utilizzano Gemini 2.5 Pro
Se si utilizza l'anteprima 2.5 Pro 05-06, il modello rimarrà disponibile fino al 19 giugno 2025 e verrà spento. Se si utilizza Anteprima 2.5 Pro 06-05, puoi semplicemente aggiornare la stringa del modello in “Gemini-2.5-Pro”.
Non vediamo l'ora di vedere ancora più domini beneficiare dell'intelligenza di 2,5 Pro e non vediamo l'ora di condividere di più sul ridimensionamento oltre Pro nel prossimo futuro.
Fonte: deepmind.google