Gemini 2.5: aggiornamenti alla nostra famiglia di modelli di pensiero

 | Intelligenza-Artificiale

Oggi siamo entusiasti di condividere gli aggiornamenti su tutta la linea della nostra famiglia modello Gemini 2.5:

  • Gemini 2.5 Pro è generalmente disponibile e stabile (nessuna variazione dall'anteprima 06-05)
  • Gemini 2.5 Flash è generalmente disponibile e stabile (nessuna modifica dall'anteprima 05-20, consultare gli aggiornamenti dei prezzi di seguito)
  • Gemini 2.5 Flash-Lite è ora disponibile in anteprima

I modelli Gemini 2.5 sono modelli pensanti, in grado di ragionare attraverso i loro pensieri prima di rispondere, con conseguenti prestazioni migliorate e una migliore precisione. Ogni modello ha il controllo del budget di pensiero, dando agli sviluppatori la possibilità di scegliere quando e quanto il modello “pensa” prima di generare una risposta.

Panoramica della nostra famiglia di modelli di pensiero Gemini 2.5

Panoramica della nostra famiglia di modelli di pensiero Gemini 2.5

Presentazione di gemelli 2.5 flash-lite

Oggi stiamo introducendo 2,5 flash-lite in anteprima con la latenza e il costo più bassi nella famiglia modello 2.5. È progettato come un aggiornamento economico rispetto ai nostri precedenti modelli flash 1.5 e 2.0. Offre anche prestazioni migliori nella maggior parte degli evali e il tempo inferiore al primo token raggiungendo anche token più alti al secondo decodifica. Questo modello è ottimo per attività ad alto rendimento come classificazione o riepilogo su larga scala.

Gemini 2.5 Flash-Lite è un modello di ragionamento, che consente il controllo dinamico del budget di pensiero con un parametro API. Poiché Flash-Lite è ottimizzato per il costo e la velocità, il “pensiero” è spento per impostazione predefinita, a differenza dei nostri altri modelli. 2.5 Flash-Lite supporta anche tutti i nostri strumenti nativi come la messa a terra con la ricerca di Google, l'esecuzione del codice e il contesto URL oltre alla chiamata delle funzioni.

Parametri di riferimento per gemelli 2.5 flash-lite

Parametri di riferimento per gemelli 2.5 flash-lite

Aggiornamenti a Gemini 2.5 Flash e prezzi

Nell'ultimo anno, i nostri team di ricerca hanno continuato a spingere la frontiera di Pareto con la nostra serie di modelli Flash. Quando è stato inizialmente annunciato 2,5 Flash, non avevamo ancora finalizzato le capacità per 2,5 Flash-Lite. Abbiamo anche lanciato con un “pensiero” e “prezzo non pensiero”, che ha portato alla confusione degli sviluppatori.

Con la versione stabile di Gemini 2.5 Flash lanciando (che è la stessa anteprima del modello 05-20 che abbiamo reso disponibile su Google I/O) e le incredibili prestazioni di 2.5 Flash, stiamo aggiornando i prezzi per 2,5 Flash:

  • Token di input $ 0,30 / 1 m (*in aumento da $ 0,15)
  • Token di uscita $ 2,50 / 1m (*in basso da $ 3,50)
  • Abbiamo rimosso la differenza di prezzo e non-pensiero
  • Abbiamo mantenuto un livello a prezzo singolo indipendentemente dalla dimensione del token di input

Mentre ci impegniamo a mantenere prezzi coerenti tra anteprima e versioni stabili per ridurre al minimo l'interruzione, si tratta di una regolazione specifica che riflette il valore eccezionale di Flash, offrendo comunque il miglior costo per intelligenza disponibile.

E con Gemini 2.5 Flash-Lite, ora abbiamo un'opzione di costo ancora più bassa (con o senza pensare) per casi d'uso sensibili ai costi e alla latenza che richiedono meno intelligenza del modello.

Aggiornamenti dei prezzi per la nostra famiglia Gemini Flash

Aggiornamenti dei prezzi per la nostra famiglia Gemini Flash

Se si utilizza l'anteprima di Gemini 2.5 Flash 04-17, i prezzi di anteprima esistenti rimarranno in vigore fino a quando la sua prevista deprecazione il 15 luglio 2025, a quel punto, l'endpoint del modello verrà disattivato. È possibile passare al modello generalmente disponibile “Gemini-2.5-Flash” o passare all'anteprima di 2,5 flash-lite come opzione a basso costo.


Continua crescita di Gemini 2.5 Pro

La crescita e la domanda di Gemini 2.5 Pro continuano ad essere la più ripida di tutti i nostri modelli che abbiamo mai visto. Per consentire a più clienti di basarsi su questo modello in produzione, stiamo realizzando la versione 06-05 del modello stabile, con lo stesso prezzo di frontiera di Pareto di prima.

Ci aspettiamo che i casi in cui hai bisogno della più alta intelligenza e la maggior parte delle capacità siano dove vedrai Pro Shine, come codifica e compiti agenti. Gemini 2.5 Pro è al centro di molti degli strumenti per sviluppatori più amati.

Strumenti per sviluppatori migliori che utilizzano Gemini 2.5 Pro, con cursore, bullone, cline, cognizione, windsurf, github, adorabile, replica e industrie Zed

Strumenti per sviluppatori migliori che utilizzano Gemini 2.5 Pro

Se si utilizza l'anteprima 2.5 Pro 05-06, il modello rimarrà disponibile fino al 19 giugno 2025 e verrà spento. Se si utilizza Anteprima 2.5 Pro 06-05, puoi semplicemente aggiornare la stringa del modello in “Gemini-2.5-Pro”.

Non vediamo l'ora di vedere ancora più domini beneficiare dell'intelligenza di 2,5 Pro e non vediamo l'ora di condividere di più sul ridimensionamento oltre Pro nel prossimo futuro.

Fonte: deepmind.google

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *