
Oggi stiamo rilasciando la versione stabile di Gemini 2.5 Flash-Lite, il nostro costo più rapido e più basso ($ 0,10 input per 1 m, $ 0,40 per 1 m) nel modello del modello Gemini 2.5. Abbiamo costruito 2,5 flash-lite per spingere la frontiera dell'intelligenza per dollaro, con funzionalità di ragionamento native che possono essere facoltativamente attivate per casi d'uso più esigenti. Basandosi sullo slancio di 2,5 Pro e 2,5 flash, questo modello completa il nostro set di 2,5 modelli pronti per l'uso della produzione in scala.
Il nostro modello 2,5 più economico e più veloce di sempre
Gemini 2.5 Flash-Lite colpisce un equilibrio tra prestazioni e costi, senza compromettere la qualità, in particolare per compiti sensibili alla latenza come la traduzione e la classificazione.
Ecco cosa lo distingue:
- Migliore velocità in classe: Gemini 2.5 Flash-Lite ha una latenza inferiore rispetto a 2,0 Flash-Lite e 2,0 Flash su un ampio campione di istruzioni.
- Efficienza in termini di costi: È il nostro modello 2,5 più basso, al prezzo di token di ingresso di $ 0,10 / 1 m e token di uscita di $ 0,40, che consente di gestire grandi volumi di richieste in modo conveniente. Abbiamo anche ridotto i prezzi di input audio del 40% dal lancio di anteprima.
- Intelligente e piccolo: Dimostra una qualità più alta di 2,0 flash-lite in una vasta gamma di parametri di riferimento, tra cui codifica, matematica, scienza, ragionamento e comprensione multimodale.
- Completamente descritto: Quando si crea con 2,5 Flash-Lite, si ottiene l'accesso a una finestra di contesto da 1 milione di tetti, budget di pensiero controllabile e supporto per strumenti nativi come la messa a terra con la ricerca di Google, l'esecuzione del codice e il contesto URL.
Gemelli 2.5 Flash-lite in azione
Dal lancio di 2,5 Flash-Lite, abbiamo già visto alcuni schieramenti di incredibile successo, ecco alcuni dei nostri preferiti:
- Satlyt sta costruendo una piattaforma di calcolo spaziale decentralizzata che trasformerà il modo in cui i dati satellitari vengono elaborati e utilizzati per il riepilogo in tempo reale della telemetria in orbita, della gestione autonoma delle attività e dell'analisi della comunicazione da satellite a satellite. 2,5 La velocità di Flash-Lite ha consentito una riduzione del 45% di latenza per diagnostica a bordo critica e a Riduzione del 30% del consumo di energia rispetto ai loro modelli di base.
- Heygen Utilizza AI per creare avatar per contenuti video e sfruttare Gemini 2.5 Flash-Lite per automatizzare la pianificazione video, analizzare e ottimizzare i contenuti e Traduci i video in oltre 180 lingue. Ciò consente loro di fornire esperienze globali e personalizzate per i loro utenti.
- Docshound Trasforma le demo del prodotto in documentazione utilizzando Gemini 2.5 Flash-Lite a elaborare video lunghi ed estrarre migliaia di screenshot con bassa latenza. Ciò trasforma i filmati in documentazione completa e dati di formazione per agenti di intelligenza artificiale molto più velocemente dei metodi tradizionali.
- Evertune Aiuta i marchi a capire come sono rappresentati attraverso i modelli di intelligenza artificiale. Gemini 2.5 Flash-Lite è un punto di svolta per loro, accelerando notevolmente l'analisi e la generazione di report. Le sue prestazioni rapide consentono loro di scansionare e sintetizzare rapidamente grandi volumi di output del modello per fornire ai clienti con approfondimenti dinamici e tempestivi.
Puoi iniziare a utilizzare 2.5 Flash-Lite specificando “Gemini-2.5-Flash-Lite” nel tuo codice. Se si utilizza la versione di anteprima, puoi passare a “Gemini-2.5-Flash-Lite” che è lo stesso modello sottostante. Prevediamo di rimuovere l'Alias di anteprima di Flash-Lite il 25 agosto.
Pronto per iniziare a costruire? Prova la versione stabile di Gemini 2.5 flash-lite ora in Google per studiare E Vertex ai.
Fonte: deepmind.google