Oggi rilasciamo la versione stabile di Gemini 2.5 Flash-Lite, il nostro modello più veloce e più economico ($ 0,10 in ingresso per 1 milione, $ 0,40 in uscita per 1 milione) nella famiglia di modelli Gemini 2.5. Abbiamo creato Flash-Lite 2.5 per ampliare la frontiera dell’intelligenza per dollaro, con funzionalità di ragionamento native che possono essere attivate facoltativamente per casi d’uso più impegnativi. Basandosi sullo slancio di 2.5 Pro e 2.5 Flash, questo modello completa il nostro set di modelli 2.5 pronti per l’uso in produzione su larga scala.
Il nostro modello 2.5 più conveniente e veloce di sempre
Gemini 2.5 Flash-Lite raggiunge un equilibrio tra prestazioni e costi, senza compromettere la qualità, in particolare per attività sensibili alla latenza come traduzione e classificazione.
Ecco cosa lo distingue:
- La migliore velocità della categoria: Gemini 2.5 Flash-Lite ha una latenza inferiore sia rispetto a 2.0 Flash-Lite che a 2.0 Flash su un ampio campione di prompt.
- Efficienza in termini di costi: È il nostro modello 2.5 più economico finora, con un prezzo di token di input di $ 0,10/1 milione e token di output di $ 0,40, che ti consente di gestire grandi volumi di richieste in modo conveniente. Abbiamo anche ridotto i prezzi degli input audio del 40% rispetto al lancio in anteprima.
- Intelligente e piccolo: Dimostra una qualità complessivamente superiore rispetto a Flash-Lite 2.0 in un’ampia gamma di benchmark, tra cui codifica, matematica, scienze, ragionamento e comprensione multimodale.
- Completo di tutte le funzionalità: Quando crei con Flash-Lite 2.5, ottieni accesso a una finestra di contesto da 1 milione di token, budget di riflessione controllabili e supporto per strumenti nativi come Grounding con Ricerca Google, Esecuzione codice e Contesto URL.
Gemini 2.5 Flash-Lite in azione
Dal lancio di Flash-Lite 2.5, abbiamo già assistito ad alcune implementazioni di incredibile successo, ecco alcune delle nostre preferite:
- Satlyt sta costruendo una piattaforma informatica spaziale decentralizzata che trasformerà il modo in cui i dati satellitari vengono elaborati e utilizzati per il riepilogo in tempo reale della telemetria in orbita, la gestione autonoma delle attività e l’analisi delle comunicazioni da satellite a satellite. 2.5 La velocità di Flash-Lite ha consentito una riduzione del 45% della latenza per la diagnostica critica di bordo e a Riduzione del consumo energetico del 30%. rispetto ai loro modelli di base.
- Ehi Gen utilizza l’intelligenza artificiale per creare avatar per i contenuti video e sfrutta Gemini 2.5 Flash-Lite per automatizzare la pianificazione video, analizzare e ottimizzare i contenuti e tradurre video in oltre 180 lingue. Ciò consente loro di fornire esperienze globali e personalizzate ai propri utenti.
- DocsHound trasforma le demo dei prodotti in documentazione utilizzando Gemini 2.5 Flash-Lite elaborare video lunghi ed estrarre migliaia di screenshot con bassa latenza. Ciò trasforma le riprese in documentazione completa e dati di formazione per gli agenti IA molto più velocemente rispetto ai metodi tradizionali.
- Evertune aiuta i marchi a capire come sono rappresentati nei modelli di intelligenza artificiale. Gemini 2.5 Flash-Lite rappresenta per loro un punto di svolta, accelerando notevolmente l’analisi e la generazione di report. Le sue prestazioni veloci consentono loro di scansionare e sintetizzare rapidamente grandi volumi di output del modello da fornire ai clienti approfondimenti dinamici e tempestivi.
Puoi iniziare a utilizzare 2.5 Flash-Lite specificando “gemini-2.5-flash-lite” nel codice. Se stai utilizzando la versione di anteprima, puoi passare a “gemini-2.5-flash-lite” che è lo stesso modello sottostante. Prevediamo di rimuovere l’alias di anteprima di Flash-Lite il 25 agosto.
Pronto per iniziare a costruire? Prova subito la versione stabile di Gemini 2.5 Flash-Lite Studio sull’intelligenza artificiale di Google E IA del vertice.
Fonte: deepmind.google
