Presentazione di Gemma 3 270m: il modello compatto per AI iper-efficiente | Intelligenza-Artificiale

Indice contenuti

Gli ultimi mesi sono stati un momento entusiasmante per la famiglia Gemma di modelli aperti. Abbiamo presentato Gemma 3 E Gemma 3 QatFornire prestazioni all’avanguardia per gli acceleratori cloud e desktop singoli. Quindi, abbiamo annunciato il rilascio completo di Gemma 3nUn’architettura mobile-first che porta un’intelligenza artificiale potenti e in tempo reale direttamente sui dispositivi Edge. Il nostro obiettivo è stato quello di fornire strumenti utili per gli sviluppatori da costruire con l’IA e continuiamo ad essere stupito dal vibrante Gemmer Stai aiutando a creare, celebrando insieme mentre i download hanno superato i 200 milioni la scorsa settimana.

Oggi stiamo aggiungendo uno strumento nuovo e altamente specializzato al toolkit Gemma 3: Gemma 3 270mUn modello di parametro compatto da 270 milioni di 270 milioni di 270 milioni di persone progettato da zero per una messa a punto specifica delle attività con forti capacità di seguire le istruzioni e di strutturazione del testo già addestrate.

Gemma 3 270m

Gemma 3 270m offre forti capacità che seguono le istruzioni a un modello di impronta di piccole dimensioni. Come mostrato dal benchmark IFEVAL (che verifica la capacità di un modello di seguire le istruzioni verificabili), stabilisce un nuovo livello di prestazioni per le sue dimensioni, rendendo sofisticate funzionalità di intelligenza artificiale più accessibili per le applicazioni sul dispositivo e sulla ricerca.

Capacità core di Gemma 3 270m

Architettura compatta e capace: Il nostro nuovo modello ha un totale di 270 milioni di parametri: 170 milioni di parametri di incorporamento a causa di una grande dimensione del vocabolario e 100 milioni per i nostri blocchi di trasformatore. Grazie al grande vocabolario di token da 256k, il modello può gestire token specifici e rari, rendendolo un modello di base forte per essere ulteriormente messo a punto in domini e lingue specifiche.

Efficienza energetica estrema: Un vantaggio chiave di Gemma 3 270m è il suo basso consumo di energia. I test interni su un SOC PIXEL 9 Pro mostrano il modello qualificato INT4 utilizzato solo lo 0,75% della batteria per 25 conversazioni, rendendolo il nostro modello GEMMA più efficiente dal punto di vista energetico.

ISTRUZIONE Seguendo: Un modello sintonizzato sull’istruzione viene rilasciato insieme a un checkpoint pre-addestrato. Sebbene questo modello non sia progettato per casi d’uso conversazionali complessi, è un modello forte che segue le istruzioni generali subito.

In ingegneria, il successo è definito dall’efficienza, non solo alla potenza grezza. Non useresti una mazza per appendere una cornice. Lo stesso principio si applica alla costruzione con AI.

Gemma 3 270m incarna questo “giusto strumento per il lavoro”. È un modello di fondazione di alta qualità che segue le istruzioni ben esaurite e la sua vera potenza viene sbloccata attraverso la messa a punto. Una volta specializzato, può eseguire attività come la classificazione del testo e l’estrazione dei dati con notevole precisione, velocità e efficacia in termini di costi. A partire da un modello compatto e capace, è possibile costruire sistemi di produzione magri, veloci e drammaticamente più economici da operare.

Un progetto del mondo reale per il successo

Il potere di questo approccio ha già offerto risultati incredibili nel mondo reale. Un esempio perfetto è Il lavoro svolto da Adaptive ML con SK Telecom. Affrontare la sfida della moderazione sfumata e multilingue, hanno scelto di specializzarsi. Invece di utilizzare un modello massiccio e per uso generale, ML adattivo ha messo a punto un modello Gemma 3 4B. I risultati sono stati sbalorditivi: il modello GEMMA specializzato non solo ha incontrato ma ha superato le prestazioni di modelli proprietari molto più grandi nel suo compito specifico.

Gemma 3 270m è progettato per consentire agli sviluppatori di adottare questo approccio ancora oltre, sbloccando un’efficienza ancora maggiore per compiti ben definiti. È il punto di partenza perfetto per creare una flotta di piccoli modelli specializzati, ognuno esperto nel proprio compito.

Ma questo potere di specializzazione non è solo per le attività aziendali; Abilita anche potenti applicazioni creative. Ad esempio, controlla Questa app Web del generatore di storie della buona notte:

Gemma 3 270m utilizzato per alimentare un’app Web del generatore di storie di buonanotte usando Transformers.js. Le dimensioni e le prestazioni del modello lo rendono adatto a attività offline, basate sul web e creative. (Credito: Joshua (@xenovacom su x) dalla squadra di abbracci)

Quando scegliere Gemma 3 270m

Gemma 3 270m eredita l’architettura avanzata e la robusta pre-allenamento della collezione Gemma 3, fornendo una solida base per le tue applicazioni personalizzate.

Ecco quando è la scelta perfetta:

Hai un compito ad alto volume e ben definito. Ideale per funzioni come analisi del sentimento, estrazione di entità, routing di query, non strutturato per elaborazione strutturata, scrittura creativa e controlli di conformità.

È necessario rendere ogni millisecondo e micro-cent. Riduci drasticamente o elimina i costi di inferenza nella produzione e offrono risposte più veloci ai tuoi utenti. Un modello a 270 m perfezionato può funzionare su infrastrutture leggere ed economiche o direttamente sul dispositivo.

È necessario iterare e distribuire rapidamente. Le dimensioni ridotte di Gemma 3 270m consentono esperimenti di perfezionamento rapidi, aiutandoti a trovare la configurazione perfetta per il caso d’uso in ore, non per giorni.

È necessario garantire la privacy dell’utente. Poiché il modello può essere interamente eseguito sul dispositivo, è possibile creare applicazioni che gestiscono informazioni sensibili senza mai inviare dati al cloud.

Vuoi una flotta di modelli di attività specializzati. Costruisci e distribuisce più modelli personalizzati, ciascuno con sapientemente formato per un compito diverso, senza rompere il budget.

Inizia con la messa a punto

Vogliamo renderlo il più semplice possibile trasformare Gemma 3 270m nella tua soluzione personalizzata. È costruito sulla stessa architettura del resto dei modelli Gemma 3, con ricette e strumenti per iniziare rapidamente. Puoi trovare la nostra guida su Fine ridotta Usando Gemma 3 270m come parte dei documenti Gemma.

Gemmaverse è costruito sull’idea che l’innovazione sia in tutte le dimensioni. Con Gemma 3 270m, stiamo autorizzando gli sviluppatori a costruire soluzioni di intelligenza artificiale più intelligenti, più veloci ed efficienti. Non vediamo l’ora di vedere i modelli specializzati che crei.

Fonte: deepmind.google