Presentazione di Gemma 3 270M: il modello compatto per un'intelligenza artificiale iperefficiente | Intelligenza-Artificiale

Indice contenuti

Gli ultimi mesi sono stati un periodo emozionante per la famiglia di modelli aperti Gemma. Ci siamo presentati Gemma 3 E Gemma3QAToffrendo prestazioni all’avanguardia per singoli acceleratori cloud e desktop. Quindi, abbiamo annunciato il rilascio completo di Gemma 3nun’architettura mobile-first che porta una potente intelligenza artificiale multimodale in tempo reale direttamente sui dispositivi edge. Il nostro obiettivo è stato fornire strumenti utili agli sviluppatori per creare con l’intelligenza artificiale e continuiamo a esserlo stupito dal vibrante Versetto di Gemma stai aiutando a creare, festeggiando insieme poiché i download hanno superato i 200 milioni la scorsa settimana.

Oggi aggiungiamo un nuovo strumento altamente specializzato al toolkit Gemma 3: Gemma3270Mun modello compatto da 270 milioni di parametri progettato da zero per la messa a punto specifica di attività con forti capacità di seguire le istruzioni e di strutturazione del testo già addestrate.

Gemma3270M

Gemma 3 270M offre potenti capacità di seguire le istruzioni in un modello di piccolo ingombro. Come dimostrato dal benchmark IFEval (che mette alla prova la capacità di un modello di seguire istruzioni verificabili), stabilisce un nuovo livello di prestazioni per le sue dimensioni, rendendo le sofisticate funzionalità di intelligenza artificiale più accessibili per le applicazioni su dispositivo e di ricerca.

Funzionalità principali di Gemma 3 270M

Architettura compatta e capace: Il nostro nuovo modello ha un totale di 270 milioni di parametri: 170 milioni di parametri di incorporamento grazie all’ampia dimensione del vocabolario e 100 milioni per i nostri blocchi trasformatore. Grazie all’ampio vocabolario di 256.000 token, il modello può gestire token specifici e rari, rendendolo un modello base forte da perfezionare ulteriormente in domini e lingue specifici.

Efficienza energetica estrema: Un vantaggio chiave del Gemma 3 270M è il basso consumo energetico. Test interni su un SoC Pixel 9 Pro mostrano che il modello quantizzato INT4 ha utilizzato solo lo 0,75% della batteria per 25 conversazioni, rendendolo il nostro modello Gemma più efficiente dal punto di vista energetico.

Istruzioni seguenti: Un modello ottimizzato per le istruzioni viene rilasciato insieme a un checkpoint pre-addestrato. Anche se questo modello non è progettato per casi d’uso conversazionali complessi, è un modello potente che segue le istruzioni generali fin dal primo utilizzo.

In ingegneria, il successo è definito dall’efficienza, non solo dalla potenza pura. Non useresti una mazza per appendere una cornice. Lo stesso principio vale per costruire con l’intelligenza artificiale.

Gemma 3 270M incarna questa filosofia dello “strumento giusto per il lavoro”. È un modello di base di alta qualità che segue le istruzioni fin dal primo utilizzo e il suo vero potere viene sbloccato attraverso la messa a punto. Una volta specializzato, può eseguire attività come la classificazione del testo e l’estrazione dei dati con notevole precisione, velocità ed efficienza in termini di costi. Partendo da un modello compatto e capace, è possibile costruire sistemi di produzione snelli, veloci e notevolmente più economici da gestire.

Un progetto concreto per il successo

La potenza di questo approccio ha già prodotto risultati incredibili nel mondo reale. Un esempio perfetto è il lavoro svolto da Adaptive ML con SK Telecom. Di fronte alla sfida della moderazione dei contenuti multilingue e sfumata, hanno scelto di specializzarsi. Invece di utilizzare un modello massiccio e generico, Adaptive ML ha messo a punto un modello Gemma 3 4B. I risultati sono stati sorprendenti: il modello specializzato Gemma non solo ha raggiunto, ma ha superato, le prestazioni di modelli proprietari molto più grandi nel suo compito specifico.

Gemma 3 270M è progettato per consentire agli sviluppatori di portare questo approccio ancora oltre, sbloccando un’efficienza ancora maggiore per attività ben definite. È il punto di partenza perfetto per creare una flotta di piccoli modelli specializzati, ognuno esperto nel proprio compito.

Ma questo potere di specializzazione non riguarda solo le attività aziendali; consente inoltre potenti applicazioni creative. Ad esempio, controlla questa app web Bedtime Story Generator:

Gemma 3 270M utilizzato per alimentare un’app Web Bedtime Story Generator utilizzando Transformers.js. Le dimensioni e le prestazioni del modello lo rendono adatto per attività creative offline, basate sul Web. (Credito: Joshua (@xenovacom su X) del team Hugging Face)

Quando scegliere Gemma 3 270M

Gemma 3 270M eredita l’architettura avanzata e il robusto pre-addestramento della collezione Gemma 3, fornendo una solida base per le vostre applicazioni personalizzate.

Ecco quando è la scelta perfetta:

Hai un compito ad alto volume e ben definito. Ideale per funzioni come analisi del sentiment, estrazione di entità, instradamento di query, elaborazione di testi da non strutturati a strutturati, scrittura creativa e controlli di conformità.

Devi far sì che ogni millisecondo e microcentesimo conti. Riduci drasticamente, o elimina, i costi di inferenza in produzione e fornisci risposte più rapide ai tuoi utenti. Un modello 270M ottimizzato può essere eseguito su un’infrastruttura leggera ed economica o direttamente sul dispositivo.

È necessario iterare e distribuire rapidamente. Le dimensioni ridotte di Gemma 3 270M consentono rapidi esperimenti di messa a punto, aiutandoti a trovare la configurazione perfetta per il tuo caso d’uso in poche ore, non in giorni.

È necessario garantire la privacy dell’utente. Poiché il modello può essere eseguito interamente sul dispositivo, puoi creare applicazioni che gestiscono informazioni sensibili senza mai inviare dati al cloud.

Desideri una flotta di modelli di attività specializzati. Costruisci e distribuisci più modelli personalizzati, ciascuno addestrato da esperti per un’attività diversa, senza sforare il budget.

Inizia con la messa a punto

Vogliamo rendere il più semplice possibile trasformare Gemma 3 270M nella tua soluzione personalizzata. È costruito sulla stessa architettura del resto dei modelli Gemma 3, con ricette e strumenti per iniziare rapidamente. Puoi trovare la nostra guida su messa a punto completa utilizzando Gemma 3 270M come parte dei documenti Gemma.

Il Gemmaverse si basa sull’idea che l’innovazione è disponibile in tutte le dimensioni. Con Gemma 3 270M, diamo agli sviluppatori la possibilità di creare soluzioni AI più intelligenti, veloci ed efficienti. Non vediamo l’ora di vedere i modelli specializzati che creerai.

Fonte: deepmind.google