Meta alza il livello con Llama 3 LLM open source

 | Intelligenza-Artificiale

Meta ha introdotto Lama 3la prossima generazione del suo modello LLM (Large Language Model) open source all'avanguardia. Il colosso della tecnologia afferma che Llama 3 stabilisce nuovi parametri di riferimento in termini di prestazioni, superando i precedenti modelli leader del settore come GPT-3.5 negli scenari del mondo reale.

“Con Llama 3, abbiamo deciso di creare i migliori modelli aperti che siano alla pari con i migliori modelli proprietari disponibili oggi”, ha affermato Meta in un post sul blog che annuncia il rilascio.

I modelli iniziali di Llama 3 aperti sono versioni da 8 miliardi e 70 miliardi di parametri. Meta afferma che i suoi team stanno ancora formando modelli più ampi con oltre 400 miliardi di parametri che saranno rilasciati nei prossimi mesi, insieme a documenti di ricerca che descrivono in dettaglio il lavoro.

La realizzazione di Llama 3 ha richiesto più di due anni, con notevoli risorse dedicate all'assemblaggio di dati di formazione di alta qualità, all'ampliamento della formazione distribuita, all'ottimizzazione dell'architettura del modello e ad approcci innovativi per la messa a punto dell'istruzione.

Il modello ottimizzato di istruzioni per parametri da 70 miliardi di Meta ha sovraperformato GPT-3.5, Claude e altri LLM di scala comparabile nelle valutazioni umane in 12 scenari di utilizzo chiave come codifica, ragionamento e scrittura creativa. Il modello preaddestrato da 8 miliardi di parametri dell'azienda stabilisce inoltre nuovi parametri di riferimento per le attività di valutazione LLM più diffuse:

“Crediamo che questi siano i migliori modelli open source della loro categoria, punto”, ha affermato Meta.

Il colosso della tecnologia sta rilasciando i modelli tramite un approccio “aperto per impostazione predefinita” per promuovere un ecosistema aperto attorno allo sviluppo dell’intelligenza artificiale. Llama 3 sarà disponibile su tutti i principali fornitori di cloud, host di modelli, produttori di hardware e piattaforme di intelligenza artificiale.

Victor Botev, CTO e co-fondatore di Iris.ai, ha dichiarato: “Con lo spostamento globale verso la regolamentazione dell’IA, il lancio del modello Llama 3 di Meta è degno di nota. Abbracciando la trasparenza attraverso l’open-sourcing, Meta si allinea con la crescente enfasi sulle pratiche di intelligenza artificiale responsabile e sullo sviluppo etico.

“Inoltre, ciò garantisce l'opportunità di un'educazione comunitaria più ampia poiché i modelli aperti facilitano la comprensione dello sviluppo e la capacità di esaminare attentamente vari approcci, con questa trasparenza che si ripercuote sulla stesura e sull'applicazione della regolamentazione.”

Ad accompagnare gli ultimi modelli di Meta c'è una suite aggiornata di strumenti di sicurezza AI, comprese le seconde iterazioni di Llama Guard per la classificazione dei rischi e CyberSec Eval per valutare il potenziale uso improprio. È stato inoltre introdotto un nuovo componente chiamato Code Shield per filtrare i suggerimenti di codice non sicuro al momento dell'inferenza.

“Tuttavia, è importante mantenere la prospettiva: un modello semplicemente open source non equivale automaticamente a un'intelligenza artificiale etica”, ha continuato Botev. “Affrontare le sfide dell’intelligenza artificiale richiede un approccio globale per affrontare questioni come la privacy dei dati, i pregiudizi algoritmici e gli impatti sociali – tutti punti chiave delle normative emergenti sull’intelligenza artificiale in tutto il mondo.

“Mentre iniziative aperte come Llama 3 promuovono il controllo e la collaborazione, il loro vero impatto dipende da un approccio olistico alla conformità della governance dell’IA e dall’integrazione dell’etica nei cicli di vita dei sistemi di intelligenza artificiale. I continui sforzi di Meta con il modello Llama rappresentano un passo nella giusta direzione, ma l’intelligenza artificiale etica richiede un impegno costante da parte di tutte le parti interessate”.

Meta afferma di aver adottato un “approccio a livello di sistema” per lo sviluppo e l'implementazione responsabile dell'IA con Llama 3. Sebbene i modelli siano stati sottoposti a test di sicurezza approfonditi, l'azienda sottolinea che gli sviluppatori dovrebbero implementare il proprio filtraggio di input/output in linea con i requisiti della loro applicazione .

Il prodotto per l'utente finale dell'azienda che integra Llama 3 è Meta AI, che secondo Meta è ora l'assistente AI leader a livello mondiale grazie ai nuovi modelli. Gli utenti possono accedere a Meta AI tramite Facebook, Instagram, WhatsApp, Messenger e altri ragnatela per produttività, apprendimento, creatività e domande generali.

Sono in arrivo versioni multimodali di Meta AI che integrano funzionalità di visione, con un'anteprima in arrivo sugli occhiali intelligenti Ray-Ban di Meta.

Nonostante i notevoli risultati ottenuti da Llama 3, alcuni nel campo dell'intelligenza artificiale hanno espresso scetticismo sul fatto che Meta sia motivata da un approccio aperto “per il bene della società”.

Tuttavia, solo un giorno dopo il set di Mistral AI un nuovo punto di riferimento per i modelli open source con Mixtral 8x22B, il rilascio di Meta alza ancora una volta il livello per i LLM apertamente disponibili.

Guarda anche: SAS mira a rendere l'intelligenza artificiale accessibile indipendentemente dalle competenze con modelli di intelligenza artificiale pacchettizzati

Vuoi saperne di più sull'intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell'intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. L'evento completo è collocato in contemporanea con altri eventi importanti, tra cui BlockX, Settimana della trasformazione digitaleE Fiera sulla sicurezza informatica e sul cloud.

Esplora altri prossimi eventi e webinar sulla tecnologia aziendale forniti da TechForge Qui.

Tag: ai, intelligenza artificiale, modello linguistico di grandi dimensioni, lama 3, llm, meta, fonte aperta

Fonte: www.artificialintelligence-news.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *