Databricks afferma che DBRX stabilisce “un nuovo standard” per i LLM open source

 | Intelligenza-Artificiale

Databricks ha annunciato il lancio di DBRX, un nuovo e potente modello linguistico di grandi dimensioni open source che, a suo avviso, stabilisce un nuovo standard per i modelli aperti superando opzioni consolidate come GPT-3.5 sui benchmark del settore.

L'azienda afferma che il modello DBRX da 132 miliardi di parametri supera i popolari LLM open source come LLaMA 2 70B, Mixtral e Grok-1 per quanto riguarda la comprensione del linguaggio, la programmazione e le attività matematiche. Su alcuni benchmark supera addirittura il modello closed-source di Anthropic, Claude.

DBRX ha dimostrato prestazioni all'avanguardia tra i modelli aperti sulle attività di codifica, battendo modelli specializzati come CodeLLaMA nonostante sia un LLM per scopi generali. Ha inoltre eguagliato o superato GPT-3.5 in quasi tutti i benchmark valutati.

Le funzionalità all'avanguardia derivano da un'architettura mista di esperti più efficiente che rende DBRX fino a 2 volte più veloce nell'inferenza rispetto a LLaMA 2 70B, nonostante abbia meno parametri attivi. Databricks afferma che l'addestramento del modello è stato anche circa 2 volte più efficiente in termini di calcolo rispetto alle alternative dense.

“DBRX sta stabilendo un nuovo standard per i LLM open source: offre alle aziende una piattaforma per creare capacità di ragionamento personalizzate basate sui propri dati”, ha affermato Ali Ghodsi, cofondatore e CEO di Databricks.

DBRX è stato pre-addestrato su ben 12 trilioni di token di dati di testo e codice “accuratamente curati” selezionati per migliorare la qualità. Sfrutta tecnologie come la codifica della posizione rotante e l'apprendimento del curriculum durante la pre-formazione.

I clienti possono interagire con DBRX tramite API o utilizzare gli strumenti dell'azienda per mettere a punto il modello sui propri dati proprietari. È già integrato nei prodotti AI di Databricks.

“La nostra ricerca mostra che le aziende intendono spendere metà dei loro budget per l’intelligenza artificiale nell’intelligenza artificiale generativa”, ha affermato Dave Menninger, direttore esecutivo di Ventana Research, parte di ISG. “Una delle tre principali sfide che devono affrontare è la sicurezza e la privacy dei dati.

“Con la loro piattaforma di Data Intelligence end-to-end e l’introduzione di DBRX, Databricks consente alle aziende di creare applicazioni di intelligenza artificiale generativa che sono governate, sicure e adattate al contesto della loro attività, mantenendo il controllo e la proprietà del proprio IP lungo tutto il percorso. modo.”

Partner tra cui Accenture, Block, Nasdaq, Prosus, Replit e Zoom hanno elogiato il potenziale di DBRX di accelerare l'adozione aziendale di modelli linguistici di grandi dimensioni aperti e personalizzati. Gli analisti affermano che ciò potrebbe favorire il passaggio da chiuso a open source poiché i modelli aperti perfezionati corrispondono alle prestazioni proprietarie.

Mike O'Rourke, responsabile AI e servizi dati del NASDAQ, ha commentato: “Databricks è un partner chiave del Nasdaq su alcuni dei nostri sistemi di dati più importanti. Continuano a essere in prima linea nel settore nella gestione dei dati e nello sfruttamento dell'intelligenza artificiale e siamo entusiasti del rilascio di DBRX.

“La combinazione tra ottime prestazioni del modello e un’economia favorevole al servizio è il tipo di innovazione che stiamo cercando mentre aumentiamo il nostro utilizzo dell’intelligenza artificiale generativa al Nasdaq”.

Puoi trovare la base DBRX e i modelli perfezionati su Volto che abbraccia. Quello del progetto GitHub contiene ulteriori risorse ed esempi di codice.

(Fotografato da Ryan Quintale)

Guarda anche: I grandi modelli linguistici potrebbero “rivoluzionare il settore finanziario entro due anni”

Vuoi saperne di più sull'intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell'intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. L'evento completo è collocato in contemporanea con altri eventi importanti, tra cui BlockX, Settimana della trasformazione digitaleE Fiera sulla sicurezza informatica e sul cloud.

Esplora altri prossimi eventi e webinar sulla tecnologia aziendale forniti da TechForge Qui.

Tag: ai, intelligenza artificiale, databrick, dbrx, impresa, modello linguistico di grandi dimensioni, llm, fonte aperta, open source

Fonte: www.artificialintelligence-news.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *