In vista dell'AI & Big Data Expo Europe, AI News ha incontrato Ivo Everts, Senior Solutions Architect presso Databricksper discutere diversi sviluppi chiave destinati a plasmare il futuro dell’intelligenza artificiale open source e della governance dei dati.
Uno dei risultati più importanti di Databricks è il DBRX modello, che stabilisce un nuovo standard per i modelli linguistici aperti di grandi dimensioni (LLM).
“Al momento del rilascio, DBRX ha sovraperformato tutti gli altri principali modelli aperti rispetto ai benchmark standard e ha un'inferenza fino a 2 volte più veloce rispetto a modelli come Llama2-70B”, spiega Everts. “È stato addestrato in modo più efficiente grazie a una serie di progressi tecnologici.
“Dal punto di vista della qualità, crediamo che DBRX sia uno dei migliori modelli open source disponibili e quando ci riferiamo a “migliore” intendiamo un'ampia gamma di parametri di riferimento del settore, tra cui comprensione del linguaggio (MMLU), programmazione (HumanEval), e matematica (GSM8K).”
Il modello di intelligenza artificiale open source mira a “democratizzare la formazione di LLM personalizzati oltre una piccola manciata di fornitori di modelli e mostrare alle organizzazioni che possono formare LLM di livello mondiale sui propri dati in modo economicamente vantaggioso”.
In linea con il proprio impegno per gli ecosistemi aperti, Databricks ha anche adottato l'open source Catalogo dell'Unità.
“L'open source Unity Catalog ne migliora l'adozione su piattaforme cloud (ad esempio AWS, Azure) e infrastrutture on-premise”, osserva Everts. “Questa flessibilità consente alle organizzazioni di applicare in modo uniforme le policy di governance dei dati indipendentemente da dove i dati vengono archiviati o elaborati”.
Unity Catalog affronta le sfide legate alla proliferazione dei dati e ai controlli di accesso incoerenti attraverso varie funzionalità:
- Gestione centralizzata dell'accesso ai dati: “Unity Catalog centralizza la governance delle risorse di dati, consentendo alle organizzazioni di gestire i controlli di accesso in modo unificato”, afferma Everts.
- Controllo degli accessi basato sui ruoli (RBAC): Secondo Everts, Unity Catalog “implementa il controllo degli accessi basato sui ruoli (RBAC), consentendo alle organizzazioni di assegnare ruoli e autorizzazioni in base ai profili utente”.
- Derivazione e controllo dei dati: Questa funzionalità “aiuta le organizzazioni a monitorare l'utilizzo e le dipendenze dei dati, semplificando l'identificazione e l'eliminazione dei dati ridondanti o obsoleti”, spiega Everts. Aggiunge che “registra anche tutti gli accessi e le modifiche ai dati, fornendo una traccia di controllo dettagliata per garantire la conformità con le politiche di sicurezza dei dati”.
- Supporto cross-cloud e ibrido: Everts sottolinea che Unity Catalog “è progettato per gestire la governance dei dati in ambienti multi-cloud e ibridi” e “garantisce che i dati siano governati in modo uniforme, indipendentemente da dove risiedono”.
L'azienda ha introdotto Databrick AI/BIun nuovo prodotto di business intelligence che sfrutta l’intelligenza artificiale generativa per migliorare l’esplorazione e la visualizzazione dei dati. Everts ritiene che “una soluzione BI veramente intelligente debba comprendere la semantica e le sfumature uniche di un’azienda per rispondere in modo efficace alle domande degli utenti aziendali”.
Il sistema AI/BI comprende due componenti chiave:
- Cruscotti: Everts la descrive come “un'interfaccia a basso codice basata sull'intelligenza artificiale per la creazione e la distribuzione di dashboard veloci e interattive”. Questi includono “funzionalità BI standard come visualizzazioni, filtri incrociati e report periodici senza la necessità di servizi di gestione aggiuntivi”.
- Genio: Everts lo spiega come “un’interfaccia conversazionale per affrontare domande ad hoc e di follow-up attraverso il linguaggio naturale”. Aggiunge che “impara dai dati sottostanti per generare visualizzazioni e suggerimenti adattivi in risposta alle domande degli utenti, migliorando nel tempo attraverso il feedback e offrendo strumenti agli analisti per perfezionare i propri risultati”.
Everts afferma che Databricks AI/BI è progettato per fornire “una profonda comprensione della semantica dei dati, consentendo l'analisi dei dati self-service per tutti in un'organizzazione”. Secondo lui è alimentato da “un sistema di intelligenza artificiale composto che apprende continuamente dall'utilizzo dell'intero stack di dati di un'organizzazione, comprese le pipeline ETL, il lignaggio e altre query”.
Presentato anche Databricks Mosaico AIche Everts descrive come “una piattaforma completa per la creazione, l'implementazione e la gestione di applicazioni di machine learning e intelligenza artificiale generativa, che integra dati aziendali per migliorare prestazioni e governance”.
Mosaic AI offre diversi componenti chiave, che Everts delinea:
- Utensili unificati: Fornisce “strumenti per creare, implementare, valutare e governare soluzioni di intelligenza artificiale e machine learning, supportando modelli predittivi e applicazioni di intelligenza artificiale generativa”.
- Modelli di intelligenza artificiale generativa: “Supporta il prompt engineering, il recupero della generazione aumentata (RAG), la messa a punto e la pre-formazione, offrendo flessibilità in base all'evoluzione delle esigenze aziendali.”
- Gestione centralizzata del modello: “Il Model Serving consente l'implementazione, la governance e l'esecuzione di query centralizzate di modelli di intelligenza artificiale, inclusi modelli ML personalizzati e modelli di base.”
- Monitoraggio e governance: “Lakehouse Monitoring e Unity Catalog garantiscono monitoraggio, governance e tracciamento completi dell'intero ciclo di vita dell'IA.”
- LLM personalizzati convenienti: “Consente la formazione e la fornitura di modelli linguistici personalizzati di grandi dimensioni a costi notevolmente inferiori, adattati a specifici domini organizzativi.”
Everts sottolinea che l'approccio di Mosaic AI alla messa a punto e alla personalizzazione dei modelli di base include funzionalità uniche come “tempi di avvio rapidi” mediante “l'utilizzo della memorizzazione nella cache del modello base in-cluster”, “valutazione tempestiva in tempo reale” in cui gli utenti possono “monitorare come le risposte del modello cambiano durante il processo di formazione” e il supporto per “checkpoint pre-addestrati personalizzati”.
Al centro di queste innovazioni c'è il Piattaforma di intelligenza dei datiche secondo Everts “trasforma la gestione dei dati utilizzando modelli di intelligenza artificiale per ottenere informazioni approfondite sulla semantica dei dati aziendali”. La piattaforma combina funzionalità di data lake e data warehouse, utilizza la tecnologia Delta Lake per l'elaborazione dei dati in tempo reale e incorpora Delta Sharing per lo scambio sicuro di dati oltre i confini dell'organizzazione.
Everts spiega che la piattaforma di data intelligence svolge un ruolo cruciale nel supportare nuove iniziative di intelligenza artificiale e condivisione dei dati fornendo:
- Una piattaforma unificata di dati e intelligenza artificiale che “combina le funzionalità di data lake e data warehouse in un'unica architettura”.
- Delta Lake per l'elaborazione dei dati in tempo realegarantendo “governance dei dati affidabile, transazioni ACID ed elaborazione dei dati in tempo reale”.
- Collaborazione e condivisione dei dati tramite Delta Sharing, consentendo “la condivisione sicura e aperta dei dati oltre i confini dell’organizzazione”.
- Supporto integrato per l'apprendimento automatico e lo sviluppo di modelli AI con librerie popolari come MLflow, PyTorch e TensorFlow.
- Scalabilità e prestazioni attraverso la sua architettura nativa del cloud e il motore Photon, “un motore di esecuzione delle query ottimizzato”.
In qualità di sponsor principale di AI e Big Data Expo EuropaDatabricks prevede di mostrare le proprie soluzioni di intelligenza artificiale e governance dei dati open source durante l'evento.
“Presso il nostro stand mostreremo anche come creare e distribuire, con le app Lakehouse, un'app GenAI personalizzata da zero utilizzando modelli open source di Hugging Face e dati di Unity Catalog”, afferma Everts.
“Con la nostra app GenAI puoi generare la tua immagine di cartone animato, il tutto in esecuzione sulla piattaforma di Data Intelligence.”
Databricks condivideranno maggiormente la loro esperienza quest'anno AI e Big Data Expo Europa. Passa allo stand di Databricks allo stand n. 280 per saperne di più sull'intelligenza artificiale aperta e sul miglioramento della governance dei dati.
Esplora altri prossimi eventi e webinar sulla tecnologia aziendale forniti da TechForge Qui.
Fonte: www.artificialintelligence-news.com