Accelerazione dello sviluppo di applicazioni ML: integrazioni del flusso d'aria pronte per la produzione con strumenti di intelligenza artificiale critici

 | Intelligenza-Artificiale

L’intelligenza artificiale generativa e l’apprendimento automatico operativo svolgono un ruolo cruciale nel moderno panorama dei dati consentendo alle organizzazioni di sfruttare i propri dati per alimentare nuovi prodotti e aumentare la soddisfazione dei clienti. Queste tecnologie vengono utilizzate per assistenti virtuali, sistemi di consigli, generazione di contenuti e altro ancora. Aiutano le organizzazioni a creare un vantaggio competitivo attraverso processi decisionali basati sui dati, automazione, processi aziendali migliorati ed esperienze dei clienti.

Apache Airflow è al centro delle operazioni ML di molti team e, con le nuove integrazioni per Large Language Models (LLM), Airflow consente a questi team di creare applicazioni di qualità produttiva con la ultimi progressi nel machine learning e nell'intelligenza artificiale.

Semplificazione dello sviluppo ML

Troppo spesso i modelli di machine learning e l’analisi predittiva vengono creati in silos, lontani dai sistemi e dalle applicazioni di produzione. Le organizzazioni affrontano la sfida continua di trasformare il notebook di un singolo data scientist in un'applicazione pronta per la produzione con stabilità, scalabilità, conformità, ecc.

Organizzazioni che standardizzano su un'unica piattaforma per orchestrando i flussi di lavoro DataOps e MLOpstuttavia, sono in grado di ridurre non solo gli attriti dello sviluppo end-to-end ma anche i costi infrastrutturali e la proliferazione dell’IT. Sebbene possa sembrare controintuitivo, questi team beneficiano anche di una maggiore scelta. Quando la piattaforma di orchestrazione centralizzata, come Apache Airflow, è open source e include integrazioni con quasi tutti gli strumenti e le piattaforme di dati, i team di dati e ML possono scegliere gli strumenti che funzionano meglio per le loro esigenze godendo al tempo stesso dei vantaggi di standardizzazione, governance e risoluzione dei problemi semplificata. e riusabilità.

Flusso d'aria di Apache E Astro (la piattaforma di orchestrazione Airflow completamente gestita di Astronomer) è il luogo in cui ingegneri di dati e ingegneri di ML si incontrano per creare valore aziendale dal ML operativo. Con un numero enorme di pipeline di ingegneria dei dati in esecuzione su Airflow ogni giorno in ogni settore e settore, Airflow è il cavallo di battaglia delle moderne operazioni sui dati e i team ML possono sfruttare questa base non solo per l'inferenza del modello ma anche per la formazione, la valutazione e il monitoraggio .

Ottimizzazione del flusso d'aria per applicazioni ML avanzate

Mentre le organizzazioni continuano a trovare modi per sfruttare modelli linguistici di grandi dimensioni, Airflow è sempre più al centro dell'operatività di cose come l'elaborazione dei dati non strutturati, Recupero della generazione aumentata (RAG)elaborazione del feedback e messa a punto dei modelli di fondazione. Per supportare questi nuovi casi d'uso e fornire un punto di partenza per gli utenti di Airflow, Astronomer ha collaborato con la comunità di Airflow per creare Chiedi ad Astro—come implementazione di riferimento pubblico di RAG con Airflow per l'intelligenza artificiale conversazionale.

Più in generale, Astronomer ha guidato lo sviluppo di nuove integrazioni con database vettoriali e fornitori LLM per supportare questa nuova generazione di applicazioni e le pipeline necessarie per mantenerle sicure, aggiornate e gestibili.

Connettiti ai servizi LLM e ai database vettoriali più utilizzati

Apache Airflow, in combinazione con alcuni dei database vettoriali più utilizzati (Weaviate, Pinecone, OpenSearch, pgvector) e fornitori di elaborazione del linguaggio naturale (NLP) (OpenAI, Cohere), offre estensibilità attraverso le ultime novità nello sviluppo open source. Insieme, consentono un'esperienza di prima classe nello sviluppo RAG per applicazioni come intelligenza artificiale conversazionale, chatbot, analisi delle frodi e altro ancora.

OpenAI

OpenAI è una società di ricerca e implementazione dell'intelligenza artificiale che fornisce un'API per l'accesso a modelli all'avanguardia come GPT-4 e DALL·E 3. Fornitore di flusso d'aria OpenAI offre moduli per integrare facilmente OpenAI con Airflow. Gli utenti possono generare incorporamenti per i dati, un passaggio fondamentale nella PNL con applicazioni basate su LLM.

Visualizza il tutorial → Orchestra le operazioni OpenAI con Apache Airflow

Coerente

Cohere è una piattaforma NLP che fornisce un'API per accedere a LLM all'avanguardia. IL Fornitore di flussi d'aria Cohere offre moduli per integrare facilmente Cohere con Airflow. Gli utenti possono sfruttare questi LLM focalizzati sull'azienda per creare facilmente applicazioni NLP utilizzando i propri dati.

Visualizza il tutorial → Orchestra i LLM Cohere con Apache Airflow

Tessitura

Tessitura è un database vettoriale open source che memorizza incorporamenti ad alta dimensione di oggetti come testo, immagini, audio o video. IL Fornitore di flussi d'aria Weaviate offre moduli per integrare facilmente Weaviate con Airflow. Gli utenti possono elaborare incorporamenti di vettori ad alta dimensione utilizzando un database vettoriale open source, che fornisce un ricco set di funzionalità, eccezionale scalabilità e affidabilità.

Visualizza il tutorial → Orchestra le operazioni di Weaviate con Apache Airflow

pgvettore

pgvector è un'estensione open source per i database PostgreSQL che aggiunge la capacità di archiviare ed eseguire query su incorporamenti di oggetti ad alta dimensione. IL pgvettore Fornitore del flusso d'aria offre moduli per integrare facilmente pgvector con Airflow. Gli utenti possono sbloccare potenti funzionalità per lavorare con i vettori in uno spazio ad alta dimensione con questa estensione open source per il loro database PostgreSQL.

Visualizza il tutorial → Orchestra le operazioni di pgvettori con Apache Airflow

Pigna

Pinecone è una piattaforma di database vettoriale proprietaria progettata per la gestione di applicazioni AI basate su vettori su larga scala. IL Fornitore di flusso d'aria Pinecone offre moduli per integrare facilmente Pinecone con Airflow.

Visualizza il tutorial → Orchestra le operazioni di Pinecone con Apache Airflow

OpenSearch

OpenSearch è un motore di ricerca e analisi distribuito open source basato su Apache Lucene. Offre funzionalità di ricerca avanzate su grandi quantità di testo insieme a potenti plug-in di apprendimento automatico. IL Fornitore OpenSearch Airflow offre moduli per integrare facilmente OpenSearch con Airflow.

Visualizza il tutorial → Orchestra le operazioni OpenSearch con Apache Airflow

Informazioni aggiuntive

Consentendo ai team incentrati sui dati di integrare più facilmente pipeline di dati ed elaborazione dei dati con flussi di lavoro ML, le organizzazioni possono semplificare lo sviluppo dell'intelligenza artificiale operativa e realizzare il potenziale dell'intelligenza artificiale e dell'elaborazione del linguaggio naturale in un contesto operativo. Pronto per immergerti più a fondo da solo? Scopri i moduli disponibili progettati per una facile integrazione—visitare il Registro Astro per vedere gli ultimi DAG di esempio AI/ML.

Fonte: www.artificialintelligence-news.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *