Una guida per sviluppatori e architetti, in particolare per coloro che non sono specializzati nell’apprendimento automatico, per progettare un’architettura MLOps per la propria organizzazione
introduzione
Secondo i risultati di Gartner, solo il 53% dei progetti di machine learning (ML) passa dalla prova di concetto (POC) alla produzione. Spesso c’è un disallineamento tra gli obiettivi strategici dell’azienda e i modelli di machine learning costruiti dai data scientist. Potrebbe esserci una mancanza di comunicazione tra DevOps, sicurezza, ufficio legale, IT e data scientist che causa difficoltà nel portare il modello in produzione. Infine, il team potrebbe avere difficoltà a mantenere i modelli in produzione lanciando al contempo nuovi modelli. Ha portato alla crescita di MLOps che porta i principi di DevOps, come integrazione continua e distribuzione continua (CI/CD), automazione e collaborazione al ciclo di vita del machine learning: sviluppo, implementazione e monitoraggio.
In questo articolo approfondirò quanto segue:
- Vari passaggi nel processo di apprendimento automatico
- Diversi componenti MLOps e spiega perché sono necessari senza entrare troppo nei dettagli che solo i data scientist devono conoscere
- Diagrammi dell’architettura MLOps in base alle dimensioni e alla maturità dell’organizzazione
- Suggerimenti generali su come iniziare il viaggio MLOps
Tipico processo di apprendimento automatico
Iniziamo innanzitutto comprendendo i passaggi coinvolti nel processo di apprendimento automatico.
Un processo di machine learning ha i seguenti componenti:
- Problema aziendale e dichiarazione del problema di machine learning: Iniziamo il processo identificando il problema aziendale e concordando che l’apprendimento automatico è la soluzione giusta per il problema. La soluzione di machine learning proposta dovrebbe produrre un risultato aziendale misurabile.
- Raccolta, integrazione e pulizia dei dati: In questa fase, i data scientist/data engineer raccolgono dati, li integrano con diverse fonti e li puliscono e trasformano per renderli pronti per il consumo. Dati…
Fonte: towardsdatascience.com