Una semplice configurazione CI/CD per progetti ML | di Marcello Politi | Dicembre 2023 | Intelligenza-Artificiale

Indice contenuti

fotografato da vackground.com SU Unsplash

Applica le best practice e impara a utilizzare GitHub Actions per creare codice affidabile

introduzione

Trattare con integrazioni, distribuzione, scalabilità e tutti quegli argomenti che rendono i progetti di Machine Learning un vero prodotto sono un lavoro a sé stante. C’è un motivo per cui esistono diverse posizioni lavorative che vanno dal data scientist all’ingegnere ML e MLOps. Tuttavia, anche se non è necessario essere un esperto di questi argomenti, lo è è bene avere alcune pratiche standard ben definite che possano aiutarti quando avvii un progetto. Certamente! In questo articolo descrivo le migliori pratiche che ho sviluppato: un equilibrio tra la qualità del codice e il tempo investito nella loro implementazione. Eseguo il mio codice Nota profondache è un notebook basato su cloud, ottimo per progetti collaborativi di data science.

Inizia in modo semplice: Leggimi

Questo può sembrare banale ma prova a mantenere un file Leggimi più o meno aggiornato. Se ti costa poco tempo, e ti piace, prova anche a fare un Readme che ti faccia bella figura. Includi icone di intestazioni immaginarie o altro. Questo file deve essere chiaro e comprensibile. Ricorda che in un progetto reale non lavorerai solo con altri sviluppatori ma anche con venditori e project manager, che di tanto in tanto potrebbero dover leggere il file Leggimi per capire su cosa stai lavorando.

Potete trovare Qui un modello readme davvero carino!

Usa ambienti virtuali, il tuo laptop sarà felice

Probabilmente lo sai meglio di me, per sviluppare un progetto interessante abbiamo bisogno di librerie esterne. Spesso molti! Questi le librerie potrebbero avere dipendenze o conflitti. Ecco perché è a buona idea creare ambienti virtuali. Un ambiente virtuale ti aiuta avere progetti isolati gli uni dagli altriavere ambienti di sviluppo completamente diversi. Di solito, per farlo in Python tu usa pip o conda.

Fonte: towardsdatascience.com