introduzione
Trattare con integrazioni, distribuzione, scalabilità e tutti quegli argomenti che rendono i progetti di Machine Learning un vero prodotto sono un lavoro a sé stante. C’è un motivo per cui esistono diverse posizioni lavorative che vanno dal data scientist all’ingegnere ML e MLOps. Tuttavia, anche se non è necessario essere un esperto di questi argomenti, lo è è bene avere alcune pratiche standard ben definite che possano aiutarti quando avvii un progetto. Certamente! In questo articolo descrivo le migliori pratiche che ho sviluppato: un equilibrio tra la qualità del codice e il tempo investito nella loro implementazione. Eseguo il mio codice Nota profondache è un notebook basato su cloud, ottimo per progetti collaborativi di data science.
Inizia in modo semplice: Leggimi
Questo può sembrare banale ma prova a mantenere un file Leggimi più o meno aggiornato. Se ti costa poco tempo, e ti piace, prova anche a fare un Readme che ti faccia bella figura. Includi icone di intestazioni immaginarie o altro. Questo file deve essere chiaro e comprensibile. Ricorda che in un progetto reale non lavorerai solo con altri sviluppatori ma anche con venditori e project manager, che di tanto in tanto potrebbero dover leggere il file Leggimi per capire su cosa stai lavorando.
Potete trovare Qui un modello readme davvero carino!
Usa ambienti virtuali, il tuo laptop sarà felice
Probabilmente lo sai meglio di me, per sviluppare un progetto interessante abbiamo bisogno di librerie esterne. Spesso molti! Questi le librerie potrebbero avere dipendenze o conflitti. Ecco perché è a buona idea creare ambienti virtuali. Un ambiente virtuale ti aiuta avere progetti isolati gli uni dagli altriavere ambienti di sviluppo completamente diversi. Di solito, per farlo in Python tu usa pip o conda.
Fonte: towardsdatascience.com