Tra le librerie ML, scikit-learn è di fatto il framework più semplice e facile per apprendere il ML. Si basa sullo stack scientifico (principalmente NumPy), si concentra su algoritmi tradizionali ma potenti come la regressione lineare/macchine vettoriali di supporto/riduzioni della dimensionalità e fornisce molti strumenti per costruire attorno a tali algoritmi (come valutazione e selezione del modello, ottimizzazione degli iperparametri, dati preelaborazione e selezione delle funzionalità).
Ma il suo vantaggio principale è, senza dubbio, la documentazione e la guida per l’utente. Puoi letteralmente imparare quasi tutto solo dal sito web scikit-learn, con molti esempi.
Tieni presente che altri framework popolari sono TensorFlow e PyTorch, ma hanno curve di apprendimento più ripide e si concentrano su argomenti più complessi come la visione artificiale e le reti neurali. Dato che questo è il mio primo vero contatto con ML, ho pensato di iniziare con sklearn.
Ho già iniziato a leggere la documentazione qualche mese fa, ma mi sono un po’ perso date le sue dimensioni. Sebbene la documentazione sia enorme e scritta molto bene, non sono sicuro che il modo migliore per imparare scikit-learn sia seguire l’intera documentazione una pagina dopo l’altra.
La buona notizia, e la cosa che ha innescato la mia intenzione di imparare ulteriormente scikit-learn, è stata l’inizio del MOOC “ufficiale” di scikit-learn, creato dall’attuale team di scikit-learn.
In questa serie cercherò di riassumere ciò che ho imparato da ciascuno dei 6 moduli che compongono il MOOC. Questo è un ottimo esercizio per esercitare la mia memoria e riassumere ciò che ho imparato, e una buona introduzione per te se vuoi entrare in contatto con sklearn.
Fonte: towardsdatascience.com