Se ti piace o vuoi imparare l’apprendimento automatico con scikit-learn, dai un’occhiata alla mia serie di tutorial su questo fantastico pacchetto:
Tutorial di Sklearn
Tutte le immagini per autore.
I modelli fittizi sono modelli molto semplicistici che devono essere utilizzati come base per confrontare i modelli reali. Una linea di base è solo una sorta di punto di riferimento con cui confrontarti. Quando calcoli i primi risultati della convalida incrociata per stimare le prestazioni del tuo modello, di solito sai che maggiore è il punteggio, meglio è, e se il punteggio è piuttosto alto al primo tentativo, è fantastico. Ma di solito non è così.
Cosa fare se il primo punteggio di precisione è piuttosto basso o inferiore a quello che desideri o ti aspetti? È a causa dei dati? È colpa del tuo modello? Entrambi? Come possiamo sapere rapidamente se il nostro modello non è mal messo a punto?
I modelli fittizi sono qui per rispondere a queste domande. La loro complessità e “intelligenza” sono molto basse: l’idea è che tu possa confrontare i tuoi modelli con loro per vedere quanto sei migliore rispetto ai modelli “più stupidi”. Tieni presente che non prevedono intenzionalmente valori stupidi, prendono semplicemente l’ipotesi intelligente più semplice e molto semplicistica. Se il tuo modello offre prestazioni peggiori rispetto al modello fittizio, dovresti mettere a punto o modificare completamente il tuo modello.
Un semplice esempio di regressore fittizio sarebbe quello di prevedere sempre il valore medio dell’obiettivo di allenamento, qualunque sia l’input: non è l’ideale, ma in media fornisce un’ipotesi ragionevolmente semplicistica. Se il tuo modello attuale fornisce risultati peggiori rispetto a questo approccio molto, molto semplice, potresti voler rivedere il tuo modello.
Fonte: towardsdatascience.com