Confronto tra regressione logistica e classificazione casuale delle foreste nelle raccomandazioni delle ricette
Un tipico flusso di lavoro di machine learning raramente prevede l’applicazione di un unico approccio al problema in questione. I modelli generalmente passano attraverso un processo iterativo con varie tecniche applicate e valutate. Le strategie di ingegneria delle funzionalità vengono testate, scartate e quindi rivisitate; gli algoritmi e i loro parametri vengono iterati in modo esaustivo, a volte per un miglioramento solo di una frazione di percentuale. Questo processo ciclico di sperimentazione e perfezionamento è essenziale per lavorare verso una soluzione solida.
L'articolo seguente è una dimostrazione di un tipico flusso di lavoro per preparare, testare, confrontare e assegnare un punteggio a un modello di classificazione per un determinato problema. In questo esempio, il team di prodotto di un ipotetico sito web di cucina sta tentando di migliorare il proprio attuale sistema di selezione delle ricette per la prima pagina del sito web, implementando un sistema di apprendimento automatico basato sulle prestazioni passate delle ricette selezionate manualmente. A tal fine, vengono applicati due algoritmi: una regressione logistica…
Fonte: towardsdatascience.com