Costruisci il tuo regressore dell’albero decisionale (da zero in Python) e scopri cosa c’è sotto il cofano
In questo articolo, dimostrerò attraverso un semplice esempio, un diagramma di flusso e un codice: l’intera logica implementata dietro il cofano di un regressore dell’albero decisionale (ovvero albero di regressione). Dopo averlo letto, sarai in grado di farti un’idea chiara del funzionamento degli alberi di regressione e sarai più attento e fiducioso nell’usarli e ottimizzarli nella tua prossima sfida di regressione.
Tratteremo quanto segue:
- Una fantastica introduzione agli alberi decisionali
- Generazione di un set di dati giocattolo per l’addestramento del nostro albero di regressione
- Descrivere la logica dell’albero di regressione sotto forma di diagramma di flusso
- Fare riferimento al diagramma di flusso per scrivere il codice utilizzando NumPy e Pandas ed effettuare la prima divisione
- Visualizzare l’albero decisionale dopo la nostra prima suddivisione, utilizzando Plotly
- Generalizzare il codice utilizzando la ricorsione per costruire l’intero albero di regressione
- Utilizzare scikit-learn per eseguire la stessa attività e confrontare i risultati (spoiler: sarai così orgoglioso di aver prodotto lo stesso risultato di scikit-learn!)
Gli alberi decisionali sono algoritmi di apprendimento automatico che possono essere utilizzati per risolvere sia problemi di classificazione che di regressione. Anche se la classificazione e la regressione sono intrinsecamente diverse l’una dall’altra, gli alberi decisionali cercano di affrontare entrambi questi problemi in modo elegante in cui l’obiettivo finale è trovare la migliore suddivisione in un dato nodo. E il modo in cui viene determinata la migliore suddivisione è ciò che rende un albero di classificazione e un albero di regressione diversi l’uno dall’altro.
Nel mio precedente articoloHo accennato alle nozioni di base su come un albero decisionale risolve un problema di classificazione. Ho utilizzato un set di dati a due classi per dimostrare un processo passo passo per comprendere come viene generata una regola decisionale su ciascun nodo utilizzando misure di impurità dei dati come l’entropia, e successivamente ho implementato un algoritmo ricorsivo in Python per produrre l’albero decisionale finale . Non sono sicuro se dovresti aggiungere Questo articolo nella tua lista di lettura? Usiamo una decisione…
Fonte: towardsdatascience.com