Costruire modelli di machine learning è abbastanza facile al giorno d’oggi, ma spesso fare buone previsioni non è sufficiente. In cima, vogliamo fare affermazioni causali Di interventi. Sapere con elevata precisione che un cliente lascerà la nostra azienda è positivo, ma sapere cosa fare al riguardo, ad esempio inviare un coupon, è molto meglio. Questo è un po’ più complicato e ho spiegato le basi nel mio altro articolo.
Ti consiglio di leggere questo articolo prima di continuare. Ti ho mostrato come puoi facilmente arrivare ad affermazioni causali ogni volta che le tue caratteristiche formano a set di regolazione sufficientecosa che assumerò anche per il resto dell’articolo.
La stima funziona utilizzando i cosiddetti meta-studenti. Tra questi ci sono gli studenti S e T, ciascuno con i propri svantaggi. In questo articolo ti mostrerò un altro approccio che può essere visto come un compromesso tra questi due meta-studenti che può darti risultati migliori.
Supponiamo di avere un set di dati (X, T, sì), Dove X denota alcune caratteristiche, T è un trattamento binario distinto, e sì è il risultato. Ricapitoliamo brevemente come funzionano gli studenti S e T e quando non ottengono buoni risultati.
S-studente
Se usi un S-leaner, correggi un modello M e addestrarlo sul set di dati in modo tale M(X, T) UN sì. Quindi calcoli
Effetti del trattamento = M(X, 1) – M(X, 0)
e basta.
Il problema con questo approccio è che la modalità potrebbe scegliere di ignorare la funzionalità T completamente. Questo in genere accade se hai già centinaia di funzionalità in X e T annega in questo rumore. Se questo…
Fonte: towardsdatascience.com