L’inferenza causale ha molte applicazioni tangibili in un’ampia varietà di scenari, ma secondo la mia esperienza è un argomento di cui si parla raramente tra i data scientist.
In questo articolo definiamo l’inferenza causale e ne motiviamo l’uso. Quindi, applichiamo alcuni algoritmi di base in Python per misurare l’effetto di un determinato fenomeno.
L’inferenza causale è un campo di studio interessato a misurare l’effetto di un determinato trattamento.
Un altro modo di pensare all’inferenza causale è che risponde cosa succede se domande. L’obiettivo è sempre quello di misurare un qualche tipo di impatto dato una determinata azione.
Esempi di domande a cui si risponde con inferenza causale sono:
- Qual è l’impatto della pubblicazione di una campagna pubblicitaria sulle vendite dei prodotti?
- Qual è l’effetto di un aumento dei prezzi sulle vendite?
- Questo farmaco fa guarire i pazienti più velocemente?
Possiamo vedere che queste domande sono rilevanti per i decisori, ma non possono essere affrontate con i tradizionali metodi di apprendimento automatico.
Inferenza causale vs apprendimento automatico tradizionale
Con le tradizionali tecniche di machine learning, generiamo previsioni o previsioni in base a una serie di funzionalità.
Ad esempio, possiamo prevedere quante vendite realizzeremo il mese prossimo.
In altre parole, i modelli di machine learning scoprono le correlazioni tra le funzionalità e un obiettivo per prevederlo meglio. In questo senso, qualsiasi correlazione tra alcune caratteristiche e l’obiettivo è utile se consente al modello di fare previsioni migliori.
Quando si tratta di inferenza causale, desideriamo misurare l’impatto di un trattamento.
Ad esempio, possiamo determinare in che modo l’aumento del prezzo di un prodotto influirà sulle vendite.
Pertanto, con l’inferenza causale, cerchiamo di scoprire percorsi causali.
La correlazione non è causalità
Fonte: towardsdatascience.com