Come imparare gratuitamente l’inferenza causale da solo |  di Quentin Gallea, Ph.D. |  Febbraio 2024

 | Intelligenza-Artificiale

La causalità, il campo focalizzato sulla comprensione delle relazioni tra causa ed effetto, cerca di rispondere a domande critiche come “Perché?” e “E se?”. Comprendere il concetto di causalità è fondamentale dalla lotta al cambiamento climatico, alla nostra ricerca della felicità, compreso il processo decisionale strategico.

Esempi di domande importanti che richiedono inferenza causale:

  • Che impatto potrebbe avere il divieto delle auto a carburante sull’inquinamento?
  • Quali sono le cause dietro la diffusione di alcuni problemi di salute?
  • Ridurre il tempo trascorso davanti allo schermo potrebbe portare ad una maggiore felicità?
  • Qual è il ritorno sull’investimento della nostra campagna pubblicitaria?

In quanto segue farò essenzialmente riferimento a due e-book gratuiti disponibili con codice Python e dati con cui giocare. Il primo e-book offre rapide panoramiche, mentre il secondo consente un’esplorazione più approfondita dei contenuti.

  1. Inferenza causale per i coraggiosi e i veri di Matheus Facure

2. Inferenza causale: il mixtape di Scott Cuningham

Immagine di Timo Elliott

1.1 Il problema fondamentale dell’inferenza causale

Immergiamoci nel concetto fondamentale necessario per comprendere l’inferenza causale attraverso una situazione con cui tutti potremmo avere familiarità.

Immagina di aver lavorato al computer tutto il giorno, che una scadenza si avvicina e di iniziare a sentire che sta arrivando il mal di testa. Hai ancora qualche ora di lavoro davanti, quindi decidi di prendere una pillola. Dopo un po’ il mal di testa scompare.

Ma poi inizi a chiederti: è stata davvero la pillola a fare la differenza? O è stato perché hai bevuto il tè o hai fatto una pausa? La parte affascinante ma alla fine anche frustrante è che è impossibile rispondere a questa domanda poiché tutti questi effetti sono confusi.

L’unico modo per sapere con certezza se è stata la pillola a curare il tuo mal di testa sarebbe avere due mondi paralleli.

In uno dei due mondi si prende la pillola, nell’altro no, oppure si prende idealmente un placebo. Puoi provare l’effetto causale della pillola solo se ti senti meglio nel mondo in cui hai preso la pillola, poiché la pillola è l’unica differenza tra i due mondi.

Sfortunatamente, non abbiamo accesso a mondi paralleli per sperimentare e valutare la causalità. Pertanto, molti fattori si verificano simultaneamente e sono confusi (ad esempio, prendere una pillola per il mal di testa, bere il tè e fare una pausa; aumentare la spesa pubblicitaria durante le stagioni di punta delle vendite; assegnare più agenti di polizia ad aree con tassi di criminalità più elevati, ecc.).

Per comprendere rapidamente questo concetto fondamentale in modo più approfondito senza richiedere alcuna conoscenza tecnica aggiuntiva, puoi approfondire il seguente articolo su Towards Data Science:

📚 Risorsa:

La scienza e l’arte della causalità (parte 1)

1.2 Un po’ di formalizzazione: risultati potenziali

Ora che hai compreso l’idea di base, è tempo di andare oltre e formalizzare teoricamente questi concetti. L’approccio più comune è il quadro dei risultati potenziali, che consente la chiara articolazione delle ipotesi del modello. Questi sono essenziali per specificare i problemi e identificare le soluzioni.

Le notazioni centrali utilizzate in questo modello sono:

  1. Yᵢ(0) rappresenta il risultato potenziale dell’individuo io senza il trattamento.
  2. Yᵢ(1) rappresenta il risultato potenziale dell’individuo io con il trattamento.

Si noti che vengono utilizzate varie notazioni. Il riferimento al trattamento (1 o 0) può apparire tra parentesi (come usato sopra), in apice o pedice. La lettera “Y” si riferisce al risultato di interesse, ad esempio una variabile binaria che assume valore uno se è presente mal di testa e zero altrimenti. Il pedice “i” si riferisce all’entità osservata (ad esempio, una persona, un topo da laboratorio, una città, ecc.). Infine, il termine “trattamento” si riferisce alla “causa” che ti interessa (ad esempio, una pillola, una pubblicità, una politica, ecc.).

Usando questa notazione, possiamo fare riferimento al problema fondamentale dell’inferenza causale affermando che è impossibile osservare simultaneamente sia Yᵢ(0) che Yᵢ(1). In altre parole, non si osserva mai il risultato per lo stesso individuo con e senza il trattamento allo stesso tempo.

Sebbene non sia possibile identificare l’effetto individuale Yᵢ(1)-Yᵢ(0), possiamo misurare l’Effetto Medio del Trattamento (ATE): E(Yᵢ(1)-Yᵢ(0)). Tuttavia, questo effetto medio del trattamento è distorto se si riscontrano differenze sistematiche tra i due gruppi diverse dal trattamento.

Per andare oltre questa breve introduzione si può fare riferimento ai due capitoli seguenti:

📚Risorse:

1.3 Rappresentazione visiva dei nessi causali: Grafi Diretti (Aciclici).

Le rappresentazioni visive sono strumenti potenti per ridurre il carico mentale, chiarire i presupposti e facilitare la comunicazione. Nell’inferenza causale utilizziamo i grafici diretti. Come suggerisce il nome, questi grafici raffigurano vari elementi (ad esempio, mal di testa, pillola, tè) come nodi, collegati da frecce unidirezionali che illustrano la direzione delle relazioni causali. (Nota: ometto deliberatamente di menzionare il presupposto comune di “Aciclicità” associato a questi grafici, poiché va oltre lo scopo di questa panoramica ma è discusso nel secondo riferimento disponibile alla fine di questa sottosezione.)

Esempio di grafico diretto, immagine dell’autore

L’inferenza causale differisce principalmente dall’inferenza predittiva a causa delle presunte relazioni causali sottostanti. Tali relazioni sono rappresentate esplicitamente utilizzando questo tipo speciale di grafico chiamato Grafi Diretti (Aciclici). Questo strumento, insieme al quadro dei risultati potenziali, è al centro dell’inferenza causale e consentirà di pensare chiaramente ai potenziali problemi e, di conseguenza, alle soluzioni per valutare la causalità

📚Risorse:

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *