In questo articolo, spiego come utilizzare il criterio backdoor nel contesto sperimentale per selezionare buone variabili di controllo o, evitare di selezionare quelle cattive, utilizzando i grafici aciclici diretti (DAG). Ho iniziato il mio viaggio di inferenza causale attraverso il modello dei risultati potenziali, introdotto nel mio precedente articolo. Ho appena “scoperto” il DAG di recente frequentando lo straordinario corso di sperimentazione e inferenza causale del Prof. Jason Roos, e mi piace molto il DAG come struttura per teorizzare e visualizzare facilmente un modello causale. Facilita l’analisi di identificazione rendendo salienti le variabili incluse nel modello e le ipotesi fatte sulle relazioni tra queste variabili. Di conseguenza, aiuta anche a identificare le variabili confondenti e ad analizzare come deconfondere.
Presumo che i lettori comprendano già le basi del DAG (in caso contrario, Causal Inference di Scott Cunningham Mixtape è un inizio utile), e credo che il modo più rapido per comprendere il criterio della backdoor sia attraverso degli esempi. Pertanto, procederò come segue: in primo luogo, esporrò la domanda a cui vogliamo rispondere e fornirò la rappresentazione DAG per consentirci di concettualizzarla facilmente; Successivamente, spiegherò cos’è il criterio backdoor e mostrerò come dovrebbe essere eseguito nel nostro esempio specifico; Infine, eseguirò l’esempio attraverso esperimenti simulati.
Il problema della scienza dei dati che vogliamo risolvere è il seguente: vogliamo sapere quali interventi possono effettivamente influenzare le persone a comportarsi in modo più sostenibile. Per fare ciò, progettiamo esperimenti randomizzati con trattamenti volti a incoraggiare le persone a ridurre il consumo di elettricità. Supponiamo di aver terminato il primo esperimento in cui abbiamo utilizzato la ricompensa monetaria come trattamento (ad esempio, una carta regalo). Ma ci stiamo chiedendo se esista un modo più economico per ottenere un effetto simile o addirittura maggiore utilizzando interventi comportamentali. Pertanto, progettiamo un secondo esperimento in cui utilizziamo i nudge informativi come trattamento (ad esempio, i partecipanti trattati riceveranno una notifica e-mail che ricorda loro di ridurre il consumo con…
Fonte: towardsdatascience.com