La nostra domanda di ricerca è: qual è l’effetto del trattamento D sull’esito y? DiD ci consente di stimare cosa sarebbe successo al gruppo di trattamento se l'intervento non fosse avvenuto. Questo scenario controfattuale è essenziale per comprendere il vero effetto del trattamento. Ogni lavoro o lavoro ruota attorno alla risposta a domande simili come l’effetto di interventi, cambiamenti politici o trattamenti in vari campi. In economia, valuta l’impatto dei tagli fiscali sulla crescita economica, mentre in politica pubblica, valuta gli effetti delle nuove leggi sulla circolazione stradale sui tassi di incidenti. Nel marketing, DiD analizza l'influenza delle campagne pubblicitarie sulle vendite.
Ad esempio, nel diagramma sopra, abbiamo dati sulla popolazione nel nostro campione. Divideremo i dati in trattamento e controllo dove il trattamento ha ricevuto l'intervento. Possiamo osservare post e pre-variabili per entrambi i gruppi.
Stima semplice della differenza trattamento/controllo
Questa equazione calcolerà l'effetto del trattamento confrontando i cambiamenti nel risultato nel tempo tra i gruppi di trattamento e di controllo.
Ho creato un esempio falso per aiutare a capire la matematica.
IL Coefficiente DiD sarebbe 9 utilizzando la formula sopra menzionata.
Stimatore DiD: calcolo utilizzando una regressione
Il DiD aiuta a controllare le caratteristiche tempo-invarianti che potrebbero influenzare la stima degli effetti del trattamento. Ciò significa che rimuove l'influenza di variabili costanti nel tempo (ad esempio, posizione geografica, genere, etnia, abilità innate, ecc.). Può farlo perché queste caratteristiche influenzano equamente sia i periodi di pretrattamento che quelli di posttrattamento per ciascun gruppo.
L’equazione fondamentale per un modello DiD di base è:
Dove:
- y​ è la variabile di risultato per l'individuo ð '– nel gruppo J al tempo ð '¡.
- ð ´ð '“ð '¡ð ''ð 'Ÿâ€‹ è una variabile dummy pari a 1 se l'osservazione è nel periodo post-trattamento.
- ð '‡ð 'Ÿð ''ð 'Žð '¡ð 'šð ''ð '›ð '¡ è una variabile dummy uguale a 1 se l'osservazione appartiene al gruppo di trattamento.
- ð ´ð '“ð '¡ð ''ð 'Ÿ × ð '‡ð 'Ÿð ''ð 'Žð '¡ð 'šð ''ð '›ð '¡â€‹ è il termine di interazione, con il coefficiente β acquisizione della stima DiD.
Il coefficiente per il termine di interazione è lo stimatore DiD in y. La regressione è più popolare tra i ricercatori perché aiuta a fornire errori standard e controllare variabili aggiuntive.
Questo è uno dei presupposti chiave di DiD. Si basa sull’idea che, in assenza di trattamento, la differenza tra il gruppo trattato e quello di controllo rimarrebbe costante nel tempo. In altre parole, in assenza di trattamento, β (stima DiD) = 0.
Formalmente ciò significa:
Un altro modo di pensare a questo è che la differenza tra i due gruppi sarebbe rimasta la stessa nel tempo senza il cambiamento delle politiche. Se le tendenze non sono parallele prima del trattamento, le stime DiD potrebbero essere distorte.
Come verificare questa ipotesi
Ora la domanda successiva è: come verificarlo? La validità dell'ipotesi del trend parallelo può essere valutata attraverso l'analisi grafica e i test con placebo.
Il presupposto è che, in assenza di trattamento, il gruppo di trattamento (linea arancione) e il gruppo di controllo (linea tratteggiata blu) seguirebbero percorsi paralleli nel tempo. L'intervento (linea verticale) segna il punto in cui viene applicato il trattamento, consentendo il confronto delle differenze di andamento tra i due gruppi prima e dopo l'intervento per stimare l'effetto del trattamento.
Esempi che violano il presupposto di tendenze parallele
In parole semplici, cerchiamo due cose nel trattamento che sono le seguenti:
- Cambio di pendenza
In entrambi i casi precedenti, l’ipotesi del trend parallelo non è soddisfatta. Il risultato del gruppo di trattamento sta crescendo più velocemente (parte a) o più lentamente (parte b) rispetto al risultato del gruppo di controllo. Il modo matematico per dirlo è:
DiD = effetto reale + trend differenziale (il trend differenziale dovrebbe essere 0)
L’andamento differenziale potrebbe essere positivo (parte a) o negativo (parte b)
DiD non sarà in grado di isolare l'impatto dell'intervento (effetto reale) poiché anche in esso abbiamo una tendenza differenziale.
2. Salta nella linea di trattamento (su o giù) dopo l'intervento
Nell'immagine sopra, la tendenza del gruppo di trattamento è cambiata in modo diverso dalla tendenza del gruppo di controllo, che avrebbe dovuto rimanere costante senza l'intervento. Nello studio del DiD non è ammesso alcun salto.
I test placebo vengono utilizzati per verificare se gli effetti terapeutici osservati sono realmente dovuti al trattamento e non ad altri fattori confondenti. Implicano l'applicazione della stessa analisi a un periodo o a un gruppo in cui non è previsto alcun effetto del trattamento. Se in questi test con placebo si riscontra un effetto significativo, ciò suggerisce che i risultati originali potrebbero essere falsi.
Ad esempio, nel 2019 è stato condotto uno studio di intervento sulla somministrazione di tablet alle scuole superiori. Possiamo eseguire un test con placebo, il che significa che possiamo creare un falso anno di intervento, ad esempio il 2017, in cui sappiamo che non si è verificato alcun cambiamento politico. Se l’applicazione dell’analisi dell’effetto del trattamento alla data del placebo (2017) non mostra alcun cambiamento significativo, suggerirà che l’effetto osservato nel 2019 (se presente) è probabilmente dovuto all’effettivo intervento politico.
- Evento Studio DiD: stima gli effetti del trattamento specifici per anno, utile per valutare la tempistica degli effetti del trattamento e verificare le tendenze preliminari. Il modello consente di variare l’effetto del trattamento in base all’anno. Possiamo studiare l'effetto di volta in volta t+1, T+2, …, T+N
- Metodo di controllo sintetico (SCM): SCM costruisce un gruppo di controllo sintetico ponderando più unità non trattate per creare un composito che si avvicini alle caratteristiche dell'unità trattata prima dell'intervento. Questo metodo è particolarmente utile quando una singola unità trattata viene confrontata con un pool di unità non trattate. Fornisce un controfattuale più credibile combinando informazioni provenienti da diverse unità.
Ce ne sono molti altri, ma mi limiterò a due soli. Magari scrivo un post più tardi spiegando nel dettaglio tutto il resto.
In questo post ho analizzato lo stimatore Difference-in-Differences (DiD), un metodo popolare per stimare gli effetti medi del trattamento. Il DiD è ampiamente utilizzato per studiare gli effetti delle politiche confrontando i cambiamenti nel tempo tra i gruppi di trattamento e di controllo. Il vantaggio principale del DiD è la sua capacità di controllare i fattori confondenti non osservati che rimangono costanti nel tempo, isolando così il vero impatto di un intervento.
Abbiamo anche esplorato concetti chiave come il presupposto delle tendenze parallele, l'importanza dei dati pre-trattamento e come verificare le violazioni dei presupposti utilizzando l'analisi grafica e i test placebo. Inoltre, ho discusso le estensioni e le variazioni del DiD, come l'Event Study DiD e il Metodo di controllo sintetico, che offrono ulteriori approfondimenti e robustezza in diversi scenari.
(1) Wing, C., Simon, K. e Bello-Gomez, RA (2018). Progettare la differenza negli studi sulle differenze: migliori pratiche per la ricerca sulle politiche di sanità pubblica. Revisione annuale della sanità pubblica, 39453–469.
(2) Callaway, B. e Sant'Anna, PH (2021). Differenza nelle differenze con più periodi di tempo. Giornale di econometria, 225(2), 200-230.
(3) Donald, SG e Lang, K. (2007). Inferenza con differenze nelle differenze e altri dati panel. La revisione di Economia e Statistica, 89(2), 221–233.
Grazie per aver letto!
Grazie per aver letto! 🤗 Se ti è piaciuto questo post e vuoi vederne altro, consideralo seguendomi. Puoi anche seguirmi su LinkedIn. Ho intenzione di scrivere blog sull'inferenza causale e sull'analisi dei dati, mirando sempre a mantenere le cose semplici.
Un piccolo disclaimer: scrivo per imparare, quindi potrebbero verificarsi errori nonostante i miei migliori sforzi. Se notate eventuali errori, fatemelo sapere. Accetto anche suggerimenti per nuovi argomenti!
Fonte: towardsdatascience.com