Perché e quando utilizzare il metodo generalizzato dei momenti | di Luis Felipe de Souza Rodrigues | Maggio 2024 | Intelligenza-Artificiale

È una tecnica di stima altamente flessibile che può essere applicata in una varietà di situazioni

fotografato da Shubham Dhage SU Unsplash

Hansen (1982) ha aperto la strada all’introduzione del metodo generalizzato dei momenti (GMM), apportando notevoli contributi alla ricerca empirica in finanza, in particolare nella determinazione dei prezzi degli asset. La creazione del modello è stata motivata dalla necessità di stimare i parametri nei modelli economici rispettando i vincoli teorici impliciti nel modello. Ad esempio, se il modello economico prevede che due cose debbano essere indipendenti, il GMM cercherà di trovare una soluzione in cui la media del loro prodotto sia zero. Pertanto, comprendere il GMM può essere una potente alternativa per coloro che necessitano di un modello in cui le condizioni teoriche sono estremamente importanti, ma che i modelli convenzionali non possono soddisfare a causa della natura dei dati.

Questa tecnica di stima è ampiamente utilizzata in econometria e statistica per affrontare l’endogeneità e altri problemi nell’analisi di regressione. Il concetto di base dello stimatore GMM prevede di minimizzare una funzione criterio scegliendo parametri che rendano i momenti campionari dei dati il più vicino possibile ai momenti della popolazione. L’equazione per lo stimatore GMM di base può essere espressa come segue:

Lo stimatore GMM mira a trovare il vettore dei parametri θ che minimizzi questa funzione criterio, garantendo così che i momenti campione dei dati si allineino il più vicino possibile ai momenti della popolazione. Ottimizzando questa funzione di criterio, lo stimatore GMM fornisce stime coerenti dei parametri nei modelli econometrici.

Essere coerenti significa che quando la dimensione del campione si avvicina all'infinito, lo stimatore converge in probabilità al vero valore del parametro (asintoticamente normale). Questa proprietà è fondamentale per garantire che lo stimatore fornisca stime affidabili all’aumentare della quantità di dati. Anche in presenza di variabili omesse, purché le condizioni momento siano valide e gli strumenti siano specificati correttamente, il GMM può fornire stimatori coerenti. Tuttavia, l’omissione di variabili rilevanti può incidere sull’efficienza e sull’interpretazione dei parametri stimati.

Per essere efficiente, GMM utilizza i minimi quadrati generalizzati (GLS) sui momenti Z per migliorare la precisione e l'efficienza delle stime dei parametri nei modelli econometrici. GLS affronta l'eteroschedasticità e l'autocorrelazione ponderando le osservazioni in base alla loro varianza. In GMM, i momenti Z vengono proiettati nello spazio delle colonne delle variabili strumentali, simile a un approccio GLS. Ciò riduce al minimo la varianza e migliora la precisione della stima dei parametri concentrandosi sui momenti Z e applicando tecniche GLS.

Tuttavia, è importante riconoscere che lo stimatore MGM è soggetto ad una serie di ipotesi che devono essere considerate durante la sua applicazione, che sono state elencate:

Esistenza di momenti: fino a un certo ordine è necessario e richiede code finite nella distribuzione dei dati.
Specificazione corretta del modello: il modello sottostante deve essere specificato correttamente, inclusa la relazione funzionale e la distribuzione dei termini di errore.
Identificabilità: deve esistere una soluzione univoca per i parametri da stimare.
Condizioni del momento: è necessario specificare correttamente le condizioni del momento, che devono avere media zero secondo le ipotesi del modello.
Strumenti validi: se applicabile, gli strumenti devono essere pertinenti e validi.
Indipendenza e omoschedasticità (condizionale): idealmente, gli errori dovrebbero essere indipendenti e omoschedastici nelle condizioni del momento.
Robustezza all'eteroschedasticità: il GMM è robusto all'eteroschedasticità se la matrice di ponderazione è stimata in modo coerente.
Multicollinearità: il GMM può gestire la multicollinearità, ma può influenzare l'efficienza degli stimatori.
Valori anomali: GMM è sensibile ai valori anomali a meno che non vengano adeguatamente affrontati nel processo di modellazione.
Campioni di grandi dimensioni: GMM è più efficiente nei campioni di grandi dimensioni.
Teoria asintotica: proprietà come coerenza ed efficienza sono asintotiche.

Pertanto, il GMM è una tecnica di stima altamente flessibile e può essere applicata in una varietà di situazioni, essendo ampiamente utilizzata come tecnica di stima dei parametri in econometria e statistica. Consente una stima efficiente dei parametri in base a diverse specifiche del modello e strutture dati. I suoi usi principali sono:

Modelli con variabili strumentali: utilizzato quando in un modello sono presenti variabili endogene. Fornisce un modo per correggere la distorsione nella stima dei parametri quando le variabili esplicative sono correlate all'errore.
Modelli con errori di misurazione: il GMM può essere utilizzato per correggere le distorsioni introdotte da errori di misurazione nelle variabili.
Modelli con restrizioni sul momento: in alcune situazioni, ci sono più condizioni sul momento che un modello deve soddisfare. GMM consente di utilizzare tutte queste informazioni contemporaneamente per una stima più efficiente.
Modelli di serie temporali: il GMM viene spesso applicato nei modelli ARMA (media mobile regressiva) e in altri modelli di serie temporali.
Modelli di dati panel: può essere utilizzato nei modelli di dati panel per gestire problemi come l'eteroschedasticità e l'autocorrelazione all'interno delle unità trasversali.
Modelli non lineari: il GMM è estendibile anche a modelli non lineari, fornendo una solida tecnica di stima quando metodi classici come la massima verosimiglianza possono essere irrealizzabili.

Il contrasto tra il metodo dei minimi quadrati ordinari (OLS) e il metodo dei momenti generalizzati (GMM) evidenzia diversi vantaggi. OLS si dimostra efficiente sotto i presupposti classici di linearità, fungendo da stimatore lineare imparziale della varianza minima (BLU). I presupposti fondamentali di un modello di regressione lineare includono: linearità nella relazione tra variabili, assenza di multicollinearità perfetta, errore medio nullo, omoschedasticità (varianza costante degli errori), non autocorrelazione degli errori e normalità degli errori. Pertanto, OLS è uno stimatore imparziale, coerente ed efficiente. Inoltre, ha una complessità computazionale relativamente inferiore.

Tuttavia, il GMM offre maggiore flessibilità, applicabile a un’ampia gamma di contesti come modelli con errori di misurazione, variabili endogene, eteroschedasticità e autocorrelazione. Non fa ipotesi sulla distribuzione degli errori ed è applicabile ai modelli non lineari. Il GMM si distingue nei casi in cui abbiamo omesso variabili importanti, condizioni di momento multiplo, modelli non lineari e set di dati con eteroschedasticità e autocorrelazione.

Al contrario, quando si confrontano il GMM e la stima della massima verosimiglianza (MLE), si evidenziano i loro approcci alla gestione delle ipotesi sui dati. GMM costruisce stimatori utilizzando dati e condizioni momento della popolazione, fornendo flessibilità e adattabilità ai modelli con meno ipotesi, particolarmente vantaggioso quando ipotesi forti sulla distribuzione dei dati potrebbero non essere valide.

MLE stima i parametri massimizzando la verosimiglianza dei dati forniti, a seconda di ipotesi specifiche sulla distribuzione dei dati. Mentre MLE funziona in modo ottimale quando la distribuzione presunta è strettamente allineata al vero processo di generazione dei dati, GMM si adatta a varie distribuzioni, rivelandosi prezioso in scenari in cui i dati potrebbero non essere conformi a una singola distribuzione specifica.

Nell'ipotetico esempio dimostrato in Python, utilizziamo la libreria linearmodels.iv per stimare un modello GMM con la funzione IVGMM. In questo modello, il consumo funge da variabile dipendente, mentre l’età e il sesso (rappresentati come variabili dummy per i maschi) sono considerate variabili esogene. Inoltre, assumiamo che il reddito sia una variabile endogena, mentre il numero di figli e il livello di istruzione siano variabili strumentali.

import pandas as pd
from linearmodels.iv import IVGMM# Read the Excel file
df = pd.read_excel('example.xlsx')
# Dependent variable
dependent = 'YConsumption'
# Exogenous variables
exog_vars = ('XAge', 'XMale1')
# Endogenous variable
endog_vars = ('XIncomeEndo')
# Instrumental variables
instruments = ('ZChildQuantity6', 'ZEducation')
# Construct the formula for GMM
formula = "{dep} ~ 1 + {exog} + ({endog} ~ {instr})".format(
dep=dependent, 
exog='+'.join(exog_vars), 
endog=endog_vars(0), 
instr='+'.join(instruments)
)
# Estimate the GMM model
model = IVGMM.from_formula(formula, df)
result = model.fit(cov_type='robust')
# Displaying GMM results
print(result)

Le variabili strumentali nei modelli GMM vengono utilizzate per affrontare i problemi di endogeneità fornendo una fonte di variazione esogena correlata ai regressori endogeni ma non correlata al termine di errore. La funzione IVGMM è specificatamente progettata per la stima di modelli in cui vengono utilizzate variabili strumentali nell'ambito del GMM.

Pertanto, specificando il Consumo come variabile dipendente e impiegando variabili esogene (età e genere) insieme a variabili strumentali (numero di figli e istruzione) per affrontare l’endogeneità, questo esempio si inserisce nel contesto del MGM.

Fonte: towardsdatascience.com