Scienza dei dati
Recentemente ho pubblicato un articolo in cui ho utilizzato l'inferenza bayesiana e la catena di Markov Monte Carlo (MCMC) per prevedere i vincitori degli ottavi di finale del CL. Lì ho provato a spiegare le statistiche bayesiane in modo relativamente approfondito, ma non ho detto molto di MCMC per evitare di renderlo eccessivamente ampio. La posta:
Quindi ho deciso di dedicare un post completo per presentare i metodi Markov Chain Monte Carlo per chiunque sia interessato a sapere come funzionano matematicamente e quando si dimostrano utili.
Per affrontare questo post, adotterò la strategia divide et impera: dividere il termine nei suoi termini più semplici e spiegarli individualmente per poi risolvere il quadro generale. Quindi questo è ciò che affronteremo:
- Metodi Montecarlo
- Processi stocastici
- Catena di Markov
- MCMC
Metodi Monte Carlo
Un metodo o simulazione Monte Carlo è un tipo di algoritmo computazionale che consiste nell'utilizzare ripetutamente numeri di campionamento per ottenere risultati numerici sotto forma di probabilità che si verifichi una serie di risultati.
In altre parole, una simulazione Monte Carlo viene utilizzata per stimare o approssimare i possibili risultati o la distribuzione di un evento incerto.
Un semplice esempio per illustrarlo è lanciare due dadi e sommare i loro valori. Potremmo facilmente calcolare la probabilità di ciascun risultato, ma potremmo anche utilizzare i metodi Monte Carlo per simulare 5.000 lanci di dadi (o più) e ottenere la distribuzione sottostante.
Processi stocastici
La definizione di Wikipedia è: “Un processo stocastico o casuale può essere definito come una raccolta di variabili casuali indicizzate da un insieme matematico”(1).
Fonte: towardsdatascience.com