
Ciao!
Le distribuzioni potrebbero non sembrare un concetto complesso a prima vista, ma sono incredibilmente potenti e fondamentali nel mondo dell’analisi dei dati e delle statistiche. Pensatela in questo modo: se dovessi raccogliere 50 magliette di varie taglie e colori, avresti creato una distribuzione dei colori, una distribuzione delle taglie e forse anche una distribuzione “quanto ti dà fastidio questa maglietta” (scherzando, ovviamente ). Il punto è che finché hai una categoria da misurare, c’è una distribuzione in attesa di essere esplorata.
Quindi, cos’è esattamente una distribuzione? È essenzialmente un modo per mostrare come una categoria si diffonde su una scala di probabilità o probabilità. Puoi capirlo dai dati che hai o da ciò che sai su un particolare argomento. Probabilmente hai sentito parlare di termini come distribuzione normale, distribuzione asimmetrica, distribuzione a coda lunga e così via: ognuno di questi descrive come vengono formati i punti dati.
Oggi volevo soffermarmi sulla distribuzione Beta e in particolare sulla sua applicazione nella calibrazione bayesiana. La calibrazione bayesiana è un approccio che aggiorna l’inferenza bayesiana con nuovi dati per trovare i valori più adatti per i parametri di un modello. Considera sia le informazioni precedenti disponibili su questi parametri sia la probabilità dei dati osservati dati tali parametri.
Prima di immergerci nella calibrazione bayesiana con la distribuzione Beta, trattiamo alcuni dettagli tecnici. Una volta chiarite le nozioni di base, esploreremo la calibrazione bayesiana con distribuzioni beta con uno scenario intrigante.
IL distribuzione betaindicata come Beta(α, β), è una distribuzione di probabilità caratterizzata da due parametri. La sua funzione di densità di probabilità (pdf) è espressa come segue:
In questa equazione, sia α che β rappresentano gli iperparametri ed è importante notare che devono sempre essere maggiori di 0. Inoltre, per…
Fonte: towardsdatascience.com