Su Jacob Bernoulli, la legge dei grandi numeri e le origini del teorema del limite centrale |  di Sachin Date |  Gennaio 2024

 | Intelligenza-Artificiale

Nonostante l’importanza della WLLN per il CLT, il percorso dalla WLLN al CLT è pieno di rovi duri, spinosi e difficili che i successori di Bernoulli hanno impiegato diversi decenni per abbattere. Consideriamo ancora una volta l’equazione al centro del teorema di Bernoulli:

Il teorema di Bernoulli
Teorema di Bernoulli (Immagine dell’autore)

Bernoulli ha scelto di inquadrare la sua indagine in un contesto binomiale. L’urna piena di biglietti è lo spazio campionario per quello che è chiaramente un esperimento binomiale e il conteggio X_bar_n di biglietti neri nel campione è Binomial(n, p). Se è nota la frazione reale p dei biglietti neri nell’urna, allora E(X_bar_n) è il valore atteso di una variabile casuale binomiale(n, p) che è np. Con E(X_bar_n) nota, la distribuzione di probabilità P(X_bar_n|p,n) è completamente specificato. Quindi è teoricamente possibile elaborare probabilità come P(np — δ ≤ X_fienile ≤ np + δ) come segue:

P(np-δ ≤ X_bar_n ≤ np+δ) dove X_bar_n ~ Binomiale(n,p)
P(np-δ ≤ X_fienile ≤ np+δ) dove X_bar_n ~ Binomiale(n,p) (Immagine dell’autore)

Suppongo che P(np — δ ≤ X_fienile ≤ np + δ) è una probabilità utile da calcolare. Ma puoi calcolarlo solo se conosci il vero rapporto p. E chi potrà mai conoscere il vero p? Bernoulli con il suo calvinista inclinazioni, e Abraham De Moivre che incontreremo nel mio prossimo articolo e che avrebbe continuato le ricerche di Bernoulli, sembrava credere che un essere divino potesse conoscere la vera ratio. Nei loro scritti entrambi fanno chiari riferimenti a Fatalismo e DESIGN ORIGINALE. Bernoulli ha allevato Fatalismo nell’ultimo comma di L’arte di progettare. De Moivre ha menzionato il DESIGN ORIGINALE (in maiuscolo!) nel suo libro sulla probabilità, La dottrina del caso. Nessuno dei due ha nascosto il sospetto che l’intenzione di un Creatore fosse la ragione per cui abbiamo una legge come la Legge dei Grandi Numeri.

Ma niente di questa teologia aiuta te o me. Quasi mai conoscerai il vero valore di quasi tutte le proprietà di qualsiasi sistema non banale in qualsiasi parte dell’universo. E se per un insolitamente bizzarro colpo di fortuna dovessi imbatterti nel vero valore di qualche parametro, il caso sarebbe chiuso, giusto? Perché perdere tempo a disegnare campioni casuali per stimare ciò che già sai quando hai la visione di Dio dei dati? A parafrasi un altro famoso scienziato, Dio non ha alcuna utilità per l’inferenza statistica.

D’altra parte, quaggiù sulla Terra, tutto ciò che hai è un campione casuale e la sua media o somma X_bar_n e la sua varianza S. Utilizzandoli, ti consigliamo di trarre inferenze sulla popolazione. Ad esempio, ti consigliamo di creare un intervallo di confidenza al 100% (1 — α) attorno a media della popolazione sconosciuta µ. Quindi, risulta che non hai molta utilità per la probabilità:

P(np — δ ≤ X_fienile ≤ np + δ)

come fai per il intervallo di confidenza per la media sconosciutavale a dire:

P(X_bar_n — δ ≤ np X_bar_n+d).

Notate quanto sottile ma cruciale sia la differenza tra le due probabilità.

La probabilità P(X_bar_n — δ ≤ np X_bar_n+δ) può essere espresso come differenza di due probabilità cumulative:

(Immagine dell’autore)

Per stimare le due probabilità cumulative, avrai bisogno di un modo per stimare la probabilità P(p|X_bar_n,n) che è l’esatto inverso della probabilità binomiale P(X_bar_n|n,p) con cui Bernoulli ha lavorato. E comunque, poiché il rapporto p è un numero reale, P(p|X_bar_n,n) è la Probabilità Funzione di densità (PDF) di p condizionato alla media campionaria osservata X_fienile. Qui stai ponendo la domanda:

Dato il rapporto osservato X_bar_n/n, qual è la funzione di densità di probabilità del rapporto vero sconosciuto p?

P(p|n,X_bar_n) viene chiamato probabilità inversa (densità). Per inciso, il percorso verso la scoperta del Teorema Centrale passa direttamente attraverso un meccanismo per calcolare questa probabilità inversa – un meccanismo che un inglese Ministro presbiteriano di nome Tommaso Bayes (della fama del Teorema di Bayes), e il Isaac Newton della Francia Pierre-Simon Laplace dovemmo scoprire indipendentemente tra la fine del 1700 e l’inizio del 1800 utilizzando due approcci sorprendentemente diversi.

Tornando all’esperimento mentale di Jacob Bernoulli, il modo per comprendere la probabilità inversa è considerare la frazione vera dei biglietti neri p come la causa questo sta “causando” il effetto di osservare X_bar_n/n frazione di biglietti neri in un campione casuale di dimensione n. Per ogni valore osservato di X_bar_n, ci sono infiniti valori possibili per p. Ad ogni valore di p è associata una probabilità densità che può essere letto da funzione di distribuzione di probabilità inversa P(p|X_bar_n,n). Se lo sai PDF inversopuoi calcolare la probabilità che p si trovi all’interno di un intervallo specificato (p_low, p_high), ovvero P(p_low ≤ p ≤ p_high) dato l’osservato X_fienile.

Sfortunatamente, il teorema di Jacob Bernoulli non è espresso in termini di PDF inversa P(p|n,X_fienile). Viene invece espresso in termini del suo complemento esatto, ovvero P(X_bar_n|n,p) che richiede di conoscere il vero rapporto p.

Essendo arrivato al punto di enunciare e dimostrare la WLLN in termini di probabilità ‘forward’ P(X_bar_n|n,p), penseresti che Jacob Bernoulli farebbe il naturale passo successivo per invertire l’enunciato del suo teorema e mostrare come calcolare la PDF inversa P(p|n,X_fienile).

Ma Bernoulli non ha fatto nulla del genere, scegliendo invece di portare misteriosamente tutta l’Ars Conjectandi a una chiusura improvvisa e inaspettata con un paragrafo dal suono mesto Fatalismo.

“…se alla fine le osservazioni di tutti dovessero continuare per tutta l’eternità (dalla probabilità alla perfetta certezza), tutto nel mondo sarebbe determinato ad accadere da certe ragioni e dalla legge dei cambiamenti. E così anche nelle cose più casuali e fortuite siamo obbligati a riconoscere una certa necessità, e se così posso dire, il destino,…”

La pagina finale della Pars Quarta (Parte IV) di L’arte di progettare (Dominio pubblico)

PARS MERCOLEDI Di L’arte di progettare doveva deludere (ma anche ispirare) le future generazioni di scienziati in un altro modo.

Osserva le somme sulla destra della seguente equazione:

P(np-δ ≤ X_bar_n ≤ np+δ) dove X_bar_n ~ Binomiale(n,p)
P(np-δ ≤ X_fienile ≤ np+δ) dove X_bar_n ~ Binomiale(n,p) (Immagine dell’autore)

Contengono fattoriali grandi e voluminosi che sono quasi impossibili da produrre per n grandi. Sfortunatamente, tutto ciò che riguarda il teorema di Bernoulli riguarda il grande n. E il calcolo deve diventare particolarmente noioso se lo si fa nell’anno 1689 sotto la luce instabile e danzante delle lampade a grasso e utilizzando nient’altro che carta e penna. Nella Parte 4, Bernoulli ha eseguito alcuni di questi calcoli, in particolare per calcolare le dimensioni minime del campione richieste per ottenere diversi gradi di accuratezza. Ma ha lasciato lì la questione.

Le ultime due pagine di Ars Conjectandi che illustrano la stima di Jacob Bernoulli delle dimensioni minime del campione (25550, 31258, 36966 ecc.) necessarie per raggiungere specifici gradi di accuratezza (1/1000, 1/10000, 1/100000) attorno alla media campionaria, assumendo una media della popolazione nota (Dominio pubblico)

Nemmeno Bernoulli ha mostrato come farlo approssimare il fattoriale (una tecnica che sarà scoperta quattro decenni dopo da Abraham De Moivre e James Stirling (in quest’ordine), né ha fatto il salto concettuale cruciale di mostrare come affrontare il problema di probabilità inversa.

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *