IL distribuzione t, è una distribuzione di probabilità continua molto simile a quella distribuzione normale, Tuttavia presenta le seguenti differenze fondamentali:
- Code più pesanti: Una parte maggiore della sua massa di probabilità si trova agli estremi (più alto curtosi). Ciò significa che è più probabile che produca valori lontani dalla sua media.
- Un parametro: La distribuzione t ha un solo parametro, il gradi di libertàcome viene utilizzato quando non siamo consapevoli della varianza della popolazione.
Un fatto interessante riguardo alla distribuzione t è che a volte viene chiamata “distribuzione t di Student”. Questo perché l’inventore della distribuzione, William Sealy Gossetuno statistico inglese, lo pubblicò usando il suo pseudonimo “Student” per mantenere la sua identità anonima, da cui il nome “Student’s t-distribution”.
Esaminiamo un po’ di teoria dietro la distribuzione per sviluppare un po’ di intuizione matematica.
Origine
L’origine della distribuzione t deriva dall’idea di modellare dati normalmente distribuiti senza conoscere la varianza di tali dati da parte della popolazione.
Ad esempio, supponiamo di campionare N punti dati da una distribuzione normale, quanto segue sarà rispettivamente la media e la varianza di questo campione:
Dove:
- X è la media campionaria.
- S è la deviazione standard del campione.
Combinando le due equazioni precedenti, possiamo costruire la seguente variabile casuale:
Qui M è la media della popolazione e T la statistica t appartiene alla distribuzione t!
Vedere Qui per una derivazione più approfondita.
Densità di probabilità
Come dichiarato sopra, la distribuzione t è parametrizzata da un solo valore, i gradi di libertà, N, e il suo densità di probabilità Somiglia a questo: