introduzione
Chiunque abbia mai studiato probabilità ha sentito parlare della definizione consolidata di probabilità di “La probabilità può essere definita come il numero di risultati favorevoli diviso per il numero totale di risultati.” Posso ancora sentire il mio insegnante di quarta elementare ripeterlo!
Mentre questa definizione è correttospesso mi chiedo come accurato è questa definizione per il mondo reale? Quanto è accurato quando ne abbiamo alcuni maggiori informazioni sugli esiti favorevoli? Per dirla più chiaramente, quando ne avremo di più”condizioni” per sfruttare i nostri risultati favorevoli.
Mettendo “condizioni” è come tagliare la torta originale del numero di risultati favorevoli in vari modi, utilizzando più condizioni, per darti la fetta che rappresenta il numero di risultati favorevoli per te in modo più reale. L'immagine qui sotto tenta di rappresentare questo concetto in modo molto breve.
Quale modo migliore se non quello di rappresentare ciò che è nella mente di molti studenti internazionali di scienze dei dati che studiano negli Stati Uniti e cercano lavoro! Il numero originale di posti di lavoro disponibili è rappresentato all'estrema sinistra.
1a condizione: Presentazione di 1° condizione per “Durata dell'esperienza lavorativa” affina la sezione in base al numero di lavori disponibili per un nuovo joiner.
2a condizione: Inoltre, introducendo il 2a condizione per “Nazionalità/cittadinanza” affina ancora di più la fetta.
3a condizione : La piccola fetta blu scuro nel grafico all'estrema destra rappresenta la rappresentazione più accurata del numero di posti di lavoro disponibili (numero di risultati favorevoli).
Prima di procedere spiegando perché la probabilità condizionata può essere migliore della probabilità, facciamo un breve riepilogo delle definizioni.
2. Definizione di probabilità e probabilità condizionata
Probabilità:
P(A) = Numero di esiti favorevoli per A / Numero totale di esiti
Probabilità condizionale :
Consideriamo ora due eventi A e B. Il fondamento della probabilità condizionata è quando c'è un “evento dato un altro evento”. In questo caso, quando si dice Un dato Bciò che significa è che si sta verificando l'evento A dato si è verificato l'evento B. Quindi allegare il “condizione di B, ad A”.
P(A|B) = P(A intersezione B) / P(B) dove
P(A intersezione B)* è data come la probabilità che si verifichino sia l'evento A che l'evento B.
*dati (A intersezione B) e (A' intersezione B) si escludono a vicenda. Quindi (A intersezione B) unione (A' intersezione B) = B.
Dopo aver definito queste definizioni un po' confuse, passerò al motivo per cui penso che la probabilità condizionata sia effettivamente migliore.
3. Esempio: ispirazione per questo articolo
Per cominciare, il motivo per cui mi è venuta l'idea per questo articolo è stato mentre stavo guardando un film di Bollywood l'altro giorno e quando c'era una scena in cui due vecchi amici discutevano sulla probabilità di incontrarsi!
Permettetemi di introdurre qualche informazione in più su questa scena:
- 1° amico : Poliziottooriginario della città di Mumbai, che era in viaggio verso Kalimpong; una piccola città, per caso.
- 2° amico : Professore di matematicache era residente nella città – Kalimpong.
Questi amici si conoscono da quando entrambi hanno studiato al stessa università.
- Attualmente gli amici si sono incontrati in un bar dove il professore andava tutti i giorni.
Dopo aver introdotto queste informazioni, torniamo a quale era la probabilità che entrambi si incontrassero a Kalimpong.
Agente di polizia: “Fratello, quante possibilità ci sono!”
Professore di matematica: “Uno su 95675”
Agente di polizia: “Sbagliato! Non mi hai contato”
Professore di matematica “L'ho fatto. La popolazione attuale è 95674”
Hmm… quindi rompiamo questa logica:
Calcolo della probabilità iniziale:
- Il professore di matematica calcolò la probabilità di incontrare il suo amico, il poliziotto, in 1/95.675.
- Ciò presuppone che tutti i 95.674 residenti di Kalimpong abbiano la stessa probabilità di incontrare il professore e l'agente di polizia.
Perché questo calcolo è impreciso:
- Questo calcolo presuppone che incontrare l'ufficiale di polizia sia uguale a incontrare QUALSIASI ALTRO residente di Kalimpong!
Introduzione della probabilità condizionata:
Consideriamo alcuni scenari specifici
I. Informazioni rilevanti:
- L'agente di polizia è residente a Mumbai e si è recato a Kalimpong.
- Il professore di matematica va in questo bar ogni giorno.
- Questa volta l'agente di polizia è andato nello stesso bar.
II. Eventi condizionali:
Evento A: Il professore e l'ufficiale di polizia si incontrano a Kalimpong.
Evento B: L'ufficiale di polizia viaggia da Mumbai a Kalimpong.
Probabilità che i due amici si incontrino:
1. La probabilità che un agente di polizia viaggi da Mumbai a Kalimpong dipende da fattori quali:
- Quanto spesso viaggia per lavoro?
- Quanto spesso viene assegnato ai casi delle piccole città?
- Supponiamo che questa probabilità sia dello 0,1%.
2. La probabilità che i due amici si incontrino dipende da fattori quali:
- Quanto spesso vanno entrambi al bar?
- Quanto è popolare il caffè?
- Il professore va regolarmente al bar.
- Supponiamo che questa probabilità sia dell'1%.
Calcoli finali:
- La probabilità che i due amici si incontrino a Kalimpong, data la presenza dell'agente di polizia, è dello 0,001%.
- Questa è una rappresentazione semplicistica del concetto, ma quello che sto cercando di dire è cercare sempre informazioni più rilevanti per affinare la propria probabilità.
Conclusione
La probabilità è semplice e complicata allo stesso tempo! Tuttavia, possiamo sempre perfezionare le informazioni aggiuntive che ci vengono fornite. Nelle situazioni del mondo reale, prova sempre a cercare come informazioni aggiuntive possano aiutarti ad aggiungere condizioni per rendere le tue probabilità più accurate.
Grazie per aver letto e spero che questo articolo ti sia stato utile!
Fonte: towardsdatascience.com