Q1. Se lanci una moneta 10 volte di seguito, qual è la probabilità che esca testa?
Immagina di essere un analista di dati in un servizio di consegna di cibo. Dopo ogni ordine, i clienti possono valutare la qualità del cibo. L’obiettivo principale del team è fornire un servizio di alto livello e, se un ristorante riceve recensioni negative, è necessario controllarlo. Quindi, ecco la grande domanda: quante recensioni negative dovrebbero far scattare un check-up al ristorante?
A volte, solo occasionalmente, un ristorante può ritrovarsi con un feedback non eccezionale, e non è colpa sua. Se un ristorante ha gestito 1000 ordini, potrebbe ricevere per caso un paio di recensioni negative.
Mettiamola così: circa il 5% degli ordini finisce con recensioni negative solo per caso. Quindi il numero di recensioni negative per ristorante segue una distribuzione binomiale Am(n, p)dove “n” rappresenta gli ordini e “p” la probabilità di una recensione negativa (che nel nostro caso è del 5%).
Quindi, se un ristorante ha 100 ordini, c’è circa il 23,4% di probabilità che riceva almeno 7 recensioni negative e una probabilità molto più piccola del 2,8% che ne riceva almeno 10. Puoi verificarlo utilizzando una calcolatrice Quii tuoi parametri sono n=100, x=10, p=0,05e non dimenticare di scegliere l’opzione x>=X.
Ecco una conclusione: se imposti la soglia a 7 recensioni per un ristorante con 100 ordini, potresti finire per controllare i ristoranti troppo spesso, il che significa costi aggiuntivi per te e maggiore pressione sui ristoranti.
Q2. Pesca una carta da un mazzo standard di 52 carte 10 volte. Qual è la probabilità di non ricevere alcun cartellino rosso?
Ora immagina te stesso nel mondo dei siti di e-commerce. Tu e il tuo team avete appena introdotto un nuovo metodo di pagamento e siete curiosi di sapere con quale frequenza i clienti utilizzano questa nuova funzionalità. Ma ecco il problema: a causa di un piccolo bug, circa il 2% delle richieste al nuovo metodo di pagamento fallisce. In altre parole, i clienti vedono questa nuova opzione di pagamento nel 98% delle loro sessioni. Per capire quanto spesso un cliente sceglie questo metodo di pagamento, è necessario concentrarsi su coloro che lo avevano sempre a disposizione. Ma è qui che le cose diventano complicate.
Pensa a un utente con una sola sessione: lo escludi dalla tua analisi con una probabilità del 2%. Consideriamo ora un utente con 25 sessioni. Per loro, la possibilità di non avere la funzionalità disponibile in almeno una sessione è 1–0,98²⁵ = 39,7%. Pertanto, potresti involontariamente escludere alcuni dei tuoi clienti più fedeli con maggiori possibilità e ciò potrebbe distorcere la tua analisi.
Q3. Se lanci un dado tre volte, qual è la probabilità di ottenere due tre consecutivi?
Immagina di lavorare in un’azienda di ride-hailing come Uber. In alcuni paesi, le persone pagano ancora le corse in contanti, il che può rappresentare una seccatura per gli automobilisti. Devono trasportare il resto, gestire le transazioni in contanti e così via.
Il tuo team è preoccupato che se un conducente riceve tre ordini di contanti di seguito, potrebbe sentirsi frustrato e rimanere senza resto. Quindi, stai pensando di limitare gli ordini in contanti in tali situazioni. Ma prima di farlo, vuoi capire quanto spesso ciò accade realmente.
Supponiamo che il numero medio di viaggi per conducente al giorno sia 10 e che il 10% di tali viaggi venga pagato in contanti.
Quindi, la probabilità di ottenere 3 viaggi in contanti consecutivi è 0,1*0,1*0,1 = 0,001. Ma può essere 1°, 2°, 3° viaggio; 2°, 3°, 4° viaggio e così via. Ciò significa che la possibilità di ottenere tre viaggi in contanti di fila è solo 8*0,1*0,1*0,1 = 0,008%. Sembra essere piuttosto basso, per ora potresti voler rimandare l’implementazione di questa funzionalità.
Q4, Un test HIV è accurato al 99% (in entrambe le direzioni). Solo lo 0,3% della popolazione è sieropositiva. Qual è la probabilità che una persona a caso sia HIV+ dato che fa il test +?
Articolo originale per la domanda Qui.
Lavori nel settore bancario o creditizio e stai costruendo modelli per prevedere se un cliente restituirà il prestito. Nel complesso, in genere viene rimborsato l’85% di tutti i prestiti. Nel tuo ultimo modello, quando dice che un cliente rimborserà, è corretto nel 92% dei casi. Tuttavia, è corretto solo nel 40% dei casi quando si prevede che un cliente non ripagherà. Ora hai una preoccupazione: Se il tuo modello dice che il cliente non ripagherà, qual è la reale possibilità che ripagherà effettivamente?
Innanzitutto, calcoliamo la probabilità che il modello preveda “il cliente non ripagherà”. Ciò comporta due componenti:
- La probabilità di ottenere questa previsione dai clienti che non ripagare il credito: (1–0,4)*(1–0,85) = 0,09
- La probabilità di ottenere questa previsione dai clienti che Volere: (1–0,92)*0,85 = 0,068
- Quindi la probabilità che il cliente ripaghi il credito se il nostro modello non la pensa così è: 0,068/(0,068+0,09) = 0,43
Quindi, se non pensi che il cliente restituirà il credito, c’è una probabilità piuttosto alta che lo faccia.
Fonte: towardsdatascience.com