lLa scorsa settimana mi sono unito a un team per lavorare su un progetto collaborativo. Il team era già costituito da alcuni mesi, con diversi scienziati che lavoravano insieme al progetto. Per semplicità, firmavano documenti, menzionavano colleghi nelle e-mail, ecc. con le loro iniziali (la prima lettera del nome seguita dalla prima lettera del cognome).
Un paio di giorni dopo l’adesione al progetto, quando ho dovuto firmare il mio primo documento con le mie iniziali, ci siamo resi conto che un’altra persona nel team aveva le mie stesse identiche iniziali.
Questo non è stato un vero problema, poiché abbiamo deciso che avrei scritto le mie iniziali al contrario, cioè “SA” invece di “AS”, e l’altra persona avrebbe continuato a firmare con “AS” come al solito.
Potrebbe essersi fermato qui. Tuttavia l’idea di scrivere un post su questo aneddoto un po’ banale mi è venuta quando il caposquadra ha affermato, nel bel mezzo di una riunione: “È davvero un peccato che voi due abbiate le stesse iniziali! Quali sono le possibilità che ciò accada a noi?!”.
Abbiamo trascorso un paio di minuti cercando di stimare questa probabilità, che alla fine si è basata principalmente sulle nostre intuizioni piuttosto che su un calcolo formale. Questo ha stuzzicato la mia curiosità.
Dato che il progetto su cui stiamo lavorando richiede l’uso di simulazioni, ho deciso di concentrarmi nel rispondere a questa domanda tramite simulazioni in R. Detto questo, come per la maggior parte delle simulazioni, è buona pratica verificare questi risultati. Questo viene fatto utilizzando teoria della probabilità. Questo confronto consentirà di valutare la veridicità dei risultati ottenuti attraverso le simulazioni.
Inoltre, ho pensato che sarebbe stato un bel modo per illustrare metodi non presentati spesso nei miei post: cicli for, repliche e scrittura di funzioni in R.
Prima di rispondere alla domanda posta dal caposquadra, ci sono tre cose da notare:
- Anche se il caposquadra era curioso di conoscere la probabilità che ciò accadesse esattamente due persone avere il…
Fonte: towardsdatascience.com