Comprendere l’algoritmo Naive Bayes |  NB Classificatore

 | Intelligenza-Artificiale

Cos’è e come applicarlo a uno scenario reale

fotografato da Google DeepMind SU Unsplash

Quest’anno il mio proposito è tornare alle basi della scienza dei dati. Lavoro con i dati ogni giorno, ma è facile dimenticare come funzionano alcuni degli algoritmi principali se si completano attività ripetitive. Il mio obiettivo è approfondire ogni settimana un algoritmo di dati qui su Towards Data Science. Questa settimana parlerò di Naive Bayes.

Giusto per toglierti di mezzo, puoi imparare come pronunciare Naive Bayes Qui.

Ora che sappiamo come dirlo, vediamo cosa significa…

Questo classificatore probabilistico si basa su Teorema di Bayesche può essere così riassunto:

La probabilità condizionata di un evento quando un secondo evento si è già verificato è il prodotto di “evento B, dato A e la probabilità di A divisa per la probabilità dell’evento B”.

P(A|B) = P(B|A)P(A) / P(B)

Un malinteso comune è che il Teorema di Bayes e la probabilità condizionata siano sinonimi.

Tuttavia, esiste una distinzione: il Teorema di Bayes utilizza la definizione di probabilità condizionata per trovare quella che è nota come “probabilità inversa” o “probabilità inversa”.

Detto in altro modo, la probabilità condizionata è la probabilità che A dato B. Il Teorema di Bayes lo prende e trova la probabilità che B dato A.

Una caratteristica notevole dell’algoritmo Naive Bayes è l’uso di eventi sequenziali. In parole povere, acquisendo informazioni aggiuntive in un secondo momento, la probabilità iniziale viene corretta. Le chiameremo probabilità a priori/probabilità marginale e probabilità a posteriori. La conclusione principale è che conoscendo il risultato di un’altra condizione, la probabilità iniziale cambia.

Un buon esempio di ciò è l’esame dei test medici. Ad esempio, se un paziente ha problemi gastrointestinali, il medico potrebbe sospettarlo Disturbo infiammatorio intestinale (IBD). La probabilità iniziale di avere questa condizione è di circa l’1,3%.

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *