Classificatore multinomiale Naive Bayes |  di Yoann Mocquin |  Marzo 2024

 | Intelligenza-Artificiale

Un esempio completo e funzionante per la classificazione della revisione del testo

In questo nuovo post, proveremo a capire come funziona il classificatore Bayes multinomiale ingenuo e forniremo esempi funzionanti con Python e scikit-learn.

Cosa vedremo:

  • Cos'è la distribuzione multinomiale: a differenza dei classificatori gaussiani naive bayesiani che si basano sulla distribuzione gaussiana presunta, i classificatori multinomiali naive bayesiani si basano sulla distribuzione multinomiale.
  • L'approccio generale per creare classificatori che si basano sul teorema di Bayes, insieme all'ingenuo presupposto che le caratteristiche di input siano indipendenti le une dalle altre data una classe target.
  • Come viene “adattato” un classificatore multinomiale apprendendo/stimando le probabilità multinomiali per ciascuna classe – utilizzando il trucco di livellamento per gestire le caratteristiche vuote.
  • Come vengono calcolate le probabilità di un nuovo campione, utilizzando il trucco dello spazio logaritmico per evitare l'underflow.

Tutte le immagini per autore.

Se hai già familiarità con la distribuzione multinomiale, puoi passare alla parte successiva.

Rappresentazione di 2 distribuzioni multinomiali (con 10 parametri). Questi rappresentano la probabilità che una determinata parola appaia in una recensione testuale.

Il primo passo importante per comprendere il classificatore multinomiale Naive Bayes è capire cosa a distribuzione multinomiale È.

In parole semplici, rappresenta le probabilità di un esperimento che può avere un numero finito di risultati e che viene ripetuto N volte, ad esempio, come lanciare un dado con 6 facce, diciamo 10 volte e contare il numero di volte in cui appare ciascuna faccia. Un altro esempio è contare il numero di volte in cui ciascuna parola di un vocabolario appare in un testo.

Puoi anche vedere la distribuzione multinomiale come un'estensione della distribuzione binomiale: ad eccezione del lancio di una moneta con 2 possibili risultati (binomio), lanci un dado con 6 risultati (multinomiale). Per quanto riguarda la distribuzione binomiale, la somma di tutte le probabilità dei possibili risultati deve sommare 1. Quindi potremmo avere:

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *