Serie di apprendimento non supervisionato: esplorazione di DBScan |  di Ivo Bernardo |  Novembre 2023

 | Intelligenza-Artificiale

Impara la teoria dietro il famoso algoritmo di clustering basato sulla densità mentre usi sklearn di Python

Immagine da Kier in vista Archivi @Unsplash.com

CGli algoritmi brillanti sono una delle soluzioni più utilizzate nel mondo della scienza dei dati, con quelli più popolari raggruppati in approcci basati sulla distanza e basati sulla densità. Anche se spesso trascurati, i metodi di clustering basati sulla densità rappresentano alternative interessanti a quelli onnipresenti k-significa E gerarchico approcci.

Alcune delle famose tecniche di clustering basate sulla densità includono DBSCan (Clustering spaziale basato sulla densità di applicazioni con rumore) o Mean-Shift, due algoritmi che utilizzano il centro di massa dei punti dati per raggruppare insieme le osservazioni.

In questo post del blog esploreremo DBScan, un algoritmo di clustering particolarmente utile quando i tuoi dati contengono alcune delle seguenti funzionalità:

  • I grappoli hanno una forma irregolare. Ad esempio, una forma non sferica.
  • Rispetto ad altri metodi, DBScan non presuppone alcuna precedenza sulla distribuzione sottostante dei dati.
  • Il tuo set di dati contiene alcuni valori anomali rilevanti che non dovrebbero influenzare il modo in cui vengono mappati i centroidi dei cluster.

Se queste tre frasi ti hanno confuso, non preoccuparti! In questo post vedremo un’implementazione passo passo di DBScan metodo, discutendo gli argomenti di cui sopra. Inoltre, controlleremo il famoso sklearn Implementazione Python!

Inoltre, se desideri leggere altri post della mia serie di apprendimento non supervisionato, puoi controllare:

Immergiamoci quindi in profondità e comprendiamo come funziona DBScan!

In questo manuale dettagliato utilizzeremo un set di dati giocattolo con informazioni sui clienti. In questo esempio, utilizzeremo un clustering a due variabili per renderlo più facile da comprendere.

Immaginiamo di gestire un negozio e di avere informazioni demografiche sui nostri clienti. Vorremmo fare alcune campagne in base al loro reddito annuale ed età e solo noi

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *