
Una guida completa ai 10 algoritmi di clustering comunemente utilizzati per il clustering gerarchico, partizionale e basato sulla densità
Gli algoritmi di clustering svolgono un ruolo importante nell’analisi dei dati. Questi strumenti di analisi esplorativa e di apprendimento non supervisionato dei dati forniscono sistemi per la scoperta della conoscenza classificando i punti dati in gruppi distinti in base a caratteristiche condivise. Ciò consente l’identificazione di relazioni e tendenze che potrebbero essere difficili da vedere nei dati grezzi. Facilitano un processo decisionale più informato aggiungendo sistematicamente maggiore comprensione a set di dati complessi e intricati.
In questo articolo tratteremo le nozioni di base di tre tipi di algoritmi di clustering: modelli di clustering gerarchico, partizionale e basato sulla densità. Inizieremo definendo ciascuna di queste categorie. Successivamente, ci immergeremo in 10 diversi algoritmi di clustering, fornendo definizioni, collegamenti a documenti di ricerca originali o interessanti, punti di forza degli algoritmi e frammenti di codice Python per ciascuno.
Sommario
Algoritmi di clustering gerarchico
Algoritmi di clustering partizionale
Algoritmi di clustering basati sulla densità
Definizione: Il clustering gerarchico è un metodo di analisi dei cluster che crea una gerarchia di cluster. Può essere visualizzato come una struttura ad albero (dendrogramma) in cui le foglie rappresentano i singoli punti dati e la radice rappresenta un singolo cluster contenente tutti i punti dati.
Casi d’uso:
- Problemi di tassonomia.
- Quando le relazioni verticali sono importanti nei dati.
Punti di forza:
- Fornisce una struttura gerarchica di cluster.
Fonte: towardsdatascience.com