Introduzione agli algoritmi di clustering | Verso la scienza dei dati | Intelligenza-Artificiale

Indice contenuti

Una guida completa ai 10 algoritmi di clustering comunemente utilizzati per il clustering gerarchico, partizionale e basato sulla densità

Gli algoritmi di clustering svolgono un ruolo importante nell’analisi dei dati. Questi strumenti di analisi esplorativa e di apprendimento non supervisionato dei dati forniscono sistemi per la scoperta della conoscenza classificando i punti dati in gruppi distinti in base a caratteristiche condivise. Ciò consente l’identificazione di relazioni e tendenze che potrebbero essere difficili da vedere nei dati grezzi. Facilitano un processo decisionale più informato aggiungendo sistematicamente maggiore comprensione a set di dati complessi e intricati.

In questo articolo tratteremo le nozioni di base di tre tipi di algoritmi di clustering: modelli di clustering gerarchico, partizionale e basato sulla densità. Inizieremo definendo ciascuna di queste categorie. Successivamente, ci immergeremo in 10 diversi algoritmi di clustering, fornendo definizioni, collegamenti a documenti di ricerca originali o interessanti, punti di forza degli algoritmi e frammenti di codice Python per ciascuno.

Sommario

Algoritmi di clustering gerarchico

Algoritmi di clustering partizionale

Algoritmi di clustering basati sulla densità

Definizione: Il clustering gerarchico è un metodo di analisi dei cluster che crea una gerarchia di cluster. Può essere visualizzato come una struttura ad albero (dendrogramma) in cui le foglie rappresentano i singoli punti dati e la radice rappresenta un singolo cluster contenente tutti i punti dati.

Casi d’uso: