Introduzione agli algoritmi di clustering |  Verso la scienza dei dati

 | Intelligenza-Artificiale

Una guida completa ai 10 algoritmi di clustering comunemente utilizzati per il clustering gerarchico, partizionale e basato sulla densità

fotografato da Asta lunga SU Unsplash

Gli algoritmi di clustering svolgono un ruolo importante nell’analisi dei dati. Questi strumenti di analisi esplorativa e di apprendimento non supervisionato dei dati forniscono sistemi per la scoperta della conoscenza classificando i punti dati in gruppi distinti in base a caratteristiche condivise. Ciò consente l’identificazione di relazioni e tendenze che potrebbero essere difficili da vedere nei dati grezzi. Facilitano un processo decisionale più informato aggiungendo sistematicamente maggiore comprensione a set di dati complessi e intricati.

In questo articolo tratteremo le nozioni di base di tre tipi di algoritmi di clustering: modelli di clustering gerarchico, partizionale e basato sulla densità. Inizieremo definendo ciascuna di queste categorie. Successivamente, ci immergeremo in 10 diversi algoritmi di clustering, fornendo definizioni, collegamenti a documenti di ricerca originali o interessanti, punti di forza degli algoritmi e frammenti di codice Python per ciascuno.

Sommario

Algoritmi di clustering gerarchico

Algoritmi di clustering partizionale

Algoritmi di clustering basati sulla densità

Definizione: Il clustering gerarchico è un metodo di analisi dei cluster che crea una gerarchia di cluster. Può essere visualizzato come una struttura ad albero (dendrogramma) in cui le foglie rappresentano i singoli punti dati e la radice rappresenta un singolo cluster contenente tutti i punti dati.

Casi d’uso:

  • Problemi di tassonomia.
  • Quando le relazioni verticali sono importanti nei dati.

Punti di forza:

  • Fornisce una struttura gerarchica di cluster.

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *