Presentazione del grafico a barre Crystal: visualizzazione del clustering differenziale sequenziale |  di Nick Gerend |  Dicembre 2023

 | Intelligenza-Artificiale

Scopri di più sui grafici a barre Crystal e creane uno tuo con Python

Grafico a barre Crystal di Nick Gerend

Esistono molti modi per comprendere meglio una serie di dati. Che si tratti di una serie di temperature, punteggi dei test, prezzi dei generi alimentari, conteggio dei passi o avvistamenti UFO, c’è sempre qualcosa da imparare sulla natura di qualcosa attraverso la lente dell’analisi e della visualizzazione dei dati.

Di seguito descriverò una nuova tecnica per visualizzare una serie di dati che utilizza un semplice clustering basato su soglia. Spero che lo troverai un nuovo approccio da abbinare ai metodi di visualizzazione convenzionali come istogrammi e box plot per raccogliere una nuova prospettiva su una caratteristica di interesse.

Numericamente

Come ci si distingue? In termini di un singolo attributo numerico, supponiamo che una soglia semplice sia lo standard in base al quale i valori ordinati vengono confrontati tra loro e separati in gruppi. Prendiamo ad esempio la seguente sequenza:

(0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144)

Queste sono ovviamente le prime 13 cifre della sequenza di Fibonacci. Se prendiamo la differenza di ciascun valore e il valore precedente nella sequenza, iniziando dalla 3a posizione, otteniamo la stessa sequenza spostata in avanti di 2 passi:

( _ , _ , 0 , 1 , 1 , 2 , 3 , 5 , 8 , 13 , 21 , 34 , 55 )

Ora impostiamo una soglia pari a 5 e assumiamo che qualsiasi valore maggiore di 5 delinei un nuovo cluster mentre attraversiamo la sequenza da sinistra a destra. Ciò comporterebbe il raggruppamento dei primi 8 elementi (valori da 0 a 13) e ciascun elemento successivo sarebbe l’unico elemento nel proprio gruppo poiché tutte le differenze rimanenti superano 5.

Per la sequenza di Fibonacci questo metodo produce un risultato prevedibile, ma nell’analisi esplorativa dei dati possono emergere tutti i tipi di modelli. Descriverò come esplorare questi modelli con un nuovo tipo di visualizzazione dei dati, iniziando con un paio di tipi di grafici familiari di seguito per il confronto.

Con un istogramma

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *