Testare la qualità dei tuoi grafici è fondamentale per garantirne le prestazioni nel tuo sistema di machine learning. Questo articolo ti mostrerà come testare la qualità dei tuoi grafici topologici
I grafici sono strutture dati in grado di rappresentare una grande quantità di informazioni. Oltre a rappresentare campioni di dati individualmente come nodi, un grafico rappresenta anche la relazione tra i dati, incapsulando più informazioni archiviate nel set di dati. Quando si crea un grafico, tuttavia, è importante verificare la qualità del grafico, che è ciò di cui parlerò come puoi fare in questo articolo.
La motivazione di questo articolo è che sto creando grafici per un progetto su cui sto lavorando. I grafici sono più avanti nella mia pipeline utilizzati per eseguire il clustering come mostrato nell’immagine della pipeline di seguito. Per garantire la correttezza del mio grafico, voglio avere un test in grado di produrre la qualità di ogni grafico che creo. Quando si lavora su progetti di machine learning, verificare i risultati e la qualità è fondamentale sia per risparmiare tempo nella correzione dei bug sia per garantire che la pipeline di dati funzioni correttamente. Il risultato della verifica può funzionare come controllo di integrità, quindi sei sicuro che il grafico non sia il problema se il tuo algoritmo di apprendimento automatico non funziona come previsto.
Inoltre, desidero anche ridurre la portata di ciò di cui parlerò. Innanzitutto quando mi riferisco a un grafo intendo una struttura del grafo definita puramente dalla sua struttura topologica, cioè mi riferisco solo alla relazione tra i dati. Un grafo definito puramente dalla sua struttura topologica, può quindi essere rappresentato con 2 liste. Un elenco di tutti gli indici dei nodi e un elenco di tutti gli spigoli (che potrebbe includere anche i pesi degli spigoli), un elenco 2D con ogni riga (sorgente, destinazione, peso). Se il tuo grafico è ponderato, puoi ignorare il peso o impostare tutti i pesi su 1. In secondo luogo, una definizione di ambito che farò è che sto utilizzando il mio grafico per separare classi diverse l’una dall’altra, il che si rifletterà in…
Fonte: towardsdatascience.com