Il potere espressivo delle GNN: introduzione e fondamenti |  di Giuseppe Futia |  Febbraio 2024

 | Intelligenza-Artificiale

Serie spiegate dalle GNN

Collegare i punti per un’analisi teorica dei modelli di rete neurale a grafo

Questa serie mira a fornire una comprensione completa di come le GNN catturano le informazioni relazionali delle strutture di rete.

Gi raph rappresentano modelli universali per descrivere elementi interagenti e le reti neurali a grafo (GNN) sono diventate un kit di strumenti essenziale per applicare algoritmi di apprendimento a dati strutturati a grafo.

Il framework più comune delle GNN è basato sulla Message Passing Neural Network (MPNN). In questo quadro, le caratteristiche del vicino sono passato al nodo di destinazione come messaggi attraverso i bordi. Quindi, la rappresentazione del nodo di destinazione viene aggiornata con la rappresentazione aggregata dei suoi vicini.

Sulla base di questo principio, la nuova rappresentazione del nodo codifica le informazioni relative alla struttura locale. Questa procedura di passaggio dei messaggi è illustrata nella Figura 1.

Figura 1 — Aggregazione delle caratteristiche vicine nel nodo arancione in un MPNN a 2 strati

Questa figura mostra come viene aggiornata la rappresentazione del nodo arancione, aggregando le caratteristiche dei suoi vicini. Più nel dettaglio, impilando un singolo layer MPNN, il nodo arancione viene aggiornato con la rappresentazione dei nodi blu. Aggiungendo un ulteriore livello, la rappresentazione risultante del nodo arancione incorpora le caratteristiche dei nodi blu e verdi.

Per semplicità consideriamo solo l’aggregazione effettuata sul nodo arancione. Tuttavia, questo calcolo viene eseguito in parallelo per tutti i nodi del grafico, inclusi i nodi blu e verde, la cui rappresentazione viene aggiornata con le caratteristiche dei loro vicini (compreso quello arancione!).

La principale differenza tra i diversi modelli GNN risiede nel tipo di aggregazione di caratteristiche eseguita per aggiornare la rappresentazione del nodo. Le caratteristiche dei vicini possono essere aggregate utilizzando una somma o un’operazione di media, come nel caso di Graph Convolutional Networks (GCN) e GraphSage. In altri casi, come i Graph Attention Networks (GAT), possiamo aggiungere un ulteriore passaggio in cui il contributo di ciascun nodo vicino viene ponderato in base alla sua importanza.

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *