Benchmark del grafico temporale.  Set di dati stimolanti e realistici per… |  di Shenyang(Andy) Huang |  Dicembre 2023

 | Intelligenza-Artificiale

L’obiettivo della previsione dinamica delle proprietà del collegamento è prevedere la proprietà (spesso l’esistenza) di un collegamento tra una coppia di nodi in un timestamp futuro.

Campionamento del fronte negativo. Nelle applicazioni reali, i bordi reali non sono noti in anticipo. Pertanto, viene interrogato un gran numero di coppie di nodi e solo le coppie con i punteggi più alti vengono trattate come archi. Motivati ​​da ciò, inquadriamo l’attività di previsione del collegamento come un problema di classificazione e campioniamo più archi negativi per ogni arco positivo. In particolare, per un dato fronte positivo (s,d,t)sistemiamo il nodo sorgente S e timestamp T e campione Q diversi nodi di destinazione D. Per ogni set di dati, Q viene selezionato in base al compromesso tra completezza della valutazione e tempo di inferenza del set di test. Fuori da Q campioni negativi, metà sono campionati in modo uniforme in modo casuale, mentre l’altra metà sono fronti negativi storici (fronti che sono stati osservati nel set di addestramento ma non sono presenti al momento T).

Metrica delle prestazioni. Utilizziamo il Mean Reciprocal Rank (MRR) filtrato come metrica per questa attività, poiché è progettato per problemi di classificazione. L’MRR calcola il rango reciproco del vero nodo di destinazione tra le destinazioni negative o false ed è comunemente utilizzato nei sistemi di raccomandazione e nella letteratura sui grafici della conoscenza.

Prestazioni MRR sui set di dati tgbl-wiki e tgbl-review

Risultati su set di dati di piccole dimensioni. Nel piccolo tgbl-wiki E tgbl-reviewset di dati, osserviamo che i modelli con le migliori prestazioni sono abbastanza diversi. Inoltre, i modelli più performanti su tgbl-wiki come CAWN e NAT hanno una significativa riduzione delle prestazioni tgbl-review. Una possibile spiegazione è che il tgbl-reviewil set di dati ha un indice di sorpresa molto più elevato rispetto al tgbl-wikiset di dati. L’alto indice di sorpresa mostra che un rapporto elevato di bordi del set di test non viene mai osservato nel set di addestramento tgbl-reviewrichiede un ragionamento più induttivo. In tgbl-reviewGraphMixer e TGAT sono i modelli più performanti. Grazie alle loro dimensioni ridotte, siamo in grado di campionare tutti i possibili negativi tgbl-wikie cento negativi per tgbl-reviewper fronte positivo.

Prestazioni MRR sui set di dati tgbl-coin, tgbl-comment e tgbl-flight.

La maggior parte dei metodi esaurisce la memoria della GPU per questi set di dati, quindi confrontiamo TGN, DyRep ed Edgebank su questi set di dati a causa dei minori requisiti di memoria della GPU. Tieni presente che alcuni set di dati come tgbl-commentO tgbl-flightche copre più anni, con conseguente potenziale spostamento della distribuzione nel suo lungo arco di tempo.

effetto del numero di campioni negativi su tgbl-wiki

Approfondimenti. Come visto sopra in tgbl-wikiil numero di campioni negativi utilizzati per la valutazione può avere un impatto significativo sulle prestazioni del modello: notiamo un calo significativo delle prestazioni nella maggior parte dei metodi, quando il numero di campioni negativi aumenta da 20 a tutte le possibili destinazioni. Ciò verifica che, in effetti, sono necessari più campioni negativi per una valutazione affidabile. Curiosamente, metodi come CAWN e Edgebank hanno un calo di prestazioni relativamente minore e lasciamo che sia compito futuro indagare sul motivo per cui alcuni metodi sono meno influenzati.

tempo totale di addestramento e validazione dei modelli TG

Successivamente, osserviamo una differenza fino a due ordini di grandezza nei tempi di training e validazione dei metodi TG, con la linea di base euristica Edgebank che è sempre la più veloce (poiché è implementata semplicemente come tabella hash). Ciò dimostra che il miglioramento dell’efficienza e della scalabilità del modello è un’importante direzione futura in modo tale che i modelli nuovi ed esistenti possano essere testati su set di dati di grandi dimensioni forniti in TGB.

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *