Incorporamenticonosciuto anche come rappresentazionisono rappresentazioni vettoriali dense di entità come parole, documenti, prodotti e altro. Sono progettati per catturare significati semantici ed evidenziare somiglianze tra le entità. Un buon insieme di rappresentazioni non dovrebbe solo codificare in modo efficiente le caratteristiche essenziali delle entità, ma anche mostrare proprietà come compattezza, significatività e robustezza in vari compiti. In questo articolo, esaminiamo vari parametri di valutazione per valutare la qualità delle rappresentazioni. Iniziamo.
Qualsiasi quadro di valutazione è costituito da tre componenti principali:
- Un metodo di base: serve come punto di riferimento rispetto al quale confrontare nuovi approcci o modelli. Fornisce un punto di riferimento per valutare le prestazioni dei metodi proposti.
- Un insieme di metriche di valutazione: le metriche di valutazione sono misure quantitative utilizzate per valutare le prestazioni dei modelli. Questi parametri possono essere supervisionati o non supervisionati e definiscono come viene valutato il successo dei risultati.
- Un set di dati di valutazione: il dataset di valutazione è una raccolta di dati etichettati/annotati o non etichettati utilizzati per valutare le prestazioni dei modelli. Questo set di dati dovrebbe essere rappresentativo degli scenari del mondo reale che i modelli dovrebbero gestire. È necessario che copra una vasta gamma di esempi per garantire una valutazione completa.
A seconda che le metriche di valutazione richiedano etichette di verità, possiamo suddividerle in metriche non supervisionateE metriche supervisionate. Spesso è più vantaggioso utilizzare parametri non supervisionati, poiché non richiedono etichette e la raccolta delle etichette è nella pratica molto costosa.
Di seguito, esamineremo i parametri all’avanguardia. Per ogni metrica, scegli un metodo di base con cui confrontare le tue valutazioni. La linea di base può essere semplice come `generatore di incorporamento casuale`!
Le metriche supervisionate richiedono un set di dati di valutazione etichettato. Una strategia comune consiste nello scegliere un predittore come un classificatore o un regressore. Quindi addestrare il predittore su un insieme limitato di dati etichettati da un…
Fonte: towardsdatascience.com