Ottimizzazione dei modelli linguistici per il riconoscimento delle entità denominate

fotografato da Choong Deng Xiang SU Unsplash

Hugging Face è una piattaforma che offre strumenti e modelli pre-addestrati per varie attività di elaborazione del linguaggio naturale (NLP) e comprensione del linguaggio naturale (NLU). Nel nostro precedente articolo, Un caloroso abbraccio: esplorare il volto abbracciatoabbiamo approfondito le basi di questa piattaforma e della sua libreria open source che presenta implementazioni di molte architetture di trasformatori all’avanguardia. Questo post migliora la documentazione di Hugging Face fornendo ai data scientist emergenti un’unica visione connessa di vari strumenti di Hugging Face per un’attività specifica. Nello specifico, questo articolo spiega come mettere insieme più funzionalità di Hugging Face per mettere a punto un modello linguistico esistente per il riconoscimento delle entità denominate (“NER”).

In questa sezione, esamineremo brevemente due concetti fondamentali essenziali per costruire il nostro modello. Come promemoria, abbiamo trattato le nozioni di base su Hugging Face Un caloroso abbraccio: esplorare il volto abbracciato.

  • Riconoscimento di entità denominate
  • Messa a punto del modello

Nelle sezioni seguenti si presuppone che tu abbia una certa conoscenza dello sviluppo del modello e dei concetti associati; tuttavia, se qualcosa non è chiaro, non esitare a contattarci!

Riconoscimento di entità denominate

Il riconoscimento di entità denominate (“NER”) è un’attività comune di elaborazione del linguaggio naturale per identificare e classificare informazioni rilevanti, o entità, in uno dei tanti gruppi predefiniti (denominati). I modelli NER possono essere addestrati su una varietà di entità. Alcuni dei più comuni sono:

  • Nomi
  • Organizzazioni
  • Date
  • Luoghi e posizioni

Nell’immagine seguente, ho taggato manualmente un paio di entità con nomi diversi in una frase di esempio. Nel contesto dell’apprendimento automatico e della PNL, il NER è il processo di automazione di questo processo di categorizzazione attraverso modelli.

I modelli NER possono consentire una varietà di attività tra cui, ma non solo, il recupero di informazioni, il riepilogo dei contenuti, la raccomandazione dei contenuti e la traduzione automatica.

Messa a punto del modello

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *