Risposte alle domande a scelta multipla in HuggingFace |  di Mina Ghashami |  Febbraio 2024

 | Intelligenza-Artificiale

Svelare il potere della risposta alle domande

Immagine da unsplash.com

Le tecniche di elaborazione del linguaggio naturale stanno dimostrando immense capacità attività di risposta alle domande (QA).. In questo post, sfruttiamo la libreria HuggingFace per affrontare una sfida di risposta a domande a scelta multipla.

Sspecificatamente, perfezioniamo un modello BERT preaddestrato su un set di dati di domande a scelta multipla utilizzando l’API Trainer. Ciò consente di adattare le potenti rappresentazioni bidirezionali del BERT pre-addestrato al nostro compito target. Aggiungendo a capoclassificail modello apprende modelli testuali che aiutano a determinare la scelta corretta da una serie di opzioni di risposta per domanda. Quindi valutiamo le prestazioni utilizzando la precisione nell’insieme dei test eseguiti.

Il framework Transformer consente di sperimentare rapidamente diverse architetture di modelli, opzioni di tokenizer e approcci di formazione. In questa analisi, dimostriamo una ricetta passo passo per ottenere prestazioni competitive sul QA a scelta multipla attraverso HuggingFace Transformers.

Il primo passo è installare e importare le librerie. Per installare le librerie utilizzare pip install comando come segue:

!pip install datasets transformers(torch) --quiet

e poi importare le librerie necessarie:

import numpy as np
import pandas as pd
import os
import json
import torch
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader

from transformers.modeling_outputs import SequenceClassifierOutput
from transformers import (
AutoTokenizer,
Trainer,
TrainingArguments,
set_seed,
DataCollatorWithPadding,
DefaultDataCollator
)
from datasets import load_dataset, load_metric
from dataclasses import dataclass, field
from typing import Optional, Union

Nella seconda fase carichiamo il treno e testiamo il set di dati. Noi usiamo set di dati codah che è disponibile per uso commerciale ed è concesso in licenza da “odc-by”(1)

from datasets import load_dataset

codah = load_dataset("codah", "codah")

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *