Ricerca di raggi: l’algoritmo più utilizzato nei modelli sequenziali |  di Riccardo Andreoni |  Dicembre 2023

 | Intelligenza-Artificiale

Impara i principi di funzionamento del più famoso algoritmo per la traduzione del testo e il riconoscimento vocale.

Beam Search consente di considerare più flussi di candidati. Fonte immagine: unsplash.com.

Immagina di essere un AI modello linguistico, come ChatGPTcompletando una frase. Come scegli la parola successiva per renderla non giusta grammaticalmente corretto ma anche contestualmente rilevante? Qui è dove Ricerca del raggio interviene.

In modo efficiente esplorando molteplici possibilità parallelamente e mantenendo i migliori candidati in ogni fase, Beam Search svolge un ruolo cruciale nel compito di previsione elementi successivi. Essendo un algoritmo efficace e potente, garantisce che l’output sia allineato ai vincoli grammaticali e al contesto.

Per comprendere l’impatto di Beam Search, pensa a tutte le applicazioni che richiedono la generazione di sequenze precise, come traduzione linguistica, completamento del testoE chatbot. In tutte queste applicazioni, Beam Search gioca un ruolo fondamentale.

In questo articolo introdurrò la teoria e ti guiderò attraverso un esempio pratico passo dopo passo dell’algoritmo Beam Search. Presenterò anche diverse varianti di Beam Search e descriverò in dettaglio tutti i pro e i contro di questo algoritmo fondamentale.

Immagina di doverlo fare traduci la seguente frase dallo spagnolo all’inglese:

Pablo sarà a New York la prossima settimana.

Non vogliamo solo ottenere una traduzione corretta, vogliamo ottenere il migliore. Per un modello linguistico, l’output migliore coincide con il quello più probabile.

Per raggiungere questo compito, la maggior parte sequenza in sequenza i modelli utilizzano la ricerca del raggio. Funziona come un algoritmo euristico, esplorando sistematicamente molteplici possibilità in parallelo. Ad ogni passaggio, una “larghezza del fascio” definita mantiene un numero fisso di candidati migliori. Ciò consente all’algoritmo di esplorare diversi candidati.

Questo approccio imita il processo decisionale processi, con il modello che valuta e seleziona le opzioni più promettenti.

Considera un modello standard da sequenza a sequenza, rappresentato dalla semplice rete seguente:

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *