Un’intuizione su come funzionano modelli come ChatGPT |  di David Hundley |  Dicembre 2023

 | Intelligenza-Artificiale

Fornire un’intuizione sulle idee alla base dei modelli di trasformatore più diffusi come ChatGPT e altri modelli linguistici di grandi dimensioni (LLM)

Titolo della carta creato dall’autore

Verso la fine del 2023, è incredibile pensare a quanto l’intelligenza artificiale generativa abbia già influenzato la nostra vita quotidiana. A partire dal rilascio di ChatGPT nel novembre 2022, questo spazio si è evoluto così rapidamente che è difficile credere che sia trascorso solo un anno in cui sono emersi tutti questi progressi.

Sebbene i risultati siano piuttosto sorprendenti, la complessità di fondo ha portato molte persone a speculare pubblicamente su come funzionano questi grandi modelli linguistici (LLM). Alcune persone hanno ipotizzato che questi modelli provengano da un database di risposte preformulato, e alcuni sono arrivati ​​​​al punto di ipotizzare che questi LLM abbiano acquisito un livello di sensibilità umana. Queste sono posizioni estreme e, come puoi immaginare, entrambe sono errate.

Potresti aver sentito che questi Gli LLM sono predittori della parola successiva, nel senso che utilizzano la probabilità per determinare la parola successiva che dovrebbe comparire in una frase. Questa comprensione è tecnicamente corretta, ma è un livello un po’ troppo elevato per comprendere sufficientemente questi modelli. Per costruire un’intuizione più forte, dobbiamo andare più in profondità. L’intento di questo post è quello di fornire ai leader aziendali una comprensione sufficientemente approfondita di questi modelli da consentire loro di prendere decisioni consapevoli su come affrontare in modo appropriato l’intelligenza artificiale generativa per le rispettive aziende.. Manterremo le cose a un livello più concettuale e intuitivo e ci allontaneremo dalla matematica profonda dietro questi modelli.

Considera la frase “Mi piace bere _______ al mattino”. Come potresti discernere come riempire quello spazio vuoto? Le persone più ragionevoli potrebbero inserire risposte come caffè, acqua o succo di frutta. I più sciocchi tra noi potrebbero dire qualcosa come birra o latte acido, ma tutte queste varie opzioni si fissano su un importante indizio contestuale: bere. Questo da solo restringe il campo in cui potrebbe essere quello spazio vuoto, ma coloro che hanno preso in considerazione l’intero contesto della frase hanno notato anche la parola “mattina” e quindi hanno ristretto ulteriormente il contesto. In altre parole, “bevanda” + “mattina” = qualcosa che si avvicina a una bevanda per la colazione.

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *