L’intelligenza artificiale generativa sta conquistando il mondo?  |  Stephanie Kirmer

 | Intelligenza-Artificiale

Le aziende stanno saltando sul carro della creazione di qualcosa, qualsiasi cosa che possano lanciare come funzionalità o prodotto di “AI generativa”. Cosa determina tutto ciò e perché è un problema?

fotografato da Martiņš Zemlickis SU Unsplash

Recentemente mi sono aggiornato sui numeri arretrati di Money Stuff, l’indispensabile newsletter/blog di Matt Levine su Bloomberg, e c’era un pezzo interessante su come gli algoritmi di selezione titoli basati sull’intelligenza artificiale in realtà non favoriscono le azioni basate sull’intelligenza artificiale (e inoltre non eseguono tutto ciò bene sulle scelte che fanno). Vai a leggere Money Stuff per saperne di più.

Ma uno dei punti sottolineati insieme a quell’analisi è che le aziende in tutto il panorama economico sono alle prese con la FOMO relativa all’intelligenza artificiale. Ciò porta a un assortimento semi-comico di applicazioni di ciò che siamo detto è l’intelligenza artificiale.

“Alcune aziende affermano di utilizzare l’intelligenza artificiale quando in realtà stanno solo cercando di capire le basi dell’automazione. I pretendenti verranno smascherati per questo prima o poi”, ha detto. …

L’azienda di moda e abbigliamento Ralph Lauren all’inizio di questo mese ha descritto l’intelligenza artificiale come “una parte davvero importante del nostro. . . percorso di crescita dei ricavi”. Catene di ristoranti come Yum Brands e Chipotle, proprietario di KFC, hanno pubblicizzato la tecnologia basata sull’intelligenza artificiale per migliorare l’efficienza degli ordini degli ingredienti o aiutare a produrre tortilla chips.

Diverse aziende legate al turismo come Marriott e Norwegian Cruise Line hanno affermato che stanno lavorando su sistemi basati sull’intelligenza artificiale per rendere processi come la prenotazione più efficienti e personalizzati.

Nessuno degli esempi sopra menzionati fa riferimento all’intelligenza artificiale nei documenti trimestrali più recenti, sebbene Ralph Lauren abbia notato alcune iniziative in termini generali nella sua relazione annuale di maggio.

(da Money Stuff, ma citava il Financial Times)

Per me, questo funziona bene, anche se non sono così sicuro che verranno scoperti. Devo ammettere, inoltre, che molte aziende stanno effettivamente impiegando l’intelligenza artificiale generativa (di solito sintonizzata su prodotti pronti da grandi società di sviluppo), ma raramente sono ciò di cui qualcuno ha effettivamente bisogno o desidera – invece, stanno solo cercando di entrare sul nuovo momento caldo.

Ho pensato, però, che potrebbe essere utile parlare di come avviene tutto questo. Quando qualcuno decide che la propria azienda ha bisogno di “innovazione AI”, che si tratti effettivamente di AI generativa o meno, cosa sta succedendo realmente?

Rivisitiamo cos’è realmente l’intelligenza artificiale prima di procedere. Come i lettori abituali sapranno, I Veramente odio quando le persone usano il termine “AI” con noncuranza, perché la maggior parte delle volte non sanno affatto cosa intendono con questo. Preferisco essere più specifico, o almeno spiegare cosa intendo.

Per me, l’intelligenza artificiale è quando utilizziamo strategie di machine learning, spesso ma non sempre deep learning, per costruire modelli o combinazioni di modelli in grado di completare compiti complessi che normalmente richiederebbero capacità umane. Quando un modello di machine learning diventa così complesso da poterlo chiamare AI? Questa è una domanda molto difficile e c’è molto disaccordo al riguardo. Ma questa è la mia inquadratura: l’apprendimento automatico è la tecnica che utilizziamo per creare l’intelligenza artificiale, e l’apprendimento automatico è un grande ombrello che comprende l’apprendimento profondo e molte altre cose. Il campo della scienza dei dati è una sorta di ombrello ancora più grande che può includere parte o tutto l’apprendimento automatico, ma include anche molte altre cose.

L’intelligenza artificiale avviene quando utilizziamo strategie di apprendimento automatico, spesso deep learning, per costruire modelli o combinazioni di modelli in grado di completare compiti complessi che normalmente richiederebbero capacità umane.

C’è un’altra sottocategoria, l’intelligenza artificiale generativa, e penso che quando la maggior parte dei profani oggi parla di intelligenza artificiale, in realtà è quello che intendono. Questi sono i tuoi LLM, la generazione di immagini e così via (vedi i miei post precedenti per ulteriori discussioni su tutto ciò). Se, per esempio, un motore di ricerca è tecnicamente AI, come si potrebbe sostenere, non è sicuramente AI generativa, e se oggi chiedessi a qualcuno per strada se un semplice motore di ricerca è AI, probabilmente non la penserebbe così.

Discutiamo un esempio, forse per aiutare a chiarire un po’ le automazioni e cosa le rende non necessariamente AI. Un chatbot che risponde a domande è un buon esempio.

Da un lato abbiamo un’automazione piuttosto elementare, qualcosa che abbiamo in giro da secoli.

  • Il cliente inserisce una domanda o una parola da cercare in una finestra popup sul tuo sito web
  • Un’applicazione che esamina questa domanda o insieme di parole ed elimina le stopword (a, e, the e così via: una semplice funzione di ricerca e sostituzione)
  • L’applicazione inserisce quindi i termini rimanenti in una casella di ricerca, restituendo i risultati di quella ricerca nel database/FAQ/wiki nella casella popup della chat

Questa è un’approssimazione molto approssimativa del vecchio modo di fare queste cose. Alla gente non piace, e se chiedi la cosa sbagliata, sei bloccato. Fondamentalmente è un LMGTFY*. Questo strumento non imita nemmeno il tipo di strategia di risoluzione dei problemi o di risposta che un essere umano potrebbe utilizzare.

D’altra parte, ora potremmo avere un equivalente ChatGPT:

  • Il cliente inserisce una domanda o una parola da cercare in una finestra popup sul tuo sito web
  • Il LLM dietro le quinte assimila l’input del cliente come un prompt, lo interpreta e restituisce una risposta testuale basata sulle parole, sui loro incorporamenti sintattici e sull’addestramento del modello per produrre risposte estremamente “simili a quelle umane”.

Ciò significherà alcuni grandi aspetti positivi. Innanzitutto, LLM conosce non solo le parole che gli hai inviato, ma anche quali ALTRE parole hanno significati e associazioni simili in base ai suoi incorporamenti di token appresi, quindi sarà in grado di andare oltre le parole esatte utilizzate durante la risposta. Se chiedi “acquisto di una casa” può collegarlo a “immobili” o “mutui” o “prezzi delle case”, più o meno perché i testi su cui è stato addestrato mostravano quelle parole in contesti simili e vicine l’una all’altra.

Inoltre, la risposta sarà probabilmente molto più piacevole da leggere e da consumare per il cliente sul sito web, rendendo esteticamente migliore la sua esperienza con la tua azienda. I risultati di questo modello sono più sfumati e molto, molto più complicati di quelli del tuo chatbot della vecchia scuola.

Tuttavia, dobbiamo ricordare che il LLM non è a conoscenza o non si preoccupa dell’accuratezza o dell’attualità delle informazioni. Ricorda i miei commenti nei post precedenti su cos’è un LLM e come viene formato: non si tratta di apprendere l’accuratezza fattuale, ma solo di produrre testo che è molto simile a ciò che scrivono gli esseri umani e ciò che gli umani amano ricevere. I fatti potrebbero essere accurati, ma ci sono tutte le possibilità che potrebbero non esserlo. Nel primo esempio, invece, hai il controllo completo su tutto ciò che eventualmente viene restituito dal tuo database.

Per un utente medio del tuo sito web, questo potrebbe non sembrare drasticamente diverso sul front-end: la risposta potrebbe essere più piacevole e potrebbe farlo sentire “compreso”, ma non ha idea che le risposte siano a rischio più elevato di imprecisione nella versione LLM. Tecnicamente, se arriviamo al dunque, entrambi stanno automatizzando il processo di risposta alle domande dei clienti, ma solo uno è uno strumento di intelligenza artificiale generativa per farlo.

Nota a margine: non entrerò nella differenza tra AGI (intelligenza artificiale generale) e IA specializzata in questo momento, se non per dire che l’AGI, al momento, non esiste e chiunque ti dica che esiste è sbagliato . Potrei trattare questa domanda in modo più approfondito in un post futuro.

Quindi, continuiamo la nostra conversazione originale. Cosa porta un’azienda a lanciare un po’ di automazione di base o un wrapper per ChatGPT in un comunicato stampa e a chiamarlo il suo nuovo prodotto AI? Chi sta guidando tutto questo e cosa stanno realmente pensando? La mia teoria è che ci sono tre percorsi essenziali che ci portano qui.

  • Voglio PR: Un dirigente vede il ciclo di hype in corso e vuole attirare l’attenzione dei media sulla propria attività, quindi convince i propri team a costruire qualcosa che possano vendere come intelligenza artificiale. (Oppure, rietichettare qualcosa che hanno già come AI.) Potrebbero o meno sapere o preoccuparsi se la cosa è effettivamente AI generativa.
  • Voglio la magia: Un dirigente sente qualcosa nelle notizie o nei media sull’intelligenza artificiale e vuole che la sua azienda ottenga tutti i vantaggi che crede che la concorrenza ottenga dall’intelligenza artificiale. Entrano in ufficio e ordinano ai loro team di costruire qualcosa che fornisca il benefici dell’intelligenza artificiale. Sarei sorpreso se questo dirigente conoscesse davvero la differenza tra l’intelligenza artificiale generativa e un’automazione più semplice.

Naturalmente, nulla di tutto ciò preclude necessariamente l’idea che un buon strumento di intelligenza artificiale generativa possa finire per realizzarsi: ne esistono già molti! Ma quando si parte dal presupposto “Dobbiamo usare questa tecnologia per qualcosa” e non da “Dobbiamo risolvere questo vero problema”, ci stiamo avvicinando al processo di sviluppo nel modo completamente sbagliato.

Ma andiamo, che male c’è in tutto questo? Ha davvero importanza, o è solo foraggio per alcune belle battute tra data scientist sull’ultima folle funzionalità “AI” che alcune aziende hanno lanciato? Direi che è importante (sebbene spesso sia anche materiale per belle battute).

Come data scientist, penso che in realtà dovremmo essere un po’ turbati da questo fenomeno, per un paio di ragioni.

Innanzitutto, questa cultura svaluta i nostri contributi effettivi. La scienza dei dati era il lavoro più sexy in circolazione, o almeno così ci dicevano le copertine di molte riviste, ma fortunatamente ci stiamo sistemando in un posto molto più calmo, più stabile e meno appariscente. I team e i dipartimenti di data science forniscono un valore solido e affidabile alle proprie attività determinando come l’azienda può essere gestita in modo efficiente ed efficace. Decidiamo a chi commercializzare e quando; diciamo alle aziende come organizzare le catene di fornitura e i magazzini; identifichiamo opportunità di produttività attraverso modifiche a sistemi e processi. Invece di dire “abbiamo sempre fatto così”, ora abbiamo il potere di trovare il modo migliore per fare effettivamente le cose, utilizzando i dati, in tutte le nostre aziende. A volte creiamo prodotti o funzionalità completamente nuovi per migliorare ciò che le nostre aziende vendono. È un lavoro incredibilmente prezioso! Vai a guardare il mio articolo su Archetipi del ruolo di data science se non sei convinto

Tutto ciò che facciamo non è meno prezioso o meno importante se non si tratta di intelligenza artificiale generativa. Facciamo un sacco di lavoro di apprendimento automatico che probabilmente non raggiunge il misterioso confine di complessità dell’intelligenza artificiale stessa, ma tutto questo aiuta ancora le persone e ha un impatto.

In secondo luogo, stiamo semplicemente alimentando questo stupido ciclo pubblicitario chiamando tutto AI. Se chiami la tua regressione lineare AI, stai anche sostenendo una corsa al ribasso in termini di cosa significa la frase. La frase morirà di mille tagli se la usiamo per riferirci assolutamente a tutto. Forse va bene, so che sono certamente pronto a non sentire più parlare della frase “intelligenza artificiale” da un momento all’altro. Ma in linea di principio, quelli di noi che lavorano nel campo della scienza dei dati conoscere meglio. Penso che abbiamo almeno una certa responsabilità nell’usare correttamente i termini del nostro mestiere e nel resistere alla pressione di lasciare che i significati si trasformino in poltiglia.

In terzo luogo, e penso che sia forse la cosa più importante, il tempo che dedichiamo a soddisfare le richieste delle persone fuori dal campo costruendo cose per produrre PR sull’intelligenza artificiale toglie tempo al valore reale che potremmo creare. La mia convinzione è che i data scientist dovrebbero creare cose che migliorino la vita delle persone e le aiutino a fare le cose di cui hanno bisogno. Se stiamo costruendo uno strumento, che utilizzi o meno l’intelligenza artificiale, di cui nessuno ha bisogno e che non aiuta nessuno, è una perdita di tempo. Non farlo. I tuoi clienti quasi sicuramente hanno effettivamente bisogno di qualcosa (guarda il tuo arretrato di biglietti!), e dovresti invece farlo tu. Non realizzare progetti solo perché “hai bisogno di qualcosa con l’intelligenza artificiale”, realizza progetti perché soddisfano un bisogno e hanno uno scopo reale.

Quando i dirigenti delle aziende entrano la mattina e decidono “abbiamo bisogno di funzionalità di intelligenza artificiale”, che sia per PR o per Magic, non si basa sulla comprensione strategica di ciò di cui la tua azienda ha effettivamente bisogno o dei problemi che sei effettivamente lì per risolvere per i tuoi clienti . Ora, so che come scienziati dei dati non siamo sempre nella posizione di respingere i mandati esecutivi, anche quando sono un po’ sciocchi, ma mi piacerebbe davvero vedere più aziende fare un passo indietro e pensare se uno strumento di intelligenza artificiale generativa è infatti la giusta soluzione a un problema reale nel loro business. In caso contrario, forse siediti e aspetta finché il problema non si presenta effettivamente. L’intelligenza artificiale generativa non andrà da nessuna parte, sarà lì quando ne avrai davvero bisogno. Nel frattempo, continua a utilizzare tutte le collaudate tecniche di data science e machine learning di cui già disponiamo, ma non fingere che ora siano “AI” per ottenere clic o premere.

Vedi di più del mio lavoro su www.stephaniekirmer.com.

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *