In che modo gli LLM democratizzeranno l'analisi esplorativa dei dati | di Ken Kehoe | Giugno 2024 | Intelligenza-Artificiale

Oppure, quando senti che la tua vita è troppo dura, vai a parlare con Claude

Quando penso alle sfide legate alla comprensione dei sistemi complessi, spesso ripenso a qualcosa che è accaduto durante la mia permanenza presso Tripadvisor. Stavo aiutando il nostro team di Machine Learning a condurre un'analisi per il team di Growth Marketing per capire quali comportamenti dei clienti fossero predittivi di un LTV elevato. Abbiamo lavorato con un talentuoso Ph.D. Data Scientist che ha addestrato un modello di regressione logistica e stampato i coefficienti come primo passaggio.

Quando abbiamo esaminato l'analisi con il team Crescita, erano confusi: i coefficienti di regressione logistica sono difficili da interpretare perché la loro scala non è lineare e le caratteristiche che risultano essere più predittive non erano cose che il team Crescita potesse facilmente influenzare . Ci siamo tutti accarezzati il mento per un minuto e abbiamo aperto un ticket per alcune analisi successive, ma come spesso accade, entrambe le squadre sono passate rapidamente alla loro brillante idea successiva. Il Data Scientist aveva del lavoro ad alta priorità da svolgere sul nostro algoritmo di classificazione delle ricerche e, per tutti gli scopi pratici, il team Growth ha gettato l'analisi nel mucchio della spazzatura.

Penso ancora a quell'esercizio: ci siamo arresi troppo presto? E se il circolo vizioso fosse stato più stretto? E se entrambe le parti avessero continuato a scavare? Cosa avrebbe rivelato il secondo o il terzo passaggio?

L'aneddoto sopra descrive un analisi esplorativa non è andata proprio bene. L’analisi esplorativa è distinta da analisi descrittivache mira semplicemente a descrivere ciò che sta accadendo. L’analisi esplorativa cerca di acquisire una maggiore comprensione di un sistema, piuttosto che di una domanda ben definita. Considera i seguenti tipi di domande che potresti incontrare in un contesto aziendale:

Notare come le domande esplorative sono a risposta aperta e mirano a migliorare la comprensione di uno spazio problematico complesso. L'analisi esplorativa spesso richiede più cicli e una collaborazione più stretta tra l'”esperto del dominio” e la persona che conduce effettivamente l'analisi, che raramente sono la stessa persona. Nell'aneddoto riportato sopra, la partnership non era abbastanza stretta, i cicli di feedback non erano abbastanza brevi e non abbiamo dedicato abbastanza cicli.

Queste sfide sono il motivo per cui molti esperti sostengono un approccio di “analisi abbinata” per l’esplorazione dei dati. Simile alla programmazione abbinata, analisi accoppiata riunisce un analista e un decisore per condurre un'esplorazione in tempo reale. Sfortunatamente, questo tipo di stretta collaborazione tra analista e decisore si verifica raramente nella pratica a causa dei limiti di risorse e di tempo.

Ora pensa all’organizzazione in cui lavori: e se ogni decisore avesse un analista esperto da affiancare? E se avessero la totale attenzione dell'analista e potessero tempestarlo di domande di follow-up a piacimento? E se quegli analisti fossero in grado di cambiare facilmente contesto, seguendo il flusso di coscienza del loro partner in una libera associazione di idee e ipotesi?

Questa è l'opportunità che i LLM presentano nello spazio di analisi: la promessa che chiunque può condurre analisi esplorative con il vantaggio di un analista tecnico al proprio fianco.

Diamo un'occhiata a come ciò potrebbe manifestarsi nella pratica. Il caso di studio e le demo seguenti illustrano come un decisore con esperienza nel settore potrebbe accoppiarsi efficacemente con un analista di intelligenza artificiale in grado di interrogare e visualizzare i dati. Confronteremo le esperienze di esplorazione dei dati del modello 4o di ChatGPT con un'analisi manuale utilizzando Tableau, che servirà anche come controllo degli errori contro potenziali allucinazioni.

Una nota sulla privacy dei dati: Le demo video collegate nella sezione seguente utilizzano set di dati puramente sintetici, intesi a imitare modelli aziendali realistici. Per consultare le note generali sulla privacy e sulla sicurezza per gli analisti AI, vedere Privacy dei dati.