Chatta con il tuo set di dati utilizzando le inferenze bayesiane.  |  di Erdogan Taskesen |  Novembre 2023

 | Intelligenza-Artificiale

La possibilità di porre domande al tuo set di dati è sempre stata una prospettiva intrigante. Rimarrai sorpreso da quanto sia facile apprendere un modello bayesiano locale che può essere utilizzato per interrogare il tuo set di dati.

fotografato da Vadim Bogulov SU Unsplash

Con l’avvento di modelli simili a chatGPT, è diventato accessibile a un pubblico più ampio analizzare il proprio set di dati e, per così dire, “fare domande”. Sebbene questo sia ottimo, un approccio di questo tipo presenta anche degli svantaggi quando viene utilizzato come passaggio analitico in pipeline automatizzate. Ciò è particolarmente vero quando i risultati dei modelli possono avere un impatto significativo. Per mantenere il controllo e garantire che i risultati siano accurati, possiamo anche utilizzare le inferenze bayesiane per comunicare con il nostro set di dati. In questo blog, esamineremo i passaggi su come apprendere un modello bayesiano e applicare il calcolo sul set di dati sugli stipendi della scienza dei dati. Dimostrerò come creare un modello che ti consenta di “porre domande” al tuo set di dati e mantenere il controllo. Rimarrai sorpreso dalla facilità di creare un modello del genere utilizzando il file libreria bnlearn.

Estrarre informazioni preziose dai set di dati è una sfida continua per data scientist e analisti. I modelli simili a ChatGPT hanno reso più semplice l’analisi interattiva dei set di dati ma, allo stesso tempo, può diventare meno trasparente e persino sconosciuto il motivo per cui vengono effettuate le scelte. Affidarsi a tali approcci a scatola nera è tutt’altro che ideale nelle pipeline analitiche automatizzate. La creazione di modelli trasparenti è particolarmente importante quando il risultato di un modello ha un impatto sulle azioni intraprese.

La capacità di comunicare in modo efficace con i set di dati è sempre stata una prospettiva interessante sia per i ricercatori che per i professionisti.

Nelle prossime sezioni presenterò innanzitutto il libreria bnlearn (1) su come apprendere le reti causali. Quindi dimostrerò come apprendere le reti causali utilizzando un set di dati misto e come applicare il calcolo per interrogare in modo efficace il set di dati. Vediamo come l’inferenza bayesiana può aiutarci a interagire con i nostri set di dati!

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *