Al giorno d'oggi è facile utilizzare diversi modelli linguistici di grandi dimensioni (LLM) tramite l'interfaccia web o l'API pubblica. Ma possiamo integrare perfettamente LLM nel processo di analisi dei dati e utilizzare il modello direttamente da Python o Jupyter Notebook? In effetti, possiamo, e in questo articolo mostrerò tre diversi modi per farlo. Come al solito, tutti i componenti utilizzati nell'articolo sono disponibili gratuitamente.
Entriamo nel vivo!
1. IA dei panda
La prima libreria Python che testerò è IA dei panda. Ci consente di porre domande sul nostro dataframe Panda in linguaggio naturale. Come esempio giocattolo, ho creato un piccolo dataframe con tutti i paesi dell'UE e le loro popolazioni:
import pandas as pddf = pd.DataFrame({
"Country": ('Austria', 'Belgium', 'Bulgaria', 'Croatia', 'Cyprus', 'Czech Republic', 'Denmark', 'Estonia', 'Finland',
'France', 'Germany', 'Greece', 'Hungary', 'Iceland', 'Ireland', 'Italy', 'Latvia', 'Liechtenstein', 'Lithuania',
'Luxembourg', 'Malta', 'Monaco', 'Montenegro', 'Netherlands', 'Norway', 'Poland', 'Portugal', 'Romania', 'Serbia',
'Slovakia', 'Slovenia', 'Spain', 'Sweden', 'Switzerland'),
"Population": (8_205000, 10_403000…
Fonte: towardsdatascience.com