
Scegliere una specializzazione universitaria è stato difficile per me. Sembrava il primo passo verso l’impegno in una carriera e volevo un po’ di tutto. Mi piacevano la matematica e la programmazione, ma volevo anche un lavoro che mi permettesse di essere creativo, mi fornisse una piattaforma per la comunicazione e fosse abbastanza versatile da esplorare diversi settori. Dopo alcune ricerche, il programma di scienza dei dati presso l'Halıcıoğlu Data Science Institute (HDSI) dell'UC San Diego sembrava una buona soluzione. Nonostante la mia decisione di intraprendere questa strada, avevo ancora dei dubbi e le ipotesi che avevo fatto all’inizio riflettevano questo scetticismo. Tuttavia, mentre lavoro nei miei ultimi trimestri, sono felice (e sorpreso!) di come la realtà della mia esperienza si sia discostata da quelle aspettative.
Aspettativa n. 1: la scienza dei dati richiederà molte lezioni ripetitive di matematica e programmazione.
La realtà: sebbene la matematica e la programmazione siano pilastri, in realtà c'è molta varietà nelle lezioni.
Guardando indietro, le mie lezioni sono state molto più variegate di quanto mi aspettassi. Le lezioni di programmazione e matematica sono la maggioranza, ma ogni corso offre una prospettiva diversa su argomenti fondamentali fornendoci una miriade di strumenti. C'è anche una diversità significativamente maggiore nel campo, che va dalle lezioni sulle definizioni di equità statistica alla bioinformatica. Ho anche trovato nicchie che mi sono piaciute particolarmente nell'assistenza sanitaria, nell'etica dei dati e nella privacy. Ciò mi ha aiutato ad ampliare le mie prospettive sui ruoli e sui settori in cui avrei potuto entrare fin dall'inizio come data scientist.
Aspettativa n. 2: lavorerei da solo per la maggior parte del tempo.
La realtà: lavoro molto con gli altri e mi sento migliore per questo.
Mi piace lavorare con le persone. Le idee vengono generate più velocemente. Mi sento più creativo ed è semplicemente più divertente! Tuttavia, inizialmente ho ceduto allo stereotipo e mi sono immaginato mentre facevo i compiti di scienza dei dati curvo su un laptop per gran parte della mia giornata, quindi sono rimasto sorpreso da quanto lavoro di gruppo ci fosse. Quasi tutte le mie lezioni di programmazione e matematica ci incoraggiano a lavorare con almeno un'altra persona. Incontrare e lavorare con persone che non conoscevo mi ha spinto fuori dalla mia zona di comfort e ha affinato le mie capacità di lavoro di squadra e di comunicazione. Anche in contesti professionali, quando il mio lavoro era indipendente, ho scoperto che lavorare con altri stagisti mi ha reso un data scientist migliore. Sebbene ognuno di noi avesse competenze fondamentali simili, appoggiarsi l'uno all'altro per utilizzare i nostri diversi punti di forza e aree di interesse ci ha permesso di essere migliori nel loro insieme.
Aspettativa n. 3: la scienza dei dati è la stessa cosa del machine learning.
La realtà: l'apprendimento automatico è solo una parte del ciclo di vita del progetto di scienza dei dati.
Ad essere onesti, non sapevo molto della scienza dei dati o di come fosse definito l'apprendimento automatico (ML) quando ho iniziato il mio viaggio. Tuttavia, entrando nel programma HDSI, pensavo che la scienza dei dati fosse sinonimo di ML. Immaginavo che la maggior parte delle mie lezioni e del mio lavoro avrebbero riguardato la creazione di modelli predittivi e l'approfondimento delle reti neurali. Invece, la maggior parte dei corsi e del lavoro nella scienza dei dati si concentra sulla pulizia dei dati, sulla scadenza dei dati e sulla visualizzazione, con l'analisi ML che richiede meno tempo di quanto ti aspetteresti alla fine… almeno per ora.
Aspettativa n. 4: il mio ruolo potrebbe essere automatizzato.
La realtà: alcune responsabilità possono essere automatizzate, ma la creatività dei data scientist come risolutori di problemi non può farlo.
Questa preoccupazione è nata durante il mio primo corso di elaborazione del linguaggio naturale in cui il mio professore ha mostrato quanto velocemente GPT-3 potesse scrivere codice. Era scoraggiante come scienziato dei dati entry-level: come avrei potuto competere con modelli in grado di scrivere correttamente query SQL più velocemente di quanto potessi leggerle? Tuttavia, questo esercizio aveva lo scopo di illustrare che il nostro ruolo di tecnici non consisteva semplicemente nell'imparare a utilizzare gli strumenti e comprendere i processi inerenti che consentono loro di funzionare. I modelli linguistici di grandi dimensioni non riescono ancora a svolgere correttamente i compiti, ma alla fine (e inevitabilmente) miglioreranno e, quando lo faranno, sono ottimista sul fatto che saranno più un aiuto piuttosto che un danno per i data scientist. A differenza dei data scientist, gli LLM non risolvono problemi. Non sono in grado di generare idee originali, usare la creatività per affrontare problemi ambigui o comunicare in modo efficace con pubblici diversi. Ciò potrebbe cambiare in futuro, ma attraverso la mia formazione e le mie esperienze professionali, sono fiducioso di poter ancora avere un impatto positivo sul campo.
L'asporto
Nell'ambito del mio percorso nella scienza dei dati, ho imparato ad abbracciare l'inaspettato che deriva dalla realtà. Ho imparato che l'ampiezza e la profondità della scienza dei dati erano ideali per fare un po' di tutto: ricercare, programmare, analizzare e raccontare storie. Detto questo, sono fiducioso nella mia decisione di dedicarmi alla scienza dei dati e sono entusiasta di vedere cosa porterà la prossima fase della mia carriera.
Fonte: towardsdatascience.com