Ho mosso i miei primi passi nella modellistica matematica circa 9 anni fa, quando ero ancora uno studente. Dopo aver terminato la mia laurea in matematica, che era molto ricca di teoria, per gli studi magistrali ho scelto alcuni corsi che riguardavano la modellazione matematica e l'ottimizzazione di questioni economiche. Il mio argomento preferito a quel tempo erano le serie temporali. È stato relativamente rilassato avere una panoramica dei diversi approcci di modellazione. Metodi collaudati erano in vigore da oltre un decennio e non erano cambiati rapidamente.
Condizioni simili esistevano fino a qualche anno fa quando si entrava nel mondo della scienza dei dati. Le tecniche e i modelli fondamentali erano relativamente veloci da apprendere. Nell'implementazione, molto è stato risolto da zerole proprie reti sono state codificate e funzionate. Nuovi strumenti e tecnologie sono stati accolti e provati.
Oggi la sensazione è diversa. Ora, quando si dà un'occhiata ai feed X o LinkedIn, si ricevono quasi settimanalmente notizie su strumenti e sviluppi importanti.
Da quando l'hype sugli LLM con il rilascio di ChatGPT nel novembre 2022, è diventato estremo. La gara è aperta tra open source e closed source. Google ha seguito con Gemini, Meta ha lanciato LLama e la Stanford University ha introdotto Alpaca. Le applicazioni vengono rese operative utilizzando strumenti come Langchain e sta emergendo un’intera gamma di strumenti per la standardizzazione delle applicazioni. I meccanismi di ottimizzazione vengono continuamente migliorati. E poi c'è stato anche il rilascio di xgboost 2.
La ruota sembra girare a una velocità sempre maggiore. Negli ultimi anni, ciò è in gran parte dovuto alle scoperte metodologiche in GenAI e al toolbox in continua crescita nell’area MLOps.
Ed è importante seguire: cosa sta succedendo nel mercato? Soprattutto quando lavori in questo settore come consulente. I nostri clienti vogliono sapere: quali sono le novità più interessanti? Come possiamo utilizzarlo con profitto?
Oggi è essenziale mantenere la palla in movimento! Coloro che non lo faranno perderanno il contatto molto velocemente.
È così?
L'ultima volta che ho partecipato a una grande conferenza, sono rimasto sveglio per due notti, riuscendo a malapena a dormire. Non era solo dovuto al nervosismo prima di un discorso, ma anche all'enorme quantità di informazioni che mi venivano lanciate in così poco tempo.
Le conferenze sono fantastiche. Mi piace incontrare nuove persone, conoscere approcci diversi e scambiare idee e problemi che potrebbero essere completamente nuovi per me. Eppure, quelle notti non riuscivo a dormire. IL Dovrò verificarlo più tardi in modo più approfondito-list sembra impossibile da affrontare. La FOMO (paura di perdersi qualcosa) entra in gioco. I pensieri si presentano come “non è già troppo tardi per saltare sul treno per GenAI?” In quel momento, ho trascurato il fatto che anch'io facevo parte del pregiudizio. La mia presentazione riguardava un caso d'uso che abbiamo implementato con un cliente. Due anni di lavoro compressi in trenta minuti. Il pubblico ha portato con sé impulsi preziosi e spunti di riflessione come previsto? Oppure il contributo ha causato subdolamente anche la FOMO?
Un altro fenomeno che continua a ripresentarsi è la sindrome dell’impostore (1). Descrive l'emergere di forti dubbi sulle proprie capacità, insieme alla paura di essere smascherati come un “frode”. Le persone che soffrono della sindrome dell'impostore spesso si sentono come se non fossero capaci o qualificate per le posizioni o le mansioni richieste. compiti che ricoprono. Ciò può avvenire anche attraverso il confronto con gli altri, portando ad una momentanea percezione di sé: “In realtà non posso fare niente di buono.â€
Da scambi onesti con persone del mio ambiente di lavoro, so che questo accade di tanto in tanto per molti. Ho parlato con persone a cui attribuirei un altissimo livello di esperienza e competenza. Quasi tutti conoscevano questa sensazione.
Anche la variabilità delle tecnologie e il rapido progresso nel campo dell’intelligenza artificiale possono innescare questo fenomeno.
Qual è l’elemento centrale della scienza dei dati? Si tratta di un sistema funzionante che crea valore aggiunto. Se non sei un ricercatore ma uno scienziato dei dati nel mondo degli affari, l'attenzione è rivolta all'applicazione. Un modello o un'euristica apprende una logica che un essere umano non può apprendere in modo così dettagliato e/o applicare su tale scala. Non deve essere una soluzione end-to-end completamente automatizzata.
Si dovrebbe iniziare con lo sviluppo di un sistema che lavori ed è accettato da parte degli stakeholder. Una volta stabilita la fiducia nel sistema, si può vedere cosa può essere ulteriormente migliorato.
È la metodologia? Forse è in uso un algoritmo che potrebbe essere sostituito da un'architettura di deep learning in grado di rappresentare più correlazioni nelle variabili.
È il tempo di esecuzione? È possibile ridurre il tempo di esecuzione con altri framework o con l'aiuto della parallelizzazione? Allora il percorso è chiaro per affrontare questo argomento.
Forse è anche l’acquisizione e la gestione sistematica della qualità dei dati. Gli strumenti di convalida dei dati possono aiutare a rilevare tempestivamente gli squilibri dei dati, identificare le derive e monitorare l’output di un sistema ML.
È valido avvicinarsi con cautela alle nuove tecniche passo dopo passo e migliorare continuamente un sistema esistente.
A dire il vero, ci vuole tempo per apprendere nuovi metodi e tecnologie. Ci sono molte opzioni per una rapida panoramica: riassunti tl;dr, repository di panoramica, canali YouTube ecc. Tuttavia, dimentico anche rapidamente gli argomenti se non ci dedico più tempo. Pertanto, per familiarizzare con un argomento o una tecnologia specifica, non ho altra scelta che riservarmi di tanto in tanto una serata o un sabato per approfondirlo.
Il fatto che l'acquisizione della conoscenza personale richieda tempo rivela anche direttamente i limiti che ognuno ha.
Un altro aspetto è quello non può forzare l’esperienza. La capacità di adottare nuove tecnologie aumenta anche con la quantità di esperienza già acquisita. Lo stesso vale per la capacità di valutare tecnologie e strumenti. Quanto maggiore è il proprio bagaglio di esperienze, tanto più facile diventa. Ma ciò richiede prima di sviluppare una comprensione più profonda delle altre tecnologie, che può essere raggiunta solo attraverso l’esperienza pratica.
Non aver paura di fare domande. Provare le cose a un livello superiore non è sbagliato. Ma a volte vale anche la pena cercare attivamente esperienze. Forse c'è già qualcuno nella tua azienda o nella tua rete che ha già lavorato con la tecnologia xy? Perché non andare a un pranzo a tema comune? Il prerequisito fondamentale per questo: trovarsi in un ambiente in cui è possibile porre domande (!).
Inoltre, rimani impegnato. Come descritto sopra: il modo migliore per conservare le cose è farle. Tuttavia, ciò non significa che non valga la pena tenere d'occhio sistematicamente a destra e a manca e tenersi informati sulle notizie che non rientrano nell'ambito (attuale) di lavoro. Ci sono molte ottime newsletter là fuori. Uno molto buono lo è Il lotto da DeepLearning.AI (2).
Lavoro in un team di sei data scientist. Anche in questo caso valgono le stesse osservazioni menzionate in precedenza: anche all'interno di questo gruppo relativamente piccolo si può essere soggetti alla sindrome dell'impostore. Dopotutto, c'è sempre qualcuno che ha più esperienza o almeno ha acquisito una certa esperienza in un particolare argomento, metodologia o strumento.
Nel nostro team ci incontriamo ogni due settimane per una Comunità di Pratica. Abbiamo stabilito due politiche:
1. Partiamo sempre da un livello elevato per garantire che tutti i membri siano coinvolti e non diamo per scontato che tutti siano già approfonditi sull'argomento. Possiamo quindi approfondire.
2. È altamente incoraggiato esplorare collettivamente un argomento in cui nessuno ha ancora sviluppato una vasta esperienza.
Nell'ultima sessione, abbiamo affrontato il tema della messa a punto degli LLM rispetto all'apprendimento e alla guida in poche fasi. Abbiamo esplorato e sperimentato insieme vari metodi di messa a punto. Ancora più importante, abbiamo ottenuto una serie di preziose informazioni sulle questioni aziendali, determinando quali meccanismi potrebbero essere più efficaci. Abbiamo lasciato l'incontro con molte buone idee e ulteriori compiti di ricerca. Questo è molto più prezioso della conoscenza approfondita di ogni dettaglio.
Fonte: towardsdatascience.com