In qualità di scienziato dei dati con un background in ingegneria del software che si occupa di vari tipi di sviluppo, mi sono spesso ritrovato a ricoprire più ruoli e, a volte, a essere il ponte tra ingegneri e scienziati dei dati.
Mentirei per negare qualsiasi attrito tra i due.
In questo post del blog approfondirò i miei sentimenti contrastanti come data scientist e contro i data scientist. Alla fine, dovresti portare via:
- 5 Realizzazioni sulla Data Science,
- 15 lezioni su come organizzare un team di Data Science ben funzionante e
- Un po’ del mio umorismo secco.
Realizzazione 1: la scienza dei dati è tutta incentrata sull’ipotesi
Le grandi aziende tecnologiche e i video per arricchirsi velocemente con la scienza dei dati su YouTube hanno dipinto un quadro roseo della scienza dei dati. Ma prendi questo:
La scienza dei dati è molto più che modellare o manipolare iperparametri e architetture di modelli.
Ricordi il metodo scientifico che abbiamo imparato al liceo? Questo è ciò che la scienza rappresenta nella Data Science.
I data scientist esaminano un set di dati e il problema aziendale e redigono piani di esperimento per raggiungere l’obiettivo. Molti di noi potrebbero cadere nell’errore di applicare tutti i tipi di modelli per trovarne uno appropriato. Non solo non è elegante e inefficiente, ma quando troviamo un modello con parametri prestazionali decenti, ci affanniamo per scoprire perché il modello ha funzionato.
Se ciò non sembra troppo grave, pensa a questo: come spieghi l’impennata del prezzo del Bitcoin a oltre 50.000 nel febbraio 2024? Il numero avrebbe potuto essere perfettamente dotato di un supporto e di un livello di resistenza. Le due linee tracciate arbitrariamente sono ora il fattore trainante dietro il movimento di Bitcoin? Oppure esiste una psicologia di mercato inspiegabile che abbiamo ignorato perché non siamo partiti da un…
Fonte: towardsdatascience.com