Vl’isualizzazione dei dati è un passaggio che viene trascurato dai data scientist. Ci aiuta a raccontare storie analizzando e curando i dati in una forma facile da comprendere. Rimuovendo tutti i dettagli tecnici e il rumore ed evidenziando le informazioni chiave, i data scientist possono spiegare l’importanza del loro lavoro a manager e dirigenti non tecnici.
Esistono molti strumenti per aiutare a visualizzare i dati. Per anni Microsoft Excel ha dominato il mercato della visualizzazione statica. Nel corso del tempo, ci siamo orientati verso visualizzazioni dinamiche e flessibilità per mostrare più dati in modo più pulito. Due tipi di strumenti hanno contribuito a creare immagini dinamiche.
- Software di business intelligence e analisi: Tabella, PowerBI
- Librerie di programmazione open source: D3.js, Plotly Dash
Gli strumenti software di terze parti come Tableau e PowerBI sono eccellenti per le persone non tecniche. Le interfacce e le astrazioni drag-and-drop consentono agli analisti di creare facilmente dashboard dinamici. Gli svantaggi sono
- gli strumenti software sono costosi
- un po’ di una curva di apprendimento per apprendere questi strumenti
- limiti alla progettazione della visualizzazione; il software potrebbe non consentire alcuni componenti
Le librerie di programmazione open source sono eccellenti per i tecnici. Chi ha dimestichezza con l’ingegneria del software può seguire la documentazione per creare con facilità visualizzazioni dinamiche flessibili. Inoltre, questi pacchetti sono gratuiti (con Plotly che offre una versione a pagamento per i suoi componenti Dash aziendali).
Le differenze tra D3.js e Plotly sono le seguenti
- D3.js è progettato in JavaScript, Plotly è progettato in Python
- D3.js è in circolazione da più tempo di Plotly e quindi ha un migliore supporto da parte della comunità e un ecosistema più maturo (esempi ed tutorial estesi).
- D3.js richiede che gli ingegneri comprendano i dettagli di basso livello dello sviluppo web (HTML, CSS, JavaScript) per poterlo utilizzare in modo efficace. Plotly astrae tali dettagli in classi Python semplici da usare.
- D3.js ha una curva di apprendimento ripida a causa della sua natura JavaScript…
Fonte: towardsdatascience.com