Crea una trama a schede perforate con Seaborn |  di Lee Vaughan |  Settembre 2023

 | Intelligenza-Artificiale

Identificare rapidamente le tendenze cicliche

Un orologio meccanico accanto a una serie di cartellini.
Un timbracartellino con cartellini (immagine di Hennie Stander su UnSplash)

UN trama a schede perforatechiamato anche a grafico a bolle della tabella, è un tipo di visualizzazione per evidenziare le tendenze cicliche nei dati. Visualizza i dati in modo rigido matrice O griglia formato, solitamente composto dai giorni della settimana rispetto alle ore del giorno. I cerchi rappresentano i punti dati alle intersezioni delle righe e delle colonne e la loro dimensione trasmette il valore dei dati. Il colore può essere utilizzato per includere informazioni aggiuntive.

Un diagramma a bolle di una tabella (immagine dell’autore)

Il nome “punchcard” è un’allusione ai vecchi “timecard” che i lavoratori timbravano o “perforavano” in una macchina per registrare i loro andirivieni.

Per costruire una trama di schede perforate, è necessario timestamp dati. In questo Scienza dei dati di successo rapido progetto, utilizzeremo un set di dati Kaggle per tenere traccia degli orari in cui le biciclette vengono noleggiate a Washington, DC

Il Kaggle Set di dati sul bike sharing a Washington DC contiene il conteggio orario e giornaliero delle bici noleggiate nel 2011 e 2012 nel Sistema di bike sharing capitale a Washington, DC (1). Questi dati vengono rilasciati sotto a Licenza CC0 1.0. Per dettagli sui contenuti del set di dati, visitare il leggimi file.

Per comodità, ho già scaricato questi dati a un pubblico Il succo.

Oltre a Python, avrai bisogno della libreria di analisi dei dati Pandas e della libreria di grafici Seaborn. Puoi installarli con:

conda install pandas seaborn

O

pip install pandas seaborn

Il seguente codice commentato è stato scritto in JupyterLab ed è descritto da cell.

Importazione di librerie e caricamento dei dati

Dopo aver importato matplotlib e seaborn per il plottaggio e pandas per l’analisi dei dati, leggeremo il file CSV dei dati di noleggio in un DataFrame pandas, mantenendo solo le colonne per la stagione dell’anno, il giorno della settimana, l’ora e il conteggio (numero degli affitti).

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *