UN trama a schede perforatechiamato anche a grafico a bolle della tabella, è un tipo di visualizzazione per evidenziare le tendenze cicliche nei dati. Visualizza i dati in modo rigido matrice O griglia formato, solitamente composto dai giorni della settimana rispetto alle ore del giorno. I cerchi rappresentano i punti dati alle intersezioni delle righe e delle colonne e la loro dimensione trasmette il valore dei dati. Il colore può essere utilizzato per includere informazioni aggiuntive.
Il nome “punchcard” è un’allusione ai vecchi “timecard” che i lavoratori timbravano o “perforavano” in una macchina per registrare i loro andirivieni.
Per costruire una trama di schede perforate, è necessario timestamp dati. In questo Scienza dei dati di successo rapido progetto, utilizzeremo un set di dati Kaggle per tenere traccia degli orari in cui le biciclette vengono noleggiate a Washington, DC
Il Kaggle Set di dati sul bike sharing a Washington DC contiene il conteggio orario e giornaliero delle bici noleggiate nel 2011 e 2012 nel Sistema di bike sharing capitale a Washington, DC (1). Questi dati vengono rilasciati sotto a Licenza CC0 1.0. Per dettagli sui contenuti del set di dati, visitare il leggimi file.
Per comodità, ho già scaricato questi dati a un pubblico Il succo.
Oltre a Python, avrai bisogno della libreria di analisi dei dati Pandas e della libreria di grafici Seaborn. Puoi installarli con:
conda install pandas seaborn
O
pip install pandas seaborn
Il seguente codice commentato è stato scritto in JupyterLab ed è descritto da cell.
Importazione di librerie e caricamento dei dati
Dopo aver importato matplotlib e seaborn per il plottaggio e pandas per l’analisi dei dati, leggeremo il file CSV dei dati di noleggio in un DataFrame pandas, mantenendo solo le colonne per la stagione dell’anno, il giorno della settimana, l’ora e il conteggio (numero degli affitti).
Fonte: towardsdatascience.com