Avere dtype appropriati per la tua serie e DataFrame è molto importante per molte ragioni:
- Gestione della memoria: utilizzando il dtype corretto per un particolare serie può ridurre drasticamente l’utilizzo della memoria e, per estensione, questo vale anche per frame di dati
- Interpretazione: chiunque altro (umano o computer) farà ipotesi sui tuoi dati in base al loro dtype: se una colonna piena di numeri interi viene archiviata come una stringa, la tratteranno come stringhe, non come numeri interi
- Ti impone di avere dati puliticome gestire valori mancanti o valori registrati erroneamente. Ciò faciliterà molto l’elaborazione dei dati lungo la strada
E probabilmente ci sono molte altre ragioni, puoi citarne alcune? Se è così, scrivetelo in un commento.
In questo primo post della mia serie sui panda, voglio rivedere le basi dei tipi di dati dei panda, o dtype.
Esamineremo innanzitutto i dtype disponibili panda offerte, mi concentrerò su 4 dtype utili che soddisferanno il 95% delle tue esigenze, vale a dire dtype numerici, dtype booleani, dtype stringa e dtype categorici.
L’obiettivo finale di questo primo post è farti sentire più a tuo agio con i vari tipi di dati disponibili in Panda e quali sono le loro differenze.
Se sei interessato ai panda e alle serie temporali, assicurati di dare un’occhiata alla mia trasformata di Fourier per i post sulle serie temporali:
- Rivedi la relazione tra la convoluzione e la trasformata di Fourier e la sua velocità:
- Approfondisci la tua comprensione della convoluzione utilizzando esempi di immagini:
- Comprendere come la trasformata di Fourier può essere visiva…
Fonte: towardsdatascience.com