Migliorare le prestazioni di analisi dei dati con le funzioni di valutazione/query di Python e Numexpr di Panda
Questo articolo ti introdurrà alla libreria Python Espr.numuno strumento che aumenta le prestazioni computazionali di Numpy Arrays
. IL eval
E query
Anche i metodi di Pandas si basano su questa libreria.
Questo articolo include anche un progetto pratico di analisi dei dati meteorologici.
Leggendo questo articolo capirai i principi di Numexpr e come utilizzare questo potente strumento per velocizzare i tuoi calcoli nella realtà.
Richiamo di array Numpy
In un precedente articolo si discute Numpy Arrays
Ho usato un esempio di libreria per spiegare perché Numpy’s Cache Locality è così efficiente:
Ogni volta che vai in biblioteca per cercare materiali, prendi alcuni libri relativi al contenuto e li metti accanto alla tua scrivania.
In questo modo, puoi controllare rapidamente i materiali correlati senza dover correre allo scaffale ogni volta che devi leggere un libro.
Questo metodo fa risparmiare molto tempo, soprattutto quando è necessario consultare molti libri correlati.
In questo scenario, lo scaffale è come la tua memoria, la scrivania equivale alla cache L1 della CPU e tu, il lettore, sei il nucleo della CPU.
I limiti di Numpy
Supponiamo che tu abbia la sfortuna di incontrare un professore esigente che vuole che tu tiri fuori le opere di Shakespeare e Tolstoj per un confronto incrociato.
A questo punto, prelevare in anticipo i libri correlati non funzionerà bene.
Fonte: towardsdatascience.com