Geospatial Data Science è una sottoarea dell’area Dati che si occupa dell’analisi dei punti dati prendendo in considerazione dove nello spazio è accaduto quell’evento.
Diciamo che possediamo una catena di negozi al dettaglio che vende smartphone. La nostra catena ha alcuni centri di distribuzione e stiamo per aprire un paio di nuovi negozi. Dove possiamo farlo?
Tale intuizione potrebbe provenire da un’analisi geospaziale che ci mostrerebbe dove sono concentrate le vendite, se ci sono cluster in cui le vendite sono più alte o più basse e altri approfondimenti.
L’analisi del pattern di punti entra in questo gioco quando vogliamo essere sicuri di guardare un set di dati raggruppati geograficamente. Proprio come gran parte del nostro lavoro di Data Scientist, lo schema a punti consiste nel creare un’ipotesi e rimuovere gran parte dell’incertezza per confermarla o meno utilizzando le statistiche applicate ai dati. In questo caso, non è diverso. Ci sono un paio di test statistici da fare, quelli che verranno mostrati in questo post.
A proposito, ultimamente abbiamo studiato scienza dei dati geospaziali qui nel mio blog. Se non sai molto dell’argomento, ecco due buone letture prima di immergerti in questo post.
Pacchetti
Iniziamo con i pacchetti da utilizzare in questo esercizio. Se qualcuno di essi non è installato nel tuo ambiente, non dimenticare di utilizzarlo pip install
O conda install
(per utenti Anaconda) seguito dal nome del pacchetto.
import pandas as pd
import numpy as np
import geopandas as gpd
import seaborn as sns
import…
Fonte: towardsdatascience.com