In questo articolo esploro i sistemi di trasporto pubblico di quattro città selezionate basandomi sulla General Transit Feed Specifiche e su vari strumenti di scienza dei dati spaziali.
Ho scelto quattro città in questo taccuino, Budapest, Berlino, Stoccolma e Toronto, per tracciare una panoramica del loro sistema di trasporto pubblico utilizzando i dati GTFS (General Transit FeedSpecification) disponibili al pubblico. Questo notebook ha lo scopo di fungere da tutorial introduttivo sull’accesso, la manipolazione, l’aggregazione e la visualizzazione dei dati sul trasporto pubblico utilizzando Panda, GeoPanda e altri strumenti standard di scienza dei dati per ricavare informazioni dettagliate sul trasporto pubblico. Successivamente, tale comprensione può essere utile in vari casi d’uso, come i trasporti, la pianificazione urbana e l’intelligence sulla posizione.
Inoltre, anche se il formato GTFS dovrebbe essere generale e universale, indicherò anche le situazioni che richiedono ancora approfondimenti individuali a livello di città e convalide manuali durante le seguenti fasi analitiche.
Per questo articolo ho scaricato i dati sul trasporto pubblico da Transitfeeds.com, un sito Web aggregatore online di dati sul trasporto pubblico. In particolare ho scaricato i dati con i seguenti orari di ultimo aggiornamento per le seguenti città:
Nei seguenti blocchi di codice esplorerò ciascuna di queste città più volte, creerò grafici comparativi e sottolineerò l’universalità del formato GTFS. Inoltre, per garantire che le mie analisi siano facili da aggiornare con i dump di dati più recenti, memorizzo i dati GTFS di ciascuna città in una cartella corrispondente alla data di aggiornamento:
import osroot = 'data'
cities = ('Budapest', 'Toronto', 'Berlin', 'Stockholm')
updated = {city : (f for f in os.listdir(root + '/' + city) if '20' in f)(0) for city in cities}
updated
L’output di questa cella:
Ora diamo uno sguardo più da vicino ai diversi file archiviati in queste cartelle:
for city in cities…
Fonte: towardsdatascience.com