Approfondimenti derivanti dall'incorporazione di dati meteorologici esterni in una regressione di serie temporali ispirata al Profeta di Meta
Quando mi sono trasferito per la prima volta nel Regno Unito, sono rimasto sbalordito nel vedere quante persone parlavano del tempo. Venendo dalle regioni subtropicali¹, il tempo di oggi era più o meno lo stesso di ieri: assolutamente splendido. E domani ci sarebbe più o meno la stessa cosa.
Ora, che ci piaccia o no (gioco di parole), l’effetto delle condizioni ambientali si ripercuote su tutto ciò che potremmo essere interessati a prevedere: quanto gelato dovrebbe immagazzinare un negozio prima di un fine settimana soleggiato, il consumo di energia domestica durante un’ondata di freddo , la disponibilità di parcheggio in spiaggia. L'elenco potrebbe continuare.
E sebbene sia importante, il tempo è notoriamente difficile da prevedere con precisione: basta chiedere all'app meteo del mio telefono. Non lasceremo che questo intralci le cose oggi, poiché daremo prima un'occhiata a come incorporare le informazioni meteorologiche in un modello può migliorare le prestazioni, prima di provare a produrre futuro previsioni meteorologiche in modo semplice e non così semplice.
Ci baseremo sulle discussioni precedenti sulla regressione delle serie temporali e, come sempre, utilizzeremo dati del mondo reale.
Continueremo nella tana del coniglio della previsione degli incidenti stradali nel Regno Unito, utilizzando il nostro quadro di serie temporali su misura per incorporare i dati meteorologici in un modello di regressione delle serie temporali.
Il modello stesso è stato ispirato dal funzionamento del modello Prophet di Meta. Sebbene questo approccio sia efficace nel catturare la tendenza sottostante, la stagionalità e gli effetti delle festività, le prestazioni del modello possono spesso essere migliorate incorporando informazioni aggiuntive.
Un aspetto importante – e spesso trascurato – è che i dati esterni integrati in un modello devono essere disponibili nel momento della previsione. Ciò va bene in molti contesti: ad esempio, non c'è motivo di aspettarsi che il punteggio di credito di un richiedente non sia disponibile per una banca che sta valutando una richiesta di mutuo.
Ci saranno però casi in cui i dati esterni sono completamente sconosciuti: il meteo ne è un buon esempio. Ciò non significa…
Fonte: towardsdatascience.com