
Scopri come valutare correttamente le prestazioni dei modelli di serie temporali attraverso il backtesting
La valutazione dei modelli di serie temporali non è un compito semplice. È abbastanza facile, infatti, commettere errori gravi nella valutazione dei modelli previsionali. Anche se questi errori potrebbero non violare il codice o impedirci di ottenere alcuni numeri di output, possono influire in modo significativo sull’accuratezza di tali stime delle prestazioni.
In questo articolo, dimostreremo come valutare correttamente i modelli di serie temporali.
Il modo più semplice per valutare le prestazioni di un modello di machine learning è dividere il set di dati in due sottoinsiemi: set di training e set di test. Per migliorare ulteriormente la robustezza della nostra stima delle prestazioni, potremmo voler dividere il nostro set di dati più volte. Questa procedura è chiamata convalida incrociata.
Il diagramma seguente rappresenta uno dei tipi più popolari di convalida incrociata: l’approccio k-fold. Nel caso della validazione 5 volte, dividiamo prima il set di dati in 5 blocchi. Quindi, addestriamo il modello utilizzando 4 di questi blocchi e valutiamo le sue prestazioni sul quinto blocco. Questo processo viene ripetuto altre 4 volte, ogni volta porgendo un pezzo diverso per la valutazione.
Fonte: towardsdatascience.com