Un’esplorazione approfondita di TiDE, la sua implementazione utilizzando Darts e un confronto di casi d’uso nella vita reale con DeepAR (un’architettura Transformer)

Poiché i settori continuano ad evolversi, l’importanza di previsioni accurate diventa una risorsa non negoziabile, sia che si lavori nel commercio elettronico, nella sanità, nella vendita al dettaglio o anche nell’agricoltura. L’importanza di essere in grado di prevedere ciò che verrà dopo e pianificare di conseguenza per superare le sfide future è ciò che può farti superare la concorrenza e prosperare in un’economia in cui i margini sono ristretti e i clienti sono più esigenti che mai.

Le architetture dei trasformatori sono state l’argomento caldo nel campo dell’intelligenza artificiale negli ultimi anni, soprattutto grazie al loro successo nell’elaborazione del linguaggio naturale (NLP), essendo uno dei casi d’uso di maggior successo, il chatGPT che ha attirato l’attenzione di tutti, indipendentemente dagli appassionati di intelligenza artificiale. o no. Ma la PNL non è l’unico argomento in cui i Transformers hanno dimostrato di superare le soluzioni all’avanguardia, sia nella Computer Vision che con Stable Diffusion e le sue varianti.

Ma i Transformer possono sovraperformare i modelli all’avanguardia nelle serie temporali? Sebbene siano stati fatti molti sforzi per sviluppare Transformers per la previsione di serie temporali, sembra che per orizzonti a lungo termine, semplici modelli lineari possano sovraperformare diversi approcci basati su Transformer.

In questo articolo esploro TiDE, un semplice modello di deep learning in grado di battere le architetture Transformer nelle previsioni a lungo termine. Fornisco anche un’implementazione passo passo di TiDE per prevedere le vendite settimanali in un set di dati di Walmart utilizzando Darts, una libreria di previsione per Python. Infine, confronto le prestazioni di TiDE e DeepAR in un caso d’uso reale della mia azienda.

Figura 1: TiDE, un nuovo modello di previsione che è MLP “imbarazzantemente” semplice per battere Transformers (fonte)

Come sempre, il codice è disponibile su Github.

TiDE è un nuovo modello di codificatore-decodificatore di serie temporali che ha dimostrato di sovraperformare i modelli Transformer all’avanguardia nelle previsioni con orizzonte temporale a lungo termine (1). È un modello di serie temporali multivariato in grado di utilizzare covariate statiche (ad esempio marca di un prodotto) e covariate dinamiche (ad esempio prezzo di un prodotto) che possono essere…

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *