Moirai: modelli di base delle serie temporali per la previsione universale

 | Intelligenza-Artificiale

Il futuro dell'analisi predittiva: esplora Moirai, il nuovo modello base di Salesforce per la previsione avanzata delle serie temporali

Questo post è stato scritto in collaborazione con Rafael Guedes.

Lo sviluppo dei modelli di base delle serie temporali ha subito un'accelerazione negli ultimi due trimestri e quasi ogni mese abbiamo assistito al rilascio di un nuovo modello. È iniziato con TimeGPT (1) nell'ultimo trimestre del 2023 e da allora abbiamo visto il rilascio di Lag-Llama (2), Google il rilascio di TimesFM (3), Amazon il rilascio di Chronos (4) e Salesforce il rilascio di Moirai (5). ).

Per comprendere il crescente interesse per i modelli di fondazione, dovremmo definire la loro capacità principale: inferenza zero-shot. Si riferisce alla capacità di eseguire compiti con precisione o fare previsioni su dati che questi modelli non hanno mai incontrato durante la fase di addestramento. Questa capacità è stata esplorata per modelli applicati in vari domini, come l'elaborazione del linguaggio naturale (PNL), la visione artificiale e attività multimodali (combinazione di testo, immagini, ecc.). Il termine “zero-shot” deriva dall’idea che il modello vede “zero” esempi da un compito specifico o da un dominio di dati durante l’addestramento ma può “sparare” o mirare a eseguire compiti in quell’area in modo efficace. Il termine è stato introdotto nel documento “Zero-Shot Learning with Semantic Output Codes”, scritto da Hinton et al. e presentato alla conferenza NIPS nel 2009. Da allora, è emerso come uno dei temi di ricerca più importanti e si sta ora facendo strada nel campo dell’analisi delle serie temporali.

In questo articolo esploriamo Moirai, un nuovo modello di base di Salesforce per la previsione delle serie temporali. Si basa sulla nostra serie di articoli sui modelli di base per la previsione delle serie temporali, in cui abbiamo fornito spiegazioni dettagliate e mostrato le prestazioni di modelli come TimeGPT e Chronos su set di dati reali.

Forniamo una spiegazione approfondita dell'architettura dietro Moirai e dei componenti principali che consentono al modello di eseguire un'inferenza zero-shot. Riassumiamo anche le differenze tra il Moirai e gli altri due modelli di fondazione che abbiamo studiato finora. Confrontiamo, ad esempio, la dimensione dei dati di addestramento, il numero di parametri del modello e se consentono la previsione multivariata.

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *