Come i modelli apprendono nuove informazioni nel tempo, mantenendo e sviluppando la conoscenza precedente

Bentornati alla serie Illustrated Machine Learning. Se leggi l’altro articoli della serieconosci il trapano. Prendiamo un (suono noioso) concetto di machine learning e rendilo divertente illustrandolo! Questo articolo tratterà un concetto chiamato Apprendimento incrementaledove i modelli di machine learning apprendono nuove informazioni nel tempo, mantenendo e sviluppando la conoscenza precedente. Ma prima di approfondire l’argomento, parliamo di come si presenta oggi il processo di costruzione del modello.

Di solito seguiamo un processo chiamato apprendimento statico quando si costruiscono modelli. In questo processo, addestriamo un modello utilizzando gli ultimi dati disponibili. Modifichiamo e ottimizziamo il modello nel processo di formazione. E una volta che siamo soddisfatti delle sue prestazioni, lo implementiamo. Questo modello è in produzione da un po’. Quindi notiamo che le prestazioni del modello peggiorano nel tempo. È allora che buttiamo via il modello esistente e ne costruiamo uno nuovo utilizzando gli ultimi dati disponibili. E sciacquiamo e ripetiamo lo stesso processo.

Illustriamolo utilizzando un esempio concreto. Consideriamo questo ipotetico scenario. Abbiamo iniziato a creare un modello antifrode alla fine di gennaio 2023. Questo modello rileva se una transazione con carta di credito è fraudolenta o meno. Addestriamo il nostro modello utilizzando tutti i dati sulle transazioni con carta di credito di cui disponevamo nell’ultimo anno (da gennaio 2022 a dicembre 2022) e utilizziamo i dati sulle transazioni di questo mese (gennaio 2023) per testare il modello.

Alla fine del mese prossimo noteremo che il modello non si comporta molto bene rispetto ai nuovi dati. Quindi abbiamo creato un altro modello, ma questa volta utilizzando i dati dell’ultimo anno (da febbraio 2022 a gennaio 2023) per addestrarlo e quindi utilizzando i dati del mese corrente (febbraio 2023) per testarlo. E tutti i dati al di fuori di questi periodi di formazione e test vengono eliminati.

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *