Come tutti sappiamo, gran parte del lavoro di un data scientist consiste nel pulire e preelaborare i dati. Gran parte di questo comporta il rilevamento e la rimozione dei valori anomali. Valori anomali di grandi dimensioni, picchi e dati errati possono davvero interferire con l'addestramento di un modello di machine learning accurato, quindi è importante che i valori anomali vengano gestiti correttamente.
Fonte: towardsdatascience.com