La fase di raccolta prevede l’acquisizione dei dati necessari per eseguire un’analisi significativa basata su informazioni accurate.
Tecniche
Requisiti dei dati
Definire quali dati sono necessari per affrontare adeguatamente il progetto (ad esempio formato, variabili, intervallo temporale, granularità)
Origine dei dati
Trovare fonti di dati affidabili e pertinenti (ad esempio database, API, file, letture di sensori)
Autenticazione
Proteggi le autorizzazioni necessarie per accedere ai dati (ad esempio email/password, OAuth, chiave API, robots.txt)
Collezione
Acquisire i dati utilizzando metodi appropriati (es. query SQL, chiamate API, web scraping, immissione manuale dei dati)
Gestione dati
Gestire i dati in conformità con le migliori pratiche (ad esempio qualità dei dati, governance dei dati, sicurezza dei dati)
Fonte: towardsdatascience.com