Comprendere la qualità dei dati e perché i team hanno difficoltà a gestirla |  di Elliott Stam |  Marzo 2024

 | Intelligenza-Artificiale

Qualità dei dati: il termine generico per indicare logica aziendale, affidabilità, validità e coerenza

L'elefante nella stanza. (Fotografato da Per ordine di Alberico SU Unsplash)

Le conversazioni sulla qualità dei dati possono essere difficili, soprattutto quando l’elefante nella stanza è un prodotto con prestazioni inferiori.

Le situazioni in cui si svolgono queste discussioni includono tipicamente stakeholder delusi, product manager frustrati e ingegneri incompresi.

Frasi familiari potrebbero rimbalzare sui muri, tra cui:

  • “correggere i dati”
  • “discrepanza”
  • “convalida dei dati”
  • “Fiducia”
  • “qualità dei dati”

Ma c’è una forza all’opera che impedisce agli individui di arrivare ad un’intesa comune. Le parole vengono dette, ma per qualche motivo non arrivano. Leggendo tra le righe di ciò che dice ogni persona, è chiaro che sono in gioco molteplici definizioni di “qualità dei dati”.

Il significato e l'implicazione dietro le parole sono diversi per ogni persona. La validità dell'esperienza e della prospettiva collettiva del team è compromessa dal fatto che continuano a parlarsi l'uno dell'altro. Il tempo continua a ticchettare e alla fine i due escono dalla conversazione senza una soluzione chiara.

Questa è una vera seccatura ed è un tema comune nei prodotti dati.

L’espressione “qualità dei dati” è ampiamente utilizzata e può significare cose diverse per persone diverse. Cominciamo con una definizione soggettiva di questo termine dal punto di vista dei tre archetipi introdotti sopra: stakeholder, product manager e ingegneri.

Parti interessate: supponiamo che si tratti di persone meno tecniche che interagiscono con prodotti di dati (come dashboard) nelle loro operazioni quotidiane. Per loro, una buona qualità dei dati significa che le informazioni riflettono accuratamente i processi del mondo reale con cui interagiscono. Quando vedono una dashboard, il loro primo pensiero è scaricare/esportare i dati in un foglio di calcolo in modo da poter riconciliare i numeri con altre quantità note di cui si fidano.

Responsabili di prodotto: la preoccupazione principale qui è che i numeri in product x abbina i numeri in product y e raccontare una storia coerente. Se i numeri corrispondono tra…

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *