Skip to main content

Che cos'è un Data Quality Score?

Un Data Quality Score trasforma lo stato di salute dei dati in un unico numero. Scopri come si calcola, che cosa si considera un buon punteggio e come monitorarlo nel tempo.

Che cos’è un Data Quality Score

Un Data Quality Score è un unico numero che riassume quanto i dati sono idonei all’uso previsto. Invece di chiedersi «i nostri dati sono buoni?» e ottenere una risposta vaga, un punteggio trasforma la domanda in una sola cifra — di solito una percentuale da 0 a 100 — che è possibile monitorare, confrontare e su cui agire.

Il punteggio viene talvolta chiamato data reliability score. Entrambi i nomi descrivono la stessa cosa: una misura composita che riunisce diversi controlli di qualità sottostanti in un unico numero di riferimento.

Un punteggio di per sé non è l’obiettivo. Il suo valore sta in ciò che consente di fare: stabilire un riferimento di base, individuare il degrado e dimostrare che il lavoro di miglioramento sta dando i suoi frutti.

Perché un unico numero è importante

I controlli di qualità grezzi producono decine di segnali separati — tassi di riempimento, conteggi di duplicati, errori di formato, record obsoleti. Presi singolarmente sono difficili da comunicare e facili da ignorare. Un unico punteggio risolve tre problemi in una volta sola:

ProblemaCome lo risolve un punteggio
Nessun linguaggio comuneUn numero che tutti comprendono, dagli analisti ai dirigenti
Nessun modo di monitorare i progressiUna linea di tendenza che mostra se la qualità sta migliorando o peggiorando
Nessun modo di stabilire le prioritàUna scomposizione che indica la dimensione o il campo più debole

Il punteggio è il dato di riferimento. La scomposizione che vi sta dietro è ciò su cui si agisce.

Come si calcola un Data Quality Score

Un Data Quality Score è una media ponderata delle singole dimensioni della qualità. Il calcolo avviene in tre fasi.

Fase 1: misurare ogni dimensione

Ogni dimensione viene misurata come tasso di superamento, ovvero la quota di record o valori che soddisfano una regola definita.

DimensioneCosa misuraEsempio di regola
CompletezzaI dati richiesti sono presentiI campi obbligatori sono compilati
ValiditàI dati sono conformi a un formatoGli indirizzi e-mail corrispondono a un formato valido
UnicitàNessun record duplicatoUn record per cliente
TempestivitàI dati sono aggiornatiRecord aggiornati entro 90 giorni
CoerenzaI valori sono uniformiPaese memorizzato come «USA», mai «US»

Per un’analisi più approfondita di ciascuna, consultare Le cinque dimensioni.

Fase 2: applicare i pesi

Non tutte le dimensioni hanno la stessa importanza. Un peso riflette quanto una dimensione è importante per il business, e i pesi sommano al 100%.

DimensioneTasso di superamentoPesoContributo
Completezza92%30%27,6
Validità88%25%22,0
Unicità99%20%19,8
Tempestività75%15%11,3
Coerenza90%10%9,0
Totale100%89,7

Fase 3: combinare in un unico punteggio

I contributi vengono sommati nella cifra finale. Nell’esempio precedente, il Data Quality Score è 89,7 su 100.

La formula generale è:

Data Quality Score = Σ (Tasso di superamento della dimensione × Peso della dimensione)

Poiché il punteggio è ponderato, due organizzazioni con gli stessi dati grezzi possono riportare punteggi diversi se assegnano pesi diversi alle dimensioni — e questo è intenzionale. I pesi codificano ciò che significa «buono» per il tuo business.

Livelli di misurazione

Un singolo punteggio a livello di organizzazione è utile per la reportistica, ma il vero lavoro inizia quando è possibile scomporlo.

LivelloDomanda a cui rispondeUso
Organizzazione / datasetQuanto sono in salute i nostri dati nel complesso?Reportistica direzionale, monitoraggio delle tendenze
Oggetto / tabellaQuale entità sta abbassando il punteggio?Definizione delle priorità degli interventi correttivi
CampoEsattamente quale colonna è il problema?Correzioni mirate e regole di validazione

Un punteggio di 89,7 potrebbe nascondere un singolo campo con il 40% di completezza. Le scomposizioni a livello di campo trasformano un numero vago in un elenco di attività specifiche.

Che cosa si considera un buon punteggio

Non esiste una soglia di superamento universale. L’obiettivo corretto dipende dall’uso che si fa dei dati — lo stesso principio di «idoneità allo scopo» su cui si fonda in generale la qualità dei dati.

Intervallo di punteggioInterpretazioneUso tipico
95–100%AffidabileDati rivolti al cliente e regolamentati
85–94%AttendibileDati operativi generali
70–84%Richiede attenzioneDati interni o secondari
Inferiore al 70%Non affidabileIntervenire prima di farvi affidamento

Imposta la soglia in base al costo dell’errore. Un campo che alimenta la fatturazione o la conformità richiede un’asticella più alta rispetto a uno utilizzato per ricerche interne occasionali.

Monitorare il punteggio nel tempo

Un punteggio misurato una sola volta è un’istantanea. Misurato ripetutamente, diventa una tendenza — ed è nella tendenza che sta il valore.

  • I punteggi puntuali rispondono a «qual è la nostra situazione oggi?»
  • I punteggi continui rispondono a «stiamo migliorando o peggiorando?»

I dati del CRM e quelli operativi si degradano di continuo a causa dell’inserimento manuale, delle integrazioni e del semplice trascorrere del tempo, perciò un punteggio che sembrava buono lo scorso trimestre può peggiorare silenziosamente. La rimisurazione pianificata individua il degrado precocemente, prima che raggiunga un report o un modello di AI.

Data Quality Score in Salesforce

All’interno di Salesforce si applica lo stesso modello: le dimensioni vengono misurate su oggetti come Account, Contatti e Lead, ponderate e riunite in un unico punteggio che è possibile monitorare su una dashboard.

DQS (Data Quality Score) misura tutto questo in modo nativo — senza esportazione di dati — sulle cinque dimensioni, e aggiunge il rilevamento PII per la prontezza AI. Per scoprire come il punteggio viene costruito e interpretato all’interno di un CRM, prosegui con:

Domande frequenti

Che cos’è un Data Quality Score?

Un Data Quality Score è un unico numero, di solito espresso come percentuale da 0 a 100, che riassume quanto i dati sono idonei all’uso previsto. Si calcola come media ponderata delle singole dimensioni della qualità, come completezza, validità, unicità, tempestività e coerenza.

Come si calcola un Data Quality Score?

Ogni dimensione della qualità viene misurata come tasso di superamento, ovvero la quota di record o valori che soddisfano una regola definita. I punteggi delle dimensioni vengono poi combinati in una media ponderata, in cui il peso di ciascuna dimensione riflette quanto è importante per il business. Il risultato è un’unica percentuale compresa tra 0 e 100.

Che cos’è un buon Data Quality Score?

Non esiste una soglia di superamento universale, perché l’obiettivo corretto dipende dall’uso che si fa dei dati. Come regola generale, il 95% o più è atteso per i dati rivolti al cliente e quelli regolamentati, l’85% o più è accettabile per i dati operativi generali e qualsiasi valore inferiore al 70% segnala dati che necessitano di interventi correttivi prima di poter essere considerati affidabili.

Un Data Quality Score è la stessa cosa di un data reliability score?

Sì. I termini sono usati in modo intercambiabile. Entrambi descrivono un unico numero composito che esprime quanto è affidabile un dataset, combinando diverse dimensioni della qualità sottostanti in un’unica cifra che è possibile monitorare nel tempo.

Passaggi successivi