Che cos'è un Data Quality Score? Definizione e formula

Che cos’è un Data Quality Score

Un Data Quality Score è un unico numero che riassume quanto i dati sono idonei all’uso previsto. Invece di chiedersi «i nostri dati sono buoni?» e ottenere una risposta vaga, un punteggio trasforma la domanda in una sola cifra — di solito una percentuale da 0 a 100 — che è possibile monitorare, confrontare e su cui agire.

Il punteggio viene talvolta chiamato data reliability score. Entrambi i nomi descrivono la stessa cosa: una misura composita che riunisce diversi controlli di qualità sottostanti in un unico numero di riferimento.

Un punteggio di per sé non è l’obiettivo. Il suo valore sta in ciò che consente di fare: stabilire un riferimento di base, individuare il degrado e dimostrare che il lavoro di miglioramento sta dando i suoi frutti.

Perché un unico numero è importante

I controlli di qualità grezzi producono decine di segnali separati — tassi di riempimento, conteggi di duplicati, errori di formato, record obsoleti. Presi singolarmente sono difficili da comunicare e facili da ignorare. Un unico punteggio risolve tre problemi in una volta sola:

Problema	Come lo risolve un punteggio
Nessun linguaggio comune	Un numero che tutti comprendono, dagli analisti ai dirigenti
Nessun modo di monitorare i progressi	Una linea di tendenza che mostra se la qualità sta migliorando o peggiorando
Nessun modo di stabilire le priorità	Una scomposizione che indica la dimensione o il campo più debole

Il punteggio è il dato di riferimento. La scomposizione che vi sta dietro è ciò su cui si agisce.

Come si calcola un Data Quality Score

Un Data Quality Score è una media ponderata delle singole dimensioni della qualità. Il calcolo avviene in tre fasi.

Fase 1: misurare ogni dimensione

Ogni dimensione viene misurata come tasso di superamento, ovvero la quota di record o valori che soddisfano una regola definita.

Dimensione	Cosa misura	Esempio di regola
Completezza	I dati richiesti sono presenti	I campi obbligatori sono compilati
Validità	I dati sono conformi a un formato	Gli indirizzi e-mail corrispondono a un formato valido
Unicità	Nessun record duplicato	Un record per cliente
Tempestività	I dati sono aggiornati	Record aggiornati entro 90 giorni
Coerenza	I valori sono uniformi	Paese memorizzato come «USA», mai «US»

Per un’analisi più approfondita di ciascuna, consultare Le cinque dimensioni.

Fase 2: applicare i pesi

Non tutte le dimensioni hanno la stessa importanza. Un peso riflette quanto una dimensione è importante per il business, e i pesi sommano al 100%.

Dimensione	Tasso di superamento	Peso	Contributo
Completezza	92%	30%	27,6
Validità	88%	25%	22,0
Unicità	99%	20%	19,8
Tempestività	75%	15%	11,3
Coerenza	90%	10%	9,0
Totale		100%	89,7

Fase 3: combinare in un unico punteggio

I contributi vengono sommati nella cifra finale. Nell’esempio precedente, il Data Quality Score è 89,7 su 100.

La formula generale è:

Data Quality Score = Σ (Tasso di superamento della dimensione × Peso della dimensione)

Poiché il punteggio è ponderato, due organizzazioni con gli stessi dati grezzi possono riportare punteggi diversi se assegnano pesi diversi alle dimensioni — e questo è intenzionale. I pesi codificano ciò che significa «buono» per il tuo business.

Livelli di misurazione

Un singolo punteggio a livello di organizzazione è utile per la reportistica, ma il vero lavoro inizia quando è possibile scomporlo.

Livello	Domanda a cui risponde	Uso
Organizzazione / dataset	Quanto sono in salute i nostri dati nel complesso?	Reportistica direzionale, monitoraggio delle tendenze
Oggetto / tabella	Quale entità sta abbassando il punteggio?	Definizione delle priorità degli interventi correttivi
Campo	Esattamente quale colonna è il problema?	Correzioni mirate e regole di validazione

Un punteggio di 89,7 potrebbe nascondere un singolo campo con il 40% di completezza. Le scomposizioni a livello di campo trasformano un numero vago in un elenco di attività specifiche.

Che cosa si considera un buon punteggio

Non esiste una soglia di superamento universale. L’obiettivo corretto dipende dall’uso che si fa dei dati — lo stesso principio di «idoneità allo scopo» su cui si fonda in generale la qualità dei dati.

Intervallo di punteggio	Interpretazione	Uso tipico
95–100%	Affidabile	Dati rivolti al cliente e regolamentati
85–94%	Attendibile	Dati operativi generali
70–84%	Richiede attenzione	Dati interni o secondari
Inferiore al 70%	Non affidabile	Intervenire prima di farvi affidamento

Imposta la soglia in base al costo dell’errore. Un campo che alimenta la fatturazione o la conformità richiede un’asticella più alta rispetto a uno utilizzato per ricerche interne occasionali.

Monitorare il punteggio nel tempo

Un punteggio misurato una sola volta è un’istantanea. Misurato ripetutamente, diventa una tendenza — ed è nella tendenza che sta il valore.

I punteggi puntuali rispondono a «qual è la nostra situazione oggi?»
I punteggi continui rispondono a «stiamo migliorando o peggiorando?»

I dati del CRM e quelli operativi si degradano di continuo a causa dell’inserimento manuale, delle integrazioni e del semplice trascorrere del tempo, perciò un punteggio che sembrava buono lo scorso trimestre può peggiorare silenziosamente. La rimisurazione pianificata individua il degrado precocemente, prima che raggiunga un report o un modello di AI.

Data Quality Score in Salesforce

All’interno di Salesforce si applica lo stesso modello: le dimensioni vengono misurate su oggetti come Account, Contatti e Lead, ponderate e riunite in un unico punteggio che è possibile monitorare su una dashboard.

DQS (Data Quality Score) misura tutto questo in modo nativo — senza esportazione di dati — sulle cinque dimensioni, e aggiunge il rilevamento PII per la prontezza AI. Per scoprire come il punteggio viene costruito e interpretato all’interno di un CRM, prosegui con:

Come misurare la qualità dei dati in Salesforce — il punteggio applicato a un’organizzazione Salesforce, chiamato anche data reliability score
Dashboard della qualità dei dati di Salesforce — le metriche che vale la pena monitorare insieme al numero di riferimento
Qualità dei dati in Salesforce — il quadro più ampio

Domande frequenti

Che cos’è un Data Quality Score?

Un Data Quality Score è un unico numero, di solito espresso come percentuale da 0 a 100, che riassume quanto i dati sono idonei all’uso previsto. Si calcola come media ponderata delle singole dimensioni della qualità, come completezza, validità, unicità, tempestività e coerenza.

Come si calcola un Data Quality Score?

Ogni dimensione della qualità viene misurata come tasso di superamento, ovvero la quota di record o valori che soddisfano una regola definita. I punteggi delle dimensioni vengono poi combinati in una media ponderata, in cui il peso di ciascuna dimensione riflette quanto è importante per il business. Il risultato è un’unica percentuale compresa tra 0 e 100.

Che cos’è un buon Data Quality Score?

Non esiste una soglia di superamento universale, perché l’obiettivo corretto dipende dall’uso che si fa dei dati. Come regola generale, il 95% o più è atteso per i dati rivolti al cliente e quelli regolamentati, l’85% o più è accettabile per i dati operativi generali e qualsiasi valore inferiore al 70% segnala dati che necessitano di interventi correttivi prima di poter essere considerati affidabili.

Un Data Quality Score è la stessa cosa di un data reliability score?

Sì. I termini sono usati in modo intercambiabile. Entrambi descrivono un unico numero composito che esprime quanto è affidabile un dataset, combinando diverse dimensioni della qualità sottostanti in un’unica cifra che è possibile monitorare nel tempo.

Passaggi successivi

Misuralo nel tuo CRM: Come misurare la qualità dei dati in Salesforce
Comprendi gli input: Le cinque dimensioni
Parti dalle fondamenta: Che cos’è la qualità dei dati?
Confronta i tuoi dati: effettua la Valutazione della prontezza AI per ottenere i tuoi punteggi in 3 minuti