Che cos’è un Data Quality Score
Un Data Quality Score è un unico numero che riassume quanto i dati sono idonei all’uso previsto. Invece di chiedersi «i nostri dati sono buoni?» e ottenere una risposta vaga, un punteggio trasforma la domanda in una sola cifra — di solito una percentuale da 0 a 100 — che è possibile monitorare, confrontare e su cui agire.
Il punteggio viene talvolta chiamato data reliability score. Entrambi i nomi descrivono la stessa cosa: una misura composita che riunisce diversi controlli di qualità sottostanti in un unico numero di riferimento.
Un punteggio di per sé non è l’obiettivo. Il suo valore sta in ciò che consente di fare: stabilire un riferimento di base, individuare il degrado e dimostrare che il lavoro di miglioramento sta dando i suoi frutti.
Perché un unico numero è importante
I controlli di qualità grezzi producono decine di segnali separati — tassi di riempimento, conteggi di duplicati, errori di formato, record obsoleti. Presi singolarmente sono difficili da comunicare e facili da ignorare. Un unico punteggio risolve tre problemi in una volta sola:
| Problema | Come lo risolve un punteggio |
|---|---|
| Nessun linguaggio comune | Un numero che tutti comprendono, dagli analisti ai dirigenti |
| Nessun modo di monitorare i progressi | Una linea di tendenza che mostra se la qualità sta migliorando o peggiorando |
| Nessun modo di stabilire le priorità | Una scomposizione che indica la dimensione o il campo più debole |
Il punteggio è il dato di riferimento. La scomposizione che vi sta dietro è ciò su cui si agisce.
Come si calcola un Data Quality Score
Un Data Quality Score è una media ponderata delle singole dimensioni della qualità. Il calcolo avviene in tre fasi.
Fase 1: misurare ogni dimensione
Ogni dimensione viene misurata come tasso di superamento, ovvero la quota di record o valori che soddisfano una regola definita.
| Dimensione | Cosa misura | Esempio di regola |
|---|---|---|
| Completezza | I dati richiesti sono presenti | I campi obbligatori sono compilati |
| Validità | I dati sono conformi a un formato | Gli indirizzi e-mail corrispondono a un formato valido |
| Unicità | Nessun record duplicato | Un record per cliente |
| Tempestività | I dati sono aggiornati | Record aggiornati entro 90 giorni |
| Coerenza | I valori sono uniformi | Paese memorizzato come «USA», mai «US» |
Per un’analisi più approfondita di ciascuna, consultare Le cinque dimensioni.
Fase 2: applicare i pesi
Non tutte le dimensioni hanno la stessa importanza. Un peso riflette quanto una dimensione è importante per il business, e i pesi sommano al 100%.
| Dimensione | Tasso di superamento | Peso | Contributo |
|---|---|---|---|
| Completezza | 92% | 30% | 27,6 |
| Validità | 88% | 25% | 22,0 |
| Unicità | 99% | 20% | 19,8 |
| Tempestività | 75% | 15% | 11,3 |
| Coerenza | 90% | 10% | 9,0 |
| Totale | 100% | 89,7 |
Fase 3: combinare in un unico punteggio
I contributi vengono sommati nella cifra finale. Nell’esempio precedente, il Data Quality Score è 89,7 su 100.
La formula generale è:
Data Quality Score = Σ (Tasso di superamento della dimensione × Peso della dimensione)
Poiché il punteggio è ponderato, due organizzazioni con gli stessi dati grezzi possono riportare punteggi diversi se assegnano pesi diversi alle dimensioni — e questo è intenzionale. I pesi codificano ciò che significa «buono» per il tuo business.
Livelli di misurazione
Un singolo punteggio a livello di organizzazione è utile per la reportistica, ma il vero lavoro inizia quando è possibile scomporlo.
| Livello | Domanda a cui risponde | Uso |
|---|---|---|
| Organizzazione / dataset | Quanto sono in salute i nostri dati nel complesso? | Reportistica direzionale, monitoraggio delle tendenze |
| Oggetto / tabella | Quale entità sta abbassando il punteggio? | Definizione delle priorità degli interventi correttivi |
| Campo | Esattamente quale colonna è il problema? | Correzioni mirate e regole di validazione |
Un punteggio di 89,7 potrebbe nascondere un singolo campo con il 40% di completezza. Le scomposizioni a livello di campo trasformano un numero vago in un elenco di attività specifiche.
Che cosa si considera un buon punteggio
Non esiste una soglia di superamento universale. L’obiettivo corretto dipende dall’uso che si fa dei dati — lo stesso principio di «idoneità allo scopo» su cui si fonda in generale la qualità dei dati.
| Intervallo di punteggio | Interpretazione | Uso tipico |
|---|---|---|
| 95–100% | Affidabile | Dati rivolti al cliente e regolamentati |
| 85–94% | Attendibile | Dati operativi generali |
| 70–84% | Richiede attenzione | Dati interni o secondari |
| Inferiore al 70% | Non affidabile | Intervenire prima di farvi affidamento |
Imposta la soglia in base al costo dell’errore. Un campo che alimenta la fatturazione o la conformità richiede un’asticella più alta rispetto a uno utilizzato per ricerche interne occasionali.
Monitorare il punteggio nel tempo
Un punteggio misurato una sola volta è un’istantanea. Misurato ripetutamente, diventa una tendenza — ed è nella tendenza che sta il valore.
- I punteggi puntuali rispondono a «qual è la nostra situazione oggi?»
- I punteggi continui rispondono a «stiamo migliorando o peggiorando?»
I dati del CRM e quelli operativi si degradano di continuo a causa dell’inserimento manuale, delle integrazioni e del semplice trascorrere del tempo, perciò un punteggio che sembrava buono lo scorso trimestre può peggiorare silenziosamente. La rimisurazione pianificata individua il degrado precocemente, prima che raggiunga un report o un modello di AI.
Data Quality Score in Salesforce
All’interno di Salesforce si applica lo stesso modello: le dimensioni vengono misurate su oggetti come Account, Contatti e Lead, ponderate e riunite in un unico punteggio che è possibile monitorare su una dashboard.
DQS (Data Quality Score) misura tutto questo in modo nativo — senza esportazione di dati — sulle cinque dimensioni, e aggiunge il rilevamento PII per la prontezza AI. Per scoprire come il punteggio viene costruito e interpretato all’interno di un CRM, prosegui con:
- Come misurare la qualità dei dati in Salesforce — il punteggio applicato a un’organizzazione Salesforce, chiamato anche data reliability score
- Dashboard della qualità dei dati di Salesforce — le metriche che vale la pena monitorare insieme al numero di riferimento
- Qualità dei dati in Salesforce — il quadro più ampio
Domande frequenti
Che cos’è un Data Quality Score?
Un Data Quality Score è un unico numero, di solito espresso come percentuale da 0 a 100, che riassume quanto i dati sono idonei all’uso previsto. Si calcola come media ponderata delle singole dimensioni della qualità, come completezza, validità, unicità, tempestività e coerenza.
Come si calcola un Data Quality Score?
Ogni dimensione della qualità viene misurata come tasso di superamento, ovvero la quota di record o valori che soddisfano una regola definita. I punteggi delle dimensioni vengono poi combinati in una media ponderata, in cui il peso di ciascuna dimensione riflette quanto è importante per il business. Il risultato è un’unica percentuale compresa tra 0 e 100.
Che cos’è un buon Data Quality Score?
Non esiste una soglia di superamento universale, perché l’obiettivo corretto dipende dall’uso che si fa dei dati. Come regola generale, il 95% o più è atteso per i dati rivolti al cliente e quelli regolamentati, l’85% o più è accettabile per i dati operativi generali e qualsiasi valore inferiore al 70% segnala dati che necessitano di interventi correttivi prima di poter essere considerati affidabili.
Un Data Quality Score è la stessa cosa di un data reliability score?
Sì. I termini sono usati in modo intercambiabile. Entrambi descrivono un unico numero composito che esprime quanto è affidabile un dataset, combinando diverse dimensioni della qualità sottostanti in un’unica cifra che è possibile monitorare nel tempo.
Passaggi successivi
- Misuralo nel tuo CRM: Come misurare la qualità dei dati in Salesforce
- Comprendi gli input: Le cinque dimensioni
- Parti dalle fondamenta: Che cos’è la qualità dei dati?
- Confronta i tuoi dati: effettua la Valutazione della prontezza AI per ottenere i tuoi punteggi in 3 minuti