Wat een datakwaliteitsscore is
Een datakwaliteitsscore is één enkel getal dat samenvat hoe geschikt uw data is voor het beoogde gebruik. In plaats van de vraag „is onze data goed?” te stellen en een vaag antwoord te krijgen, vertaalt een score de vraag naar één cijfer — doorgaans een percentage van 0 tot 100 — dat u kunt volgen, vergelijken en waarop u kunt handelen.
De score wordt soms een databetrouwbaarheidsscore genoemd. Beide namen beschrijven hetzelfde: een samengestelde maatstaf die verschillende onderliggende kwaliteitscontroles samenbrengt tot één kerngetal.
Een score op zich is niet het doel. De waarde ligt in wat het u mogelijk maakt: een basislijn vaststellen, letten op degradatie en aantonen dat verbeterwerk loont.
Waarom één enkel getal ertoe doet
Onbewerkte kwaliteitscontroles produceren tientallen afzonderlijke signalen — vulpercentages, duplicaataantallen, indelingsfouten, verouderde records. Op zichzelf zijn ze moeilijk te communiceren en gemakkelijk te negeren. Eén enkele score lost drie problemen tegelijk op:
| Probleem | Hoe een score het oplost |
|---|---|
| Geen gemeenschappelijke taal | Eén getal dat iedereen begrijpt, van analisten tot bestuurders |
| Geen manier om voortgang te volgen | Een trendlijn die laat zien of de kwaliteit verbetert of achteruitgaat |
| Geen manier om te prioriteren | Een uitsplitsing die wijst op de zwakste dimensie of het zwakste veld |
De score is het kerngetal. De uitsplitsing erachter is waarop u handelt.
Hoe een datakwaliteitsscore wordt berekend
Een datakwaliteitsscore is een gewogen gemiddelde van afzonderlijke kwaliteitsdimensies. De berekening verloopt in drie stappen.
Stap 1: Meet elke dimensie
Elke dimensie wordt gemeten als een slagingspercentage — het aandeel records of waarden dat aan een gedefinieerde regel voldoet.
| Dimensie | Wat het meet | Voorbeeldregel |
|---|---|---|
| Volledigheid | Vereiste data is aanwezig | Verplichte velden zijn gevuld |
| Geldigheid | Data voldoet aan een indeling | E-mailadressen komen overeen met een geldig patroon |
| Uniciteit | Geen dubbele records | Één record per klant |
| Tijdigheid | Data is actueel | Records bijgewerkt binnen 90 dagen |
| Consistentie | Waarden zijn uniform | Land opgeslagen als „USA”, nooit „US” |
Voor een diepere blik op elke dimensie, zie De vijf dimensies.
Stap 2: Pas gewichten toe
Niet elke dimensie weegt even zwaar. Een gewicht weerspiegelt hoe belangrijk een dimensie is voor de business, en de gewichten tellen op tot 100%.
| Dimensie | Slagingspercentage | Gewicht | Bijdrage |
|---|---|---|---|
| Volledigheid | 92% | 30% | 27,6 |
| Geldigheid | 88% | 25% | 22,0 |
| Uniciteit | 99% | 20% | 19,8 |
| Tijdigheid | 75% | 15% | 11,3 |
| Consistentie | 90% | 10% | 9,0 |
| Totaal | 100% | 89,7 |
Stap 3: Combineer tot één score
De bijdragen worden opgeteld tot het eindcijfer. In het bovenstaande voorbeeld is de datakwaliteitsscore 89,7 van de 100.
De algemene formule luidt:
Datakwaliteitsscore = Σ (Slagingspercentage dimensie × Gewicht dimensie)
Omdat de score gewogen is, kunnen twee organisaties met dezelfde onbewerkte data verschillende scores rapporteren als ze de dimensies anders wegen — en dat is met opzet. De gewichten coderen wat „goed” betekent voor uw business.
Meetniveaus
Eén enkele organisatiebrede score is nuttig voor rapportage, maar het echte werk gebeurt wanneer u het kunt uitsplitsen.
| Niveau | Vraag die het beantwoordt | Gebruik |
|---|---|---|
| Organisatie / dataset | Hoe gezond is onze data in het algemeen? | Bestuursrapportage, trendvolging |
| Object / tabel | Welke entiteit drukt de score omlaag? | Prioriteren van herstel |
| Veld | Precies welke kolom is het probleem? | Gerichte oplossingen en validatieregels |
Een score van 89,7 kan een enkel veld met 40% volledigheid verbergen. Uitsplitsingen op veldniveau veranderen een vaag getal in een concrete takenlijst.
Wat telt als een goede score
Er bestaat geen universele slaaggrens. Het juiste doel hangt af van waarvoor de data wordt gebruikt — hetzelfde principe van „geschiktheid voor het doel” dat ten grondslag ligt aan datakwaliteit in het algemeen.
| Scorebereik | Interpretatie | Typisch gebruik |
|---|---|---|
| 95–100% | Vertrouwd | Klantgerichte en gereguleerde data |
| 85–94% | Betrouwbaar | Algemene operationele data |
| 70–84% | Vraagt aandacht | Interne of secundaire data |
| Onder 70% | Niet betrouwbaar | Herstellen voordat u erop vertrouwt |
Stel de drempel vast op basis van de kosten van een fout. Een veld dat facturatie of compliance voedt, vereist een hogere lat dan een veld dat af en toe voor interne opzoekingen wordt gebruikt.
De score in de loop van de tijd volgen
Een score die één keer wordt gemeten, is een momentopname. Herhaaldelijk gemeten wordt het een trend — en in de trend ligt de waarde.
- Momentopname-scores beantwoorden „waar staan we vandaag?”
- Continue scores beantwoorden „worden we beter of slechter?”
CRM- en operationele data degraderen voortdurend door handmatige invoer, integraties en het verstrijken van de tijd, dus een score die vorig kwartaal gezond leek, kan ongemerkt wegglijden. Geplande hermeting vangt degradatie vroeg op, voordat het een rapport of een AI-model bereikt.
Datakwaliteitsscore in Salesforce
Binnen Salesforce geldt hetzelfde model: dimensies worden gemeten over objecten zoals Accounts, Contacts en Leads, gewogen en samengebracht tot één enkele score die u op een dashboard kunt bewaken.
DQS (Data Quality Score) meet dit native — zonder data-export — over de vijf dimensies, en voegt PII-detectie toe voor AI-gereedheid. Om te zien hoe de score wordt opgebouwd en binnen een CRM wordt gelezen, ga verder met:
- Datakwaliteit meten in Salesforce — de score toegepast op een Salesforce-org, ook wel een databetrouwbaarheidsscore genoemd
- Salesforce-datakwaliteitsdashboard — de statistieken die het waard zijn om naast het kerngetal te volgen
- Datakwaliteit in Salesforce — het bredere beeld
Veelgestelde vragen
Wat is een datakwaliteitsscore?
Een datakwaliteitsscore is één enkel getal, doorgaans uitgedrukt als een percentage van 0 tot 100, dat samenvat hoe geschikt uw data is voor het beoogde gebruik. Het wordt berekend als een gewogen gemiddelde van afzonderlijke kwaliteitsdimensies zoals volledigheid, geldigheid, uniciteit, tijdigheid en consistentie.
Hoe wordt een datakwaliteitsscore berekend?
Elke kwaliteitsdimensie wordt gemeten als een slagingspercentage — het aandeel records of waarden dat aan een gedefinieerde regel voldoet. Die dimensiescores worden vervolgens gecombineerd tot een gewogen gemiddelde, waarbij het gewicht van elke dimensie weerspiegelt hoe belangrijk deze is voor de business. Het resultaat is één enkel percentage tussen 0 en 100.
Wat is een goede datakwaliteitsscore?
Er bestaat geen universele slaaggrens, omdat het juiste doel afhangt van waarvoor de data wordt gebruikt. Als vuistregel geldt: 95% of hoger wordt verwacht voor klantgerichte en gereguleerde data, 85% of hoger is acceptabel voor algemene operationele data, en alles onder 70% wijst op data die hersteld moet worden voordat erop kan worden vertrouwd.
Is een datakwaliteitsscore hetzelfde als een databetrouwbaarheidsscore?
Ja. De termen worden door elkaar gebruikt. Beide beschrijven één enkel samengesteld getal dat uitdrukt hoe betrouwbaar een dataset is, door meerdere onderliggende kwaliteitsdimensies te combineren tot één cijfer dat u in de loop van de tijd kunt volgen.
Volgende stappen
- Meet het in uw CRM: Datakwaliteit meten in Salesforce
- Begrijp de inputs: De vijf dimensies
- Begin met de basis: Wat is datakwaliteit?
- Benchmark uw eigen data: neem de AI-gereedheidsbeoordeling om uw scores in 3 minuten te krijgen