Wat is een datakwaliteitsscore? Definitie en formule

Wat een datakwaliteitsscore is

Een datakwaliteitsscore is één enkel getal dat samenvat hoe geschikt uw data is voor het beoogde gebruik. In plaats van de vraag „is onze data goed?” te stellen en een vaag antwoord te krijgen, vertaalt een score de vraag naar één cijfer — doorgaans een percentage van 0 tot 100 — dat u kunt volgen, vergelijken en waarop u kunt handelen.

De score wordt soms een databetrouwbaarheidsscore genoemd. Beide namen beschrijven hetzelfde: een samengestelde maatstaf die verschillende onderliggende kwaliteitscontroles samenbrengt tot één kerngetal.

Een score op zich is niet het doel. De waarde ligt in wat het u mogelijk maakt: een basislijn vaststellen, letten op degradatie en aantonen dat verbeterwerk loont.

Waarom één enkel getal ertoe doet

Onbewerkte kwaliteitscontroles produceren tientallen afzonderlijke signalen — vulpercentages, duplicaataantallen, indelingsfouten, verouderde records. Op zichzelf zijn ze moeilijk te communiceren en gemakkelijk te negeren. Eén enkele score lost drie problemen tegelijk op:

Probleem	Hoe een score het oplost
Geen gemeenschappelijke taal	Eén getal dat iedereen begrijpt, van analisten tot bestuurders
Geen manier om voortgang te volgen	Een trendlijn die laat zien of de kwaliteit verbetert of achteruitgaat
Geen manier om te prioriteren	Een uitsplitsing die wijst op de zwakste dimensie of het zwakste veld

De score is het kerngetal. De uitsplitsing erachter is waarop u handelt.

Hoe een datakwaliteitsscore wordt berekend

Een datakwaliteitsscore is een gewogen gemiddelde van afzonderlijke kwaliteitsdimensies. De berekening verloopt in drie stappen.

Stap 1: Meet elke dimensie

Elke dimensie wordt gemeten als een slagingspercentage — het aandeel records of waarden dat aan een gedefinieerde regel voldoet.

Dimensie	Wat het meet	Voorbeeldregel
Volledigheid	Vereiste data is aanwezig	Verplichte velden zijn gevuld
Geldigheid	Data voldoet aan een indeling	E-mailadressen komen overeen met een geldig patroon
Uniciteit	Geen dubbele records	Één record per klant
Tijdigheid	Data is actueel	Records bijgewerkt binnen 90 dagen
Consistentie	Waarden zijn uniform	Land opgeslagen als „USA”, nooit „US”

Voor een diepere blik op elke dimensie, zie De vijf dimensies.

Stap 2: Pas gewichten toe

Niet elke dimensie weegt even zwaar. Een gewicht weerspiegelt hoe belangrijk een dimensie is voor de business, en de gewichten tellen op tot 100%.

Dimensie	Slagingspercentage	Gewicht	Bijdrage
Volledigheid	92%	30%	27,6
Geldigheid	88%	25%	22,0
Uniciteit	99%	20%	19,8
Tijdigheid	75%	15%	11,3
Consistentie	90%	10%	9,0
Totaal		100%	89,7

Stap 3: Combineer tot één score

De bijdragen worden opgeteld tot het eindcijfer. In het bovenstaande voorbeeld is de datakwaliteitsscore 89,7 van de 100.

De algemene formule luidt:

Datakwaliteitsscore = Σ (Slagingspercentage dimensie × Gewicht dimensie)

Omdat de score gewogen is, kunnen twee organisaties met dezelfde onbewerkte data verschillende scores rapporteren als ze de dimensies anders wegen — en dat is met opzet. De gewichten coderen wat „goed” betekent voor uw business.

Meetniveaus

Eén enkele organisatiebrede score is nuttig voor rapportage, maar het echte werk gebeurt wanneer u het kunt uitsplitsen.

Niveau	Vraag die het beantwoordt	Gebruik
Organisatie / dataset	Hoe gezond is onze data in het algemeen?	Bestuursrapportage, trendvolging
Object / tabel	Welke entiteit drukt de score omlaag?	Prioriteren van herstel
Veld	Precies welke kolom is het probleem?	Gerichte oplossingen en validatieregels

Een score van 89,7 kan een enkel veld met 40% volledigheid verbergen. Uitsplitsingen op veldniveau veranderen een vaag getal in een concrete takenlijst.

Wat telt als een goede score

Er bestaat geen universele slaaggrens. Het juiste doel hangt af van waarvoor de data wordt gebruikt — hetzelfde principe van „geschiktheid voor het doel” dat ten grondslag ligt aan datakwaliteit in het algemeen.

Scorebereik	Interpretatie	Typisch gebruik
95–100%	Vertrouwd	Klantgerichte en gereguleerde data
85–94%	Betrouwbaar	Algemene operationele data
70–84%	Vraagt aandacht	Interne of secundaire data
Onder 70%	Niet betrouwbaar	Herstellen voordat u erop vertrouwt

Stel de drempel vast op basis van de kosten van een fout. Een veld dat facturatie of compliance voedt, vereist een hogere lat dan een veld dat af en toe voor interne opzoekingen wordt gebruikt.

De score in de loop van de tijd volgen

Een score die één keer wordt gemeten, is een momentopname. Herhaaldelijk gemeten wordt het een trend — en in de trend ligt de waarde.

Momentopname-scores beantwoorden „waar staan we vandaag?”
Continue scores beantwoorden „worden we beter of slechter?”

CRM- en operationele data degraderen voortdurend door handmatige invoer, integraties en het verstrijken van de tijd, dus een score die vorig kwartaal gezond leek, kan ongemerkt wegglijden. Geplande hermeting vangt degradatie vroeg op, voordat het een rapport of een AI-model bereikt.

Datakwaliteitsscore in Salesforce

Binnen Salesforce geldt hetzelfde model: dimensies worden gemeten over objecten zoals Accounts, Contacts en Leads, gewogen en samengebracht tot één enkele score die u op een dashboard kunt bewaken.

DQS (Data Quality Score) meet dit native — zonder data-export — over de vijf dimensies, en voegt PII-detectie toe voor AI-gereedheid. Om te zien hoe de score wordt opgebouwd en binnen een CRM wordt gelezen, ga verder met:

Datakwaliteit meten in Salesforce — de score toegepast op een Salesforce-org, ook wel een databetrouwbaarheidsscore genoemd
Salesforce-datakwaliteitsdashboard — de statistieken die het waard zijn om naast het kerngetal te volgen
Datakwaliteit in Salesforce — het bredere beeld

Veelgestelde vragen

Wat is een datakwaliteitsscore?

Een datakwaliteitsscore is één enkel getal, doorgaans uitgedrukt als een percentage van 0 tot 100, dat samenvat hoe geschikt uw data is voor het beoogde gebruik. Het wordt berekend als een gewogen gemiddelde van afzonderlijke kwaliteitsdimensies zoals volledigheid, geldigheid, uniciteit, tijdigheid en consistentie.

Hoe wordt een datakwaliteitsscore berekend?

Elke kwaliteitsdimensie wordt gemeten als een slagingspercentage — het aandeel records of waarden dat aan een gedefinieerde regel voldoet. Die dimensiescores worden vervolgens gecombineerd tot een gewogen gemiddelde, waarbij het gewicht van elke dimensie weerspiegelt hoe belangrijk deze is voor de business. Het resultaat is één enkel percentage tussen 0 en 100.

Wat is een goede datakwaliteitsscore?

Er bestaat geen universele slaaggrens, omdat het juiste doel afhangt van waarvoor de data wordt gebruikt. Als vuistregel geldt: 95% of hoger wordt verwacht voor klantgerichte en gereguleerde data, 85% of hoger is acceptabel voor algemene operationele data, en alles onder 70% wijst op data die hersteld moet worden voordat erop kan worden vertrouwd.

Is een datakwaliteitsscore hetzelfde als een databetrouwbaarheidsscore?

Ja. De termen worden door elkaar gebruikt. Beide beschrijven één enkel samengesteld getal dat uitdrukt hoe betrouwbaar een dataset is, door meerdere onderliggende kwaliteitsdimensies te combineren tot één cijfer dat u in de loop van de tijd kunt volgen.

Volgende stappen

Meet het in uw CRM: Datakwaliteit meten in Salesforce
Begrijp de inputs: De vijf dimensies
Begin met de basis: Wat is datakwaliteit?
Benchmark uw eigen data: neem de AI-gereedheidsbeoordeling om uw scores in 3 minuten te krijgen