Skip to main content

Was ist ein Data Quality Score?

Ein Data Quality Score verwandelt die Gesundheit Ihrer Daten in eine einzige Zahl. Erfahren Sie, wie er berechnet wird, was als guter Wert gilt und wie Sie ihn im Zeitverlauf verfolgen.

Was ein Data Quality Score ist

Ein Data Quality Score ist eine einzige Zahl, die zusammenfasst, wie gut Ihre Daten für ihren vorgesehenen Zweck geeignet sind. Statt zu fragen „Sind unsere Daten gut?” und eine vage Antwort zu erhalten, verwandelt ein Score die Frage in eine einzige Kennzahl — üblicherweise ein Prozentwert von 0 bis 100 — die Sie verfolgen, vergleichen und auf die Sie reagieren können.

Der Score wird manchmal als Data Reliability Score bezeichnet. Beide Namen beschreiben dasselbe: eine zusammengesetzte Kennzahl, die mehrere zugrunde liegende Qualitätsprüfungen zu einer einzigen Schlagzeilen-Zahl bündelt.

Ein Score an sich ist nicht das Ziel. Sein Wert liegt darin, was er Ihnen ermöglicht: einen Basiswert festzulegen, auf Verschlechterungen zu achten und nachzuweisen, dass sich Verbesserungsarbeit auszahlt.

Warum eine einzige Zahl zählt

Rohe Qualitätsprüfungen erzeugen Dutzende einzelner Signale — Befüllungsraten, Dublettenanzahl, Formatfehler, veraltete Datensätze. Für sich genommen sind sie schwer zu vermitteln und leicht zu ignorieren. Eine einzige Kennzahl löst drei Probleme auf einmal:

ProblemWie ein Score es löst
Keine gemeinsame SpracheEine Zahl, die jeder versteht, von Analysten bis zur Führungsebene
Keine Möglichkeit, Fortschritt zu verfolgenEine Trendlinie, die zeigt, ob die Qualität steigt oder sinkt
Keine Möglichkeit zu priorisierenEine Aufschlüsselung, die auf die schwächste Dimension oder das schwächste Feld verweist

Der Score ist die Schlagzeile. Die Aufschlüsselung dahinter ist das, worauf Sie reagieren.

Wie ein Data Quality Score berechnet wird

Ein Data Quality Score ist ein gewichteter Durchschnitt einzelner Qualitätsdimensionen. Die Berechnung erfolgt in drei Schritten.

Schritt 1: Jede Dimension messen

Jede Dimension wird als Erfüllungsrate gemessen — der Anteil der Datensätze oder Werte, die eine definierte Regel erfüllen.

DimensionWas sie misstBeispielregel
VollständigkeitErforderliche Daten sind vorhandenPflichtfelder sind ausgefüllt
GültigkeitDaten entsprechen einem FormatE-Mail-Adressen entsprechen einem gültigen Muster
EindeutigkeitKeine doppelten DatensätzeEin Datensatz pro Kunde
AktualitätDaten sind aktuellDatensätze innerhalb von 90 Tagen aktualisiert
KonsistenzWerte sind einheitlichLand gespeichert als „USA”, niemals „US”

Einen vertieften Blick auf jede Dimension finden Sie unter Die fünf Dimensionen.

Schritt 2: Gewichte anwenden

Nicht jede Dimension ist gleich wichtig. Ein Gewicht spiegelt wider, wie wichtig eine Dimension für das Unternehmen ist, und die Gewichte ergeben zusammen 100 %.

DimensionErfüllungsrateGewichtBeitrag
Vollständigkeit92%30%27,6
Gültigkeit88%25%22,0
Eindeutigkeit99%20%19,8
Aktualität75%15%11,3
Konsistenz90%10%9,0
Gesamt100%89,7

Schritt 3: Zu einem Score kombinieren

Die Beiträge werden zur endgültigen Kennzahl summiert. Im obigen Beispiel beträgt der Data Quality Score 89,7 von 100.

Die allgemeine Formel lautet:

Data Quality Score = Σ (Erfüllungsrate der Dimension × Gewicht der Dimension)

Da der Score gewichtet ist, können zwei Organisationen mit denselben Rohdaten unterschiedliche Scores melden, wenn sie die Dimensionen unterschiedlich gewichten — und das ist beabsichtigt. Die Gewichte kodieren, was „gut” für Ihr Unternehmen bedeutet.

Messebenen

Ein einzelner organisationsweiter Score ist nützlich für das Reporting, aber die eigentliche Arbeit geschieht, wenn Sie ihn aufschlüsseln können.

EbeneWelche Frage sie beantwortetNutzen
Organisation / DatensatzWie gesund sind unsere Daten insgesamt?Reporting für die Führungsebene, Trendverfolgung
Objekt / TabelleWelche Entität drückt den Score nach unten?Priorisierung der Bereinigung
FeldWelche Spalte ist genau das Problem?Gezielte Korrekturen und Validierungsregeln

Ein Score von 89,7 kann ein einzelnes Feld mit 40 % Vollständigkeit verbergen. Aufschlüsselungen auf Feldebene verwandeln eine vage Zahl in eine konkrete To-do-Liste.

Was als guter Score gilt

Es gibt keine universelle Bestehensgrenze. Das richtige Ziel hängt davon ab, wofür die Daten verwendet werden — dasselbe Prinzip der „Zweckmäßigkeit”, das der Datenqualität allgemein zugrunde liegt.

Score-BereichInterpretationTypischer Nutzen
95–100%VertrauenswürdigKundenrelevante und regulierte Daten
85–94%ZuverlässigAllgemeine Betriebsdaten
70–84%Erfordert AufmerksamkeitInterne oder sekundäre Daten
Unter 70%Nicht vertrauenswürdigVor der Nutzung bereinigen

Legen Sie den Schwellenwert anhand der Kosten eines Fehlers fest. Ein Feld, das in die Abrechnung oder Compliance einfließt, benötigt eine höhere Messlatte als eines, das für gelegentliche interne Abfragen genutzt wird.

Den Score im Zeitverlauf verfolgen

Ein einmal gemessener Score ist eine Momentaufnahme. Wiederholt gemessen, wird er zu einem Trend — und im Trend liegt der Wert.

  • Punktuelle Scores beantworten „Wo stehen wir heute?”
  • Kontinuierliche Scores beantworten „Werden wir besser oder schlechter?”

CRM- und Betriebsdaten verfallen kontinuierlich durch manuelle Eingabe, Integrationen und den Lauf der Zeit, sodass ein Score, der im letzten Quartal gesund aussah, unbemerkt absinken kann. Geplante Neumessung erkennt Verschlechterungen frühzeitig, bevor sie in einen Bericht oder ein KI-Modell gelangen.

Data Quality Score in Salesforce

Innerhalb von Salesforce gilt dasselbe Modell: Dimensionen werden über Objekte wie Accounts, Kontakte und Leads gemessen, gewichtet und zu einem einzigen Score zusammengefasst, den Sie auf einem Dashboard überwachen können.

DQS (Data Quality Score) misst dies nativ — ohne Datenexport — über die fünf Dimensionen und ergänzt PII-Erkennung für die KI-Bereitschaft. Um zu sehen, wie der Score aufgebaut und innerhalb eines CRM gelesen wird, lesen Sie weiter:

Häufig gestellte Fragen

Was ist ein Data Quality Score?

Ein Data Quality Score ist eine einzige Zahl, üblicherweise als Prozentwert von 0 bis 100 ausgedrückt, die zusammenfasst, wie gut Ihre Daten für ihren vorgesehenen Zweck geeignet sind. Er wird als gewichteter Durchschnitt einzelner Qualitätsdimensionen wie Vollständigkeit, Gültigkeit, Eindeutigkeit, Aktualität und Konsistenz berechnet.

Wie wird ein Data Quality Score berechnet?

Jede Qualitätsdimension wird als Erfüllungsrate gemessen — der Anteil der Datensätze oder Werte, die eine definierte Regel erfüllen. Diese Dimensions-Scores werden dann zu einem gewichteten Durchschnitt kombiniert, wobei das Gewicht jeder Dimension widerspiegelt, wie wichtig sie für das Unternehmen ist. Das Ergebnis ist ein einzelner Prozentwert zwischen 0 und 100.

Was ist ein guter Data Quality Score?

Es gibt keine universelle Bestehensgrenze, denn das richtige Ziel hängt davon ab, wofür die Daten verwendet werden. Als Faustregel gilt: 95 % oder höher werden für kundenrelevante und regulierte Daten erwartet, 85 % oder höher sind für allgemeine Betriebsdaten akzeptabel, und alles unter 70 % signalisiert Daten, die bereinigt werden müssen, bevor man ihnen vertrauen kann.

Ist ein Data Quality Score dasselbe wie ein Data Reliability Score?

Ja. Die Begriffe werden synonym verwendet. Beide beschreiben eine einzige zusammengesetzte Zahl, die ausdrückt, wie vertrauenswürdig ein Datensatz ist, indem mehrere zugrunde liegende Qualitätsdimensionen zu einer Kennzahl zusammengefasst werden, die Sie im Zeitverlauf verfolgen können.

Nächste Schritte