Skip to main content

Czym jest wskaźnik jakości danych (Data Quality Score)?

Wskaźnik jakości danych zamienia kondycję Twoich danych w jedną liczbę. Dowiedz się, jak się go oblicza, co uznaje się za dobry wynik i jak śledzić go w czasie.

Czym jest wskaźnik jakości danych

Wskaźnik jakości danych to pojedyncza liczba, która podsumowuje, na ile Twoje dane nadają się do zamierzonego użycia. Zamiast pytać „czy nasze dane są dobre?” i otrzymywać niejasną odpowiedź, wskaźnik zamienia to pytanie w jedną wartość — zwykle procent od 0 do 100 — którą możesz śledzić, porównywać i na której podstawie możesz działać.

Wskaźnik bywa nazywany wskaźnikiem wiarygodności danych (data reliability score). Obie nazwy opisują to samo: złożoną miarę, która łączy kilka leżących u podstaw kontroli jakości w jedną nadrzędną liczbę.

Sam wskaźnik nie jest celem. Jego wartość polega na tym, co dzięki niemu możesz zrobić: ustalić poziom bazowy, obserwować degradację i udowodnić, że praca nad usprawnieniami się opłaca.

Dlaczego pojedyncza liczba ma znaczenie

Surowe kontrole jakości dają dziesiątki osobnych sygnałów — stopnie wypełnienia, liczby duplikatów, błędy formatu, przeterminowane rekordy. Same w sobie są trudne do zakomunikowania i łatwo je zignorować. Pojedynczy wskaźnik rozwiązuje trzy problemy naraz:

ProblemJak wskaźnik to rozwiązuje
Brak wspólnego językaJedna liczba zrozumiała dla wszystkich, od analityków po kadrę zarządzającą
Brak sposobu śledzenia postępówLinia trendu pokazująca, czy jakość się poprawia, czy pogarsza
Brak sposobu ustalania priorytetówRozbicie wskazujące najsłabszy wymiar lub pole

Wskaźnik to nagłówek. To, co kryje się za jego rozbiciem, jest tym, na czym działasz.

Jak oblicza się wskaźnik jakości danych

Wskaźnik jakości danych to średnia ważona poszczególnych wymiarów jakości. Obliczenie odbywa się w trzech krokach.

Krok 1: Zmierz każdy wymiar

Każdy wymiar mierzy się jako wskaźnik zgodności — udział rekordów lub wartości, które spełniają zdefiniowaną regułę.

WymiarCo mierzyPrzykładowa reguła
KompletnośćWymagane dane są obecnePola obowiązkowe są wypełnione
PoprawnośćDane są zgodne z formatemAdresy e-mail pasują do prawidłowego wzorca
UnikalnośćBrak zduplikowanych rekordówJeden rekord na klienta
AktualnośćDane są bieżąceRekordy zaktualizowane w ciągu 90 dni
SpójnośćWartości są jednoliteKraj zapisany jako „USA”, nigdy „US”

Szczegółowe omówienie każdego z nich znajdziesz w artykule Pięć wymiarów.

Krok 2: Zastosuj wagi

Nie każdy wymiar ma takie samo znaczenie. Waga odzwierciedla, jak ważny jest dany wymiar dla biznesu, a wagi sumują się do 100%.

WymiarWskaźnik zgodnościWagaWkład
Kompletność92%30%27,6
Poprawność88%25%22,0
Unikalność99%20%19,8
Aktualność75%15%11,3
Spójność90%10%9,0
Razem100%89,7

Krok 3: Połącz w jeden wynik

Wkłady są sumowane do końcowej wartości. W powyższym przykładzie wskaźnik jakości danych wynosi 89,7 na 100.

Ogólny wzór to:

Wskaźnik jakości danych = Σ (Wskaźnik zgodności wymiaru × Waga wymiaru)

Ponieważ wskaźnik jest ważony, dwie organizacje z tymi samymi surowymi danymi mogą raportować różne wyniki, jeśli inaczej ważą wymiary — i jest to zamierzone. Wagi kodują to, co „dobre” oznacza dla Twojego biznesu.

Poziomy pomiaru

Pojedynczy wskaźnik dla całej organizacji jest przydatny do raportowania, ale prawdziwa praca zaczyna się, gdy możesz go rozbić.

PoziomPytanie, na które odpowiadaZastosowanie
Organizacja / zbiór danychJak zdrowe są nasze dane jako całość?Raportowanie zarządcze, śledzenie trendów
Obiekt / tabelaKtóry byt obniża wynik?Ustalanie priorytetów napraw
PoleDokładnie która kolumna jest problemem?Ukierunkowane poprawki i reguły walidacji

Wynik 89,7 może ukrywać pojedyncze pole o kompletności 40%. Rozbicia na poziomie pól zamieniają niejasną liczbę w konkretną listę zadań.

Co uznaje się za dobry wynik

Nie istnieje uniwersalny próg zaliczenia. Właściwy cel zależy od tego, do czego dane są wykorzystywane — ta sama zasada „przydatności do celu”, która leży u podstaw jakości danych ogólnie.

Zakres wynikuInterpretacjaTypowe zastosowanie
95–100%ZaufaneDane kontaktowe z klientami i dane regulowane
85–94%WiarygodneOgólne dane operacyjne
70–84%Wymaga uwagiDane wewnętrzne lub drugorzędne
Poniżej 70%NiewiarygodneNapraw, zanim na nich polegniesz

Ustal próg na podstawie kosztu pomyłki. Pole zasilające rozliczenia lub zgodność wymaga wyższej poprzeczki niż takie, które wykorzystywane jest do sporadycznego wyszukiwania wewnętrznego.

Śledzenie wyniku w czasie

Wynik zmierzony jednorazowo to migawka. Mierzony wielokrotnie staje się trendem — a to w trendzie kryje się wartość.

  • Wyniki punktowe odpowiadają na pytanie „gdzie stoimy dzisiaj?”
  • Wyniki ciągłe odpowiadają na pytanie „czy idziemy ku lepszemu, czy ku gorszemu?”

Dane CRM i dane operacyjne nieustannie ulegają degradacji w wyniku ręcznego wprowadzania, integracji i upływu czasu, więc wynik, który wyglądał zdrowo w ubiegłym kwartale, może po cichu się obniżyć. Zaplanowany ponowny pomiar wychwytuje degradację wcześnie, zanim dotrze ona do raportu lub modelu AI.

Wskaźnik jakości danych w Salesforce

Wewnątrz Salesforce obowiązuje ten sam model: wymiary mierzy się w obiektach takich jak Accounts, Contacts i Leads, waży i sumuje w pojedynczy wynik, który możesz monitorować na dashboardzie.

DQS (Data Quality Score) mierzy to natywnie — bez eksportu danych — w pięciu wymiarach i dodaje wykrywanie PII na potrzeby gotowości na AI. Aby zobaczyć, jak wynik jest budowany i odczytywany wewnątrz CRM, przejdź dalej:

Najczęściej zadawane pytania

Czym jest wskaźnik jakości danych (Data Quality Score)?

Wskaźnik jakości danych to pojedyncza liczba, zwykle wyrażona jako procent od 0 do 100, która podsumowuje, na ile Twoje dane nadają się do zamierzonego użycia. Oblicza się go jako średnią ważoną poszczególnych wymiarów jakości, takich jak kompletność, poprawność, unikalność, aktualność i spójność.

Jak oblicza się wskaźnik jakości danych?

Każdy wymiar jakości mierzy się jako wskaźnik zgodności — udział rekordów lub wartości, które spełniają zdefiniowaną regułę. Te wyniki wymiarów są następnie łączone w średnią ważoną, gdzie waga każdego wymiaru odzwierciedla, jak ważny jest on dla biznesu. Rezultatem jest pojedynczy procent między 0 a 100.

Co to jest dobry wskaźnik jakości danych?

Nie istnieje uniwersalny próg zaliczenia, ponieważ właściwy cel zależy od tego, do czego dane są wykorzystywane. Z reguły 95% lub więcej oczekuje się dla danych kontaktowych z klientami i danych regulowanych, 85% lub więcej jest akceptowalne dla ogólnych danych operacyjnych, a wszystko poniżej 70% sygnalizuje dane wymagające naprawy, zanim będzie można im zaufać.

Czy wskaźnik jakości danych to to samo, co wskaźnik wiarygodności danych (data reliability score)?

Tak. Terminy te są używane zamiennie. Oba opisują pojedynczą złożoną liczbę, która wyraża, na ile zbiór danych jest godny zaufania, łącząc kilka leżących u podstaw wymiarów jakości w jedną wartość, którą można śledzić w czasie.

Następne kroki