Skip to main content

Qu'est-ce qu'un score de qualité des données ?

Un score de qualité des données traduit la santé de vos données en un seul chiffre. Découvrez comment il se calcule, ce qui constitue un bon score et comment le suivre dans le temps.

Ce qu’est un score de qualité des données

Un score de qualité des données est un chiffre unique qui résume à quel point vos données sont adaptées à leur usage prévu. Au lieu de demander « nos données sont-elles bonnes ? » et d’obtenir une réponse vague, un score transforme la question en une seule valeur — généralement un pourcentage de 0 à 100 — que vous pouvez suivre, comparer et exploiter.

Le score est parfois appelé score de fiabilité des données. Les deux noms désignent la même chose : une mesure composite qui regroupe plusieurs contrôles de qualité sous-jacents en un seul chiffre clé.

Un score en soi n’est pas l’objectif. Sa valeur réside dans ce qu’il permet de faire : établir une référence, surveiller la dégradation et prouver que les travaux d’amélioration portent leurs fruits.

Pourquoi un chiffre unique est important

Les contrôles de qualité bruts produisent des dizaines de signaux distincts — taux de remplissage, nombre de doublons, erreurs de format, enregistrements obsolètes. Pris isolément, ils sont difficiles à communiquer et faciles à ignorer. Un score unique résout trois problèmes d’un coup :

ProblèmeComment un score le résout
Pas de langage communUn chiffre que tout le monde comprend, des analystes aux dirigeants
Pas de moyen de suivre les progrèsUne courbe de tendance qui montre si la qualité s’améliore ou se dégrade
Pas de moyen de prioriserUne ventilation qui pointe vers la dimension ou le champ le plus faible

Le score est le chiffre clé. La ventilation qui le sous-tend est ce sur quoi vous agissez.

Comment se calcule un score de qualité des données

Un score de qualité des données est une moyenne pondérée de dimensions de qualité individuelles. Le calcul se déroule en trois étapes.

Étape 1 : Mesurer chaque dimension

Chaque dimension est mesurée sous forme de taux de conformité — la part des enregistrements ou des valeurs qui satisfont à une règle définie.

DimensionCe qu’elle mesureExemple de règle
ComplétudeLes données requises sont présentesLes champs obligatoires sont remplis
ValiditéLes données respectent un formatLes adresses e-mail correspondent à un format valide
UnicitéAucun enregistrement en doubleUn enregistrement par client
ActualitéLes données sont à jourEnregistrements mis à jour dans les 90 jours
CohérenceLes valeurs sont uniformesPays stocké comme « USA », jamais « US »

Pour un examen plus approfondi de chacune, voir Les cinq dimensions.

Étape 2 : Appliquer les pondérations

Toutes les dimensions n’ont pas la même importance. Une pondération reflète l’importance d’une dimension pour l’entreprise, et la somme des pondérations atteint 100 %.

DimensionTaux de conformitéPondérationContribution
Complétude92 %30 %27,6
Validité88 %25 %22,0
Unicité99 %20 %19,8
Actualité75 %15 %11,3
Cohérence90 %10 %9,0
Total100 %89,7

Étape 3 : Combiner en un seul score

Les contributions sont additionnées pour obtenir le chiffre final. Dans l’exemple ci-dessus, le score de qualité des données est de 89,7 sur 100.

La formule générale est :

Score de qualité des données = Σ (Taux de conformité de la dimension × Pondération de la dimension)

Parce que le score est pondéré, deux organisations disposant des mêmes données brutes peuvent rapporter des scores différents si elles pondèrent les dimensions différemment — et c’est intentionnel. Les pondérations encodent ce que « bon » signifie pour votre entreprise.

Niveaux de mesure

Un score unique à l’échelle de l’organisation est utile pour le reporting, mais le vrai travail commence lorsque vous pouvez le ventiler.

NiveauQuestion à laquelle il répondUsage
Organisation / jeu de donnéesQuelle est la santé globale de nos données ?Reporting de direction, suivi des tendances
Objet / tableQuelle entité tire le score vers le bas ?Priorisation de la remédiation
ChampExactement quelle colonne pose problème ?Corrections ciblées et règles de validation

Un score de 89,7 peut masquer un seul champ à 40 % de complétude. Les ventilations au niveau du champ transforment un chiffre vague en une liste de tâches précise.

Ce qui constitue un bon score

Il n’existe pas de seuil universel. La bonne cible dépend de l’usage des données — le même principe « fit for purpose » qui sous-tend la qualité des données en général.

Plage de scoreInterprétationUsage typique
95–100 %Digne de confianceDonnées en contact avec le client et données réglementées
85–94 %FiableDonnées opérationnelles générales
70–84 %À surveillerDonnées internes ou secondaires
Moins de 70 %Non digne de confianceRemédier avant de s’y fier

Définissez le seuil à partir du coût de l’erreur. Un champ qui alimente la facturation ou la conformité exige une exigence plus élevée qu’un champ utilisé pour des consultations internes occasionnelles.

Suivre le score dans le temps

Un score mesuré une seule fois est un instantané. Mesuré de façon répétée, il devient une tendance — et c’est dans la tendance que réside la valeur.

  • Les scores ponctuels répondent à la question « où en sommes-nous aujourd’hui ? »
  • Les scores continus répondent à la question « nous améliorons-nous ou nous dégradons-nous ? »

Les données CRM et opérationnelles se dégradent en continu sous l’effet de la saisie manuelle, des intégrations et du temps qui passe ; un score qui semblait sain au dernier trimestre peut donc se détériorer discrètement. La re-mesure planifiée détecte la dégradation tôt, avant qu’elle n’atteigne un rapport ou un modèle d’IA.

Score de qualité des données dans Salesforce

Dans Salesforce, le même modèle s’applique : les dimensions sont mesurées sur des objets comme Accounts, Contacts et Leads, pondérées, puis regroupées en un seul score que vous pouvez surveiller sur un tableau de bord.

DQS (Data Quality Score) mesure cela nativement — sans export de données — sur les cinq dimensions, et ajoute la détection des PII pour la préparation à l’IA. Pour voir comment le score est construit et lu au sein d’un CRM, poursuivez avec :

Foire aux questions

Qu’est-ce qu’un score de qualité des données ?

Un score de qualité des données est un chiffre unique, généralement exprimé en pourcentage de 0 à 100, qui résume à quel point vos données sont adaptées à leur usage prévu. Il se calcule comme une moyenne pondérée de dimensions de qualité individuelles telles que la complétude, la validité, l’unicité, l’actualité et la cohérence.

Comment se calcule un score de qualité des données ?

Chaque dimension de qualité est mesurée sous forme de taux de conformité — la part des enregistrements ou des valeurs qui respectent une règle définie. Ces scores de dimension sont ensuite combinés en une moyenne pondérée, où le poids de chaque dimension reflète son importance pour l’entreprise. Le résultat est un pourcentage unique compris entre 0 et 100.

Qu’est-ce qu’un bon score de qualité des données ?

Il n’existe pas de seuil universel, car la bonne cible dépend de l’usage des données. En règle générale, on attend 95 % ou plus pour les données en contact avec le client et les données réglementées, 85 % ou plus est acceptable pour les données opérationnelles générales, et tout score inférieur à 70 % signale des données nécessitant une remédiation avant de pouvoir leur faire confiance.

Un score de qualité des données est-il la même chose qu’un score de fiabilité des données ?

Oui. Les termes sont utilisés de manière interchangeable. Tous deux décrivent un chiffre composite unique qui exprime à quel point un jeu de données est digne de confiance, en combinant plusieurs dimensions de qualité sous-jacentes en une seule valeur que vous pouvez suivre dans le temps.

Étapes suivantes