Qu'est-ce qu'un score de qualité des données ? Définition et formule

Ce qu’est un score de qualité des données

Un score de qualité des données est un chiffre unique qui résume à quel point vos données sont adaptées à leur usage prévu. Au lieu de demander « nos données sont-elles bonnes ? » et d’obtenir une réponse vague, un score transforme la question en une seule valeur — généralement un pourcentage de 0 à 100 — que vous pouvez suivre, comparer et exploiter.

Le score est parfois appelé score de fiabilité des données. Les deux noms désignent la même chose : une mesure composite qui regroupe plusieurs contrôles de qualité sous-jacents en un seul chiffre clé.

Un score en soi n’est pas l’objectif. Sa valeur réside dans ce qu’il permet de faire : établir une référence, surveiller la dégradation et prouver que les travaux d’amélioration portent leurs fruits.

Pourquoi un chiffre unique est important

Les contrôles de qualité bruts produisent des dizaines de signaux distincts — taux de remplissage, nombre de doublons, erreurs de format, enregistrements obsolètes. Pris isolément, ils sont difficiles à communiquer et faciles à ignorer. Un score unique résout trois problèmes d’un coup :

Problème	Comment un score le résout
Pas de langage commun	Un chiffre que tout le monde comprend, des analystes aux dirigeants
Pas de moyen de suivre les progrès	Une courbe de tendance qui montre si la qualité s’améliore ou se dégrade
Pas de moyen de prioriser	Une ventilation qui pointe vers la dimension ou le champ le plus faible

Le score est le chiffre clé. La ventilation qui le sous-tend est ce sur quoi vous agissez.

Comment se calcule un score de qualité des données

Un score de qualité des données est une moyenne pondérée de dimensions de qualité individuelles. Le calcul se déroule en trois étapes.

Étape 1 : Mesurer chaque dimension

Chaque dimension est mesurée sous forme de taux de conformité — la part des enregistrements ou des valeurs qui satisfont à une règle définie.

Dimension	Ce qu’elle mesure	Exemple de règle
Complétude	Les données requises sont présentes	Les champs obligatoires sont remplis
Validité	Les données respectent un format	Les adresses e-mail correspondent à un format valide
Unicité	Aucun enregistrement en double	Un enregistrement par client
Actualité	Les données sont à jour	Enregistrements mis à jour dans les 90 jours
Cohérence	Les valeurs sont uniformes	Pays stocké comme « USA », jamais « US »

Pour un examen plus approfondi de chacune, voir Les cinq dimensions.

Étape 2 : Appliquer les pondérations

Toutes les dimensions n’ont pas la même importance. Une pondération reflète l’importance d’une dimension pour l’entreprise, et la somme des pondérations atteint 100 %.

Dimension	Taux de conformité	Pondération	Contribution
Complétude	92 %	30 %	27,6
Validité	88 %	25 %	22,0
Unicité	99 %	20 %	19,8
Actualité	75 %	15 %	11,3
Cohérence	90 %	10 %	9,0
Total		100 %	89,7

Étape 3 : Combiner en un seul score

Les contributions sont additionnées pour obtenir le chiffre final. Dans l’exemple ci-dessus, le score de qualité des données est de 89,7 sur 100.

La formule générale est :

Score de qualité des données = Σ (Taux de conformité de la dimension × Pondération de la dimension)

Parce que le score est pondéré, deux organisations disposant des mêmes données brutes peuvent rapporter des scores différents si elles pondèrent les dimensions différemment — et c’est intentionnel. Les pondérations encodent ce que « bon » signifie pour votre entreprise.

Niveaux de mesure

Un score unique à l’échelle de l’organisation est utile pour le reporting, mais le vrai travail commence lorsque vous pouvez le ventiler.

Niveau	Question à laquelle il répond	Usage
Organisation / jeu de données	Quelle est la santé globale de nos données ?	Reporting de direction, suivi des tendances
Objet / table	Quelle entité tire le score vers le bas ?	Priorisation de la remédiation
Champ	Exactement quelle colonne pose problème ?	Corrections ciblées et règles de validation

Un score de 89,7 peut masquer un seul champ à 40 % de complétude. Les ventilations au niveau du champ transforment un chiffre vague en une liste de tâches précise.

Ce qui constitue un bon score

Il n’existe pas de seuil universel. La bonne cible dépend de l’usage des données — le même principe « fit for purpose » qui sous-tend la qualité des données en général.

Plage de score	Interprétation	Usage typique
95–100 %	Digne de confiance	Données en contact avec le client et données réglementées
85–94 %	Fiable	Données opérationnelles générales
70–84 %	À surveiller	Données internes ou secondaires
Moins de 70 %	Non digne de confiance	Remédier avant de s’y fier

Définissez le seuil à partir du coût de l’erreur. Un champ qui alimente la facturation ou la conformité exige une exigence plus élevée qu’un champ utilisé pour des consultations internes occasionnelles.

Suivre le score dans le temps

Un score mesuré une seule fois est un instantané. Mesuré de façon répétée, il devient une tendance — et c’est dans la tendance que réside la valeur.

Les scores ponctuels répondent à la question « où en sommes-nous aujourd’hui ? »
Les scores continus répondent à la question « nous améliorons-nous ou nous dégradons-nous ? »

Les données CRM et opérationnelles se dégradent en continu sous l’effet de la saisie manuelle, des intégrations et du temps qui passe ; un score qui semblait sain au dernier trimestre peut donc se détériorer discrètement. La re-mesure planifiée détecte la dégradation tôt, avant qu’elle n’atteigne un rapport ou un modèle d’IA.

Score de qualité des données dans Salesforce

Dans Salesforce, le même modèle s’applique : les dimensions sont mesurées sur des objets comme Accounts, Contacts et Leads, pondérées, puis regroupées en un seul score que vous pouvez surveiller sur un tableau de bord.

DQS (Data Quality Score) mesure cela nativement — sans export de données — sur les cinq dimensions, et ajoute la détection des PII pour la préparation à l’IA. Pour voir comment le score est construit et lu au sein d’un CRM, poursuivez avec :

Comment mesurer la qualité des données dans Salesforce — le score appliqué à une org Salesforce, aussi appelé score de fiabilité des données
Tableau de bord de qualité des données Salesforce — les métriques à suivre en complément du chiffre clé
Qualité des données dans Salesforce — la vision d’ensemble

Foire aux questions

Qu’est-ce qu’un score de qualité des données ?

Un score de qualité des données est un chiffre unique, généralement exprimé en pourcentage de 0 à 100, qui résume à quel point vos données sont adaptées à leur usage prévu. Il se calcule comme une moyenne pondérée de dimensions de qualité individuelles telles que la complétude, la validité, l’unicité, l’actualité et la cohérence.

Comment se calcule un score de qualité des données ?

Chaque dimension de qualité est mesurée sous forme de taux de conformité — la part des enregistrements ou des valeurs qui respectent une règle définie. Ces scores de dimension sont ensuite combinés en une moyenne pondérée, où le poids de chaque dimension reflète son importance pour l’entreprise. Le résultat est un pourcentage unique compris entre 0 et 100.

Qu’est-ce qu’un bon score de qualité des données ?

Il n’existe pas de seuil universel, car la bonne cible dépend de l’usage des données. En règle générale, on attend 95 % ou plus pour les données en contact avec le client et les données réglementées, 85 % ou plus est acceptable pour les données opérationnelles générales, et tout score inférieur à 70 % signale des données nécessitant une remédiation avant de pouvoir leur faire confiance.

Un score de qualité des données est-il la même chose qu’un score de fiabilité des données ?

Oui. Les termes sont utilisés de manière interchangeable. Tous deux décrivent un chiffre composite unique qui exprime à quel point un jeu de données est digne de confiance, en combinant plusieurs dimensions de qualité sous-jacentes en une seule valeur que vous pouvez suivre dans le temps.

Étapes suivantes

Mesurez-le dans votre CRM : Comment mesurer la qualité des données dans Salesforce
Comprenez les entrées : Les cinq dimensions
Commencez par les fondations : Qu’est-ce que la qualité des données ?
Évaluez vos propres données : passez l’évaluation de préparation à l’IA pour obtenir vos scores en 3 minutes