Skip to main content

ما هي درجة جودة البيانات؟

تحوّل درجة جودة البيانات صحة بياناتك إلى رقم واحد. تعرّف على كيفية حسابها، وما الذي يُعَدّ درجة جيدة، وكيف تتابعها بمرور الوقت.

ما هي درجة جودة البيانات

درجة جودة البيانات هي رقم واحد يلخّص مدى صلاحية بياناتك للاستخدام المخصّص لها. فبدلًا من السؤال «هل بياناتنا جيدة؟» والحصول على إجابة غامضة، تحوّل الدرجة السؤال إلى رقم واحد — عادةً نسبة مئوية من 0 إلى 100 — يمكنك متابعته ومقارنته والتصرّف بناءً عليه.

تُسمّى الدرجة أحيانًا درجة موثوقية البيانات. ويصف الاسمان الشيء نفسه: مقياس مركّب يجمع عدة فحوصات جودة أساسية في رقم رئيسي واحد.

الدرجة بحد ذاتها ليست الهدف. قيمتها فيما تتيحه لك: إرساء خط أساس، ومراقبة التدهور، وإثبات أن أعمال التحسين تؤتي ثمارها.

لماذا يهمّ رقم واحد

تنتج فحوصات الجودة الخام عشرات الإشارات المنفصلة — معدّلات التعبئة، وأعداد المكررات، وأخطاء التنسيق، والسجلات القديمة. وهي بمفردها يصعب توصيلها ويسهل تجاهلها. تحلّ الدرجة الواحدة ثلاث مشكلات دفعةً واحدة:

المشكلةكيف تحلّها الدرجة
غياب لغة مشتركةرقم واحد يفهمه الجميع، من المحلّلين إلى التنفيذيين
غياب وسيلة لتتبّع التقدّمخط اتجاه يُظهر ما إذا كانت الجودة تتحسّن أم تتراجع
غياب وسيلة لترتيب الأولوياتتفصيل يشير إلى البُعد أو الحقل الأضعف

الدرجة هي العنوان الرئيسي. أما التفصيل الكامن خلفها فهو ما تتصرّف بناءً عليه.

كيف تُحسب درجة جودة البيانات

درجة جودة البيانات هي متوسط موزون لأبعاد الجودة الفردية. ويجري الحساب في ثلاث خطوات.

الخطوة 1: قياس كل بُعد

يُقاس كل بُعد كمعدّل نجاح — أي حصة السجلات أو القيم التي تستوفي قاعدة محدّدة.

البُعدما يقيسهمثال على القاعدة
الاكتمالالبيانات المطلوبة موجودةالحقول الإلزامية معبّأة
الصحةالبيانات تتوافق مع تنسيقعناوين البريد الإلكتروني تطابق نمطًا صحيحًا
التفرّدلا سجلات مكررةسجل واحد لكل عميل
الحداثةالبيانات حاليةالسجلات مُحدّثة خلال 90 يومًا
الاتساقالقيم موحّدةالدولة مخزّنة كـ«USA»، وليست «US» أبدًا

للاطلاع على نظرة أعمق لكل بُعد، راجع الأبعاد الخمسة.

الخطوة 2: تطبيق الأوزان

ليست كل الأبعاد متساوية الأهمية. يعكس الوزن مدى أهمية البُعد للعمل، وتضيف الأوزان إلى 100%.

البُعدمعدّل النجاحالوزنالمساهمة
الاكتمال92%30%27.6
الصحة88%25%22.0
التفرّد99%20%19.8
الحداثة75%15%11.3
الاتساق90%10%9.0
الإجمالي100%89.7

الخطوة 3: الدمج في درجة واحدة

تُجمع المساهمات في الرقم النهائي. في المثال أعلاه، تبلغ درجة جودة البيانات 89.7 من 100.

الصيغة العامة هي:

درجة جودة البيانات = Σ (معدّل نجاح البُعد × وزن البُعد)

ولأن الدرجة موزونة، يمكن لمؤسستين تملكان البيانات الخام نفسها أن تُبلِغا عن درجتين مختلفتين إذا رجّحتا الأبعاد بشكل مختلف — وهذا أمر مقصود. فالأوزان تُرمِّز ما يعنيه «الجيد» لعملك.

مستويات القياس

الدرجة الواحدة على مستوى المؤسسة مفيدة لإعداد التقارير، لكن العمل الحقيقي يبدأ حين تتمكّن من تفصيلها.

المستوىالسؤال الذي يجيب عنهالاستخدام
المؤسسة / مجموعة البياناتما مدى صحة بياناتنا إجمالًا؟التقارير التنفيذية، تتبّع الاتجاهات
الكائن / الجدولأي كيان يخفّض الدرجة؟ترتيب أولويات المعالجة
الحقلأي عمود تحديدًا يمثّل المشكلة؟الإصلاحات الموجّهة وقواعد التحقّق

قد تخفي درجة 89.7 حقلًا واحدًا عند اكتمال 40%. تحوّل التفصيلات على مستوى الحقل رقمًا غامضًا إلى قائمة مهام محدّدة.

ما الذي يُعَدّ درجة جيدة

لا توجد علامة نجاح عالمية. فالهدف الصحيح يعتمد على الغرض الذي تُستخدم فيه البيانات — وهو مبدأ «الصلاحية للغرض» نفسه الذي تقوم عليه جودة البيانات عمومًا.

نطاق الدرجةالتفسيرالاستخدام النموذجي
95–100%موثوقةالبيانات التي يراها العملاء والبيانات الخاضعة للتنظيم
85–94%يُعتمد عليهاالبيانات التشغيلية العامة
70–84%تحتاج إلى انتباهالبيانات الداخلية أو الثانوية
دون 70%غير موثوقةعالِجها قبل الاعتماد عليها

حدّد العتبة انطلاقًا من تكلفة الخطأ. الحقل الذي يغذّي الفوترة أو الامتثال يحتاج إلى معيار أعلى من حقل يُستخدم في عمليات بحث داخلية عرضية.

متابعة الدرجة بمرور الوقت

الدرجة المقاسة مرة واحدة هي لقطة. أما المقاسة بشكل متكرر فتصبح اتجاهًا — والاتجاه هو موضع القيمة.

  • تجيب الدرجات في نقطة زمنية عن «أين نقف اليوم؟»
  • تجيب الدرجات المستمرة عن «هل نتحسّن أم نتراجع؟»

تتدهور بيانات CRM والبيانات التشغيلية باستمرار عبر الإدخال اليدوي وعمليات التكامل ومرور الوقت، لذا فإن الدرجة التي بدت صحية في الربع الماضي قد تتراجع بهدوء. تلتقط إعادة القياس المجدولة التدهور مبكرًا، قبل أن يصل إلى تقرير أو نموذج ذكاء اصطناعي.

درجة جودة البيانات في Salesforce

داخل Salesforce، ينطبق النموذج نفسه: تُقاس الأبعاد عبر كائنات مثل Accounts وContacts وLeads، وتُرجَّح، وتُدمج في درجة واحدة يمكنك مراقبتها على لوحة معلومات.

يقيس DQS (Data Quality Score) هذا أصليًا — دون تصدير للبيانات — عبر الأبعاد الخمسة، ويضيف اكتشاف PII للجاهزية للذكاء الاصطناعي. لمعرفة كيف تُبنى الدرجة وتُقرأ داخل نظام CRM، تابع مع:

الأسئلة الشائعة

ما هي درجة جودة البيانات؟

درجة جودة البيانات هي رقم واحد، يُعبَّر عنه عادةً كنسبة مئوية من 0 إلى 100، يلخّص مدى صلاحية بياناتك للاستخدام المخصّص لها. تُحسب كمتوسط موزون لأبعاد الجودة الفردية مثل الاكتمال والصحة والتفرّد والحداثة والاتساق.

كيف تُحسب درجة جودة البيانات؟

يُقاس كل بُعد من أبعاد الجودة كمعدّل نجاح — أي حصة السجلات أو القيم التي تستوفي قاعدة محدّدة. ثم تُدمج درجات الأبعاد هذه في متوسط موزون، حيث يعكس وزن كل بُعد مدى أهميته للعمل. والنتيجة هي نسبة مئوية واحدة بين 0 و100.

ما هي درجة جودة البيانات الجيدة؟

لا توجد علامة نجاح عالمية، لأن الهدف الصحيح يعتمد على الغرض الذي تُستخدم فيه البيانات. وكقاعدة عامة، يُتوقّع 95% أو أعلى للبيانات التي يراها العملاء والبيانات الخاضعة للتنظيم، و85% أو أعلى مقبول للبيانات التشغيلية العامة، وأي شيء دون 70% يشير إلى بيانات تحتاج إلى معالجة قبل أن يمكن الوثوق بها.

هل درجة جودة البيانات هي نفسها درجة موثوقية البيانات؟

نعم. يُستخدم المصطلحان بالتبادل. كلاهما يصف رقمًا مركّبًا واحدًا يعبّر عن مدى موثوقية مجموعة البيانات عبر دمج عدة أبعاد جودة أساسية في رقم واحد يمكنك متابعته بمرور الوقت.

الخطوات التالية