ما هو الـ Definition؟
الـ Definition هو فحص جودة البيانات الذي أعددته في DQS. يحدّد أي كائن Salesforce يُحلَّل، وأي حقول تُشمل، وأي قدرات تُقاس، وأي عتبات تُطبَّق.
فكّر في الـ Definition كوصفة طهي. تخبر DQS بأي مكوّنات (حقول) يفحص وبأي معايير (عتبات) يطبّق. ويتّبع DQS وصفتك في كل مرة تُجري فيها فحصًا.
معالج الخطوات الخمس
يرشدك Definition Builder عبر خمس خطوات:
- اختيار القدرات - اختر ما تريد قياسه
- تحديد النطاق - اختر أي كائن وحقول
- إضافة المرشّحات - ضيّق مجموعة السجلات (اختياري)
- الإعداد - اضبط العتبات والخيارات
- المراجعة - تحقّق وفعّل
تبني كل خطوة على سابقتها. يمكنك حفظ تقدّمك في أي خطوة والعودة لاحقًا.
الخطوة 1: اختيار القدرات
في هذه الخطوة، تختار أبعاد جودة البيانات التي تريد قياسها.
القدرات المتاحة
يعرض المعالج لوحتين:
جودة البيانات (النظافة التشغيلية)
- Completeness - هل الحقول معبّأة؟
- Validity - هل تطابق القيم الصيغ المتوقّعة؟
- Uniqueness - هل السجلات متمايزة؟
- Timeliness - هل البيانات حديثة؟
- Consistency - هل القيم موحّدة؟
الجاهزية للذكاء الاصطناعي (التحضير لـ Agentforce)
- PII Detection - هل البيانات الحساسة محمية قبل انكشافها للذكاء الاصطناعي؟
اختيار القدرات
- انقر بطاقة قدرة لاختيارها
- تُبرَز البطاقة وتظهر علامة اختيار
- اختر عدّة قدرات لتحليل شامل
- انقر مرة أخرى لإلغاء الاختيار
نصيحة: ابدأ بقدرتين إلى ثلاث في أول Definition لك. يمكنك إضافة المزيد لاحقًا.
أفضل ممارسة: ابدأ مركّزًا
اختر القدرات بناءً على هدفك المباشر:
| الهدف | القدرات المُوصى بها |
|---|---|
| تحسين جودة إدخال البيانات | Completeness, Validity |
| العثور على التكرارات | Uniqueness |
| تنظيف السجلات المتقادمة | Timeliness |
| التحضير للذكاء الاصطناعي/Agentforce | جميع قدرات الجاهزية للذكاء الاصطناعي |
| تدقيق بيانات كامل | جميع القدرات |
انقر Continue عندما تنتهي من اختيار القدرات.
الخطوة 2: تحديد النطاق
في هذه الخطوة، تختار أي كائن Salesforce وحقول تريد تحليلها.
اختيار كائن
- استخدم قائمة منسدلة لمنتقي الكائنات
- ابحث باسم الكائن أو API name
- انقر لاختيار الكائن
يدعم DQS الكائنات القياسية والمخصّصة. يعرض المعالج تسمية الكائن و API name لمساعدتك في اختيار الكائن الصحيح.
نصيحة: ابدأ بكائن عالي القيمة مثل Contact أو Lead أو Account. عادةً ما يكون لهذه الكائنات أكبر أثر على جودة البيانات.
اختيار الحقول
بعد اختيار كائن، يعرض المعالج الحقول المتاحة.
- تُجمَّع الحقول حسب النوع (نص، رقم، تاريخ، إلخ)
- انقر صفّ حقل لاختياره
- استخدم مربّع البحث للعثور على حقول محدّدة
- اختر عدّة حقول للتحليل
يُظهر المعالج أي القدرات تنطبق على كل حقل بناءً على نوع الحقل:
| القدرة | أنواع الحقول المتوافقة |
|---|---|
| Completeness | معظم الأنواع (نص، رقم، تاريخ، picklist، إلخ) |
| Validity | Text، email، phone، URL، picklist |
| Uniqueness | جميع الأنواع |
| Timeliness | Date، DateTime فقط |
| Consistency | Text، picklist، email |
الإعداد لكل حقل
يمكنك ضبط عتبات مختلفة لكل حقل على حدة. هذا مفيد عندما:
- تحتاج الحقول الحرجة إلى عتبات أكثر صرامة
- لبعض الحقول متطلبات صيغة فريدة
- لحقول مختلفة توقعات حداثة مختلفة
انقر أيقونة الترس بجانب حقل للوصول إلى إعدادات ذلك الحقل.
انقر Continue عندما تنتهي من اختيار الحقول.
الخطوة 3: إضافة المرشّحات (اختياري)
تضيّق المرشّحات مجموعة السجلات التي يحلّلها DQS. هذه الخطوة اختيارية لكنها مفيدة لمجموعات البيانات الكبيرة أو حالات الاستخدام المحدّدة.
متى تستخدم المرشّحات
| السيناريو | مثال على المرشّح |
|---|---|
| تحليل الحسابات النشطة فقط | Status = ‘Active’ |
| التركيز على السجلات الحديثة | CreatedDate = LAST_90_DAYS |
| استبعاد بيانات الاختبار | Name does not contain ‘Test’ |
| استهداف مناطق محدّدة | BillingCountry = ‘United States’ |
بناء مرشّح
- انقر Add Condition
- اختر حقلًا من القائمة المنسدلة
- اختر عاملًا (equals، contains، greater than، إلخ)
- أدخل قيمة
- كرّر لإضافة شروط أخرى
منطق المرشّحات
استخدم منطق AND/OR لدمج الشروط:
- AND - يجب أن تتحقّق كل الشروط
- OR - يكفي أن يتحقّق أي شرط
مثال: (Status = 'Active') AND (Industry = 'Technology' OR Industry = 'Finance')
معاينة عدد السجلات
يُظهر المعالج عدد السجلات التي تطابق مرشّحك. استخدم هذا للتحقّق من أن مرشّحك يعمل كما هو متوقّع.
- العدد 0 يعني عدم وجود سجلات مطابقة (راجع مرشّحك)
- العدد المرتفع جدًا قد يحتاج إلى مزيد من الترشيح في المؤسسات الكبيرة
نصيحة: تخطَّ المرشّحات في أول Definition لك للحصول على صورة كاملة. أضِف المرشّحات لاحقًا للتحليل المستهدف.
انقر Continue للمتابعة (أو تخطَّ هذه الخطوة).
الخطوة 4: الإعداد
في هذه الخطوة، تضبط العتبات والخيارات لكل قدرة مختارة.
الإعدادات العالمية مقابل الإعدادات لكل حقل
تنطبق الإعدادات على مستويين:
- عالمي (Global) - إعدادات افتراضية لجميع الحقول
- لكل حقل (Per-Field) - تجاوز الإعدادات لحقول محدّدة
أعِدّ الإعدادات العالمية أولًا، ثم خصّص الحقول الفردية إذا لزم الأمر.
إعداد Completeness
| الخيار | الوصف | الافتراضي |
|---|---|---|
| Treat blanks as incomplete | عدّ القيم المكوّنة من مسافات فقط كمفقودة | Yes |
| Treat placeholders as incomplete | عدّ N/A و TBD و Unknown كمفقودة | Yes |
| Custom placeholder values | أضِف أنماط النائبات الخاصة بك | None |
| Threshold | الحد الأدنى المقبول لنسبة الاكتمال | 95% |
مثال على الإعدادات لـ Contact:
- Threshold: 90% للحقول الاختيارية
- Threshold: 99% للحقول المطلوبة مثل Email
- Placeholders: N/A، TBD، Unknown، -، .
إعداد Validity
| الخيار | الوصف | الافتراضي |
|---|---|---|
| Pattern type | Email، URL، Fixed Length، Custom Regex | |
| Custom regex | نمط التحقّق الخاص بك | None |
| Case sensitive | المطابقة بحسّاسية حالة الأحرف | No |
| Include blank values | عدّ الفراغات كغير صالحة | No |
الأنماط المدمجة:
- Email - صيغة متوافقة مع RFC 5322
- URL - صيغة HTTP/HTTPS
- Fixed Length - عدد أحرف دقيق
إعداد Uniqueness
| الخيار | الوصف | الافتراضي |
|---|---|---|
| Case sensitive | معاملة “ABC” و”abc” كمختلفين | No |
| Threshold | الحد الأدنى المقبول لنسبة التفرّد | 95% |
إعداد Timeliness
| الخيار | الوصف | الافتراضي |
|---|---|---|
| Freshness window (days) | عدد الأيام قبل اعتبار البيانات متقادمة | 90 |
| Grace period (days) | فترة سماح قبل وضع علامة التقادم | 7 |
| Operational range | حدود التاريخ الدنيا/القصوى المتوقّعة | None |
مثال على الإعدادات حسب الحقل:
- LastModifiedDate: نافذة حداثة 30 يومًا
- LastActivityDate: نافذة 90 يومًا
- BirthDate: لا حاجة لفحص الحداثة
إعداد Consistency
| الخيار | الوصف | الافتراضي |
|---|---|---|
| Expected values | قائمة القيم الصالحة | None |
| Import from picklist | تعبئة تلقائية من picklist الحقل | No |
| Case sensitive | المطابقة بحسّاسية حالة الأحرف | No |
| Top N dominant values | إظهار أكثر القيم تكرارًا | 5 |
إعداد PII Detection
| الخيار | الوصف | الافتراضي |
|---|---|---|
| Pattern type | أي أنماط PII تُفحص | All patterns |
| Custom patterns | أضِف أنماط regex الخاصة بك للبيانات الحساسة الخاصة بمؤسستك | None |
مؤشّر تكلفة المعالجة
تُظهر كل قدرة تكلفة معالجة:
| التكلفة | القدرات | الأثر |
|---|---|---|
| LOW | Completeness, Validity | سريع، موارد ضئيلة |
| MEDIUM | Timeliness, Consistency, PII Detection | وقت معالجة معتدل |
| HIGH | Uniqueness | معالجة أطول، مقارنات أكثر |
ضع التكلفة في الاعتبار عند اختيار القدرات لمجموعات البيانات الكبيرة.
انقر Continue عند اكتمال الإعداد.
الخطوة 5: المراجعة
تُظهر الخطوة الأخيرة ملخّصًا لـ Definition الخاص بك.
قائمة تحقّق المراجعة
تحقّق مما يلي قبل التفعيل:
- Object - الكائن الصحيح مختار
- Fields - جميع الحقول المهمّة مشمولة
- Capabilities - الفحوصات المناسبة مختارة
- Filters - عدد السجلات يبدو صحيحًا
- Thresholds - الإعدادات تطابق متطلباتك
ملخّص الـ Definition
يعرض الملخّص:
- اسم الـ Definition (قابل للتحرير)
- الكائن المستهدف وعدد السجلات
- القدرات المختارة مع متغيّراتها
- عدد الحقول لكل قدرة
- تكلفة المعالجة المقدّرة
تسمية الـ Definition
استخدم أسماء وصفية تشير إلى:
- الكائن الذي يُحلَّل
- الغرض أو النطاق
- المالك (اختياري)
أسماء جيدة:
- “Contact Data Quality - Sales Team”
- “Lead AI Readiness Check”
- “Account Completeness - EMEA Region”
أسماء سيئة:
- “Definition 1”
- “Test”
- “My Definition”
الحفظ والتفعيل
لديك خياران:
- Save as Draft - الحفظ دون تفعيل (قابل للتحرير لاحقًا)
- Activate - الحفظ والتجهيز للفحص
يمكن تحرير Definitions المسوّدة. أما Definitions النشطة فمقفلة لكنها جاهزة للتشغيل.
مثال: بناء Contact Definition
لنستعرض إنشاء Contact Data Quality Definition.
الخطوة 1: اختيار القدرات
اختر:
- Completeness (التحقّق من البيانات المفقودة)
- Validity (التحقّق من صيغ البريد الإلكتروني والهاتف)
- Timeliness (العثور على سجلات Contact المتقادمة)
الخطوة 2: تحديد النطاق
Object: Contact
الحقول:
- Email (text، email)
- Phone (phone)
- MailingCity (text)
- MailingState (text)
- MailingCountry (text)
- Title (text)
- LastActivityDate (date)
الخطوة 3: إضافة المرشّحات
الشرط: AccountId != null (Contacts المرتبطة بـ Accounts فقط)
معاينة عدد السجلات: 15,234 سجلًا
الخطوة 4: الإعداد
Completeness:
- Threshold: 90%
- Treat blanks as incomplete: Yes
- Placeholders: N/A، Unknown، TBD
Validity:
- حقل Email: نمط Email
- حقل Phone: نمط Phone (إن توفّر)
Timeliness:
- LastActivityDate: نافذة حداثة 60 يومًا
- Grace period: 14 يومًا
الخطوة 5: المراجعة
الاسم: “Contact Data Quality - Active Accounts”
الملخّص:
- 7 حقول
- 3 قدرات
- 15,234 سجلًا
- التكلفة المقدّرة: LOW
انقر Activate للإكمال.
إدارة الـ Definitions
عرض جميع الـ Definitions
من الشاشة الرئيسية لـ DQS، ترى:
- جميع Definitions الخاصة بك
- الحالة (Draft، Active، Archived)
- تاريخ آخر فحص
- إجراءات سريعة
تحرير الـ Definitions
- Draft - قابل للتحرير بالكامل
- Active - أنشئ نسخة جديدة للتحرير
- Archived - للعرض فقط
أرشفة الـ Definitions
أرشِف Definitions التي لم تعد تحتاجها:
- انقر القائمة المنسدلة
- اختر Archive
- أكّد
تبقى Definitions المؤرشَفة قابلة للعرض لكنها لا تستطيع التشغيل.
استكشاف الأخطاء وإصلاحها
”No fields available”
السبب: القدرات المختارة لا تطابق أنواع الحقول المتاحة.
الحل: اختر قدرات مختلفة أو اختر كائنًا بأنواع حقول متوافقة.
”0 records match filter”
السبب: شروط المرشّح مقيِّدة أكثر من اللازم.
الحل: اضبط قيم المرشّح أو أزل الشروط.
الخطوات التالية
- تشغيل عمليات الفحص: نفّذ الـ Definition الخاص بك
- فهم النتائج: فسّر مخرجات الفحص