Definition क्या है?
एक Definition DQS में आपका configure किया हुआ data quality check है। यह तय करती है कि किस Salesforce object का विश्लेषण करना है, कौन-से fields शामिल करने हैं, कौन-सी capabilities मापनी हैं, और कौन-से thresholds लागू करने हैं।
एक Definition को एक recipe की तरह समझें। आप DQS को बताते हैं कि किन सामग्रियों (fields) की जाँच करनी है और कौन-से मानक (thresholds) लागू करने हैं। हर बार scan चलाने पर DQS आपकी recipe का पालन करता है।
5-Step Wizard
Definition Builder आपको पाँच चरणों से गुज़ारता है:
- Select Capabilities - चुनें कि क्या मापना है
- Define Scope - तय करें कि कौन-सा object और fields
- Add Filters - record set को सीमित करें (वैकल्पिक)
- Configure - thresholds और options सेट करें
- Review - validate करें और activate करें
हर चरण पिछले चरण पर आगे बढ़ता है। आप किसी भी चरण पर अपनी प्रगति save कर सकते हैं और बाद में लौट सकते हैं।
चरण 1: Select Capabilities
इस चरण में, आप चुनते हैं कि कौन-सी data quality dimensions मापनी हैं।
उपलब्ध Capabilities
Wizard दो panels दिखाता है:
Data Quality (Operational Hygiene)
- Completeness - क्या fields भरे हुए हैं?
- Validity - क्या values अपेक्षित formats से मेल खाती हैं?
- Uniqueness - क्या records अलग-अलग हैं?
- Timeliness - क्या डेटा मौजूदा है?
- Consistency - क्या values एक समान हैं?
AI Readiness (Agentforce Prep)
- PII Detection - क्या संवेदनशील डेटा AI के संपर्क में आने से पहले सुरक्षित है?
Capabilities चुनना
- किसी capability card पर click करके उसे select करें
- card highlight हो जाती है और एक checkmark दिखता है
- एक व्यापक विश्लेषण के लिए कई capabilities select करें
- deselect करने के लिए फिर से click करें
टिप: अपनी पहली Definition के लिए 2-3 capabilities से शुरुआत करें। आप बाद में और जोड़ सकते हैं।
Best Practice: Focused शुरुआत करें
अपने तात्कालिक लक्ष्य के आधार पर capabilities चुनें:
| लक्ष्य | अनुशंसित Capabilities |
|---|---|
| Data entry quality बेहतर करना | Completeness, Validity |
| Duplicates ढूँढना | Uniqueness |
| पुराने records साफ़ करना | Timeliness |
| AI/Agentforce के लिए तैयारी | सभी AI Readiness |
| पूरा data audit | सभी capabilities |
जब आप अपनी capabilities select कर लें तो Continue पर click करें।
चरण 2: Define Scope
इस चरण में, आप चुनते हैं कि किस Salesforce object और fields का विश्लेषण करना है।
Object चुनना
- object picker dropdown का इस्तेमाल करें
- object name या API name से खोजें
- object select करने के लिए click करें
DQS standard और custom दोनों objects को support करता है। सही object चुनने में मदद के लिए wizard object label और API name दिखाता है।
टिप: Contact, Lead या Account जैसे high-value object से शुरुआत करें। आमतौर पर इन्हीं का data quality पर सबसे ज़्यादा असर होता है।
Fields चुनना
object चुनने के बाद, wizard उपलब्ध fields दिखाता है।
- Fields type के अनुसार समूहित होते हैं (text, number, date, आदि)
- किसी field row पर click करके उसे select करें
- खास fields ढूँढने के लिए search box का इस्तेमाल करें
- विश्लेषण के लिए कई fields select करें
Wizard दिखाता है कि field type के आधार पर हर field पर कौन-सी capabilities लागू होती हैं:
| Capability | अनुकूल Field Types |
|---|---|
| Completeness | अधिकांश types (text, number, date, picklist, आदि) |
| Validity | Text, email, phone, URL, picklist |
| Uniqueness | सभी types |
| Timeliness | केवल Date, DateTime |
| Consistency | Text, picklist, email |
Per-Field Configuration
आप अलग-अलग fields के लिए अलग-अलग thresholds सेट कर सकते हैं। यह तब उपयोगी है जब:
- महत्वपूर्ण fields को सख़्त thresholds चाहिए
- कुछ fields की format आवश्यकताएँ अलग हों
- अलग-अलग fields की freshness अपेक्षाएँ अलग हों
per-field settings तक पहुँचने के लिए किसी field के बगल वाले gear icon पर click करें।
जब आप अपने fields select कर लें तो Continue पर click करें।
चरण 3: Add Filters (वैकल्पिक)
Filters यह सीमित करते हैं कि DQS किन records का विश्लेषण करता है। यह चरण वैकल्पिक है लेकिन बड़े datasets या खास use cases के लिए उपयोगी है।
Filters का इस्तेमाल कब करें
| परिदृश्य | Filter उदाहरण |
|---|---|
| केवल active accounts का विश्लेषण करें | Status = ‘Active’ |
| हाल के records पर focus करें | CreatedDate = LAST_90_DAYS |
| Test data को बाहर रखें | Name does not contain ‘Test’ |
| खास regions को target करें | BillingCountry = ‘United States’ |
Filter बनाना
- Add Condition पर click करें
- dropdown से एक field select करें
- एक operator चुनें (equals, contains, greater than, आदि)
- एक value दर्ज करें
- और conditions के लिए दोहराएँ
Filter Logic
Conditions को जोड़ने के लिए AND/OR logic का इस्तेमाल करें:
- AND - सभी conditions सही होनी चाहिए
- OR - कोई भी एक condition सही हो सकती है
उदाहरण: (Status = 'Active') AND (Industry = 'Technology' OR Industry = 'Finance')
Record Count Preview
Wizard दिखाता है कि आपके filter से कितने records मेल खाते हैं। इसका इस्तेमाल यह पक्का करने के लिए करें कि आपका filter उम्मीद के मुताबिक काम करता है।
- 0 की count का मतलब है कोई record मेल नहीं खाता (अपना filter जाँचें)
- बहुत ऊँची count बड़े orgs के लिए और filtering माँग सकती है
टिप: पूरी तस्वीर पाने के लिए अपनी पहली Definition में filters छोड़ दें। targeted विश्लेषण के लिए बाद में filters जोड़ें।
आगे बढ़ने के लिए Continue पर click करें (या इस चरण को छोड़ दें)।
चरण 4: Configure
इस चरण में, आप हर select की गई capability के लिए thresholds और options सेट करते हैं।
Global बनाम Per-Field Settings
Settings दो स्तरों पर लागू होती हैं:
- Global - सभी fields के लिए default settings
- Per-Field - खास fields के लिए settings override करना
पहले global settings configure करें, फिर ज़रूरत हो तो अलग-अलग fields को customize करें।
Completeness Configuration
| Option | विवरण | Default |
|---|---|---|
| Treat blanks as incomplete | केवल whitespace वाली values को गायब गिनें | Yes |
| Treat placeholders as incomplete | N/A, TBD, Unknown को गायब गिनें | Yes |
| Custom placeholder values | अपने खुद के placeholder patterns जोड़ें | None |
| Threshold | न्यूनतम स्वीकार्य completeness % | 95% |
Contact के लिए उदाहरण settings:
- Threshold: optional fields के लिए 90%
- Threshold: Email जैसे ज़रूरी fields के लिए 99%
- Placeholders: N/A, TBD, Unknown, -, .
Validity Configuration
| Option | विवरण | Default |
|---|---|---|
| Pattern type | Email, URL, Fixed Length, Custom Regex | |
| Custom regex | आपका खुद का validation pattern | None |
| Case sensitive | exact case match करें | No |
| Include blank values | blanks को अमान्य गिनें | No |
Built-in patterns:
- Email - RFC 5322 के अनुरूप format
- URL - HTTP/HTTPS format
- Fixed Length - सटीक character count
Uniqueness Configuration
| Option | विवरण | Default |
|---|---|---|
| Case sensitive | ”ABC” और “abc” को अलग मानें | No |
| Threshold | न्यूनतम स्वीकार्य uniqueness % | 95% |
Timeliness Configuration
| Option | विवरण | Default |
|---|---|---|
| Freshness window (days) | कितने दिनों बाद डेटा को पुराना माना जाए | 90 |
| Grace period (days) | पुराना flag करने से पहले का buffer | 7 |
| Operational range | अपेक्षित न्यूनतम/अधिकतम date सीमाएँ | None |
Field के हिसाब से उदाहरण settings:
- LastModifiedDate: 30-दिन का freshness window
- LastActivityDate: 90-दिन का window
- BirthDate: किसी freshness check की ज़रूरत नहीं
Consistency Configuration
| Option | विवरण | Default |
|---|---|---|
| Expected values | मान्य values की सूची | None |
| Import from picklist | field के picklist से अपने आप भरें | No |
| Case sensitive | exact case match करें | No |
| Top N dominant values | सबसे बार-बार आने वाली values दिखाएँ | 5 |
PII Detection Configuration
| Option | विवरण | Default |
|---|---|---|
| Pattern type | किन PII patterns के लिए scan करना है | All patterns |
| Custom patterns | org-specific संवेदनशील डेटा के लिए अपने खुद के regex patterns जोड़ें | None |
Processing Cost Indicator
हर capability एक processing cost दिखाती है:
| Cost | Capabilities | असर |
|---|---|---|
| LOW | Completeness, Validity | तेज़, न्यूनतम resources |
| MEDIUM | Timeliness, Consistency, PII Detection | मध्यम processing time |
| HIGH | Uniqueness | लंबा processing, ज़्यादा comparisons |
बड़े datasets के लिए capabilities चुनते समय cost का ध्यान रखें।
जब configuration पूरी हो जाए तो Continue पर click करें।
चरण 5: Review
अंतिम चरण आपकी Definition का सारांश दिखाता है।
Review Checklist
activate करने से पहले इन बातों की पुष्टि करें:
- Object - सही object select किया गया
- Fields - सभी ज़रूरी fields शामिल हैं
- Capabilities - उपयुक्त checks select किए गए
- Filters - record count सही लग रही है
- Thresholds - settings आपकी आवश्यकताओं से मेल खाती हैं
Definition Summary
सारांश दिखाता है:
- Definition name (editable)
- Target object और record count
- variants के साथ select की गई capabilities
- capability के हिसाब से field count
- अनुमानित processing cost
अपनी Definition का नाम रखना
ऐसे वर्णनात्मक नाम इस्तेमाल करें जो दर्शाएँ:
- कौन-सा object विश्लेषित हो रहा है
- उद्देश्य या scope
- Owner (वैकल्पिक)
अच्छे नाम:
- “Contact Data Quality - Sales Team”
- “Lead AI Readiness Check”
- “Account Completeness - EMEA Region”
खराब नाम:
- “Definition 1”
- “Test”
- “My Definition”
Save और Activate करना
आपके पास दो विकल्प हैं:
- Save as Draft - activate किए बिना save करें (बाद में editable)
- Activate - save करें और scanning के लिए तैयार करें
Draft Definitions को edit किया जा सकता है। Active Definitions locked होती हैं लेकिन चलने के लिए तैयार होती हैं।
उदाहरण: एक Contact Definition बनाना
आइए एक Contact Data Quality Definition बनाने की पूरी प्रक्रिया से गुज़रें।
चरण 1: Select Capabilities
Select करें:
- Completeness (गायब डेटा की जाँच)
- Validity (email और phone formats की पुष्टि)
- Timeliness (पुराने contact records ढूँढना)
चरण 2: Define Scope
Object: Contact
Fields:
- Email (text, email)
- Phone (phone)
- MailingCity (text)
- MailingState (text)
- MailingCountry (text)
- Title (text)
- LastActivityDate (date)
चरण 3: Add Filters
Condition: AccountId != null (केवल Accounts वाले Contacts)
Record count preview: 15,234 records
चरण 4: Configure
Completeness:
- Threshold: 90%
- Treat blanks as incomplete: Yes
- Placeholders: N/A, Unknown, TBD
Validity:
- Email field: Email pattern
- Phone field: Phone pattern (अगर उपलब्ध हो)
Timeliness:
- LastActivityDate: 60-दिन का freshness window
- Grace period: 14 दिन
चरण 5: Review
Name: “Contact Data Quality - Active Accounts”
सारांश:
- 7 fields
- 3 capabilities
- 15,234 records
- अनुमानित cost: LOW
पूरा करने के लिए Activate पर click करें।
Definitions का प्रबंधन
सभी Definitions देखना
DQS home screen से, आप देखते हैं:
- आपकी सभी Definitions
- Status (Draft, Active, Archived)
- आख़िरी scan की तारीख़
- Quick actions
Definitions को Edit करना
- Draft - पूरी तरह editable
- Active - edit करने के लिए एक नया version बनाएँ
- Archived - केवल देखने के लिए
Definitions को Archive करना
जिन Definitions की अब ज़रूरत नहीं, उन्हें Archive करें:
- dropdown menu पर click करें
- Archive select करें
- पुष्टि करें
Archived Definitions देखी जा सकती हैं लेकिन चल नहीं सकतीं।
समस्या-समाधान
”No fields available”
कारण: Select की गई capabilities उपलब्ध field types से मेल नहीं खातीं।
समाधान: अलग capabilities select करें या अनुकूल field types वाला object चुनें।
“0 records match filter”
कारण: Filter conditions बहुत ज़्यादा प्रतिबंधक हैं।
समाधान: filter values समायोजित करें या conditions हटाएँ।
अगले कदम
- Running Scans: अपनी Definition चलाएँ
- Understanding Results: scan outputs की व्याख्या करें