Che cos’è una Definition?
Una Definition è il vostro controllo di qualità dei dati configurato in DQS. Specifica quale oggetto Salesforce analizzare, quali campi includere, quali capability misurare e quali soglie applicare.
Pensate a una Definition come a una ricetta. Indicate a DQS quali ingredienti (campi) esaminare e quali standard (soglie) applicare. DQS segue la vostra ricetta ogni volta che lanciate una scansione.
La procedura guidata in 5 passaggi
Il Definition Builder vi guida attraverso cinque passaggi:
- Selezionare le capability - scegliere cosa misurare
- Definire l’ambito - scegliere oggetto e campi
- Aggiungere filtri - restringere l’insieme di record (opzionale)
- Configurare - impostare soglie e opzioni
- Revisionare - convalidare e attivare
Ogni passaggio si basa sul precedente. Potete salvare i progressi in qualsiasi passaggio e riprendere in seguito.
Passaggio 1: Selezionare le capability
In questo passaggio scegliete quali dimensioni di qualità dei dati misurare.
Capability disponibili
La procedura guidata mostra due pannelli:
Data Quality (igiene operativa)
- Completezza - i campi sono compilati?
- Validità - i valori rispettano i formati attesi?
- Unicità - i record sono distinti?
- Tempestività - i dati sono aggiornati?
- Coerenza - i valori sono uniformi?
AI Readiness (preparazione ad Agentforce)
- Rilevamento PII - i dati sensibili sono protetti prima dell’esposizione all’AI?
Selezionare le capability
- Cliccate una scheda capability per selezionarla
- La scheda si evidenzia e compare un segno di spunta
- Selezionate più capability per un’analisi completa
- Cliccate di nuovo per deselezionare
Suggerimento: iniziate con 2-3 capability per la vostra prima Definition. Potete aggiungerne altre in seguito.
Migliore pratica: iniziare in modo mirato
Selezionate le capability in base al vostro obiettivo immediato:
| Obiettivo | Capability consigliate |
|---|---|
| Migliorare la qualità dell’inserimento dati | Completezza, Validità |
| Trovare i duplicati | Unicità |
| Ripulire i record obsoleti | Tempestività |
| Prepararsi per l’AI/Agentforce | Tutte le AI Readiness |
| Audit completo dei dati | Tutte le capability |
Cliccate Continue dopo aver selezionato le capability.
Passaggio 2: Definire l’ambito
In questo passaggio scegliete quale oggetto Salesforce e quali campi analizzare.
Selezionare un oggetto
- Utilizzate il menu a tendina di selezione dell’oggetto
- Cercate per nome dell’oggetto o nome API
- Cliccate per selezionare l’oggetto
DQS supporta oggetti standard e custom. La procedura guidata mostra l’etichetta dell’oggetto e il nome API per aiutarvi a selezionare quello corretto.
Suggerimento: iniziate con un oggetto ad alto valore come Contact, Lead o Account. Di solito sono quelli con il maggiore impatto sulla qualità dei dati.
Selezionare i campi
Dopo aver scelto un oggetto, la procedura guidata mostra i campi disponibili.
- I campi sono raggruppati per tipo (testo, numero, data, ecc.)
- Cliccate la riga di un campo per selezionarlo
- Utilizzate la casella di ricerca per trovare campi specifici
- Selezionate più campi per l’analisi
La procedura guidata mostra quali capability si applicano a ciascun campo in base al tipo di campo:
| Capability | Tipi di campo compatibili |
|---|---|
| Completezza | La maggior parte dei tipi (testo, numero, data, picklist, ecc.) |
| Validità | Testo, email, telefono, URL, picklist |
| Unicità | Tutti i tipi |
| Tempestività | Solo Date e DateTime |
| Coerenza | Testo, picklist, email |
Configurazione per campo
Potete impostare soglie diverse per i singoli campi. È utile quando:
- I campi critici richiedono soglie più rigide
- Alcuni campi hanno requisiti di formato particolari
- Campi diversi hanno aspettative di freschezza diverse
Cliccate l’icona a forma di ingranaggio accanto a un campo per accedere alle impostazioni per campo.
Cliccate Continue dopo aver selezionato i campi.
Passaggio 3: Aggiungere filtri (opzionale)
I filtri restringono i record che DQS analizza. Questo passaggio è opzionale ma utile per dataset di grandi dimensioni o casi d’uso specifici.
Quando usare i filtri
| Scenario | Esempio di filtro |
|---|---|
| Analizzare solo gli account attivi | Status = ‘Active’ |
| Concentrarsi sui record recenti | CreatedDate = LAST_90_DAYS |
| Escludere i dati di test | Name does not contain ‘Test’ |
| Mirare a regioni specifiche | BillingCountry = ‘United States’ |
Costruire un filtro
- Cliccate Add Condition
- Selezionate un campo dal menu a tendina
- Scegliete un operatore (uguale a, contiene, maggiore di, ecc.)
- Inserite un valore
- Ripetete per ulteriori condizioni
Logica dei filtri
Utilizzate la logica AND/OR per combinare le condizioni:
- AND - tutte le condizioni devono essere vere
- OR - è sufficiente che una condizione sia vera
Esempio: (Status = 'Active') AND (Industry = 'Technology' OR Industry = 'Finance')
Anteprima del conteggio dei record
La procedura guidata mostra quanti record corrispondono al vostro filtro. Usatela per verificare che il filtro funzioni come previsto.
- Un conteggio pari a 0 significa che nessun record corrisponde (controllate il filtro)
- Un conteggio molto alto potrebbe richiedere ulteriori filtri nelle org di grandi dimensioni
Suggerimento: saltate i filtri per la vostra prima Definition per avere un quadro completo. Aggiungete i filtri in seguito per analisi mirate.
Cliccate Continue per procedere (oppure saltate questo passaggio).
Passaggio 4: Configurare
In questo passaggio impostate soglie e opzioni per ogni capability selezionata.
Impostazioni globali vs per campo
Le impostazioni si applicano su due livelli:
- Globale - impostazioni predefinite per tutti i campi
- Per campo - impostazioni che sovrascrivono quelle globali per campi specifici
Configurate prima le impostazioni globali, poi personalizzate i singoli campi se necessario.
Configurazione della Completezza
| Opzione | Descrizione | Default |
|---|---|---|
| Trattare i vuoti come incompleti | Conta i valori composti solo da spazi come mancanti | Sì |
| Trattare i segnaposto come incompleti | Conta N/A, TBD, Unknown come mancanti | Sì |
| Valori segnaposto personalizzati | Aggiungete i vostri pattern di segnaposto | Nessuno |
| Soglia | % di completezza minima accettabile | 95% |
Esempio di impostazioni per Contact:
- Soglia: 90% per i campi facoltativi
- Soglia: 99% per i campi obbligatori come Email
- Segnaposto: N/A, TBD, Unknown, -, .
Configurazione della Validità
| Opzione | Descrizione | Default |
|---|---|---|
| Tipo di pattern | Email, URL, Fixed Length, Custom Regex | |
| Regex personalizzata | Il vostro pattern di validazione | Nessuno |
| Distinzione maiuscole/minuscole | Confronto esatto di maiuscole e minuscole | No |
| Includere i valori vuoti | Conta i vuoti come non validi | No |
Pattern integrati:
- Email - formato conforme a RFC 5322
- URL - formato HTTP/HTTPS
- Fixed Length - numero esatto di caratteri
Configurazione dell’Unicità
| Opzione | Descrizione | Default |
|---|---|---|
| Distinzione maiuscole/minuscole | Tratta “ABC” e “abc” come diversi | No |
| Soglia | % di unicità minima accettabile | 95% |
Configurazione della Tempestività
| Opzione | Descrizione | Default |
|---|---|---|
| Finestra di freschezza (giorni) | Giorni prima che i dati siano considerati obsoleti | 90 |
| Periodo di tolleranza (giorni) | Margine prima di segnalare come obsoleto | 7 |
| Intervallo operativo | Limiti di data minimo/massimo attesi | Nessuno |
Esempio di impostazioni per campo:
- LastModifiedDate: finestra di freschezza di 30 giorni
- LastActivityDate: finestra di 90 giorni
- BirthDate: nessun controllo di freschezza necessario
Configurazione della Coerenza
| Opzione | Descrizione | Default |
|---|---|---|
| Valori attesi | Elenco dei valori validi | Nessuno |
| Importa da picklist | Popola automaticamente dalla picklist del campo | No |
| Distinzione maiuscole/minuscole | Confronto esatto di maiuscole e minuscole | No |
| Top N valori dominanti | Mostra i valori più frequenti | 5 |
Configurazione del Rilevamento PII
| Opzione | Descrizione | Default |
|---|---|---|
| Tipo di pattern | Quali pattern PII scansionare | Tutti i pattern |
| Pattern personalizzati | Aggiungete i vostri pattern regex per dati sensibili specifici dell’org | Nessuno |
Indicatore del costo di elaborazione
Ogni capability mostra un costo di elaborazione:
| Costo | Capability | Impatto |
|---|---|---|
| LOW | Completezza, Validità | Veloce, risorse minime |
| MEDIUM | Tempestività, Coerenza, Rilevamento PII | Tempo di elaborazione moderato |
| HIGH | Unicità | Elaborazione più lunga, più confronti |
Tenete conto del costo quando selezionate le capability per dataset di grandi dimensioni.
Cliccate Continue al termine della configurazione.
Passaggio 5: Revisionare
L’ultimo passaggio mostra un riepilogo della vostra Definition.
Lista di controllo per la revisione
Verificate quanto segue prima di attivare:
- Oggetto - oggetto corretto selezionato
- Campi - tutti i campi importanti inclusi
- Capability - controlli appropriati selezionati
- Filtri - il conteggio dei record sembra corretto
- Soglie - le impostazioni corrispondono ai vostri requisiti
Riepilogo della Definition
Il riepilogo mostra:
- Nome della Definition (modificabile)
- Oggetto di destinazione e conteggio dei record
- Capability selezionate con le varianti
- Numero di campi per capability
- Costo di elaborazione stimato
Assegnare un nome alla Definition
Utilizzate nomi descrittivi che indichino:
- L’oggetto analizzato
- Lo scopo o l’ambito
- Il proprietario (facoltativo)
Nomi efficaci:
- “Contact Data Quality - Sales Team”
- “Lead AI Readiness Check”
- “Account Completeness - EMEA Region”
Nomi inefficaci:
- “Definition 1”
- “Test”
- “My Definition”
Salvataggio e attivazione
Avete due opzioni:
- Save as Draft - salva senza attivare (modificabile in seguito)
- Activate - salva e rende pronta per la scansione
Le Definition in stato Draft possono essere modificate. Le Definition Active sono bloccate ma pronte per l’esecuzione.
Esempio: costruire una Definition per Contact
Vediamo insieme come creare una Definition di qualità dei dati per Contact.
Passaggio 1: Selezionare le capability
Selezionate:
- Completezza (verifica i dati mancanti)
- Validità (verifica i formati di email e telefono)
- Tempestività (individua i record di contatto obsoleti)
Passaggio 2: Definire l’ambito
Oggetto: Contact
Campi:
- Email (testo, email)
- Phone (telefono)
- MailingCity (testo)
- MailingState (testo)
- MailingCountry (testo)
- Title (testo)
- LastActivityDate (data)
Passaggio 3: Aggiungere filtri
Condizione: AccountId != null (solo i Contact con Account)
Anteprima del conteggio dei record: 15.234 record
Passaggio 4: Configurare
Completezza:
- Soglia: 90%
- Trattare i vuoti come incompleti: Sì
- Segnaposto: N/A, Unknown, TBD
Validità:
- Campo Email: pattern Email
- Campo Phone: pattern Phone (se disponibile)
Tempestività:
- LastActivityDate: finestra di freschezza di 60 giorni
- Periodo di tolleranza: 14 giorni
Passaggio 5: Revisionare
Nome: “Contact Data Quality - Active Accounts”
Riepilogo:
- 7 campi
- 3 capability
- 15.234 record
- Costo stimato: LOW
Cliccate Activate per completare.
Gestire le Definition
Visualizzare tutte le Definition
Dalla schermata principale di DQS vedete:
- Tutte le vostre Definition
- Lo stato (Draft, Active, Archived)
- La data dell’ultima scansione
- Le azioni rapide
Modificare le Definition
- Draft - completamente modificabile
- Active - create una nuova versione per modificarla
- Archived - sola visualizzazione
Archiviare le Definition
Archiviate le Definition che non vi servono più:
- Aprite il menu a tendina
- Selezionate Archive
- Confermate
Le Definition archiviate restano visualizzabili ma non possono essere eseguite.
Risoluzione dei problemi
”No fields available”
Causa: le capability selezionate non corrispondono ai tipi di campo disponibili.
Soluzione: selezionate capability diverse o scegliete un oggetto con tipi di campo compatibili.
”0 records match filter”
Causa: le condizioni del filtro sono troppo restrittive.
Soluzione: modificate i valori del filtro o rimuovete delle condizioni.
Prossimi passi
- Esecuzione delle scansioni: eseguite la vostra Definition
- Interpretare i risultati: interpretate gli output delle scansioni