Definition とは
Definition(定義)とは、DQS において設定済みのデータ品質チェックのことです。どの Salesforce オブジェクトを分析するか、どの項目を含めるか、どの機能を測定するか、そしてどのしきい値を適用するかを指定します。
Definition はレシピのようなものだと考えてください。あなたは DQS に対して、どの材料(項目)を調べ、どの基準(しきい値)を適用するかを伝えます。DQS は、スキャンを実行するたびにあなたのレシピに従います。
5 ステップのウィザード
Definition Builder は、次の 5 つのステップをガイドします。
- Select Capabilities(機能の選択) - 何を測定するかを選ぶ
- Define Scope(範囲の定義) - どのオブジェクトと項目を対象にするかを選ぶ
- Add Filters(フィルタの追加) - レコードの対象を絞り込む(任意)
- Configure(設定) - しきい値とオプションを設定する
- Review(確認) - 検証して有効化する
各ステップは前のステップの上に積み上がります。どのステップでも進捗を保存し、後で再開できます。
ステップ 1:Select Capabilities(機能の選択)
このステップでは、どのデータ品質ディメンションを測定するかを選びます。
利用できる機能
ウィザードには 2 つのパネルが表示されます。
Data Quality(運用上の衛生状態)
- Completeness(完全性) - 項目は入力されているか?
- Validity(妥当性) - 値は期待される形式に従っているか?
- Uniqueness(一意性) - レコードは重複していないか?
- Timeliness(適時性) - データは最新か?
- Consistency(一貫性) - 値は統一されているか?
AI Readiness(Agentforce への準備)
- PII Detection(PII 検出) - 機微なデータは、AI に公開される前に保護されているか?
機能を選択する
- 機能のカードをクリックして選択する
- カードがハイライトされ、チェックマークが表示される
- 包括的な分析を行うために複数の機能を選択する
- もう一度クリックすると選択が解除される
ヒント: 最初の Definition では 2〜3 個の機能から始めましょう。後から追加できます。
ベストプラクティス:絞り込んで始める
当面の目標に応じて機能を選択しましょう。
| 目標 | 推奨される機能 |
|---|---|
| データ入力品質を改善する | Completeness、Validity |
| 重複を見つける | Uniqueness |
| 古くなったレコードを整理する | Timeliness |
| AI / Agentforce に備える | すべての AI Readiness |
| データの全面監査 | すべての機能 |
機能を選択したら Continue をクリックします。
ステップ 2:Define Scope(範囲の定義)
このステップでは、どの Salesforce オブジェクトと項目を分析するかを選びます。
オブジェクトを選択する
- オブジェクト選択のドロップダウンを使う
- オブジェクト名または API 名で検索する
- クリックしてオブジェクトを選択する
DQS は標準オブジェクトとカスタムオブジェクトに対応しています。正しいものを選べるよう、ウィザードにはオブジェクトのラベルと API 名が表示されます。
ヒント: Contact、Lead、Account のような価値の高いオブジェクトから始めましょう。これらは通常、データ品質の影響が最も大きい対象です。
項目を選択する
オブジェクトを選ぶと、ウィザードに利用可能な項目が表示されます。
- 項目はタイプ別(テキスト、数値、日付など)にグループ化される
- 項目の行をクリックして選択する
- 検索ボックスで特定の項目を探す
- 分析対象として複数の項目を選択する
ウィザードは、項目タイプに基づいて、各項目にどの機能が適用できるかを表示します。
| 機能 | 対応する項目タイプ |
|---|---|
| Completeness | ほとんどのタイプ(テキスト、数値、日付、picklist など) |
| Validity | テキスト、メール、電話、URL、picklist |
| Uniqueness | すべてのタイプ |
| Timeliness | Date、DateTime のみ |
| Consistency | テキスト、picklist、メール |
項目ごとの設定
個々の項目に対して異なるしきい値を設定できます。これは次のような場合に役立ちます。
- 重要な項目により厳しいしきい値が必要なとき
- 一部の項目に固有の形式要件があるとき
- 項目ごとに鮮度の期待値が異なるとき
項目の横にある歯車アイコンをクリックすると、項目ごとの設定にアクセスできます。
項目を選択したら Continue をクリックします。
ステップ 3:Add Filters(フィルタの追加・任意)
フィルタは、DQS が分析するレコードの対象を絞り込みます。このステップは任意ですが、大規模なデータセットや特定のユースケースでは役立ちます。
フィルタを使う場面
| シナリオ | フィルタの例 |
|---|---|
| 有効な取引先のみを分析する | Status = ‘Active’ |
| 最近のレコードに絞る | CreatedDate = LAST_90_DAYS |
| テストデータを除外する | Name does not contain ‘Test’ |
| 特定の地域を対象にする | BillingCountry = ‘United States’ |
フィルタを組み立てる
- Add Condition をクリックする
- ドロップダウンから項目を選ぶ
- 演算子(equals、contains、greater than など)を選ぶ
- 値を入力する
- 追加の条件について繰り返す
フィルタロジック
AND/OR ロジックを使って条件を組み合わせます。
- AND - すべての条件が真である必要がある
- OR - いずれかの条件が真であればよい
例:(Status = 'Active') AND (Industry = 'Technology' OR Industry = 'Finance')
レコード件数のプレビュー
ウィザードは、フィルタに一致するレコードの件数を表示します。これを使って、フィルタが意図どおりに機能していることを確認しましょう。
- 件数が 0 の場合、一致するレコードがありません(フィルタを確認してください)
- 件数が非常に多い場合、大規模な組織ではさらなる絞り込みが必要なことがあります
ヒント: 最初の Definition では、全体像をつかむためにフィルタを省略しましょう。的を絞った分析のためには、後からフィルタを追加できます。
Continue をクリックして進みます(またはこのステップをスキップします)。
ステップ 4:Configure(設定)
このステップでは、選択した各機能に対してしきい値とオプションを設定します。
Global と Per-Field の設定
設定は 2 つのレベルで適用されます。
- Global(グローバル) - すべての項目に対するデフォルト設定
- Per-Field(項目ごと) - 特定の項目に対する上書き設定
まずグローバル設定を行い、必要に応じて個々の項目をカスタマイズしましょう。
Completeness の設定
| オプション | 説明 | デフォルト |
|---|---|---|
| Treat blanks as incomplete | 空白のみの値を欠落として数える | Yes |
| Treat placeholders as incomplete | N/A、TBD、Unknown を欠落として数える | Yes |
| Custom placeholder values | 独自のプレースホルダーパターンを追加する | None |
| Threshold | 許容できる最低完全性 % | 95% |
Contact における設定例:
- Threshold:任意項目は 90%
- Threshold:Email のような必須項目は 99%
- Placeholders:N/A、TBD、Unknown、-、.
Validity の設定
| オプション | 説明 | デフォルト |
|---|---|---|
| Pattern type | Email、URL、Fixed Length、Custom Regex | |
| Custom regex | 独自の検証パターン | None |
| Case sensitive | 大文字小文字を厳密に一致させる | No |
| Include blank values | 空白を無効として数える | No |
組み込みパターン:
- Email - RFC 5322 準拠の形式
- URL - HTTP/HTTPS 形式
- Fixed Length - 厳密な文字数
Uniqueness の設定
| オプション | 説明 | デフォルト |
|---|---|---|
| Case sensitive | 「ABC」と「abc」を別物として扱う | No |
| Threshold | 許容できる最低一意性 % | 95% |
Timeliness の設定
| オプション | 説明 | デフォルト |
|---|---|---|
| Freshness window (days) | データが古いとみなされるまでの日数 | 90 |
| Grace period (days) | 古いとフラグするまでの猶予 | 7 |
| Operational range | 期待される日付の最小/最大の境界 | None |
項目別の設定例:
- LastModifiedDate:30 日の鮮度ウィンドウ
- LastActivityDate:90 日のウィンドウ
- BirthDate:鮮度チェックは不要
Consistency の設定
| オプション | 説明 | デフォルト |
|---|---|---|
| Expected values | 有効な値のリスト | None |
| Import from picklist | 項目の picklist から自動入力する | No |
| Case sensitive | 大文字小文字を厳密に一致させる | No |
| Top N dominant values | 最頻出値を表示する | 5 |
PII Detection の設定
| オプション | 説明 | デフォルト |
|---|---|---|
| Pattern type | スキャン対象とする PII パターン | All patterns |
| Custom patterns | 組織固有の機微なデータ向けに独自の正規表現パターンを追加する | None |
処理コストインジケーター
各機能には処理コストが表示されます。
| コスト | 機能 | 影響 |
|---|---|---|
| LOW | Completeness、Validity | 高速で、リソース消費が最小 |
| MEDIUM | Timeliness、Consistency、PII Detection | 中程度の処理時間 |
| HIGH | Uniqueness | 処理が長く、比較がより多い |
大規模なデータセットで機能を選ぶ際は、コストを考慮しましょう。
設定が完了したら Continue をクリックします。
ステップ 5:Review(確認)
最後のステップでは、Definition の概要が表示されます。
確認チェックリスト
有効化する前に、次の項目を確認しましょう。
- Object - 正しいオブジェクトが選択されているか
- Fields - 重要な項目がすべて含まれているか
- Capabilities - 適切なチェックが選択されているか
- Filters - レコード件数が妥当に見えるか
- Thresholds - 設定が要件に合っているか
Definition の概要
概要には次の内容が表示されます。
- Definition 名(編集可能)
- 対象オブジェクトとレコード件数
- バリアントを含む、選択された機能
- 機能ごとの項目数
- 推定処理コスト
Definition に名前を付ける
次の点が分かる、説明的な名前を使いましょう。
- 分析対象のオブジェクト
- 目的または範囲
- 担当者(任意)
良い名前の例:
- 「Contact Data Quality - Sales Team」
- 「Lead AI Readiness Check」
- 「Account Completeness - EMEA Region」
良くない名前の例:
- 「Definition 1」
- 「Test」
- 「My Definition」
保存と有効化
2 つの選択肢があります。
- Save as Draft - 有効化せずに保存する(後で編集可能)
- Activate - 保存してスキャンの準備を整える
下書き(Draft)の Definition は編集できます。有効(Active)な Definition はロックされますが、実行する準備が整っています。
例:Contact の Definition を作成する
Contact のデータ品質 Definition を作成する手順を見ていきましょう。
ステップ 1:Select Capabilities
次を選択します。
- Completeness(欠落データのチェック)
- Validity(メールと電話の形式を検証)
- Timeliness(古くなった Contact レコードを見つける)
ステップ 2:Define Scope
オブジェクト:Contact
項目:
- Email(text、email)
- Phone(phone)
- MailingCity(text)
- MailingState(text)
- MailingCountry(text)
- Title(text)
- LastActivityDate(date)
ステップ 3:Add Filters
条件:AccountId != null(Account に紐づく Contact のみ)
レコード件数のプレビュー:15,234 件
ステップ 4:Configure
Completeness:
- Threshold:90%
- Treat blanks as incomplete:Yes
- Placeholders:N/A、Unknown、TBD
Validity:
- Email 項目:Email パターン
- Phone 項目:Phone パターン(利用可能な場合)
Timeliness:
- LastActivityDate:60 日の鮮度ウィンドウ
- Grace period:14 日
ステップ 5:Review
名前:「Contact Data Quality - Active Accounts」
概要:
- 7 項目
- 3 機能
- 15,234 件
- 推定コスト:LOW
Activate をクリックして完了します。
Definition の管理
すべての Definition を表示する
DQS のホーム画面から、次の内容が確認できます。
- すべての Definition
- ステータス(Draft、Active、Archived)
- 最終スキャン日
- クイックアクション
Definition を編集する
- Draft - 完全に編集可能
- Active - 編集するには新しいバージョンを作成する
- Archived - 閲覧のみ
Definition をアーカイブする
不要になった Definition をアーカイブします。
- ドロップダウンメニューをクリックする
- Archive を選択する
- 確認する
アーカイブされた Definition は引き続き閲覧できますが、実行はできません。
トラブルシューティング
「No fields available(利用できる項目がありません)」
原因: 選択した機能が、利用可能な項目タイプに一致していません。
対処法: 別の機能を選ぶか、対応する項目タイプを持つオブジェクトを選びましょう。
「0 records match filter(フィルタに一致するレコードが 0 件)」
原因: フィルタの条件が厳しすぎます。
対処法: フィルタの値を調整するか、条件を削除しましょう。