Skip to main content

Definition Builder ガイド

5 ステップのウィザードを使って DQS の Definition を作成する手順を解説します。オブジェクト、項目、しきい値、ディメンションの重みを設定しましょう。

Definition とは

Definition(定義)とは、DQS において設定済みのデータ品質チェックのことです。どの Salesforce オブジェクトを分析するか、どの項目を含めるか、どの機能を測定するか、そしてどのしきい値を適用するかを指定します。

Definition はレシピのようなものだと考えてください。あなたは DQS に対して、どの材料(項目)を調べ、どの基準(しきい値)を適用するかを伝えます。DQS は、スキャンを実行するたびにあなたのレシピに従います。

5 ステップのウィザード

Definition Builder は、次の 5 つのステップをガイドします。

  1. Select Capabilities(機能の選択) - 何を測定するかを選ぶ
  2. Define Scope(範囲の定義) - どのオブジェクトと項目を対象にするかを選ぶ
  3. Add Filters(フィルタの追加) - レコードの対象を絞り込む(任意)
  4. Configure(設定) - しきい値とオプションを設定する
  5. Review(確認) - 検証して有効化する

各ステップは前のステップの上に積み上がります。どのステップでも進捗を保存し、後で再開できます。

ステップ 1:Select Capabilities(機能の選択)

このステップでは、どのデータ品質ディメンションを測定するかを選びます。

利用できる機能

ウィザードには 2 つのパネルが表示されます。

Data Quality(運用上の衛生状態)

  • Completeness(完全性) - 項目は入力されているか?
  • Validity(妥当性) - 値は期待される形式に従っているか?
  • Uniqueness(一意性) - レコードは重複していないか?
  • Timeliness(適時性) - データは最新か?
  • Consistency(一貫性) - 値は統一されているか?

AI Readiness(Agentforce への準備)

  • PII Detection(PII 検出) - 機微なデータは、AI に公開される前に保護されているか?

機能を選択する

  1. 機能のカードをクリックして選択する
  2. カードがハイライトされ、チェックマークが表示される
  3. 包括的な分析を行うために複数の機能を選択する
  4. もう一度クリックすると選択が解除される

ヒント: 最初の Definition では 2〜3 個の機能から始めましょう。後から追加できます。

ベストプラクティス:絞り込んで始める

当面の目標に応じて機能を選択しましょう。

目標推奨される機能
データ入力品質を改善するCompleteness、Validity
重複を見つけるUniqueness
古くなったレコードを整理するTimeliness
AI / Agentforce に備えるすべての AI Readiness
データの全面監査すべての機能

機能を選択したら Continue をクリックします。

ステップ 2:Define Scope(範囲の定義)

このステップでは、どの Salesforce オブジェクトと項目を分析するかを選びます。

オブジェクトを選択する

  1. オブジェクト選択のドロップダウンを使う
  2. オブジェクト名または API 名で検索する
  3. クリックしてオブジェクトを選択する

DQS は標準オブジェクトとカスタムオブジェクトに対応しています。正しいものを選べるよう、ウィザードにはオブジェクトのラベルと API 名が表示されます。

ヒント: Contact、Lead、Account のような価値の高いオブジェクトから始めましょう。これらは通常、データ品質の影響が最も大きい対象です。

項目を選択する

オブジェクトを選ぶと、ウィザードに利用可能な項目が表示されます。

  1. 項目はタイプ別(テキスト、数値、日付など)にグループ化される
  2. 項目の行をクリックして選択する
  3. 検索ボックスで特定の項目を探す
  4. 分析対象として複数の項目を選択する

ウィザードは、項目タイプに基づいて、各項目にどの機能が適用できるかを表示します。

機能対応する項目タイプ
Completenessほとんどのタイプ(テキスト、数値、日付、picklist など)
Validityテキスト、メール、電話、URL、picklist
Uniquenessすべてのタイプ
TimelinessDate、DateTime のみ
Consistencyテキスト、picklist、メール

項目ごとの設定

個々の項目に対して異なるしきい値を設定できます。これは次のような場合に役立ちます。

  • 重要な項目により厳しいしきい値が必要なとき
  • 一部の項目に固有の形式要件があるとき
  • 項目ごとに鮮度の期待値が異なるとき

項目の横にある歯車アイコンをクリックすると、項目ごとの設定にアクセスできます。

項目を選択したら Continue をクリックします。

ステップ 3:Add Filters(フィルタの追加・任意)

フィルタは、DQS が分析するレコードの対象を絞り込みます。このステップは任意ですが、大規模なデータセットや特定のユースケースでは役立ちます。

フィルタを使う場面

シナリオフィルタの例
有効な取引先のみを分析するStatus = ‘Active’
最近のレコードに絞るCreatedDate = LAST_90_DAYS
テストデータを除外するName does not contain ‘Test’
特定の地域を対象にするBillingCountry = ‘United States’

フィルタを組み立てる

  1. Add Condition をクリックする
  2. ドロップダウンから項目を選ぶ
  3. 演算子(equals、contains、greater than など)を選ぶ
  4. 値を入力する
  5. 追加の条件について繰り返す

フィルタロジック

AND/OR ロジックを使って条件を組み合わせます。

  • AND - すべての条件が真である必要がある
  • OR - いずれかの条件が真であればよい

例:(Status = 'Active') AND (Industry = 'Technology' OR Industry = 'Finance')

レコード件数のプレビュー

ウィザードは、フィルタに一致するレコードの件数を表示します。これを使って、フィルタが意図どおりに機能していることを確認しましょう。

  • 件数が 0 の場合、一致するレコードがありません(フィルタを確認してください)
  • 件数が非常に多い場合、大規模な組織ではさらなる絞り込みが必要なことがあります

ヒント: 最初の Definition では、全体像をつかむためにフィルタを省略しましょう。的を絞った分析のためには、後からフィルタを追加できます。

Continue をクリックして進みます(またはこのステップをスキップします)。

ステップ 4:Configure(設定)

このステップでは、選択した各機能に対してしきい値とオプションを設定します。

Global と Per-Field の設定

設定は 2 つのレベルで適用されます。

  1. Global(グローバル) - すべての項目に対するデフォルト設定
  2. Per-Field(項目ごと) - 特定の項目に対する上書き設定

まずグローバル設定を行い、必要に応じて個々の項目をカスタマイズしましょう。

Completeness の設定

オプション説明デフォルト
Treat blanks as incomplete空白のみの値を欠落として数えるYes
Treat placeholders as incompleteN/A、TBD、Unknown を欠落として数えるYes
Custom placeholder values独自のプレースホルダーパターンを追加するNone
Threshold許容できる最低完全性 %95%

Contact における設定例:

  • Threshold:任意項目は 90%
  • Threshold:Email のような必須項目は 99%
  • Placeholders:N/A、TBD、Unknown、-、.

Validity の設定

オプション説明デフォルト
Pattern typeEmail、URL、Fixed Length、Custom RegexEmail
Custom regex独自の検証パターンNone
Case sensitive大文字小文字を厳密に一致させるNo
Include blank values空白を無効として数えるNo

組み込みパターン:

  • Email - RFC 5322 準拠の形式
  • URL - HTTP/HTTPS 形式
  • Fixed Length - 厳密な文字数

Uniqueness の設定

オプション説明デフォルト
Case sensitive「ABC」と「abc」を別物として扱うNo
Threshold許容できる最低一意性 %95%

Timeliness の設定

オプション説明デフォルト
Freshness window (days)データが古いとみなされるまでの日数90
Grace period (days)古いとフラグするまでの猶予7
Operational range期待される日付の最小/最大の境界None

項目別の設定例:

  • LastModifiedDate:30 日の鮮度ウィンドウ
  • LastActivityDate:90 日のウィンドウ
  • BirthDate:鮮度チェックは不要

Consistency の設定

オプション説明デフォルト
Expected values有効な値のリストNone
Import from picklist項目の picklist から自動入力するNo
Case sensitive大文字小文字を厳密に一致させるNo
Top N dominant values最頻出値を表示する5

PII Detection の設定

オプション説明デフォルト
Pattern typeスキャン対象とする PII パターンAll patterns
Custom patterns組織固有の機微なデータ向けに独自の正規表現パターンを追加するNone

処理コストインジケーター

各機能には処理コストが表示されます。

コスト機能影響
LOWCompleteness、Validity高速で、リソース消費が最小
MEDIUMTimeliness、Consistency、PII Detection中程度の処理時間
HIGHUniqueness処理が長く、比較がより多い

大規模なデータセットで機能を選ぶ際は、コストを考慮しましょう。

設定が完了したら Continue をクリックします。

ステップ 5:Review(確認)

最後のステップでは、Definition の概要が表示されます。

確認チェックリスト

有効化する前に、次の項目を確認しましょう。

  1. Object - 正しいオブジェクトが選択されているか
  2. Fields - 重要な項目がすべて含まれているか
  3. Capabilities - 適切なチェックが選択されているか
  4. Filters - レコード件数が妥当に見えるか
  5. Thresholds - 設定が要件に合っているか

Definition の概要

概要には次の内容が表示されます。

  • Definition 名(編集可能)
  • 対象オブジェクトとレコード件数
  • バリアントを含む、選択された機能
  • 機能ごとの項目数
  • 推定処理コスト

Definition に名前を付ける

次の点が分かる、説明的な名前を使いましょう。

  • 分析対象のオブジェクト
  • 目的または範囲
  • 担当者(任意)

良い名前の例:

  • 「Contact Data Quality - Sales Team」
  • 「Lead AI Readiness Check」
  • 「Account Completeness - EMEA Region」

良くない名前の例:

  • 「Definition 1」
  • 「Test」
  • 「My Definition」

保存と有効化

2 つの選択肢があります。

  1. Save as Draft - 有効化せずに保存する(後で編集可能)
  2. Activate - 保存してスキャンの準備を整える

下書き(Draft)の Definition は編集できます。有効(Active)な Definition はロックされますが、実行する準備が整っています。

例:Contact の Definition を作成する

Contact のデータ品質 Definition を作成する手順を見ていきましょう。

ステップ 1:Select Capabilities

次を選択します。

  • Completeness(欠落データのチェック)
  • Validity(メールと電話の形式を検証)
  • Timeliness(古くなった Contact レコードを見つける)

ステップ 2:Define Scope

オブジェクト:Contact

項目:

  • Email(text、email)
  • Phone(phone)
  • MailingCity(text)
  • MailingState(text)
  • MailingCountry(text)
  • Title(text)
  • LastActivityDate(date)

ステップ 3:Add Filters

条件:AccountId != null(Account に紐づく Contact のみ)

レコード件数のプレビュー:15,234 件

ステップ 4:Configure

Completeness:

  • Threshold:90%
  • Treat blanks as incomplete:Yes
  • Placeholders:N/A、Unknown、TBD

Validity:

  • Email 項目:Email パターン
  • Phone 項目:Phone パターン(利用可能な場合)

Timeliness:

  • LastActivityDate:60 日の鮮度ウィンドウ
  • Grace period:14 日

ステップ 5:Review

名前:「Contact Data Quality - Active Accounts」

概要:

  • 7 項目
  • 3 機能
  • 15,234 件
  • 推定コスト:LOW

Activate をクリックして完了します。

Definition の管理

すべての Definition を表示する

DQS のホーム画面から、次の内容が確認できます。

  • すべての Definition
  • ステータス(Draft、Active、Archived)
  • 最終スキャン日
  • クイックアクション

Definition を編集する

  • Draft - 完全に編集可能
  • Active - 編集するには新しいバージョンを作成する
  • Archived - 閲覧のみ

Definition をアーカイブする

不要になった Definition をアーカイブします。

  1. ドロップダウンメニューをクリックする
  2. Archive を選択する
  3. 確認する

アーカイブされた Definition は引き続き閲覧できますが、実行はできません。

トラブルシューティング

「No fields available(利用できる項目がありません)」

原因: 選択した機能が、利用可能な項目タイプに一致していません。

対処法: 別の機能を選ぶか、対応する項目タイプを持つオブジェクトを選びましょう。

「0 records match filter(フィルタに一致するレコードが 0 件)」

原因: フィルタの条件が厳しすぎます。

対処法: フィルタの値を調整するか、条件を削除しましょう。

次のステップ