Salesforceの重複データを完全削除!初心者でも分かる3つの方法と予防策
目次
Salesforceに「同じ会社名が複数」「表記がバラバラ」といったデータが眠っていませんか? その“重複”は、知らず知らずのうちに営業アプローチのミスや不正確なレポートを生み、ビジネスの足を引っ張る原因になります。
この記事では、非エンジニアの方でも安心して実践できるよう、重複データの削除・統合手順を徹底解説。手軽な手動マージから大量データの一括削除、さらに根本的な再発防止策まで、この記事一つで全てが分かります。信頼できるデータで、Salesforceの価値を最大限に引き出しましょう。
Salesforceでデータ重複が起きてしまう主な原因
解決策に取り組む前に、まずは「なぜ重複データが発生するのか」という根本原因を理解することが重要です。原因を知ることで、効果的な対策を立てることができます。
原因1:手動入力によるミスや表記ゆれ
最も一般的で、防ぎにくいのが手動入力による重複です。複数の担当者がそれぞれのルールで顧客情報を入力することで、意図せず重複データが生まれてしまいます。
手動入力によるミスや表記ゆれの具体例
| 項目 | 具体例 |
|---|---|
| 会社名の表記ゆれ | 「株式会社ABC」、「(株)ABC」、「ABC株式会社」など |
| 担当者名の漢字・カナ違い | 「山田 太郎」と「山田 太朗」、「ヤマダ タロウ」など |
| 電話番号や住所のフォーマット違い | ハイフンの有無、半角・全角の違い、都道府県名の有無など |
| 単純な入力ミス・確認漏れ | 登録前に既存データがないかを確認せず、新規で作成してしまうケース |
原因2:外部システムからのデータ連携・インポート
セミナー参加者リストや名刺管理ツールなど、外部システムからデータを一括でインポートする際にも重複は発生しがちです。多くのインポートツールには重複を確認する機能がありますが、キーとなる項目(メールアドレスなど)が異なっている場合、システムは別のデータと判断してしまい、結果として重複レコードが作成されます。
原因3:重複ルールが設定されていない
Salesforceには、データの重複を防ぐための「重複ルール」という効果的な機能があります。このルールを事前に設定しておくことで、ユーザーが重複の可能性があるレコードを作成・編集しようとした際に、警告を表示したり、作成をブロックしたりできます。この重複ルールが設定されていない、あるいは設定が不十分な状態だと、チェック機能が働かず、重複データが容易に作成されてしまいます。
重複レコードの特定方法
対策を講じる前に、まずは自社のSalesforce環境にどれくらいの重複データが存在するのかを把握しましょう。Salesforceの標準機能である「レポート」機能を使うと、重複の可能性があるレコードを簡単に見つけ出すことができます。
例えば、「取引先」オブジェクトで、名前が完全に一致するレコードや、電話番号が一致するレコードをグループ化するレポートを作成します。グループ化された結果で、レコード数が2以上になっているものが重複の候補となります。
まずは現状を把握することで、どの解決策が最も適しているかを判断する材料になります。
Salesforceの重複データを削除・統合する3つの方法
それでは、具体的な重複データの削除・統合方法を3つご紹介します。それぞれの方法に特徴があるため、ご自身の状況やスキルレベルに合わせて最適なものを選びましょう。
方法1:手動で簡単!「レコードをマージ」機能を使う
数件の重複データを発見した場合や、営業担当者が自身の管理するデータの重複に気づいた場合に最適なのが、手動でレコードを統合する「マージ」機能です。
この方法のメリットは、特別なツールや専門知識が不要で、誰でも直感的に操作できる点です。項目ごとに残す情報を選択しながら安全に統合でき、関連する商談やケースなども自動で引き継がれます。一方、デメリットとして、一度にマージできるのは最大3件までとなっており、大量のデータを処理するには時間がかかりすぎる点が挙げられます。
この方法は、特にSalesforceを利用する営業担当者やチームリーダーが、発見した数件程度の重複データを手早く解決したい場合におすすめです。
【具体的な操作手順】
1.重複しているレコードのいずれかを開きます。
2.画面右上に「重複の可能性があります」という警告が表示されている場合、そこをクリックします。
※表示されていない場合は、レポートなどから重複するレコードを探し、そのうちの1つを開きます
3.「重複を表示」をクリックすると、重複の可能性があるレコードのリストが表示されます。マージしたいレコードにチェックを入れ、「次へ」をクリックします。
4.マージ画面が表示されます。ここで、残したいレコード(マスターレコード)を選択し、各項目(電話番号、住所など)でどちらの情報を採用するかをラジオボタンで選択します。
5.すべての項目を確認したら、「マージ」ボタンをクリックします。これで、選択した情報が1つのレコードに統合され、他の重複レコードは削除されます。
方法2:大量のデータを一括処理!「データローダ」で削除する
数百、数千件といった大量の重複データが存在する場合、手動でのマージは現実的ではありません。そこで活躍するのが、Salesforce公式のツール「データローダ」です。
データローダの大きなメリットは、大量の重複データを一括で削除できるため、作業時間を大幅に短縮できることです。その反面、デメリットとして、専用アプリケーションのインストールが必要なことや、操作に慣れが求められる点が挙げられます。誤操作は大量のデータ損失に繋がるリスクがあるため、ExcelでのID特定作業など、慎重な手順が求められます。
この方法は、数百件以上の大量データをクレンジングしたいシステム管理者や、ExcelのVLOOKUP関数などの操作に抵抗がない方に適しています。
【具体的な操作手順】
1.Salesforceの[設定]メニューからデータローダをダウンロードし、PCにインストールします。
2.レポート機能などで重複の可能性があるレコードを特定し、データローダの「Export」機能で対象オブジェクトから「レコードID」を必ず含めてCSVファイルとしてエクスポートします。
3.エクスポートしたCSVファイルをExcelで開き、重複グループの中から、残したいレコード(マスターレコード)を1つだけ決め、それ以外の削除したいレコードの「レコードID」だけをリストアップした、新しいCSVファイルを作成します。これが削除用ファイルになります。
4.データローダを起動し、「Delete」を選択します。Salesforceにログイン後、先ほど作成した「削除用IDリスト」のCSVファイルをアップロードし、処理を実行します。
【重要】
データローダでの削除操作は元に戻せません。必ず事前にサンドボックス環境でテストを行うか、データのバックアップ(ウィークリーエクスポートなど)を取得してから実行してください。
方法3:応用編!「フロー」を使って重複を自動で検出・処理する
より高度な方法として、Salesforceの自動化ツール「フロー(Flow Builder)」を活用する方法があります。
フローを活用するメリットは、一度設定すれば重複チェックのプロセスを自動化し、将来的な工数を削減できる点です。削除だけでなく、担当者への通知など柔軟な処理が可能です。ただし、デメリットとして、作成にはSalesforceの自動化に関する知識が必要で、初心者には難易度が高いこと、複雑な処理はシステムのパフォーマンスに影響を与える可能性があることが挙げられます。
Salesforceのカスタマイズ経験があるシステム管理者で、データクレンジングのプロセスを標準化・自動化したい場合に最適な方法と言えるでしょう。
【フロー作成の基本的な考え方】
基本的な考え方として、「レコードが作成・更新された時」をトリガーにフローを起動させます。フロー内で、入力されたレコードと類似する条件(会社名が同じなど)で既存レコードを検索し、もし見つかった場合は「重複フラグ」を立てたり、管理者に通知したりするアクションを実行するように構築します。
目的別おすすめの使い分け
3つの方法をご紹介しましたが、あなたの目的や状況に合った方法を選べるよう、以下の表にまとめました。
| 方法 | おすすめのシーン | データ量 | スキルレベル |
|---|---|---|---|
| レコードをマージ | 営業担当者が日々の業務で発見した重複を解消 | 少ない(~数件) | ★☆☆(初級) |
| データローダ | システム管理者が定期的な大掃除で一括処理 | 多い(数百件~) | ★★☆(中級) |
| フロー | 重複チェックを自動化し、予防と早期発見を実現 | - | ★★★(上級) |
まずは手軽な「マージ機能」から試してみて、データ量が多い場合は「データローダ」に挑戦するのがおすすめです。「フロー」は、今後の運用を見据えた応用的な対策と位置づけると良いでしょう。
Salesforceのデータクレンジングを維持する予防策
重複データを一度きれいにしても、何の対策もしなければ、また同じ問題が繰り返されてしまいます。重要なのは、重複データを発生させない仕組みを作ることです。
予防策1:重複ルールと一致ルールの設定
最も効果的な予防策が、Salesforceの標準機能である「重複ルール」と「一致ルール」を設定することです。これは、何をもって「重複」と見なすかの基準を定義し、重複が検出された場合に警告を表示するなどのアクションを設定する機能です。これを設定すれば、ユーザーが重複レコードを作成しようとした際にシステムが自動で検知し、未然に防ぐことができます。
予防策2:入力規則(バリデーションルール)の活用
「株式会社」と「(株)」のような表記ゆれを防ぐには、「入力規則」が有効です。例えば、「取引先名の末尾に『株式会社』以外の法人格を入力させない」といったルールを設定することで、入力フォーマットを統一し、表記ゆれによる重複のリスクを減らすことができます。
予防策3:定期的なデータメンテナンスの習慣化
どんなに優れた仕組みを導入しても、100%重複を防ぐことは困難です。そこで重要になるのが、定期的なデータメンテナンスです。四半期に一度など、社内で「データクレンジング期間」を設け、レポート機能で重複候補をチェックし、クリーンアップする作業を習慣化しましょう。
【Q&A】Salesforceの重複データ削除に関するよくある質問
Q1. 削除してしまったデータは復元できますか?
A. 一定期間内であれば復元可能です。Salesforceで削除されたレコードは、まず「ごみ箱」に移動します。ごみ箱内のデータは、15日以内であればユーザーが自分で復元できます。15日を過ぎると完全に削除されるため、注意が必要です。
Q2. マージする際に注意すべき点は何ですか?
A. 最も注意すべき点は、「どのレコードをマスターレコードとして残すか」と「どの項目の情報を優先するか」を慎重に選ぶことです。例えば、片方のレコードにしか情報が入っていない項目がある場合、誤って情報の入っていない方を採用するとデータが失われてしまいます。マージ実行前には、プレビュー画面で内容を十分に確認しましょう。
Q3. どのくらいの頻度でメンテナンスすべきですか?
A. 最適な頻度は、企業の規模やデータの増加量によって異なります。一般的には、四半期(3ヶ月)に一度のレビューをおすすめします。データの新規登録が非常に多い企業や、外部からのインポートを頻繁に行う場合は、毎月チェックするのが理想的です。
まとめ
本記事では、Salesforceにおける重複データの原因から、具体的な削除・統合方法、そして未来のための予防策までを網羅的に解説しました。
日々の業務で発生する重複には、数件なら手軽な「マージ機能」、大量なら「データローダ」での一括処理といったように、状況に応じた使い分けが鍵となります。そして、一度きれいにした状態を「重複ルール」の設定などで維持していくことが何より重要です。
Salesforceのデータは、企業の重要な資産です。その価値を最大化するデータクレンジングは、単なる掃除ではなく、営業や分析の精度を高めるための戦略的な投資に他なりません。
まずはこの記事を手に、自社の重複状況をレポートで確認することから始めてみてください。