名寄せロジックとは？設計手順とアルゴリズム5選を解説

「名寄せツールを導入してもなぜか統合精度が伸びない」「重複は減ったが本来別法人を同一視するエラーが残る」「ロジック設計の議論で『どこまでを許容するか』が決められない」——名寄せの「中身」を設計するエンジニア・営業企画担当者によく見られる課題です。名寄せロジックは『ツールが裏でよしなにやってくれる仕組み』ではなく、マッチング精度をどこに置くか・誤統合をどう許容するかを定義する設計工程です。5つのアルゴリズムと照合キー戦略の組み合わせが、企業データ運用の上限を決めます。

本記事は、名寄せロジックを「フィーリングの議論」から「再現性のある設計プロセス」へ落とし込むための実践ガイドです。基本の仕組み・5つのマッチングアルゴリズム・設計5ステップ・前処理（正規化・クレンジング）・照合キー戦略・精度を高める運用ポイント・ツール活用・アルゴリズム別の精度コスト比較・ROBOT PAYMENT事例・SalesNow MCPによる自然言語実装・着手前チェックリストまでを順に扱います。読み終える頃には、自社の名寄せロジックをどこから手を入れれば精度が上がるかの判断軸が手に入ります。

特定のテーマを先に知りたい方は、以下の関連記事から読み進めることもできます。

名寄せの全体像・5ステップ手順を知りたい方 → 名寄せとは？意味・手順・ツール活用まで徹底解説
名寄せの方法を体系的に学びたい方 → 名寄せの方法とは？5ステップの手順とExcel・ツール活用法を解説
Excelで名寄せを実装したい方 → エクセルで名寄せする方法｜関数・手順・限界まで徹底解説

名寄せロジックとは？基本の仕組みを理解する

BtoB営業の現場では、CRM・SFA・MAなど複数のシステムにデータが分散しているケースが一般的です。同じ企業が「株式会社ABC」「(株)ABC」「ABCカンパニー」のように複数表記で登録され、放置すると同じ企業に複数の営業担当が別々にアプローチしたり、正確な顧客分析ができなくなったりします。名寄せロジックは、こうした分散・重複したレコードを「同一企業」と判定して統合するための判定ルールやアルゴリズムの総称です。名寄せの精度はロジックの設計品質に直結するため、ツール選定の前に設計の理解が不可欠です。

名寄せロジックが解決する3つの課題

名寄せロジックは、以下の3つの課題を解決するために設計されます。名寄せの基礎知識とあわせてご覧ください。

重複排除：同一企業・同一人物のデータを1つに統合し、データベースの正確性を担保する
データ統合：異なるシステム間のデータを結合し、顧客の全体像を把握できるようにする
データ品質の維持：表記ゆれや入力ミスを検出・補正し、データの信頼性を高める

たとえば「株式会社SalesNow」「(株)セールスナウ」「SalesNow Inc.」は、表記が異なるものの同一企業を指しています。名寄せロジックは、このような表記の違いを吸収して同一レコードとして判定する仕組みです。SalesNowでは1,400万件超の企業・組織データベースを基盤に、法人番号をキーとした高精度な名寄せを自動で実行し、CRM/SFAのデータ品質を担保しています。

名寄せロジックの基本構造

名寄せロジックは、大きく分けて「前処理（正規化）」「照合（マッチング）」「判定（統合/非統合の決定）」の3層構造で成り立っています。

層	処理内容	具体例
第1層：前処理	表記ゆれの統一・不要文字の除去	「（株）」→「株式会社」、全角→半角変換
第2層：照合	照合キーによるレコード間の比較	法人番号一致、企業名の類似度算出
第3層：判定	一致度に基づく統合可否の決定	スコア80%以上→自動統合、50〜79%→目視確認

この3層構造を正しく設計できるかどうかが、名寄せの成否を分けます。特に第1層の前処理（データクレンジング）は名寄せ精度に直結するため、最も重要な工程です。名寄せとデータクレンジングを一体で進める手順とツール比較は「名寄せ・データクレンジングのやり方｜手順・ツール比較・コツを解説」で詳しく解説しています。

名寄せで使われる5つのマッチングアルゴリズム

名寄せの精度と効率は、2つのレコードが同一かどうかを判定する計算手法（マッチングアルゴリズム）の選択で大きく変わります。1つのアルゴリズムだけでは取りこぼしや誤統合が出るため、用途に応じて複数を組み合わせるのが実務の定石です。代表的な5つを順に整理します。

名寄せで使用される主なマッチング方式は5種類あり、それぞれ精度・処理速度・対応範囲が異なります。自社のデータ特性と目的に合わせて最適な方式を選択することが重要です。

1. 完全一致方式

完全一致方式とは、照合対象の文字列が一字一句同じ場合のみ「一致」と判定するマッチング方式です。法人番号や電話番号のように、表記ゆれが発生しにくい項目に適しています。

処理速度が速く実装もシンプルですが、「株式会社」と「(株)」のような表記ゆれには対応できません。完全一致方式を採用する場合は、事前の正規化処理が不可欠です。精度は正規化の品質に依存し、正規化済みデータであれば99%以上の精度を実現できます。

2. あいまい一致方式

あいまい一致方式とは、文字列の部分的な一致や類似パターンを許容して判定するマッチング方式です。編集距離（レーベンシュタイン距離）やN-gram類似度といったアルゴリズムを用いて、文字列間の類似性を数値化します。

たとえばレーベンシュタイン距離では、「セールスナウ」を「セールズナウ」に変換するために必要な編集操作（挿入・削除・置換）の回数を計算します。この場合、「ス」→「ズ」の1回の置換なので距離は1となり、高い類似度と判定されます。入力ミスや軽微な表記ゆれに強い一方、処理速度は完全一致より遅く、大量データの処理では計算コストが課題になります。

3. 類似度スコアリング方式

類似度スコアリング方式とは、複数の照合項目（企業名・住所・電話番号など）をそれぞれスコア化し、加重合計で総合スコアを算出するマッチング方式です。たとえば、企業名一致に40点、住所一致に30点、電話番号一致に30点を割り当て、合計スコアが80点以上であれば「同一」と判定するといった設計が可能です。

この方式では、項目ごとの重み付けを柔軟に調整できるため、業種やデータ特性に応じた最適化が容易です。SalesNowの名寄せ機能では、法人番号を最優先の照合キーとしつつ、企業名・住所・電話番号を組み合わせた類似度スコアリングを採用し、98%以上の名寄せ精度を実現しています。

4. ルールベース方式

ルールベース方式とは、人間が定義した条件分岐ルール（if-then形式）に基づいてマッチング判定を行う方式です。「法人番号が一致する場合は統合」「企業名が5文字以上一致し、かつ都道府県が同じ場合は候補として抽出」のように、ビジネスロジックに即したルールを定義します。

ルールベース方式の利点は、判定根拠が明確でブラックボックス化しない点です。金融機関や大手企業など、判定の透明性が求められる組織で多く採用されています。一方で、ルールの作成・メンテナンスに専門知識が必要で、表記パターンが増えるほどルールが複雑化するデメリットがあります。

5. AI・機械学習方式

AI・機械学習方式とは、過去の名寄せ事例を学習データとして、同一判定のパターンをアルゴリズムに自動学習させるマッチング方式です。ランダムフォレストやニューラルネットワークなどの手法が使われ、人間が想定しない表記パターンにも柔軟に対応できます。機械学習を用いた名寄せの仕組みと活用法は「名寄せAIとは？機械学習による照合精度向上と活用法を解説」で詳しく解説しています。

経済産業省「DXレポート2.1」でもAIを活用したデータ品質管理の重要性が指摘されており、近年導入企業が増加しています。ただし、十分な学習データ（一般的に数千件以上の正解ペア）が必要であり、導入初期のコストが高い点に注意が必要です。

5つのアルゴリズム比較表

方式	精度	処理速度	表記ゆれ対応	導入コスト	適用場面
完全一致	高（正規化前提）	非常に速い	不可	低	法人番号・電話番号の照合
あいまい一致	中〜高	やや遅い	可	中	企業名・住所の照合
類似度スコアリング	高	中程度	可	中	複数項目の総合判定
ルールベース	高（ルール次第）	速い	一部可	中〜高	透明性が求められる場面
AI・機械学習	非常に高	遅い（学習時）	高精度で可	高	大量データ・複雑な表記ゆれ

実務では単一のアルゴリズムだけでなく、複数の方式を組み合わせるハイブリッド型が主流です。たとえば、法人番号で完全一致を試み、不一致のレコードにあいまい一致を適用する段階的アプローチが効果的です。

名寄せロジック設計の5ステップ

名寄せロジックの設計とは、自社のデータ特性に合わせて最適な照合ルールを構築するプロセスです。設計の質がそのまま名寄せの精度と運用効率に直結します。

実務で成果を出す名寄せロジックを構築するには、以下の5つのステップを順に進めることが重要です。

ステップ1：データの現状把握と課題の特定

名寄せロジック設計の第一歩は、現在のデータベースの品質を定量的に把握することです。具体的には、レコード総数、重複の推定件数、表記ゆれの頻出パターン、欠損項目の割合を調査します。

一般的なBtoB企業のCRM/SFAでは、データの重複率が15〜30%程度存在するとされています。ある調査では、営業担当者がデータの重複確認や修正に1人あたり週平均2.5時間を費やしているという結果も出ています。この現状把握のフェーズを省略すると、設計したロジックが実データに適合せず、手戻りが発生します。

ステップ2：照合キーの選定

レコード同士を比較するときに「どの項目を見るか」を決めるのが照合キーです。代表的な照合キーには、法人番号・企業名・住所・電話番号・メールアドレスのドメインなどがあります。どのキーを主軸に据えるかで、誤統合と取りこぼしのバランスが大きく変わります。

照合キーの選定では、「一意性」「データ充足率」「表記安定性」の3つの基準で評価します。法人番号は一意性が高く最も信頼性の高いキーですが、データベースに法人番号が含まれていないケースも多いため、複数のキーを組み合わせる設計が現実的です。照合キーの設計については後述のセクションで詳しく解説します。

ステップ3：前処理ルールの策定

マッチング処理の前段階で、データを統一的なフォーマットに整える正規化が前処理ルールです。「（株）→株式会社」「全角英数→半角英数」「スペース除去」など、業種やデータ特性に応じたルールセットを定義します。詳細は「名寄せの前処理｜正規化・データクレンジングの実践」で解説します。

ステップ4：マッチングアルゴリズムの選定と閾値設定

前述の5つのアルゴリズムから、自社のデータ特性と運用体制に合った方式を選定します。重要なのは閾値（スレッショルド）の設定です。

閾値が高すぎると本来統合すべきレコードを見逃し（False Negative）、低すぎると別の企業を誤って統合してしまいます（False Positive）。一般的には、類似度80%以上で自動統合、50〜79%で目視確認、50%未満で非統合とする3段階の閾値設計が推奨されます。テストデータで検証し、自社に最適な閾値を見つけることが重要です。

ステップ5：テスト・検証とPDCAサイクルの確立

設計したロジックの精度を測定するために、正解データ（ゴールドスタンダード）を用意してテストを実施します。精度指標としては、適合率（Precision）と再現率（Recall）、そしてそれらの調和平均であるF1スコアを使用します。

初回のテストでF1スコア90%以上を達成することは稀であり、通常は閾値の調整や正規化ルールの追加を繰り返して精度を高めます。SalesNowでは、1,400万件超のデータベースを基盤に名寄せロジックを継続的に改善しており、導入企業のCRM/SFAデータの重複を平均85%以上削減しています。

名寄せの前処理｜正規化・データクレンジングの実践

名寄せにおける前処理とは、照合の精度を最大化するためにデータを統一的なフォーマットに変換する工程です。前処理の品質が名寄せ全体の精度の70%以上を決定するとも言われています。

BtoB営業のデータベースで頻出する表記ゆれには一定のパターンがあり、それぞれに対応する正規化ルールを設計することで、名寄せの精度を大幅に向上させることができます。名寄せとデータクレンジングを一体で進める手順とツール比較は「名寄せ・データクレンジングのやり方｜手順・ツール比較・コツを解説」で詳しく解説しています。

企業名の正規化ルール

企業名は名寄せにおいて最も表記ゆれが発生しやすい項目です。以下の正規化ルールを適用することで、照合精度が大幅に向上します。

正規化ルール	変換前	変換後
法人格の統一	（株）、(株)、㈱	株式会社
全角→半角変換	ＡＢＣ、１２３	ABC、123
半角カナ→全角カナ	ｾｰﾙｽﾅｳ	セールスナウ
スペース除去	Sales Now	SalesNow
記号除去	セールス・ナウ	セールスナウ
大文字→小文字変換	SALESNOW	salesnow

これらの正規化ルールを適用するだけで、企業名の照合精度は平均で30〜40%向上するとされています。正規化処理は名寄せの土台であり、ここを手抜きすると後工程のアルゴリズムがいくら高精度でも成果が出ません。

住所の正規化ルール

住所データは、番地表記やビル名の有無、略称の使用など、多様な表記パターンが存在する項目です。住所の正規化は名寄せの精度向上に不可欠な工程です。

都道府県の省略補完（「渋谷区」→「東京都渋谷区」）
番地表記の統一（「3丁目5番地2号」→「3-5-2」）
ビル名・階数の分離（照合対象から除外）
旧住所の新住所への変換

国土交通省が公開している住所マスタや、総務省の全国地方公共団体コードを活用すると、住所の正規化精度をさらに高めることができます。

電話番号・その他項目の正規化

電話番号はハイフンの有無や市外局番の記載方法でゆれが発生します。「03-1234-5678」「0312345678」「03（1234）5678」をすべて「0312345678」のようにハイフンなし半角数字に統一するのが基本です。

メールアドレスのドメイン部分（@以降）も有効な照合キーになります。個人のフリーメールではなく、企業ドメインであれば企業の特定に活用できるため、正規化の対象に含めることを推奨します。

照合キーの選定と組み合わせ戦略

照合キーの選定とは、名寄せロジックにおいて「どの項目を使ってレコードを比較するか」を決定する工程です。照合キーの設計が名寄せの成否を左右すると言っても過言ではありません。

法人番号を第一照合キーに設定する

法人番号とは、国税庁が全法人に付与する13桁の一意の識別番号です。2015年10月の法人番号制度開始以降、約600万社以上の法人に番号が付与されており、名寄せにおいて最も信頼性の高い照合キーです。

法人番号は1社に1つしか存在しないため、一致すれば同一企業と100%判定できます。SalesNowは1,400万件超の企業データに法人番号を紐づけて管理しており、ユーザーのCRM/SFAデータに法人番号を自動付与する機能を提供しています。法人番号が付与されたデータ同士であれば、完全一致方式だけで高精度な名寄せが完了します。

第二照合キー：企業名 + 住所の組み合わせ

法人番号がないレコードに対しては、企業名と住所の組み合わせが次に有効な照合キーとなります。企業名単独では同名の異企業（「田中建設」など）を誤って統合するリスクがありますが、住所を組み合わせることでこのリスクを大幅に低減できます。

企業名の類似度が80%以上かつ都道府県が一致する場合を「候補」として抽出し、市区町村まで一致すれば「高確度」とする段階的な判定が効果的です。

補助照合キーの活用

第一・第二照合キーで判定できないケースには、補助照合キーを活用します。代表的な補助キーは以下の通りです。

電話番号：企業の代表番号や部署直通番号で照合。SalesNowは部署直通番号を含む組織データを保有しており、より細かい粒度での名寄せが可能
Webサイトドメイン：企業のコーポレートサイトのドメインで照合。グループ企業の判別にも有効
メールアドレスドメイン：社員のメールアドレスの@以降で照合。Gmail等のフリーメールは除外する
代表者名：中小企業の場合、代表者名の一致は高い信頼度を持つ

照合キーの優先順位設計

実務では、照合キーに優先順位を設けた段階的マッチングが効果的です。

第1段階：法人番号の完全一致 → 自動統合（信頼度100%）
第2段階：企業名＋住所の類似度スコアリング → スコア80%以上で自動統合
第3段階：電話番号またはドメインの完全一致 → 企業名類似度50%以上で統合候補に
第4段階：上記すべて不一致 → 新規レコードとして登録

この段階的アプローチにより、自動処理で解決できる範囲を最大化しつつ、誤判定のリスクを最小限に抑えることが可能です。

名寄せロジックの精度を高める運用のポイント

名寄せロジックの精度向上とは、一度設計したロジックを継続的に改善し、データ品質を維持・向上させる取り組みです。名寄せは一度実行して終わりではなく、継続的な運用改善が不可欠です。

定期実行のサイクルを設計する

名寄せの実行頻度は、データの流入速度に応じて設計します。展示会やセミナー後にリードが大量流入する企業であれば、イベント後に都度実行するのが効果的です。一般的な目安として、月次での定期実行を推奨します。

ある調査によれば、BtoB企業のCRMデータは月平均で3〜5%の新規レコードが追加されるとされています。月次で名寄せを実行することで、重複データの蓄積を防ぎ、データベースの品質を一定水準に保つことができます。

誤判定の分析とルール改善

名寄せ実行後には、誤判定の分析を必ず行います。False Positive（別企業を同一と誤判定）とFalse Negative（同一企業を見逃し）のそれぞれについて原因を特定し、正規化ルールの追加や閾値の調整に反映します。

たとえば、グループ企業を誤って統合してしまうケースが多発する場合は、「社名に『グループ』『ホールディングス』を含む場合は住所一致を必須条件にする」といったルールを追加します。このPDCAサイクルを回すことで、名寄せ精度は運用を重ねるほど向上します。

データガバナンスとの連携

名寄せロジックを組織全体で運用するためには、データガバナンスの枠組みとの連携が重要です。データの入力ルール（命名規則・必須項目）を明確化し、入力段階で表記ゆれを防止する仕組みを整備します。

入力段階での品質管理と名寄せロジックによる事後的な品質管理を組み合わせることで、CRM/SFAのデータ品質を高い水準で維持できます。SalesNowでは、データ入力時に法人番号を自動検索・付与する仕組みを提供しており、入力段階からデータの一意性を担保できます。

名寄せツールの活用で効率と精度を両立する

名寄せツールとは、前処理・照合・判定の一連のプロセスを自動化し、人手による作業工数を大幅に削減するソフトウェアです。手動での名寄せには限界があるため、ツールの活用が現実的な選択肢となります。

手動名寄せの限界

手動による名寄せは、データ量が1,000件を超えると急激に工数が増大します。10,000件のレコードに対して手動で名寄せを行う場合、1件あたり平均3分として500時間以上の工数が必要です。さらに人為的なミスの発生率も高く、一般的に手動名寄せの精度は70〜80%程度にとどまります。

名寄せツール選定の5つの基準

名寄せツールはタイプ別に得意領域が異なるため、選定軸を絞ってから比較するのが現実的です。タイプ別の名寄せツール比較や選び方は「名寄せツール比較おすすめ10選｜選び方・タイプ別・SFA連携で徹底解説」で詳しく解説しています。具体的な評価基準として、以下の5つを推奨します。

照合アルゴリズムの種類：完全一致のみか、あいまい一致・AI対応があるか
正規化の自動化範囲：企業名・住所・電話番号の正規化がどこまで自動化されるか
CRM/SFA連携：Salesforce・HubSpotなど既存システムとのデータ連携が可能か
マスタデータの品質：照合基盤となる企業データベースの網羅性と鮮度
運用サポート：導入後のルール調整や精度改善のサポート体制があるか

SalesNowは、国内1,400万件超の企業・組織データベースを照合基盤として、法人番号ベースの高精度な名寄せ機能を提供しています。Salesforce・HubSpotとのネイティブ連携に対応し、CRM/SFAのデータ品質を自動的に維持します。名寄せだけでなく、新規開拓リストの作成やアクティビティ通知まで一気通貫で対応できる点がSalesNowの強みです。名寄せをデータクレンジングと一体で進めるための手順とツール比較は「名寄せ・データクレンジングのやり方｜手順・ツール比較・コツを解説」で詳しく解説しています。

導入効果の目安

名寄せツールの導入により、以下のような効果が期待できます。

指標	手動運用	ツール導入後
名寄せ精度	70〜80%	95%以上
処理時間（10,000件）	500時間以上	数分〜数時間
月次運用工数	40時間以上	5時間以下
重複データ削減率	50〜60%	85%以上

SalesNowの導入企業では、名寄せ・データ整備の工数を1人あたり月8.6時間削減し、商談数2.3倍を達成した実績があります。アイムファクトリー社の導入事例でも、名寄せロジックの改善による成果が報告されています。名寄せロジックの設計から運用まで、ツールの活用により大幅な効率化が可能です。

マッチングアルゴリズム別の精度・コスト比較

名寄せロジックを設計するうえで最も判断が分かれるのが、どのマッチングアルゴリズムをどの段階で組み合わせるかです。アルゴリズムごとに「適合率（誤統合の少なさ）」と「再現率（取りこぼしの少なさ）」のバランス、実装コスト、運用負荷が異なります。代表的な5アルゴリズムを実務観点で比較します。

アルゴリズム	適合率	再現率	向くケース・実装コスト
完全一致（Exact Match）	高 ★★★	低 ★☆☆	法人番号・メールアドレス等の一意キーで突合。実装コスト最小、誤統合がほぼ起きない代わりに表記ゆれは拾えない
あいまい一致（Fuzzy Match）	中 ★★☆	中 ★★☆	Levenshtein距離・編集距離で「株式会社ABC」と「(株)ABC」を同一視。前処理（正規化）の品質に精度が左右される
類似度スコアリング	中 ★★☆	高 ★★★	複数項目（社名・住所・電話番号）の類似度を加重平均でスコア化し、閾値で統合判定。閾値設計に経験が必要
ルールベース（条件分岐）	高 ★★★	中 ★★☆	「業種が同じ＋住所の市区町村が同じ＋電話番号下4桁が同じ」のような複合条件で判定。意図が明確だが業種・業態が増えるとルール爆発
機械学習（AI/ML）	高 ★★★	高 ★★★	過去の正解データから判定モデルを学習し、未知のパターンも統合可能。学習データ整備とモデル運用に専門人材が必要

実務では 「① 完全一致（法人番号） → 取りこぼしを ② あいまい一致＋③ 類似度スコアリングで吸収 → ④ ルールベースで例外処理」 の段階的マッチングが定石です。AI/MLは学習データが十分に揃った中〜大規模組織向けの選択肢で、まずは①〜④で実装し、運用が安定した後に⑤を検討するのが現実的です。

実践事例：ROBOT PAYMENTが名寄せ率3倍に引き上げハウスリスト掘り起こしで成果を上げた取り組み

ハウスリストとのデータマッチ率が低くABMの実行に支障が出ていた

請求管理クラウド「請求管理ロボ」などを提供するROBOT PAYMENTでは、ABM（Account Based Marketing）の実行に必要なハウスリストとのデータマッチ率の低さが大きな課題でした。既存ツールでは保有リードへの企業属性データ（業種・従業員数・売上高など）の付与率が限定的で、掘り起こし戦略を実行しようにも、そもそも「どの企業に何があるか」を正確に把握できない状況だったのです。

SalesNow導入で名寄せ率3倍と複数項目のデータ付与率を実現

同社はSalesNowを導入し、法人番号ベースの照合ロジックを採用することで名寄せ率を以前の3倍まで引き上げました。あわせて従業員数・売上・業界などの主要属性の付与率も他社比較で最高水準まで改善し、Salesforceとの自動連携によって商談データとの統合も効率化しました。「ハウスリストに何があるか」が正確に把握できるようになったことで、ABM施策の前提条件が整いました。

名寄せ率3倍により新規受注の30%を掘り起こし起点で獲得

名寄せロジックの高度化を起点とした掘り起こし施策の結果、新規受注企業の30%がハウスリストの掘り起こしから生まれるようになりました。名寄せ率（適合率）を引き上げることが、ABMやハウスリスト活用といった上位の営業戦略を初めて成立させる前提条件であることを示す好例です。出典：SalesNow導入事例株式会社ROBOT PAYMENT。

ROBOT PAYMENTの取り組みの詳細は、SalesNow導入事例ページ（株式会社ROBOT PAYMENT）からお読みいただけます。

SalesNow MCPで「自然言語×名寄せロジック」を実装する

名寄せロジックの実装は、ここ数年で「ルールベースをコードで組み立てる」「ツールUIで設定する」「LLMから自然言語で指示する」の3スタイルに分岐しました。設計の議論と実装が分断されがちな名寄せ領域で、MCP接続は議論したロジックをそのまま自然言語で動かせる新しい選択肢です。

名寄せロジック実装の3スタイル比較

スタイル	進め方	限界・注意点
① ルールベースをコードで組む	Python/SQL等で前処理・マッチングルールを実装し、バッチ処理として運用	細かい調整が利く反面、ロジック変更時のメンテナンスコストが高い。担当者が離任すると属人化リスク
② LLM単独で名寄せを試みる	ChatGPTやClaudeに「このリストを名寄せして」と投げて整理させる	LLMは企業データベースに接続していないため、表記の似た別社を統合する/異名同社を別社判定するハルシネーション・誤統合が発生。法人番号での厳密照合ができない
③ MCP接続で企業DB×LLM	SalesNow MCP経由でClaude等のLLMがSalesNowの1,400万件超の企業データ（法人番号・正式社名・拠点情報）に直接アクセスし、自然言語の指示で正規化されたレコードを生成	MCP対応の企業データソースとMCP環境のセットアップが必要。初回構築は1〜2時間程度の工数

「この100件のリストから法人番号を割り出し、グループ企業を識別したうえで、本社単位で統合して」と指示するだけで、SalesNow MCPがハルシネーションなしの正規化リストを返してくれます。ロジック設計で議論した条件をそのまま自然言語で動かせるため、設計と実装の往復コストが大幅に削減されます。MCPの仕組みは「MCP×企業データ活用ガイド｜SalesNow MCPで実現する仕組み・実装・API連携」で詳しく解説しています。

名寄せロジック設計前のチェックリスト10項目

名寄せロジックを設計する前に、以下の10項目を確認しておくと、PoC段階や本番運用での手戻りを大幅に減らせます。

☐ 名寄せ対象のデータ件数（数百件/数千件/数万件以上）を把握している
☐ 名寄せ後の活用目的（営業リスト/CRM統合/レポート集計）が明確になっている
☐ 第一照合キー（法人番号を中心とするか企業名を中心とするか）が決まっている
☐ 国税庁法人番号公表サイトのCSV/APIから法人番号マスタを取得できる
☐ 採用するマッチングアルゴリズム（完全一致/あいまい一致/類似度スコアリング/ルールベース/AI）の組み合わせが決まっている
☐ 前処理（正規化・データクレンジング）のルールが明文化できている
☐ 個人事業主・拠点情報・グループ会社・吸収合併済み法人の扱いを運用ルールで整理している
☐ 名寄せ後のレコード重複判定基準（完全一致/あいまい一致）が決まっている
☐ 適合率（Precision）と再現率（Recall）のバランスをどう取るかが合意できている
☐ 定期的なPDCA運用ルール（再名寄せ頻度・新規データ追加時の処理）が決まっている

10項目中7つ以上に「☐」を付けられない場合は、ロジック設計に入る前にデータ整備と運用ルール設計から着手するのがおすすめです。

まとめ

名寄せロジックは、「前処理（正規化）」「照合（マッチング）」「判定（統合/非統合）」の3層構造で設計します。マッチングアルゴリズムは完全一致・あいまい一致・類似度スコアリング・ルールベース・AI方式の5種類があり、自社のデータ特性に合わせた選択が重要です。

設計のポイントは、法人番号を第一照合キーとした段階的マッチング、徹底した前処理（正規化・データクレンジング）、そして定期的なPDCAサイクルによる精度改善です。手動での名寄せには精度・工数の両面で限界があるため、名寄せツールの活用が現実的な選択肢となります。

SalesNowは、1,400万件超の企業データベースと法人番号ベースの名寄せ機能を提供し、CRM/SFAのデータ整備から新規開拓まで一気通貫で支援しています。名寄せロジックの設計・運用にお悩みの方は、まずSalesNowの資料をご覧ください。

よくある質問

Q. 名寄せロジックとは何ですか？

名寄せロジックは、複数のデータベースに散在する同一企業・同一人物のレコードを統合するための判定ルールやアルゴリズムを指します。企業名・住所・電話番号などの項目を照合し、一致度を判定して重複データを特定します。SalesNowでは1,400万件超の企業データベースを基盤に、法人番号ベースの高精度な名寄せを実現しています。

Q. 名寄せロジックにはどのような種類がありますか？

主な名寄せロジックには、完全一致方式、あいまい一致方式、類似度スコアリング方式、ルールベース方式、AI・機械学習方式の5種類があります。完全一致は高精度だが表記ゆれに弱く、あいまい一致やAI方式は柔軟性が高い反面、誤判定のリスクがあります。実務では複数の方式を組み合わせるハイブリッド型が主流です。

Q. 名寄せロジックを設計する際に最も重要なポイントは何ですか？

名寄せロジック設計で最も重要なのは、照合キーの選定と前処理（正規化）の精度です。法人番号のような一意識別子を第一照合キーに設定し、企業名・住所は事前に表記ゆれを正規化してから照合することで、名寄せ精度を大幅に向上できます。SalesNowは法人番号の自動付与機能を提供しており、入力段階からデータの一意性を担保できます。

※本記事は情報提供を目的としており、特定のサービスの購入を推奨するものではありません。記載内容は執筆時点の情報に基づいています。編集ポリシーについて