【図解】Excelで名寄せ(マージ)する方法を紹介!具体的な作業方法を解説

マージ(名寄せ)とは
マージ(merge)とは、2つのものを併合するという意味で、マーケティングにおいてはリストの整理や重複チェックといった意味で使われています(日本語では「名寄せ」とも言われます)。そこで今回は、マージの中でも特に頭を悩ませる「企業リストのマージ方法」について執筆します。
マージ(名寄せ)が重要視される背景
近年、リストの管理はSFAやCRMなど、クラウド上で管理をすることが多くなってきました。これらは誰がどこにいても入力や編集、閲覧が出来る便利なツールである一方、誰でも入力できる環境であるからこそ、データの不備や重複に課題を感じている企業も増えていくことと思います。そのため、入力や編集の際のルールを統一して運用をしていくことが望ましいと言えます。
しかしながら、関係者全員にルールを徹底してもらうことは現実的には難しいため、リストの正確性を担保するためには、定期的なメンテナンスが必要になります。ここで発生するのがマージ作業です。
マージ(名寄せ)の方法
マージと言っても様々なケースがありますが、本稿では「企業リストのマージ方法」について、とりわけ、企業名を正式社名にして重複チェックをする方法について執筆します。この作業は様々なマージ作業の基本型とも言えるものですので、覚えておくと便利です。作業の順は以下になります。
- ①企業名を正式社名に修正
- ②重複リストのチェック~削除
①企業名を正式社名に修正(置換、テキストフィルタ検索)
まずは、よくある正式社名でないケースを精査していきます。
(1)置換作業
企業名の列を全選択し、置換機能を使って以下の作業をします。
- ・「 」(スペース)を、置換を使って削除 ※置換後の文字列を空白にすれば削除されます
- ・「(株)(株)、㈱」(※全角カッコ、半角カッコ、特殊文字)を「株式会社」に置換
- ・「(有)(有)、㈲」(※全角カッコ、半角カッコ、特殊文字)を「有限会社」に置換
- ・「,」(全角コロン)を「,」(半角コロン)に置換
- ・「.」(全角ドット)を「.」(半角ドット)に置換
(2)検索作業その1
企業名の列で以下の文字をテキストフィルタで検索し、企業名以外のものは削除をします。
- ・「(」(※全角カッコ、半角カッコ)
⇒「ワンツースリー(123)株式会社」などの可能性をチェック - ・「営業、事業、部、所、署、店、支社、本社、センター、カスタマー、様」
⇒東京事業所、東京支店、コールセンター、カスタマーサポートなどの可能性をチェック - ・「関(関東、関西を両方検索できる)、東京、大阪、その他主要エリア名」
⇒関東支社、関西エリア統括などの可能性をチェック
(3)検索作業その2
ここまでが完了したら、企業名の列で"「会社」を含まないもの"という条件で検索し、Webサイトの会社概要を見るなりして、企業名を正式名称に修正していきます。「株式会社」を含まない企業名も実際には存在するので、ここでは目検での精査が必要になります。
ここまでの作業が完了したら、ほとんどの企業名が正式社名に修正されていると思いますので、重複リストのチェックをしやすいように、企業名を基準にして昇順で並び替えます。この際、並べ替えの選択範囲は、付帯情報なども含めて選択をするよう注意して下さい。そうしないと、下記②で作業する重複削除が正確に行われないことになってしまいます。
②重複リストのチェック~削除(COUNTIF関数)
企業リストの重複チェック~削除にあたっては、「COUNTIF関数」を使っていきます。下記の例では、C2からC13に「=IF(COUNTIF($A$2:$A$13,A2)>1,"重複","")」という関数が入っており、A列に重複したものがある場合は、C列に重複フラグがつくようになっています。
エクセルの機能にも「重複の削除」というものがありますが、わざわざCOUNTIFを使ってから重複を削除していく理由は、9行目~10行目のように、同一社名であるにも関わらず全く違う企業である場合が存在するからです。これが企業リストのマージの難しさの1つでもあります。
したがって、ここからはC列に重複フラグが立っているものを目検で精査していく必要があります。(※ただし、母数にもよりますが、同一社名の企業がリスト内に存在するケースは稀ですので、そう時間のかかる作業ではないかと思います。)重複フラグのついたリストをチェックし、必要に応じて削除が完了すれば、晴れてハウスリストの企業名のマージが完了します。
マージ後の運用 ~入力ルールを作って徹底する~
せっかく企業リストをマージして綺麗に精査をしても、その後の入力ルールがしっかりとしていないと、時間が経てばまた重複だらけのリストになってしまいます。そこで、統一された分かりやすい入力ルールの整備が必要です。以下では、企業リストに重複が発生しやすい代表的な事象から、対応すべきオススメの入力ルールをご紹介します。
企業名は「株式会社」を含めた正式名で登録する
【オススメのルール】
その1 必ず「株式会社」は入力する!
その2 「(株)」や「㈱ ※特殊文字」などは絶対使わない!
企業名に「 」(スペース)や「・」が含まれている場合はこうする
【オススメのルール】
その1 スペースは削除する!
その2 中黒「・」は残す!
企業名に英数字記号が含まれている場合はこうする
【オススメのルール】
その1 コーポレートサイトの会社概要に載っている企業名を正式なものとする!
その2 入力の際は誤りが無いよう原則にはコピー&ペーストで貼り付ける!
その3 英数字記号は半角で入力する!
「ABC株式会社」
「エイビーシー株式会社」
「エイビーシィ株式会社」
「エービーシー株式会社」
「エービーシィ株式会社」
「エイ・ビー・シー株式会社」
「エイ・ビー・シィ株式会社」
「エー・ビー・シー株式会社」
「エー・ビー・シィ株式会社」
ざっと挙げただけでもこれだけの可能性があるということを、是非覚えておいて下さい。とくに、「シー」と「シィ」などは先入観念で見間違うケースも多いので、入力の際はコーポレートサイトの会社概要に載っている企業名をコピー&ペーストする運用が望ましいと言えます。
また、英数字の場合には"半角"と"全角"の違いもあります。例えば、エクセルで企業リストを降順で並び替えて重複の削除を行ったとしましょう。この場合、「ABC株式会社(半角)」と「ABC株式会社(全角)」は別のものと判断されるため、同一社名にも関わらず削除されないことになります。
したがって、英数字の場合には"半角"or"全角"どちらか一方に統一する必要があります。個人的にオススメするのは"半角"です。理由は、英数字を含んだ企業のコーポレートサイトの会社概要を見てみると、ほとんどの場合"半角"で記載されているからです。企業名をコピー&ペーストする運用を前提とするならば、修正は少ないほうがいいので"半角"をオススメするということです。
以上、いかがでしたか?整備されたリストがあれば営業活動もマーケティング活動も捗ります!ちょっと大変ですが、マージ作業は定期的に行うようにしましょう。みなさまのマージ作業のヒントになれば幸いです。
これを読んでもっとUrumo!
この記事を読んだあなたに、さらにステップアップできる記事をご紹介します。