データマイニングで企業に有益な情報を採掘!データマイニングの基本から活用法
ITビジネスの分野では、近年「ビッグデータ」が注目を集めています。それに伴い、ビッグデータを有効に活用するための手段として、「データマイニング」にも注目が集まっています。
この記事では、データマイニングについての基本的なことから、データマイニングの活用法についてご説明します。
データマイニングとは
データマイニングとは、大量に蓄積されたデータから機械学習や統計分析を用いて有益な情報や「価値ある知識」を採掘する解析方法です。
ITビジネスの分野では、近年「ビッグデータ」が注目を集めており、それに伴いビッグデータを有効に活用するための手段として、「データマイニング」に注目が集まっています。これらのビッグデータをもとにデータマイニングを行うことで、これまで知り得なかった有用な情報がわかるようになるのです。
データマイニングで得られる知識とは
データマイニングで得られる「価値ある知識」とはいったいどういったものなのでしょうか。データマイニングについて理解するために、ここでは「DIKWモデル」についてご説明します。
一般的にデータマイニングで得られる知識とは、
- Data(データ) まだ整理整理されていない数値
- Information(情報) データに対し整理や分類を行ったもの
- Knowledge(知識) 情報から得られる傾向や知見
- Wisdom(知恵) 知識を利用して人が判断する力
の4つです。
これらの頭文字を取って「DIKWモデル」と呼ばれており、順に有用性が高いと判断されます。データマイニングで行えるのはデータ(Data)の収集から知識(Knowledge)の発見で、それを知恵(Wisdom)として活用するには人の判断が必要となります。
データマイニングは、データ(Data)の収集から知識(Knowledge)までを効率よく正確に行うための手法となります。
データマイニングで解析できること
1.発生確率を予測する
大量に蓄積されたデータの中から、受注や購入などの、事象が発生する確率と、その要因を明らかにします。
たとえば、どのような条件であれば、どのような製品を購入する可能性が高いかなどの予測をすることができます。予測がわかることで、営業の方は高い見込みのある顧客にアプローチをかけることができるのです。
2.データの分類
データを特徴ごとにセグメンテーションします。
たとえば、力を入れるべき製品に対し、その製品に興味のある顧客はどんな人で、興味のない人はどんな人であるのかなどの分類をすることで 、そのグループに最適な施策を打つことができます。
データを分類することで、グループごとの訴求ポイントが分かるため、製品のどこに力をいれるべきなのかマーケティング戦略の指標を立てることができます。
3.データの関係性を見つける
大量のデータの中から、同時に発生する頻度の高い事象を発見します。
たとえば、"Aという条件が満たされている場合には、Bという条件が満たされる"など、どの組み合わせが合っているのかを発見することができます。
データの相関性が分かることで、今まで気づくことのできなかった事象を知ることができ、マーケティング戦略にも営業の顧客開拓にも役立てることができますね。
データマイニングの分析方法
データマイニングを使った分析方法はいくつかありますが、今回は定番の4つの方法について簡単にご説明します。
1.マーケット・バスケット分析
顧客の取引データをもとに、何が一緒に購入されるかを分析します。
例えば、「おにぎりを買っている人の50%が、お味噌汁も買っている」ということを把握できます。この分析によって、店舗では陳列の仕方の変更や、セット割引のキャンペーンをするなど、売上を上げるための販売方法を考えることができます。
2.クラスター分析
クラスターとは「集団」を意味します。異なる性質のものが混在している中から、性質の似たものを集め、クラスターを作ります。例えばアンケート調査で、「時間にゆとりがあって、健康に気を使っている人は料理をよくするタイプ」「忙しく、食べ物や健康に興味があまりない人は外食やコンビニで買って食事をするタイプ」などグループ分けすることができます。
クラスター分析では、集団のポジショニングを確認して、ポジションに合わせてどのような製品を提供するか考えていくことができます。
3.ABC分析
製品や売上などをクラス分けする方法です。グルーピングをしてから、グループごとに管理を効率化することが大切になります。
例えば、Aランク製品は良く売れるから大量に受注して在庫を切らさないようにする、Bランク製品は在庫がなくなりそうな時に受注する、Cランク製品はほとんど売れないため取り扱いを検討するなどの分析ができます。
4.ロジスティック回帰分析
ある事象の発生確率の予測に向いている分析法です。YesまたはNoの形式でデータを収集します。たとえば、期間内に資料のダウンロードを1件しかしていない人は製品を購入しないことが多い、複数ダウンロードした人は製品を購入すると定義すると、資料ダウンロード1人あたりの購入確率を出すことができます。
データマイニングの種類
データマイニングを行う際に用いられる種類には、機械学習と統計分析があります。
機械学習で知識発見
機械学習では、事前に仮説を立てることなく膨大なデータの中からAIがそれを分析し、相対関係を導き出します。人が想定することのできなかった原因の特定や、新たな知識の発見ができるのが機械学習の強みです。
- 機械学習で用いられる分析方法
- ・マーケット・バスケット分析
- ・クラスター分析
統計分析で仮説検証
統計分析は、事前に仮説を立て、その仮説に関連するデータを分析し知識を見出す方法です。必要に応じて、さまざまな分析方法を組み合わせて原因を特定します。
仮説を立てるには統計学の専門知識のある人の知識が欠かせませんが、データマイニングツールによってある程度補うことができます。
- 統計分析で用いられる分析方法
- ・ABC分析
- ・ロジスティック回帰分析
データマイニングの手順
では実際にデータマイニングを行う手順をご紹介します。
データ収集
データマイニングを行う際にはまず、データの収集を行います。
手元にあるビックデータをただ活用すればいいのではなく、あらかじめ分析したい内容に関連性のある「目的と合致したデータ」を収集します。
データ整理
データが収集できたら次にデータの整理・加工を行います。
収集されたデータには、数値データだけでなく記号データなどさまざまな形式があります。これらの形式を統一することで正確な分析を行うことができるようになるのです。こうしたデータの加工は「デートクレンジング」とも呼ばれます。
分析・検証
データの収集、整理の準備ができたらいよいよ分析に移ります。先ほどご紹介したさまざまな分析方法を活用し、データのパターンを発見したりグループ化を行います。
分析後は、その分析結果に基づいて要因の特定を行います。発見したパターンやルールを実際のデータに当てはめ検証を行うことが重要です。
まとめ
いかがでしたでしょうか。データマイニングを活用することで、これまで出来なかった明確な市場分析が可能になります。情報化社会になり多くのデータが蓄積されたいま、あなたもデータマイニングを使って市場を把握したうえで、事業計画を立てると良い結果が出るかもしれませんね。