リサーチ手法

テキスト解析手法

テキスト解析(テキストマイニング)とは?

現在、多くの企業でビッグデータ活用に向けた取り組みが進みつつあります。このビックデータには、売上データ、SNSの投稿、画像、映像など様々なタイプが存在していますが、大きく分けると「数字の定量データ」と「文字の定性データ」の2種類から成ります。従来のマーケティングの現場においては、多くの場合、定量データの分析に焦点が当てられてきましたが、「定性データ」もまた重要なポイントになってきます。

 

定性データの分析は、文章をひとつひとつ目を通していく必要がある、非常に時間のかかる作業でした。規模の小さいサンプル数のアンケート調査であれば目視で確認することも可能ですが、SNSの投稿内容といった、1日に数十万件から数百万件も生成されるようなビッグデータを対象とした場合、そのテキスト情報をすべて読むことは難しいでしょう。

この大規模なテキストデータの分析を可能にするのが、「テキストマイニング」です。

 

テキストマイニングは文章を定量的に扱うための分析手法です。アンケートの自由記述をはじめ、TwitterなどSNSでのクチコミ分析やコールセンターへの問い合わせ内容の分析などに活用されています。

テキストマイニングは、大量のテキストデータの中から、これまで気がついていなかった貴重な分析結果を発見する手掛かりを与えてくれます。

 

テキスト解析(テキストマイニング)の仕組み・運用方法

テキストマイニングとは大量のテキストデータを分析する手法のことです。テキストをフレーズや単語に分解し(形態素解析)、フレーズや単語の出現率をはじめ、それらの相関関係や時系列での変化について分析します。

 

「形態素解析」は文章を単語単位で分割し、その品詞について特定します。英語であれば単語ごとにスペースで区切られているため、分割は容易にできますが、日本語においては高度な処理が必要です。

日本語は英語などに比べてテキストマイニングに不向きな言語とされています。日本語に特有な敬語、方言、漢字などにより、同じ意味を指す言葉でも様々な表記が存在することもテキストマイニングの処理を難しくしている要因です。

 

また、テキストマイニングにとって重要な点が、辞書の作成です。テキストマイニングは辞書によって、文章から単語の判定を行い、品詞を特定する事ができます。

新しい言葉は常に生まれているため、この辞書は定期的に更新する必要があります。

テキストマイニングの精度は、辞書の量と質に依存します。

 

テキスト解析の活用シーン

テキストマイニングの活用に適しているのは、「全体像の把握」と「特徴の抽出」です。しかし、どちらも正確に集計することには向いていないことが注意点です。

 

インターネット上のマーケティングデータ

SNS、ブログ、その他インターネット上の掲示板・コミュニティサイトなどには、顧客、ユーザーの生の情報が埋まっています。しかし、膨大な数があるため分析までは手が回りません。

そこで、テキストマイニングを活用し、商品・サービスの満足度や評価などを探ります。

商品の評判や反響をインターネット上で収集し分析している企業もあります。

 

「ユーザーの声」の分析

「ユーザーの声」は全ての企業活動にとって有益な情報となります。

商品・サービスに対して寄せられたフィードバックを調査分析し、再び商品・サービスに反映することで、ユーザーの満足に応えることが可能です。

具体的な利用シーンは、製品開発、品質向上、解約防止、満足度向上などに分析結果を活用できるでしょう。

 

テキスト解析のメリット・デメリット

インターネット上には、商品・サービスに対するユーザーの不満・満足・要望のデータが大量に溢れ、多くのお客様の声が埋もれています。これらのテキストデータには、なぜ商品が売れていないかを知ることができる多種多様なキーワードが隠されているのです。

テキストマイニングを行うことで、これらの要素の関係性を分析し、商品の売れない理由、機会損失を起こしている要因が把握でき、どのような対策を取るべきなのかを知ることができます。

 

一方で、日本語のテキストマイニングは英語と比べ自然言語処理の精度が悪くなってしまう点、単語を判定するための辞書を定期的に更新する必要がある点や、「正確」な集計には向いていないことに注意が必要です。

 

「意味フラグ」と評価グリッド法®

意味フラグをたてることはテキストマイニングの大きな特徴の一つと言えるでしょう。この「意味フラグ」とは、テキストデータ内の特定の単語を抽出するだけでなく、テキストそのものの意味合いも考慮してデータを抽出することを意味します。これにより、例えば、特定のスマートフォンに搭載された高性能カメラに対し、男性の場合は「カメラが付いていてかっこいい」と言った、商品そのもののスペックに着目した感想を述べる傾向があるのに対し、女性の場合は「画質の良い写真が取れる」と言った、実用性に着目した感想を述べる傾向があると言った結果を得ることが出来ます。これにより、性別や年齢ごとの感じ方の違いなどをテキストデータから抽出することができ、商品の開発や特定のターゲットに対する宣伝方法の選定の際に参考にすることが可能です。

一方で、テキストマイニングには、その対象をテキストデータとしているため、それによって得られる結果には、視覚的な要素が不足していると言うデメリットもあります。これを補うためには、評価グリッド法®と呼ばれるマーケティング手法との併用が有効です。評価グリッド法®とは、特定の製品グループを購入したいか否かと言った基準のもと分類してもらうと言った簡単な調査方法で、その結果は、階層構造と呼ばれる視覚的に理解しやすい方法で表すことが出来ます。このような点からも、テキストマイニングとの併用に適した解析手法と言うことが出来るでしょう。

ここでは、テキスト解析手法として「テキストマイニング」を紹介すると同時に、併用に適した評価グリッド法®も紹介しました。各々の手法で得られる結果の特徴を認識することで、様々なシーンで応用できる事でしょう。