リサーチ手法
多変量解析

多変量解析とは
多変量解析とは、多くの情報(複数の変数に関するデータ)を基に、変数間の相互関連を分析する統計的方法の総称です。元々は統計学で使われていた言葉ですが、マーケティングにおいても、膨大な量のデータの中から相関や因果関係を見つける際に用います。分析手法は多岐にわたり、主に売り上げなどの予測を目的として、因果関係を数式でモデル化する時に使用されます。
ここでいう「変量(変数)」は、アンケート結果をはじめ上昇に応じて数値が変化する値のことで、この変量に関する多くの情報を事前に仮説を立てて関連性を明確にします。
多変量解析の仕組み
多変量解析行う際、事前のデータ処理やデータ解析が重要です。収集したデータは必要に応じて対数変換などを行い、内容にノイズデータがないかなど確認しクリーニングや加工をしてデータを整えます。その後、単変量解析→2変量解析→多変量解析の順で分析を進めていきます。
多変量解析で扱うデータには、性別や職業、居住地区など分類を目的とした「名義尺度」、順序に意味はあるが等間隔とは限らない“1位、2位、3位”や“長女、次女、三女”といった「順序尺度」、西暦や摂氏温度、偏差値のような順序尺でありデータ間の間隔にも意味がある「間隔尺度」、距離や大きさ、お金など基となるデータに意味がある「比率尺度」という4種類があります。どのデータを扱うかでも使用できる分析手法が異なります。
多変量解析の種類&主な活用シーン
代表的なものに、「回帰分析」、「判別分析」、「クラスター分析」などがあります。各手法の概要は次の通りです。
- 回帰分析:1つの目的変数を1つの説明変数で予測する「単回帰分析」と、複数の説明変数から1つの目的変数を推定する「重回帰分析」があります。単回帰分析は、たとえば身長(※説明変数)から体重(※目的変数)を推定するような場合に使い、重回帰分析は、身長・腹囲・胸囲という複数の要因から体重を予測するようなケースで用います。
- 判別分析:量的変数から質的変数を予測。つまり、調査対象者の回答データから、その人物がどのような群に属するかを判別する方法で、集団の情報というよりは個人を分類することを目的に使用されるのが一般的です。たとえば顧客のランク分けや見込み客のデータから購入しそうな人物とそうでない人物を分けるといったような場面で使用できます。
- クラスター分析:多様な特性を持つ対象を類似性の指標、質問項目や回答者などを使いグルーピングする手法です。「階層クラスター分析」と「非階層クラスター分析」という2種類に大別でき、前者は事前にクラスターを決める必要なく好きな数に分けられますが、対象が多いケースには不向きです。逆に後者は、似たようなパターンで回答した回答者が同じグループに属するよう自動グルーピングするアルゴリズムですが、あらかじめクラスタ数を決めておく必要があり、クラスター数の決定が重要となります。生活者のセグメンテーションやポジショニング確認を目的としたブランドの分類などに用いられることが多いです。
ほかにも「主成分分析」「因子分析」「コンジョイント分析」といった手法があります。
多変量解析が適している活用シーン
多変量解析は、実にさまざまな場面で活用することができます。たとえばWebコンテンツでいくつかページ分けをし、そこからアクセスして資料請求をした人をサンプルデータとして解析する場合、どのページを見たかを用いて分析しますが、この場合は「クラスター分析」や「主成分分析」が有効です。
一方、営業成績をサンプルに、変数の中の年間売上金額を目的変数、担当顧客数と訪問件数などを説明変数にして予測や評価をする場合には、「重回帰分析」や「判別分析」を使用することになります。
多変量解析のメリット・デメリット
企業では研究開発や生産工程、市場調査や売上予測など、あらゆる場面や事象に際し、多変量解析を活用して問題解決に当たるケースが想定されます。消費者の購買データや製品データを基に、顧客が購買するものを予測し、最適な商品情報を届けるための施策運用を実施する上で、多変量解析は分析力を支える大きな武器になり得ます。
しかし、多変量解析は理論上、必ず何かしらの結果を導き出しますが、それが実情に沿っていなかったり、取り上げる変数次第では誤った道筋となってしまう可能性も少なからず存在します。近年、大きな注目を集めているビッグデータの解析に関しても、うまく分析できないケースなどもあり、どのような変数を扱うかで結論が左右されてしまうという面もあります。
多変量解析を運用する際の注意点
多変量解析には数多くの手法があり、それぞれに一長一短、向き不向きがあるため、各手法の特性をしっかりと理解しておくことが重要です。また、いくつかの変数を使った分析事態に意味を見いだそうとしがちになりますが、多変量解析を行ったからといって、必ずしも数式通りにマーケティング課題やリサーチ課題が明らかになるわけではありません。常に課題に沿った分析を考えることが必要となります。
また、多変量解析の実施時には、きちんとした仮説を立てた上で臨まなければ、せっかく調査・分析をしても、実用性のない結果となってしまうことも少なくありません。
さらに、多くの変数を扱うのが特徴の分析方法ではありますが、準備段階で基データでの精査・クリーニングなどを行うため、実際には集計された基データの内容を100%反映しているわけではありません。
変数の取り方によっては、時として重要度の高い質問も単なる情報の一部となってしまい、細部が見えにくくなってしまう場合もありますので注意が必要です。