相関分析
相関分析は、2つ以上の変数の間に相関関係があるかどうかを数値的に判断する統計学的手法である。変数がどの程度連動して動くかを数値で示し、その関係が強いのか弱いのか、または正の相関か負の相関かを明らかにする。これにより、現象やデータの背後にあるパターンを理解し、予測や意思決定に活用することができる。相関分析は、マーケティング、経済学、心理学、工学など様々な分野で広く使用されている。
相関係数
相関係数は、2つの変数間の相関の強さと方向を数値で示す指標である。一般的には、-1から+1までの範囲で表される。+1に近いほど正の相関が強く、-1に近いほど負の相関が強い。0の場合は、相関がないことを意味する。代表的な相関係数として、ピアソンの積率相関係数、スピアマンの順位相関係数、ケンドールの順位相関係数がある。
正の相関と負の相関
正の相関とは、一方の変数が増加するともう一方の変数も増加する関係を指す。例えば、広告費と売上の関係が正の相関である場合、広告費を増やすと売上も増える傾向にある。一方、負の相関は、一方の変数が増加するともう一方の変数が減少する関係を指す。例えば、商品の価格と販売量が負の相関の場合、価格を上げると販売量が減る可能性が高い。
相関係数の符号
なお、相関係数の符号は、正(+)のときには、正の相関関係があることを、負(-)のときには、負の相関関係があることを示唆している。相関関係の強さは、相関係数の絶対値|r|または二乗値r2で評価する。どちらも1に近いほど相関が強いことを意味する。相関関係が存在しないときには、相関係数の値は0に近い値(ちょうど0になることはまれである)を示す。

散布図の併用
相関分析は一般的に相関係数と散布図を併用して、相関関係を分析する。「散布図の視察」という視覚的分析のステップと、「相関係数の吟味」という数値的分析のステップで構成される。下記はサンプルデータであり、「広告予算」と「売上」の関係を示しており、相関関係が可視化されている。また、相関係数行列を併記し、「広告予算」と「売上」の間にわずかな負の相関(-0.101)が示されている。

相関分析の実施手順
相関分析を行う際の手順は、まずデータを収集し、変数間の関係を視覚的に確認するために散布図を作成する。その後、適切な相関係数を計算し、得られた数値を解釈する。最後に、相関の強さや方向性に基づいて仮説を立て、必要に応じてさらなる分析を行う。このプロセスを通じて、データの背後にある関係性を明らかにすることができる。
メリット
相関分析のメリットは、データ間の関係性を簡単に把握できる点である。これにより、変数間の関連性を明確にし、将来的な予測や仮説の構築に役立てることができる。また、変数間の相関を数値で示すため、比較や評価が容易であり、データに基づいた意思決定を支援するツールとしても有効である。
デメリット
相関分析にはいくつかのデメリットも存在する。まず、相関係数が因果関係を示すわけではないため、誤った解釈をする可能性がある。また、外れ値や非線形な関係を持つデータでは相関係数が正確な関係を反映しない場合がある。そのため、相関分析の結果を過信せず、他の手法と組み合わせて分析することが重要である。
ピアソンの積率相関係数
ピアソンの積率相関係数は、最も一般的な相関係数であり、2つの変数が線形関係にあるかどうかを測定する。数値データに適しており、平均値からの偏差を使って計算される。この相関係数は、変数間の関係が直線的である場合に有効で、-1から+1の範囲で示される。ただし、非線形の関係には適用できないため、その点に注意が必要である。
スピアマンの順位相関係数
スピアマンの順位相関係数は、変数間の単調な関係を測定するための相関係数である。データが順序データの場合や、変数間の関係が線形ではない場合に適している。この方法では、各データを順位に変換し、その順位に基づいて相関係数を計算する。したがって、極端な値や非線形性に対して頑健である。
相関分析の活用事例
相関分析は、マーケティングでの消費者行動分析、金融市場での株価の動向予測、医学における健康データの関連性の研究など、幅広い分野で活用されている。例えば、企業が広告費と売上の相関関係を分析することで、広告戦略の効果を評価し、最適な予算配分を決定することが可能となる。
相関分析と回帰分析の違い
相関分析と回帰分析は、共に変数間の関係を調べる手法だが、その目的とアプローチには違いがある。相関分析は、変数間の関係の強さと方向を把握するのに対し、回帰分析は一方の変数を他方の変数で予測することを目的とする。つまり、相関分析は関連性を示すのみであり、回帰分析は因果関係をモデル化するために用いられる。