エクセルで相関係数を計算する方法を説明します。相関係数は、変数が同じ方向に動く場合は1に近く、無相関の場合はゼロ、変数が反対に動く場合はマイナス1になる係数です。経済分析の基本となる手法です。
変数が2つの場合はCORREL関数を使います。
分析ツールを使えば、3つ以上の変数について、すべての組み合わせの相関係数を計算した表(相関係数行列)が計算できるので、便利です。
経済統計の使い方では、統計データの入手法から分析法まで解説しています。
相関係数とは
相関係数は、以下の式で表せます。共分散をわかりやすいように、ー1から1までの間の数に入るようにしたものです。
$ 相関係数= \dfrac{XとYの共分散 }{ Xの標準偏差×Yの標準偏差} $
相関係数が正の場合は、正の相関がある、と言います。1に近いほど相関が強いです。0の場合は無相関で、AとBに関係がない場合です。相関係数が負の場合は逆相関(負の相関)と呼び、ー1に近いほど逆相関(負の相関)が強いです。
相関係数 | 呼び方 | 説明 |
1 | (完全な)正の相関 | Aが増えるとBも増える |
0.5 | 弱い正の相関 | |
0 | 無相関 | Aが増えると、Bは増る場合と減る場合がある |
-0.5 | 弱い逆相関 | |
-1 | (完全な)逆相関 | Aが増えると、Bは減る |
データ
データは、小巻泰之・山澤成康『計量経済学15講』の第4章にあるテストの成績のデータを利用します。回帰分析で使うデータと同じです。
利用するのは以下の学生の成績データです。
学生 | 基礎科目(X) | 応用科目(Y) |
A | 50 | 60 |
B | 55 | 55 |
C | 45 | 60 |
D | 55 | 65 |
E | 65 | 60 |
F | 65 | 70 |
G | 75 | 75 |
H | 75 | 80 |
I | 80 | 90 |
J | 85 | 85 |
CORREL関数
最も簡単にエクセルで相関係数を求めるには、CORREL関数を使います。相関(correlation)の略です。XとYのそれぞれのデータを配列1、配列2として指定すると、相関係数が求められます。
CORREL関数では3つ以上の相関係数の組み合わせの表(相関係数行列)は計算できません。
分析ツールによる相関分析
次に分析ツールによる相関係数の計算法です。2変数の場合はCORREL関数で十分ですが、3変数以上で相関係数行列を作る場合は、分析ツールが便利です。
分析ツールは通常、有効な状態になっていないので、アドインの「分析ツール」を有効にしておく必要があります。
分析ツールを有効化すると、データタブにデータ分析が現れます。データ分析を選びます。
データ分析をクリックすると、下記のウインドウが開くので、相関を選びます。
相関をクリックすると以下の画面になります。この後の作業は2つだけです。
- 入力範囲にデータの範囲を指定する。
- ラベルにチェックを入れる。
データの範囲を指定するには、右側の矢印マークをクリックします。
矢印マークをクリックすると、以下の画面になります。マウスで、基礎科目(X)と応用科目(Y)のデータを選択します。データのみを選択することもできますが、最上段の「基礎科目(X)」、「応用科目(Y)」も一緒に指定すると、このセルがラベルになって結果がわかりやすくなります。範囲を指定した後、ラベルにチェックを入れます。データのみを選択した場合は、チェックを入れる必要はありません。
OKを押すと、結果が表示されます。基礎科目と応用科目の行列になっています。基礎科目と基礎科目、応用科目と応用科目はそれぞれ同じなので、相関係数は1になります。基礎科目と応用科目の相関係数は0.887625365です。小数点第2位までで表示すると0.89です。
分析ツールによる相関係数行列(4変数の場合)
分析ツールを使って、4変数で相関係数行列を出力する場合の例です。方法は2変数の場合と同じで、変数を4つ分選べば相関係数行列が出力されます。
今回は、人流を表すグーグルのコミュニティモビリティレポートを加工して、東京都の人流を月次で作り、小売店、雑貨店・薬局、乗換駅、仕事場の4つの変数について、相関係数を取りました。データの期間は2020年2月から2022年9月までです。
- 【反実仮想の世界】課題3 就学年数と年収(操作変数法)
- 【反実仮想の世界】課題2 少子化対策(傾向スコアマッチング)
- 【反実仮想の世界】課題1 英語のテストと研修の効果(RCT)
- 【機械学習への道】課題3 働く力の作成
- 【機械学習への道】課題2 ベイズによる分析