経済統計の使い方
統計初心者の社会人向けに、経済データの解説をしています。「まとめページ」をご覧くだされば、全体的な内容がわかると思います。
エクセル

【統計学】【エクセル】相関係数、相関係数行列の計算法 |CORREL関数と分析ツール

エクセルで相関係数を計算する方法を説明します。相関係数は、変数が同じ方向に動く場合は1に近く、無相関の場合はゼロ、変数が反対に動く場合はマイナス1になる係数です。経済分析の基本となる手法です。

変数が2つの場合はCORREL関数を使います。

分析ツールを使えば、3つ以上の変数について、すべての組み合わせの相関係数を計算した表(相関係数行列)が計算できるので、便利です。

経済統計の使い方では、統計データの入手法から分析法まで解説しています。

【エクセル】エクセルのまとめ 経済統計の使い方では、統計データの入手法から分析法まで解説しています。 https://officekaisuiyoku.com...

相関係数とは

相関係数は、以下の式で表せます。共分散をわかりやすいように、ー1から1までの間の数に入るようにしたものです。

$ 相関係数= \dfrac{XとYの共分散 }{ Xの標準偏差×Yの標準偏差} $

相関係数が正の場合は、正の相関がある、と言います。1に近いほど相関が強いです。0の場合は無相関で、AとBに関係がない場合です。相関係数が負の場合は逆相関(負の相関)と呼び、ー1に近いほど逆相関(負の相関)が強いです。

相関係数呼び方説明
(完全な)正の相関Aが増えるとBも増える
0.5弱い正の相関
0無相関Aが増えると、Bは増る場合と減る場合がある
-0.5弱い逆相関
-1(完全な)逆相関Aが増えると、Bは減る

データ

データは、小巻泰之・山澤成康『計量経済学15講』の第4章にあるテストの成績のデータを利用します。回帰分析で使うデータと同じです。

利用するのは以下の学生の成績データです。

学生基礎科目(X)応用科目(Y)
A5060
B5555
C4560
D5565
E6560
F6570
G7575
H7580
I8090
J8585

CORREL関数

最も簡単にエクセルで相関係数を求めるには、CORREL関数を使います。相関(correlation)の略です。XとYのそれぞれのデータを配列1配列2として指定すると、相関係数が求められます。

CORREL関数では3つ以上の相関係数の組み合わせの表(相関係数行列)は計算できません。

分析ツールによる相関分析

次に分析ツールによる相関係数の計算法です。2変数の場合はCORREL関数で十分ですが、3変数以上で相関係数行列を作る場合は、分析ツールが便利です。

分析ツールは通常、有効な状態になっていないので、アドインの「分析ツール」を有効にしておく必要があります。

【エクセル】分析ツールの有効化|オプションの設定を変更します。 記述統計量の出力や回帰分析など統計分析をするには、エクセルのアドイン(追加プログラム)である「分析ツール」を有効化する必要があります...

分析ツールを有効化すると、データタブにデータ分析が現れます。データ分析を選びます。

データ分析をクリックすると、下記のウインドウが開くので、相関を選びます。

相関をクリックすると以下の画面になります。この後の作業は2つだけです。

  • 入力範囲にデータの範囲を指定する。
  • ラベルにチェックを入れる。

データの範囲を指定するには、右側の矢印マークをクリックします。

矢印マークをクリックすると、以下の画面になります。マウスで、基礎科目(X)と応用科目(Y)のデータを選択します。データのみを選択することもできますが、最上段の「基礎科目(X)」、「応用科目(Y)」も一緒に指定すると、このセルがラベルになって結果がわかりやすくなります。範囲を指定した後、ラベルにチェックを入れます。データのみを選択した場合は、チェックを入れる必要はありません

OKを押すと、結果が表示されます。基礎科目と応用科目の行列になっています。基礎科目と基礎科目、応用科目と応用科目はそれぞれ同じなので、相関係数は1になります。基礎科目と応用科目の相関係数は0.887625365です。小数点第2位までで表示すると0.89です。

分析ツールによる相関係数行列(4変数の場合)

分析ツールを使って、4変数で相関係数行列を出力する場合の例です。方法は2変数の場合と同じで、変数を4つ分選べば相関係数行列が出力されます。

今回は、人流を表すグーグルのコミュニティモビリティレポートを加工して、東京都の人流を月次で作り、小売店、雑貨店・薬局、乗換駅、仕事場の4つの変数について、相関係数を取りました。データの期間は2020年2月から2022年9月までです。

このデータを使った結果は以下の通りです。4変数のそれぞれについて相関係数が出力されます。最も相関が高いのは、小売店と乗り換え駅の人流でした。小売店と雑貨・薬局との相関はほぼないことがわかります。
【エクセル】エクセルのまとめ 経済統計の使い方では、統計データの入手法から分析法まで解説しています。 https://officekaisuiyoku.com...

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA