平均値の差の検定のうち、母分散が等しい場合です。
- 研修前、研修後など対応のある場合
- 母分散が等しい場合
- 母分散が等しくない場合
の3種類が考えられますが、この記事で扱うのは2番目です。
経済統計の使い方では、統計データの入手法から分析法まで解説しています。
平均値の差の検定(母分散が等しい場合)
2つの平均値に差があるかどうかの検定です。
今回の条件は、母平均、母分散が等しい2つの母集団A、Bからそれぞれ、$n_A$、$n_B$の標本を抽出した場合です。
この時、Tは自由度$n_A+n_Bー2$のt分布に従います。
具体例
A国とB国について以下の情報がわかっているとします。
- A国 40人 平均体重 63㎏ 不偏分散 $5^2$
- B国 60人 平均体重 59㎏ 不偏分散 $9^2$
A国の方が栄養状態が良いことがわかっています(片側検定で検定する)。A国の平均体重よりB国の平均体重の方が重いと言えるかどうか?1%で検定します。
帰無仮説
検定するための、帰無仮説と対立仮説を考えます。帰無仮説は「A国の平均体重とB国の平均体重は等しい」とします。
- 帰無仮説 A国の平均体重=B国の平均体重
- 対立仮説 A国の平均体重>B国の平均体重
次に、有意水準(偶然では起こりえないほど珍しい確率)を決めます。ここでは、1%以下とします。
t分布の棄却域を求める
t分布表から、棄却域を調べます。
T.INV(0.99,自由度)
有意水準が片側1%の場合は、以下の値となります。自由度は40+60-2=98です。
T.INV(0.99,98)=2.37
Tを計算する
帰無仮説を認めたうえで
- 有意水準(偶然では起こりえないほど珍しい確率)を決める。1%とする。
- 標本数、t分布表から、棄却域を調べる。 2.37より大きい
- 標本平均を使った場合のt値を調べる。T=2.56
- 標本平均が棄却域に入れば帰無仮説が棄却される。 棄却
- 帰無仮説が棄却される。
- A国の方がB国の方より重い。
エクセルの場合はもっと簡単
エクセルで平均値の差を検定する場合の例を示します。金融業と製造業の年間収入に差があるかどうかを5%水準で検定する場合を考えます。データは以下の通りとします。金融業から10人、製造業から10人をランダムに選んできて年収を聞いたデータです。
2つの母集団の分散は等しいとします。
金融業 | 製造業 |
744 | 672 |
684 | 708 |
780 | 672 |
720 | 684 |
756 | 696 |
696 | 684 |
684 | 720 |
720 | 660 |
720 | 684 |
696 | 660 |
エクセルで平均値の差の検定をする場合は、分析ツールを使います。データ→データ分析で、分析ツールが表示されます。分析ツールのなかでt検定:等分散を仮定した2標本による検定を選びます。
変数1と変数2を指定します。ラベル(変数名)がある場合はラベルにチェックします。棄却域は5%となっています。
以下のように出力されます。t値は3.033899です。5%水準の棄却域は両側検定で2.100922が境界値となります。この結果から、帰無仮説は棄却できることがわかります。つまり、金融業の賃金は製造業の賃金より有意に高いということです。実感にもあってます。