MCMCのソフトウエアであるStanをRで使って、単回帰分析をします。
データは、エクセルの回帰分析で使っているものと同じです。
MCMCによる単回帰分析の基本的な枠組みは、ベイズ統計です。事前に主観的な予想(事前分布)があり、新たにデータを入手することで、その主観的な分布を更新していくという仕組みです。
これらの仕組みをうまく回すためには、MCMCという手法が有効です。MCMCとは、マルコフ連鎖モンテカルロ法の略です。
経済統計の使い方では、統計データの入手法から分析法まで解説しています。

ベイズモデリング
ベイズの定理は以下で表せます。
最初にこれを見ても何が何だかわからないと思います。この式は、単なる恒等式です。以下の式を変形したものです。
AとBが同時に起こる確率は、Bが起った時Aが起こる確率、Aが起った時にBが起きる確率に等しいので以下の式が成り立ちます。この式の
AをデータD、Bを仮説Hとすると、以下の式になります。Hは「そのコインにはインチキがある」とか「景気は後退している」などです。
さらに、仮説Hを確率分布のパラメーターθ(正規分布の場合は平均と分散)とすると、以下の式になります。確率分布のパラメータが決まるということは、確率分布が決まるということです。
事前確率分布
ということで、データが得られれば、事後確率分布を決めることができます。問題は、その後です。θを動かしたときに確率はどう変化するかを計算するためには、事後確率分布を積分する必要があり、これが計算するうえでは難しいということです。それを解決するのが、MCMCということになります。
データ
データはエクセルの回帰分析でも使った学生の成績のデータです。
学生 | 基礎科目(X) | 応用科目(Y) |
A | 50 | 60 |
B | 55 | 55 |
C | 45 | 60 |
D | 55 | 65 |
E | 65 | 60 |
F | 65 | 70 |
G | 75 | 75 |
H | 75 | 80 |
I | 80 | 90 |
J | 85 | 85 |
plotコマンドで散布図を描いたものです。plot(df2)です。

モデル
統計モデルとしては、線形の形を想定します。
Yが正規分布に従うとすると、パラメーターは平均と標準偏差です。平均は、上式より(
mcmcの結果
mcmcの結果は以下のようになりました。
alpphaの平均値は19.8、betaは0.77、sigmaは7.08です。

