決定木は、多数のデータを分類するのに適しています。「営業利益の前期比が-0.35よりも小さく、有効求人倍率が0.3より大きい時は、景気拡大期」といった判断ができるようになります。
経済統計の使い方では、統計データの入手法から分析法まで解説しています。

決定木を使った分析を説明します。ここでは、景気の拡大期と後退期とそれに対応するデータを使って、どのような変数が景気の拡大期と後退期に影響を与えているかを見ていくことにします。まず、データをインポートします
データ
データは、1975年2月から2020年5月までで、変数BIが景気の状態を表す変数(データの型は因子型)です。景気拡大期はup、景気後退期はdownです。残りは景気動向指数一致指数の構成指数でC6とC7は前月差、他は前月比伸び率で表しています。
C1 生産指数(鉱工業),C2 鉱工業用生産財出荷指数 ,C3 耐久消費財出荷指数 ,C4 労働投入量指数(調査産業計) ,C5 投資財出荷指数(除輸送機械) ,C6 商業販売額(小売業)(前年同月比) ,C7 商業販売額(卸売業)(前年同月比) ,C8 営業利益(全産業) ,C9 有効求人倍率(除学卒) ,C10 輸出数量指数
決定木の計算
決定木を使うには、rpart パッケージを使います。コマンドはrpartです。書式は最小二乗法の場合と同じで、最初に被説明変数である景気を表す変数があり、~ 以降に説明変数を並べます。結果をresultに入れ、resultと入力するとその結果が表示されます。
library(“rpart”)
以下が結果です。
決定木を描く
rpart コマンドで結果は出力されますが、わかりにくいので、木の形にして表示します。rpart.plot パッケージを使います。木の形はさまざまなオプションで変えることはできますが、オプションを指定しなくても木を書いてくれます。

結果の解釈
この分析によると、まずC8(営業利益 全産業)の前期比によって枝分かれします。C8が-0.35よりも小さい時、左側の枝に移行します。次に、C9(有効求人倍率)の数値で判断します。C9が0.3より大きい時は、景気拡大期となります。0.3以下の時は同じくC9で判断し、-1.1より小さければ景気後退期になります。