本ページは、川崎賢太郎『数量経済分析』2026 S1 講義ノート第17章の原文に忠実な全文和訳である。要約・再構成は行わず、原文の論理展開・脚注・参考文献の順序をそのまま日本語に移している。直観的な理解には図解版を併用されたい。
Spring 2026 / Kentaro Kawasaki
[参考文献]Cameron, ch.7–8、Wooldridge, IE, ch.6。
本節では、モデル選択の手続きをまとめる。
2つのモデルは、一方が他方の特殊ケース(special case)である場合にネスト型(nested)であると言われる。一方、いずれのモデルも他方の特殊ケースとして表せない場合には非ネスト型(nonnested)である。
次の例では、Model 1 と Model 2 はネスト型である。なぜなら \(\beta_3 = \beta_4 = 0\) とすれば Model 2 は Model 1 に帰着する(すなわち Model 1 は Model 2 の特殊ケースである)からである。同様に、Model 1 と Model 3 もネスト型である。しかし、Model 2 と Model 3 は非ネスト型である。
ネスト型モデル間の判別は、一方のモデルを他方に帰着させるパラメトリックな制約(parametric restrictions)に対する標準的な仮説検定(hypothesis test)を用いて行うことができる。
しかし非ネスト型の場合には、代替的な手法を新たに用意する必要がある。
Wald 検定(Wald test)を用いる。これは t 検定(単一の係数を検定する場合)または F 検定(複数の係数を検定する場合)としても知られている。Wald 検定は有意性検定(significance test)である。
Stata では、Wald 検定は「test」コマンドを用いて実行できる。
例:上の例で Model 1 と Model 2 を検定するには、F 検定を用いて \(\beta_3 = \beta_4 = 0\) であるか否かを検定する。帰無仮説(\(\beta_3 = \beta_4 = 0\))が棄却される場合(p 値 \(<\) 0.1)には Model 2 が選好され、その逆もまた成り立つ。
モデルが最尤法(maximum likelihood)で推定される場合には、尤度比検定(likelihood ratio, LR test)やラグランジュ乗数検定(Lagrange multiplier, LM test)を用いることもできる。Wald 検定とこれら2つの検定は漸近的に同値(asymptotically equivalent)であるため、計算の容易さと有限標本における性能(finite-sample performance)に基づいて、これらのうちから選択することになる。(Verbeek, ch.6.2、Cameron, ch.7.3 を参照)
モデルが最尤法で推定される場合には、赤池情報量規準(Akaike information criterion, AIC)またはベイズ情報量規準(Bayesian information criterion, BIC)を用いる。
モデルが最尤法で推定されない場合(例:OLS)には、簡便な方法として、調整済み \(R^2\)(adjusted R-squared)を用いて予測能力を比較することが挙げられる。
非尤度の場合に非ネスト型モデル間を判別するための形式的検定(formal tests)は、しばしば次の2つのアプローチのいずれかをとる。人工的ネスティング(artificial nesting)は、2つの非ネスト型モデルをより一般的な人工的モデルに埋め込むものであり、いわゆる J 検定(J tests)や
P 検定(P tests)および関連する検定へとつながる。エンコンパッシング原理(encompassing principle)は、あるモデルを競合する非ネスト型モデルに対して検定するための、きわめて一般的な枠組みへとつながる。
この文献の概要については、Verbeek, ch.3.2.3、Greene, ch.5、または Davidson and MacKinnon (1993, chapter 11) を参照のこと。
上で述べた検定は、同一の被説明変数(the same dependent variable)に対してのみ適用可能である。
2つのモデルが \(y\) について異なる関数形をもつ場合(例:\(y\) と \(\log(y)\))には、代替的な方法を用いるべきである。
次の2つのモデルを推定したとしよう。
モデルの性能をどのように比較すればよいだろうか。
指数をとって線形モデルと比較したくなるかもしれない(すなわち \(y_{\text{predict}} = \exp[\log(y)] = \exp[\mathbf{x}\beta]\))。しかし、\(\log(y)\) のモデルから \(y\) を予測することは一筋縄ではいかない(「OLS: Practical issues」節を参照)。次の手順に従うべきである(Wooldridge, IE, ch.6)。
その他の方法(Box-Cox 変換(Box-Cox transformation)やエンコンパッシング・アプローチを含む)も利用可能である。Verbeek (2012) ch. 3.2.3 を参照。
OLS か 2SLS か? FE か RE か?
Hausman 検定(Hausman test)を用いる。
連続的に観察される変数については、正規性検定は通常、歪度(skewness, 第3モーメント)と超過尖度(excess kurtosis, 第4モーメント)を調べる。
しかしプロビットモデルでは、誤差項は直接には観察できない。
したがって、正規性を特殊ケースとして含むより一般的なモデルを推定し、正規性が成立するか否かを検定すべきである。
正規性の下では(標準的なプロビットモデルにおけるように)、次が成り立つ。
より一般的な Pearson 型分布(Pearson distributions)の下では、次が成り立つ。
正規性は \(\gamma_2 = \gamma_3 = 0\) を要請する。これはラグランジュ乗数(Lagrange multiplier, LM)の枠組みの下で容易に検定できる。
Verbeek (2012) ch. 7.1.7 を参照。
(Klomp and de Haan 2013)
General-to-specific 法(一般から特殊へ):この手法は経済理論には依拠しないが、モデルの仕様(model specification)を決定するために応用計量経済学で広く用いられている手法である。
まず、すべてのコントロール変数を含むモデルを推定する。
次に、最も有意でない変数(the least significant variable)を落として、モデルを再び推定する。
10% 水準で有意な変数のみが残るまで、この手続きを繰り返す。
Stata では「stepwise」を用いる。
コントロール変数の最良の組み合わせを見つけることが、機械学習における主たる焦点である。
計量経済学と機械学習の主たる違いは、計量経済学の主目的が因果関係(causality)を明らかにすることであるのに対し、機械学習の主目的は予測(prediction)であり、したがって因果関係は重視されない、という点にある。
機械学習の入門については James et al (2013) および Hastie et al (2001) を、経済学への応用については Mullainathan and Spiess (2017) を参照のこと。