SECTION 01
連立方程式体系の概要
単一方程式ではなく、複数の方程式を体系(system)として同時に 扱う。内生変数の有無によってモデルの性質と推定手法が根本的に異なる。
内生性なし:SUR
各方程式は独立に見えるが、誤差項が方程式をまたいで相関している
Zellner (1962)「見かけ上無関係な回帰」モデル
各式を OLS で個別推定しても一致推定量が得られる
ただし GLS(FGLS)はより効率的
内生性あり:同時方程式モデル
右辺に内生変数が含まれ、OLS は非一致推定量になる
識別(identification)の確認が不可欠
2SLS を方程式ごとに適用するか、体系全体で同時推定する
体系推定:3SLS・GMM・FIML
本章の参考文献は Wooldridge IE ch.16、Wooldridge (2010) ch.7・8・9、Greene 7e p.370 である。
SECTION 02
内生性なし ― SUR モデル
内生変数のない \(G\) 本の方程式からなる体系を考える。各方程式は見かけ上独立だが、誤差項が方程式間で相関している点が OLS との相違点である。
\[
y_{1i} = \mathbf{x}_{1i}\boldsymbol{\beta}_1 + u_{1i}
\]
\[
y_{2i} = \mathbf{x}_{2i}\boldsymbol{\beta}_2 + u_{2i}
\]
\[
y_{Gi} = \mathbf{x}_{Gi}\boldsymbol{\beta}_G + u_{Gi}
\]
例: \(y_1\) が食料への支出、\(y_2\) が衣類への支出、……であり、\(\mathbf{x}\) には所得・家族人数などが含まれる場合。
\(\mathbf{x}_g\) は \(G \times K_g\) 行列、\(\boldsymbol{\beta}_g\) は \(K_g \times 1\) ベクトル、\(K = \sum_{g} K_g\) とする。多くの応用では全方程式に同じ説明変数が入るが、一般的なモデルでは方程式ごとに変数の種類と数が異なることも許容される。
この体系は Zellner (1962) の見かけ上無関係な回帰(Seemingly Unrelated Regressions; SUR)モデル と呼ばれる。各方程式が固有のパラメータベクトル \(\boldsymbol{\beta}_g\) を持つため、一見すると方程式が互いに無関係に見えることに由来する名称である。
行列による体系表現
体系全体をまとめて \(\mathbf{y}_i = \mathbf{x}_i\boldsymbol{\beta} + \mathbf{u}_i\) と表記する。各ベクトル・行列の定義は次のとおりである。
記号 サイズ 内容
\(\mathbf{y}_i\)
\(G \times 1\)
被説明変数ベクトル \((y_{1i},\, y_{2i},\, \ldots,\, y_{Gi})'\)
\(\mathbf{x}_i\)
\(G \times K\)
ブロック対角行列(各対角ブロックが \(\mathbf{x}_{gi}\)、それ以外は 0)
\(\boldsymbol{\beta}\)
\(K \times 1\)
全方程式のパラメータを積み上げたベクトル \((\boldsymbol{\beta}_1',\, \boldsymbol{\beta}_2',\, \ldots,\, \boldsymbol{\beta}_G')'\)
\(\mathbf{u}_i\)
\(G \times 1\)
誤差ベクトル \((u_{1i},\, u_{2i},\, \ldots,\, u_{Gi})'\)
\[
\mathbf{x}_i = \begin{pmatrix}
\mathbf{x}_{1i} & \mathbf{0} & \cdots & \mathbf{0} \\
\mathbf{0} & \mathbf{x}_{2i} & & \vdots \\
\vdots & & \ddots & \mathbf{0} \\
\mathbf{0} & \cdots & \mathbf{0} & \mathbf{x}_{Gi}
\end{pmatrix}
\]
SECTION 03
SUR の推定 ― OLS vs GLS
SUR の仮定のもとでは OLS でも一致推定量が得られる。ただし、方程式間の誤差相関を除去する GLS(または FGLS)を用いることで、より効率的な推定 が可能になる。
仮定
A1
厳格な外生性(strict exogeneity)
\(\mathrm{E}[\mathbf{u}_i \mid \mathbf{x}_1, \mathbf{x}_2, \ldots, \mathbf{x}_G] = \mathbf{0}\)
A2
均一分散(homoscedasticity)
\(\mathrm{Var}(u_{gi}) = \sigma_g^2\)
A3
観測値間の無相関・方程式間の相関
同一観測値内では方程式間に相関あり:\(\mathrm{Cov}(u_{gi},\, u_{hi}) = \sigma_{gh}\)。異なる観測値間では無相関:\(\mathrm{Cov}(u_{gi},\, u_{hj}) = 0\)(\(i \neq j\))。
仮定 A1〜A3 のもとでは、各方程式は OLS 仮定 1〜4(OLS.1–OLS.4)を満たすので、方程式を1本ずつ OLS で推定しても、一致推定量(consistent)が得られる(ただし効率的ではない)。
GLS を使う利得が小さくなる2つのケース
1
方程式が実際に無関係な場合(\(\sigma_{gh} = 0\))
方程式間の誤差相関がゼロならば、GLS を使っても OLS と同じ結果になる。方程式間の相関がない限り、GLS に乗り替えても効率の改善はない。
2
全方程式に同じ説明変数が含まれる場合(\(\mathbf{x}_1 = \mathbf{x}_2 = \cdots = \mathbf{x}_G\))
全方程式の説明変数が同一の場合、OLS と GLS の推定量は一致する(identical)。
説明変数が全方程式で同じであっても、SUR を使う重要な理由がある。異なる方程式にまたがるパラメータの結合仮説検定 を行うためには、推定量間の共分散を含む分散行列 \(\hat{\boldsymbol{\Sigma}}\) を推定しなければならない。方程式ごとに OLS を適用するだけでは、異なる方程式の推定量間の共分散が直接的に得られない。
SECTION 04
内生性あり ― 同時方程式モデル
内生変数を体系に導入する。方程式の右辺に他の内生変数が現れるため、OLS 推定量は非一致 となる。操作変数(IV)による識別が不可欠である。
2 方程式の構造モデル
\[
y_1 = \alpha_0 + \alpha_1 y_2 + \alpha_2 z + u_1
\]
\[
y_2 = \gamma_0 + \gamma_1 y_1 + u_2
\]
ここで \(z\) は外生変数と仮定する。\(y_2\) は一般に \(u_1\) と相関し、\(y_1\) は \(u_2\) と相関する。なぜか。
直感: たとえば第1式で \(y_1\) が増えれば(\(u_1\) が大きいとき)、第2式を通じて \(y_2\) が増える。すると「\(y_2\) が大きいときに \(u_1\) が大きい」という相関が生まれる。これが同時性バイアス(simultaneous equations bias)の本質である。したがって OLS 推定量は非一致であり、操作変数が必要になる。
SECTION 05
識別問題(Identification)
「どの方程式が識別可能か」を判断する。モデルの外に追加変数がない場合、除外操作変数の数と内生変数の数の大小 で識別の可否が決まる。
2 方程式モデルにおける識別
再び 2 方程式モデルを見る。
第1式:\(y_1 = \alpha_0 + \alpha_1 y_2 + \alpha_2 z + u_1\)
第2式:\(y_2 = \gamma_0 + \gamma_1 y_1 + u_2\)
第2式を識別するには、\(y_1\) に対する除外 IV として \(z\) を使える(\(z\) は第2式に現れないので除外操作変数になる)。
第1式の識別には \(y_2\) に対する除外 IV が必要だが、\(z\) は第1式に含まれているため使えない。モデルの外に別の変数がなければ、第1式は識別不能(not identified) である。
IV 推定のルール(rule for IV estimation)を適用する:
除外操作変数の数(# of excluded instruments)≥ 方程式内の内生変数の数(# of endogenous variables in the equation)
3 方程式モデルにおける識別の例
\[
y_1 = \alpha_0 + \alpha_1 y_2 + \alpha_2 y_3 + \alpha_3 z_1 + u_1
\]
\[
y_2 = \beta_0 + \beta_1 y_1 + \beta_2 z_1 + \beta_3 z_2 + \beta_4 z_3 + u_2
\]
\[
y_3 = \gamma_0 + \gamma_1 y_2 + \gamma_2 z_1 + \gamma_3 z_2 + \gamma_4 z_3 + \gamma_5 z_4 + u_3
\]
外生変数:\(z_1, z_2, z_3, z_4\)(モデルの外に追加変数はないと仮定)。
各方程式の識別状況(順序条件)
方程式
除外 IV の数
内生変数の数
判定
第1式(\(y_1\))
3 (\(z_2, z_3, z_4\))
2 (\(y_2, y_3\))
3 > 2 ∴ 識別可能(過剰識別)
第2式(\(y_2\))
1 (\(z_4\))
1 (\(y_1\))
1 ≥ 1 ∴ 識別可能(丁度識別)
第3式(\(y_3\))
0
1 (\(y_2\))
0 < 1 ∴ 識別不能
Professor Note ― 第2・3式の除外 IV の数え方
第2式には \(z_1, z_2, z_3\) が含まれ、\(z_4\) は含まれない。したがって除外 IV は \(z_4\) のみ(1本)。内生変数は \(y_1\) の1本だけなので、順序条件を満たす(丁度識別)。第3式には \(z_1, z_2, z_3, z_4\) が含まれ、除外できる外生変数は 0 本。内生変数は \(y_2\) の1本なので識別不能。
原典 P.75 の空欄部分。テキストに空白が設けられており、講義中に受講生が考える設問形式になっている。
SECTION 06
順序条件と階数条件
順序条件(order condition) は識別の必要条件であり、確認が容易である。しかしこれは十分条件ではなく、より強い 階数条件(rank condition) を確認することが必要である。
順序条件(Order Condition)
必要条件(necessary condition)
除外 IV の数 ≥ 内生変数の数
確認が容易で計算不要
これを満たさない方程式は識別不能と即断できる
階数条件(Rank Condition)
十分条件(sufficient condition)
除外変数が実際に内生変数と相関しているか
弱 IV 問題(weak IV problem)と密接に関連
順序条件を満たしても階数条件を満たさない場合がある
The order condition is only necessary, not sufficient condition, for identification. For example, if \(\gamma_5 = 0\), \(z_4\) appears nowhere in the system, which means it is not correlated with \(y_1\), \(y_2\), or \(y_3\). Then the second equation is not identified, because \(z_4\) is useless as an IV for \(y_1\).
順序条件は識別の必要条件に過ぎず、十分条件ではない。たとえば \(\gamma_5 = 0\) ならば、\(z_4\) は体系のどこにも現れないことになり、\(y_1, y_2, y_3\) のいずれとも相関しない。この場合、第2式は識別不能となる。なぜなら \(z_4\) は \(y_1\) に対する IV として役に立たないからである。したがって第2式を識別するためには \(\gamma_5 \neq 0\) でなければならない(弱 IV 問題と同様である)。
原典 P.75。
SECTION 07
推定方法の概要 ― 2SLS・3SLS・GMM・FIML
方程式が識別可能であることを確認したうえで推定に進む。最もシンプルな手法は 方程式ごとの 2SLS だが、体系全体の同時推定によってより効率的な推定量が得られる。
体系全体を一括推定することで得られる効率性の改善は、SUR において OLS より FGLS を使うことで得られる改善と類比的である。
2SLS
方程式別 2 段階最小二乗法(Two-Stage Least Squares by Equation)
最もシンプルな手法。一致推定量(consistent)を与えるが、多くの場合、体系手続きを使うより非効率である。誤差項の方程式間相関を利用しない。
3SLS
3 段階最小二乗法(Three-Stage Least Squares)
体系全体を同時推定する代表的 IV 手法の一つ。Stata コマンド reg3 で実装されている。下記の3ステップで理解できる(Greene 7e p.370)。
GMM
一般化モーメント法(Generalized Method of Moments)
本章で詳しく取り上げる。モーメント条件(直交条件)を利用して最小化問題を解く。異分散に対してより効率的な推定量を与える。
FIML
完全情報最尤法(Full Information Maximum Likelihood)
体系全体の尤度を最大化する。正規分布の仮定が正しければ漸近的に最も効率的。本章では扱わない。
3SLS の3ステップ(Stata manual of reg3)
Step 1. 2SLS の第1段階と同一。各内生変数を操作変数に回帰してフィットした値を取得する。
Step 2. 各構造方程式の 2SLS 残差から、方程式間撹乱項の共分散行列の一致推定量を求める。
Step 3. Step 2 で推定した共分散行列と、右辺内生変数をインストルメント化した値を用いて GLS 型の推定を行う。
原典 P.76 脚注21。
SECTION 08
GMM のセットアップ
GMM の出発点は、操作変数と誤差項の直交性(orthogonality)からなるモーメント条件 である。
モデルの設定
\[
\mathbf{y}_i = \mathbf{x}_i\boldsymbol{\beta} + \mathbf{u}_i
\]
記号 サイズ 内容
\(\mathbf{y}_i\) \(G \times 1\) 被説明変数ベクトル
\(\mathbf{x}_i\) \(G \times K\) 一部の要素が内生変数(endogenous)の説明変数行列
\(\mathbf{u}_i\) \(G \times 1\) 誤差ベクトル
\(\boldsymbol{\beta}\) \(K \times 1\) 推定すべきパラメータベクトル
\(\mathbf{z}_i\) \(G \times L\) 操作変数行列(除外 IV + \(\mathbf{x}_i\) 中の外生変数)
操作変数は誤差項と無相関でなければならない。これをモーメント(直交)条件 という。
\[
\mathrm{Corr}(\mathbf{z}_i', \mathbf{u}_i) = 0
\;\Leftrightarrow\;
\mathrm{Cov}(\mathbf{z}_i', \mathbf{u}_i) = 0
\;\Leftrightarrow\;
\mathrm{E}(\mathbf{z}_i' \mathbf{u}_i) = 0
\;\Leftrightarrow\;
\mathrm{E}[\mathbf{z}_i'(\mathbf{y}_i - \mathbf{x}_i\boldsymbol{\beta})] = \mathbf{0}
\quad (L \times 1)
\]
モーメント条件の数(\(L\))と未知パラメータの数(\(K\))の大小関係によって、推定問題の性格が変わる:
\(L = K\)(丁度識別)→ モーメント条件を正確にゼロにする解が一意に存在する。
\(L > K\)(過剰識別)→ 全条件を同時にゼロにはできない。GMM は二次形式を最小化する。
SECTION 09
モーメント法(MM)
モーメント法(Method of Moments; MM) は、標本モーメントをゼロにするようにパラメータを選ぶ手法である。最小二乗法や最尤法とは根本的に異なる発想である。
標本モーメント \(\mathbf{m}(\boldsymbol{\beta})\) を次のように定義する。
\[
\mathbf{m}(\boldsymbol{\beta}) = N^{-1}\sum_{i=1}^{N} \mathbf{z}_i'(\mathbf{y}_i - \mathbf{x}_i\boldsymbol{\beta}) = \mathbf{0} \quad (L \times 1)
\]
モーメント法の発想は最小二乗法・最尤法とは本質的に異なる。まずモーメント条件を設定し、次にその条件を(できるだけ)満たすようにパラメータを選ぶ。
丁度識別(\(L = K\))の場合
\(L = K\) のとき、\(\mathbf{m}(\boldsymbol{\beta}) = \mathbf{0}\) は一意解を持つ。
\[
\hat{\boldsymbol{\beta}}
= \left(N^{-1}\sum_{i=1}^{N} \mathbf{z}_i'\mathbf{x}_i\right)^{-1}
\left(N^{-1}\sum_{i=1}^{N} \mathbf{z}_i'\mathbf{y}_i\right)
\quad (K \times 1 \text{ ベクトル})
\]
IV 推定量との等価性: これは IV 推定量と等価である。すなわち IV 推定量は MM の特殊ケースである。
特に、内生性がない場合(\(\mathbf{z}_i = \mathbf{x}_i\))は、
\[
\hat{\boldsymbol{\beta}}
= \left(N^{-1}\sum_{i=1}^{N} \mathbf{x}_i'\mathbf{x}_i\right)^{-1}
\left(N^{-1}\sum_{i=1}^{N} \mathbf{x}_i'\mathbf{y}_i\right)
\]
OLS 推定量との等価性: これは OLS 推定量と等価である。すなわち OLS は MM の特殊ケースである。
過剰識別(\(L > K\))の場合
識別に必要な数よりも多くの IV(方程式)がある場合(過剰識別)、原則として \(\mathbf{m}(\boldsymbol{\beta}) = \mathbf{0}\) を満足する解は存在しない。そこで代わりに、この式を「できるだけ小さく」する \(\boldsymbol{\beta}\) を選ぶ。正と負の値が相殺されないよう、二次形式をとる。
\[
\mathbf{m}(\boldsymbol{\beta})'\mathbf{m}(\boldsymbol{\beta})
= \left[N^{-1}\sum_{i=1}^{N} \mathbf{z}_i'(\mathbf{y}_i - \mathbf{x}_i\boldsymbol{\beta})\right]'
\left[N^{-1}\sum_{i=1}^{N} \mathbf{z}_i'(\mathbf{y}_i - \mathbf{x}_i\boldsymbol{\beta})\right]
\quad (\text{スカラー})
\]
数値例:\(L = 2,\; K = 1\) の場合
操作変数が2本(\(L = 2\))、パラメータが1個(\(K = 1\))とする。データを代入すると
\[
\mathbf{m}(\beta) = \begin{bmatrix} 3 - \beta \\ 2 - \beta \end{bmatrix}
\]
すなわち「第1 IV から得られるモーメント条件:\(3 - \beta = 0\)」と「第2 IV から得られるモーメント条件:\(2 - \beta = 0\)」の2つがある。1つの未知パラメータで両条件を同時にゼロにすることはできない(\(3 - \beta = 2 - \beta = 0\) は不可能)。そこで MM は以下を最小化する。
\[
\mathbf{m}(\beta)'\mathbf{m}(\beta)
= [3 - \beta,\; 2 - \beta]
\begin{bmatrix} 3 - \beta \\ 2 - \beta \end{bmatrix}
= (3 - \beta)^2 + (2 - \beta)^2
\]
少し計算すると、最小値は \(\hat{\beta} = 2.5\) で達成される。
この方法は各モーメント条件に等しいウェイトを与えている(単位行列による二次形式)。これは一致推定量を与えるが、より効率的な方法がある。各モーメント条件にウェイトを適用することで、パラメータの分散を小さくできる。これが GMM の動機である。
SECTION 10
GMM 推定量
一般化モーメント法(Generalized Method of Moments; GMM) は、モーメント条件の二次形式にウェイト行列 \(\mathbf{W}\) を導入することで、MM よりも効率的な推定量を実現する。
GMM 推定量は次の目的関数を最小化することで得られる。
\[
\mathbf{m}(\boldsymbol{\beta})' \mathbf{W} \mathbf{m}(\boldsymbol{\beta})
= \left[N^{-1}\sum_{i=1}^{N} \mathbf{z}_i'(\mathbf{y}_i - \mathbf{x}_i\boldsymbol{\beta})\right]'
\mathbf{W}
\left[N^{-1}\sum_{i=1}^{N} \mathbf{z}_i'(\mathbf{y}_i - \mathbf{x}_i\boldsymbol{\beta})\right]
\]
ここで \(\mathbf{W}\) は \(L \times L\) の対称半正定値行列(symmetric, positive semidefinite)のウェイト行列である。これは \(\boldsymbol{\beta}\) の二次関数であるから、解析的に解くことができる。
数値例:ウェイト行列による変化
\(\mathbf{m}(\beta) = \begin{bmatrix} 3 - \beta \\ 2 - \beta \end{bmatrix}\)、\(\mathbf{W} = \begin{bmatrix} a & c \\ c & b \end{bmatrix}\) の場合、
\[
\mathbf{m}(\beta)' \mathbf{W} \mathbf{m}(\beta)
= [3-\beta,\; 2-\beta]
\begin{bmatrix} a & c \\ c & b \end{bmatrix}
\begin{bmatrix} 3-\beta \\ 2-\beta \end{bmatrix}
= a(3-\beta)^2 + b(2-\beta)^2 + c(3-\beta)(2-\beta)
\]
\(\mathbf{W}\) が2つのモーメント条件に対するウェイトであることが見てとれる。
SECTION 11
最適ウェイト行列
GMM の推定量の分散を最小にする 最適ウェイト行列(optimal weight matrix) は、モーメント条件の分散の逆行列として与えられる(Hansen 1982)。
\[
\mathbf{W}^* = \mathbf{S}^{-1}
\quad \text{ただし} \quad
\mathbf{S} = \mathrm{Var}(\mathbf{m}(\boldsymbol{\beta})) = \mathrm{Var}(\mathbf{z}'\mathbf{u}) = \mathrm{E}(\mathbf{z}'\mathbf{u}\mathbf{u}'\mathbf{z})
\]
直感: 最適 GMM は分散の小さい、すなわち「より信頼できる」モーメント条件に高いウェイトを与える。
しかし \(\mathbf{u}\) は観察できないため、\(\mathbf{S}\) を直接計算することはできない。そこで2段階のアプローチが必要になる。誤差が独立だが必ずしも同一分布でない(すなわち異分散あり)と仮定する場合、次の2段階推定が GMM 推定量の最小分散を達成する。
SECTION 12
2ステップ GMM
\(\mathbf{S}\) を直接知ることはできないため、まず暫定的なウェイトで推定し、その残差からウェイト行列を更新する 2ステップ手続きを踏む。
1
第1ステップ:\(\mathbf{W} = \mathbf{W}_1\) で GMM を推定する
初期ウェイト行列として次を用いる。
\[
\mathbf{W}_1 = \left(N^{-1}\sum_{i=1}^{N} \mathbf{z}_i'\mathbf{z}_i\right)^{-1}
\]
\(\mathbf{W}_1\) を用いた GMM 推定量は 2SLS 推定量と等価である(Wooldridge 2010, ch. 8.3.2 および 8.3.3)。
2
第2ステップ:残差を使って \(\mathbf{W}_2\) を構築し、GMM を再推定する
第1ステップで得た推定値 \(\hat{\boldsymbol{\beta}}_0\) から残差を計算する:\(\mathbf{u}_{0i} = \mathbf{y}_i - \mathbf{x}_i\hat{\boldsymbol{\beta}}_0 \quad (G \times 1)\)。次に第2ステップのウェイト行列として次を用いる。
\[
\mathbf{W}_2 = \left(N^{-1}\sum_{i=1}^{N} \mathbf{z}_i'\mathbf{u}_{0i}\mathbf{u}_{0i}'\mathbf{z}_i\right)^{-1}
\]
第1ステップで使うウェイトは誤差構造の仮定に依存する。たとえば誤差が相関していると仮定する場合は、第1ステップで異なるウェイトを用いるべきである。
SECTION 13
GMM の留意点
GMM は強力な手法だが、実務上いくつかの留意点がある。丁度識別の場合はウェイト行列に依存しない こと、小標本バイアス、実証研究における採用率の低さ、が主な論点である。
1
丁度識別(\(L = K\))では \(\mathbf{W}\) の選択が不問
モデルが丁度識別の場合(\(L = K\))、GMM の解はウェイト行列 \(\mathbf{W}\) の選択によらない。
2
単一方程式モデルへの応用
GMM は体系モデルだけでなく単一方程式モデルにも適用できる。異分散のもとでは、大標本において GMM は OLS・2SLS・固定効果推定量(FE)よりも効率的になりうる。ただし小標本では GMM の有限標本バイアスが問題になる。
3
実証研究では LS が支配的
異分散が明らかに存在する場合でも、係数と有意性の推定値への影響はしばしば軽微である。また、異分散に頑健な標準誤差を計算する手法が存在する。GMM による追加の利得は小さい場合が多く、実証研究者はほぼ例外なく最小二乗法(LS)を用いている。
4
GMM が特に重要な分野
動的パネルデータモデル(dynamic panel data models)、非線形モデル(例:\(y = \beta_0 + \beta_1 x^{\beta_2}\))、時系列分析(time series analysis)。(Wooldridge 2001, JEP 参照)
However, virtually every empirical researcher has used LS rather than GMM. The reason would be that even when heteroskedasticity clearly exists, it often has only a minor impact on estimates of coefficients and statistical significance. Moreover, there are methods for calculating standard errors that are robust to heteroskedasticity. The additional gains from using GMM may be small.
しかし実証研究者のほぼ全員が GMM ではなく LS を用いている。その理由は、異分散が明らかに存在する場合でも、係数と有意性の推定値への影響がしばしば軽微だからである。さらに、異分散に頑健な標準誤差を計算する方法が存在する。GMM を使うことで得られる追加の利得は小さい場合が多い。
原典 P.78。
SECTION 14
参考文献(References)
Greene, W. H. Econometric Analysis , 7th ed. Prentice Hall. (特に p.370:3つの IV 手法)
Hansen, L. P. (1982). Large sample properties of generalized method of moments estimators. Econometrica , 50: 1029–1054.
Wooldridge, J. M. Introductory Econometrics: A Modern Approach . ch.16.
Wooldridge, J. M. (2001). Applications of generalized method of moments estimation. Journal of Economic Perspectives , 15(4): 87–100.
Wooldridge, J. M. (2010). Econometric Analysis of Cross Section and Panel Data , 2nd ed. MIT Press. ch.7, 8, 9(特に ch. 8.3.2 および 8.3.3:GMM と 2SLS の関係)
Zellner, A. (1962). An efficient method of estimating seemingly unrelated regressions and tests for aggregation bias. Journal of the American Statistical Association , 57(298): 348–368.
出典:原典 P.74・P.78 参考文献リスト。
Chapter 11
パネルデータ
Chapter 13
二値選択モデル