Chapter 11 · Part III 内生性と識別 · 原典 P.68–73

パネルデータ

同一個体を複数時点にわたって追跡することで、個体固有・時間不変の未観測要因 \(a_i\) を制御できる。固定効果（FE）・1階差分（FD）・変量効果（RE）の3推定量の論理と使い分け、そして動学パネルが生じさせる新たな内生性問題を体系的に整理する。

パネルデータ固定効果変量効果 within変換動学パネル

川崎賢太郎（東京大学大学院農学生命科学研究科）原典 P.68–73 Panel Data

図解で読む原文に忠実な和訳

Contents

01. パネルデータとは
02. データ構造とバランス性
03. Pooled OLS と級内相関
04. 1階差分推定量（FD）
05. 固定効果推定量（FE）
06. FE vs FD ― どちらを使うか
07. 変量効果推定量（RE）
08. RE vs FE ― Hausman 検定
09. 時間不変変数の処理
10. 厳格外生性の違反と内生性
11. 動学パネルと system-GMM
12. 参考文献

SECTION 01

パネルデータとは

パネルデータ（panel data）は、同一の個体（農場・世帯・都市・国など）を複数の時点にわたって追跡したデータである。その最大の利点は、標準的な OLS のような推定量においてバイアスを引き起こしうる、個体固有・時間不変の未観測変数に起因する内生性を制御できる点にある。

Panel data-sets follow a random sample of individuals (or farm, households, cities, countries, etc.) over time.
The big advantage of working with panel data is that we will be able to control for the endogeneity caused by individual-specific, time-invariant omitted variable, the presence of which could lead to bias in standard estimators like OLS.

パネルデータは、個人（農場・世帯・都市・国など）の無作為標本を時系列方向に追跡する。パネルデータを用いる最大の利点は、個体固有・時間不変の欠落変数に起因する内生性を制御できることであり、この欠落変数は OLS のような標準的な推定量にバイアスをもたらしうる。

原典 P.68。参照：Wooldridge, Introductory Econometrics, ch.13, 14; Wooldridge (2010), ch.10.

パネルデータの外観

パネルデータは、個体識別子（id）と時点（year）が2つのキーとなるデータ構造を持つ。以下は典型的な外観である（原典 P.68 の表より）。

表1 パネルデータの構造例
id	year	y	x
1	2010	3.35	1.56
1	2011	0.69	13.26
1	2012	0.43	5.35
2	2010	0.79	3.13
2	2011	1.80	3.74
2	2012	1.32	2.11
…（以下続く）

SECTION 02

データ構造とバランス性

本講義では、\(N\) が大きく \(T\) が小さいケース（large \(N\), small \(T\)）に焦点を当てる。\(N\)＝データ単位の数、\(T\)＝時点の数。

反対のケース、たとえば \(N = 5\) か国・\(T = 40\) 年のような場合は、複数の時系列分析（multiple time series analysis）の領域となる。

Balanced Panel

バランスト・パネル

すべての \(N\) 個体について、データが存在する時点の長さが同一であるパネル。

Unbalanced Panel

アンバランスト・パネル

個体によって観察期間の長さが異なるパネル。実務ではこちらが一般的。

脱落が非ランダムな場合の注意。たとえば相対的に生産性の低い農場ほど脱落率が高い、といった非ランダムな理由でアンバランスが生じている場合は、これを無視するとバイアスが生じうる。この問題はサンプル選択モデル（sample selection model）によって対処できる（Wooldridge, 2010, ch.19.9）。本講義ではこの問題は捨象する。

プールド・クロスセクションとの違い。プールド（繰り返し）クロスセクション（pooled/repeated cross sections）は、異なる時点で同一の母集団からサンプリングしたデータである。個体の識別情報は記録されず、個体を時点をまたいで追跡しようとしない点で、パネルデータとは根本的に異なる。

SECTION 03

パネルデータに対する OLS（Pooled OLS）と級内相関

基本モデルは \(y_{it} = \mathbf{x}_{it}\boldsymbol{\beta} + a_i + u_{it}\) である。\(a_i\) を無視して OLS を適用することを Pooled OLS 推定量という。

記号の定義

記号	呼称・説明
\(i\)	データ単位（個人・農場・世帯・都市・国など）。\(i = 1, \dots, N\)
\(t\)	時点。\(t = 1, \dots, T\)
\(a_i\)	未観測効果（unobserved effects）、または未観測異質性（unobserved heterogeneity）、農場固有の異質性（farm-specific heterogeneity）とも呼ぶ。すべての未観測・個体固有・時間不変（時間添字 \(t\) を持たない点に注意）の、\(y\) に影響する要因を捉える。
\(u_{it}\)	特異的誤差（idiosyncratic error）。個体・時点双方に固有の誤差。

\(a_i\) の例

生産関数（Production Function）

\(a_i\) に含まれるもの

土壌品質（soil quality）と農家の能力（farmer's ability）は時間不変と考えられるため、\(a_i\) に含まれる。

生産関数（Production Function）

\(a_i\) に含まれないもの

病害圧（pest pressure）は時間不変でないため、\(a_i\) には含まれない。

賃金方程式（Wage Equation）

\(a_i\)＝能力（ability）

賃金式においては、観察できない個人の能力が \(a_i\) として代表的に例示される。

Pooled OLS の問題：級内相関（serial correlation）

\(a_i\) が観察できないため、誤差項 \(v_{it} = a_i + u_{it}\) に吸収される。すると合成誤差項 \(v\) は系列相関（serial correlation）を持つ。

\[ y_{it} = \mathbf{x}_{it}\boldsymbol{\beta} + (a_i + u_{it}) \equiv \mathbf{x}_{it}\boldsymbol{\beta} + v_{it} \]

（ケース1）\(a_i\) が \(\mathbf{x}\) と無相関の場合：OLS は一致推定量となる。ただし誤差 \(v\) は系列相関を持つため、Assumption OLS.5 が成立せず、OLS は効率的でなく、標準誤差の通常計算式が誤りとなる。

\[\mathrm{Cov}(v_{it}, v_{is}) = E(v_{it} v_{is}) - E(v_{it})E(v_{is}) = E[(a_i + u_{it})(a_i + u_{is})] - 0 \]

\[ = E(a_i^2) + E(a_i u_{is}) + E(a_i u_{it}) + E(u_{it} u_{is}) = \sigma_a^2 + 0 + 0 + 0 = \sigma_a^2 > 0 \]

\[ \mathrm{Corr}(v_{it}, v_{is}) = \frac{\mathrm{Cov}(v_{it}, v_{is})}{\sqrt{\mathrm{Var}(v_{it})}\sqrt{\mathrm{Var}(v_{is})}} = \frac{\sigma_a^2}{\sigma_a^2 + \sigma_u^2} \]

この相関係数を級内相関（intra-class correlation）という（Wooldridge, 2010, ch.10.6.3）。

対処法：個体レベルでのクラスタリング（clustering on individuals）により、不均一分散と系列相関に対してロバストな標準誤差を得ることができる。あるいは、系列相関を明示的に考慮する変換を施す変量効果（RE）推定量を用いる（後述）。

（ケース2）\(a_i\) が \(\mathbf{x}\) と相関している場合：\(a_i\) を誤差項に入れることは欠落変数の問題を引き起こし、OLS 推定量は不一致となる。この場合は別の戦略（FE または FD）が必要である。

SECTION 04

1階差分推定量（FD: First Difference Estimator）

\(a_i\) が \(\mathbf{x}\) と自由に相関していると仮定する。連続する2時点間の差分を取ることで \(a_i\) を消去する。

仮定

FD の仮定

\(a_i\) と \(\mathbf{x}\) の相関

\(a_i\) は \(\mathbf{x}\) と自由に相関していてよい。

FD の外生性条件

逐次外生性（Sequential Exogeneity）

\(\mathbf{x}\) は当期および前期の \(u\) と無相関：\(E(x_{it} u_{is}) = 0\) （\(s = t\) および \(s = t-1\) のとき）。

1階差分による変換

基本モデル（t 期）

\(y_{it} = \mathbf{x}_{it}\boldsymbol{\beta} + a_i + u_{it}\)

1期前のモデルを引く（\(t-1\) 期）

\(y_{i,t-1} = \mathbf{x}_{i,t-1}\boldsymbol{\beta} + a_i + u_{i,t-1}\) を上式から引く

1階差分方程式（\(a_i\) が消去される）

\(\Delta y_{it} = \Delta \mathbf{x}_{it}\boldsymbol{\beta} + \Delta u_{it}\)

差分データに対して OLS を実行

差分データが Assumptions OLS.1〜OLS.4 を満たす限り、一致推定量が得られる。これを 1階差分（FD）推定量という。

FD の限界：時間不変変数（例：性別）のパラメータは推定できない。差分を取ることで消去されてしまうためである。

SECTION 05

固定効果推定量（FE: Fixed Effects Estimator）

\(a_i\) が \(\mathbf{x}\) と自由に相関していると仮定する。全期間の個体内平均（within mean）を引く within 変換（demeaning）によって \(a_i\) を消去する。

仮定

FE の仮定

\(a_i\) と \(\mathbf{x}\) の相関

\(a_i\) は \(\mathbf{x}\) と自由に相関していてよい。

FE の外生性条件

厳格外生性（Strict Exogeneity）

\(\mathbf{x}\) はすべての時点の \(u\) と無相関：\(E(x_{it} u_{is}) = 0\)（\(s = 1, 2, \dots, T\)）。FD の逐次外生性より強い条件。過去・将来の \(u\) すべてから現在の \(\mathbf{x}\) へのフィードバックを排除する。

within 変換（demeaning）の手順

個体内平均を計算

\(\bar{y}_i = \frac{1}{T}\sum_t y_{it}\)、 \(\bar{\mathbf{x}}_i = \frac{1}{T}\sum_t \mathbf{x}_{it}\)、 \(\bar{u}_i = \frac{1}{T}\sum_t u_{it}\) を求める。すると \(\bar{y}_i = \bar{\mathbf{x}}_i \boldsymbol{\beta} + a_i + \bar{u}_i\)。

構造方程式から個体内平均を引く（within 変換）

\((y_{it} - \bar{y}_i) = (\mathbf{x}_{it} - \bar{\mathbf{x}}_i)\boldsymbol{\beta} + (u_{it} - \bar{u}_i)\)

\(a_i\) が消去される

変換後の式には \(a_i\) が含まれない（within 変換）。OLS により一致推定量が得られる。これを 固定効果（FE）推定量または within 推定量という。

\[ \ddot{y}_{it} = \ddot{\mathbf{x}}_{it}\boldsymbol{\beta} + \ddot{u}_{it} \]

within 変換後

ここで \(\ddot{y}_{it} \equiv y_{it} - \bar{y}_i\) などとする。

なぜ厳格外生性が必要か。demeaned 残差 \(\ddot{u}_{it}\) は \(\bar{u}_i\) を含み、これ自体が \(u_{i1}, u_{i2}, \dots, u_{iT}\) すべてを含む。一方、説明変数ベクトル \(\ddot{\mathbf{x}}_{it}\) も \(\mathbf{x}_{i1}, \dots, \mathbf{x}_{iT}\) すべての値を含む。したがって、すべての \((t, s)\) の組み合わせで \(E(x_{it} u_{is}) = 0\) が成立しなければ、demeaned 方程式を OLS 推定すると内生性バイアスが生じる。

FE と同値な推定方法

ダミー変数を用いた方法：\(y_{it} = \mathbf{x}_{it}\boldsymbol{\beta} + D_i + u_{it}\)（\(D_i\) は各個体のダミー変数）に対して OLS を実行すると、FE と全く同一の結果が得られる。ただし個体数が大きい場合は計算に時間がかかる。

Mundlak の相関変量効果アプローチ（Correlated Random Effects）：次の方程式に OLS を実行すると FE と全く同一の結果が得られる。

\[ y_{it} = \mathbf{x}_{it}\boldsymbol{\beta}_1 + \bar{\mathbf{x}}_i \boldsymbol{\beta}_2 + u_{it}^* \]

Mundlak

ここで \(\bar{\mathbf{x}}_i\) は各説明変数の農場固有の時点平均（farm-specific time averages）。このアプローチは、プロビットモデルなどの非線形モデルでは demeaning や1階差分が困難なため、非線形モデルで頻繁に用いられる。

FE の限界：FD と同様に、性別などの時間不変変数のパラメータは推定できない（demeaning によって消去されてしまう）。

SECTION 06

FE vs FD ― どちらを使うか

FE と FD はどちらも未観測効果を除去する代替的な方法である。選択は特異的誤差 \(u_{it}\) の仮定に依存する。

固定効果（FE）が効率的な条件

\(T = 2\) のとき FE と FD は完全に同値
\(T \geq 3\) かつ厳格外生性が成立
\(u_{it}\) が系列無相関（serially uncorrelated）のとき FE の方が効率的
多くの実証研究者は（根拠なく）FE を使う

1階差分（FD）が効率的な条件

\(T \geq 3\) かつ厳格外生性が成立
\(u_{it}\) が系列相関を持つ（autocorrelated）ときは FD の方が効率的
極端な例：\(u_{it}\) がランダムウォーク（\(u_{it} = u_{i,t-1} + e_{it}\)）のとき FD が明確に優位

Professor Note ― ランダムウォークの場合

\(u_{it} = u_{i,t-1} + e_{it}\)（ランダムウォーク）のとき、\(u_{it}\) は前期の \(u\) と正の相関を持つ。しかし、差分 \(\Delta u_{it} = e_{it}\) は系列無相関（\(\mathrm{Cov}(\Delta u_{it}, \Delta u_{i,t-1}) = \mathrm{Cov}(e_{it}, e_{i,t-1}) = 0\) と仮定）であるから、FD 推定量の方が FE より効率的となる。

逆に、\(u_{it} \sim \mathrm{iid}(0, \sigma_u^2)\)（独立同分布: i.i.d.）のとき、差分 \(\Delta u_{it} = u_{it} - u_{i,t-1}\) は系列相関を持つ（\(\mathrm{Cov}(\Delta u_{it}, \Delta u_{i,t-1}) = -\mathrm{Var}(u_{it})\) となる）ため、FE 推定量の方が FD より効率的となる。

脚注19（原典 P.70）：\(\mathrm{Cov}(\Delta u_{it}, \Delta u_{i,t-1}) = E[(u_{it}-u_{i,t-1})(u_{i,t-1}-u_{i,t-2})] = -E[u_{i,t-1}^2] = -\mathrm{Var}(u_{it})\)

FE vs FD の選択に使える検定

厳格外生性の検定（Testing Strict Exogeneity）

厳格外生性が成立していれば、FE と FD はともに一致推定量である。したがって FE と FD の推定値が有意に乖離している場合、厳格外生性の違反が示唆される。

\(u_{it}\) の系列相関の検定（Testing Serial Correlation）

FD の残差 \(\Delta \hat{u}_{it}\) を取得し、\(\Delta \hat{u}_{it}\) を \(\Delta \hat{u}_{i,t-1}\) に回帰して係数が有意かどうかを調べる。系列相関が検出された場合は、FE を使うか、ロバスト標準誤差付きの FD を使うべきである（Wooldridge, 2010, ch.10.6.3）。

Advanced Tips

固定効果モデルに交互作用項を含める場合で、かつ交互作用される両変数がユニット内で時間変動する（農場固有でない）変数のとき、二重 demeaned 交互作用推定量（double demeaned interaction estimator）を使用すること（Giesselmann and Schmidt-Catran 2022）。

SECTION 07

変量効果推定量（RE: Random Effects Estimator）

\(a_i\) が \(\mathbf{x}\) と無相関と仮定する（かなり強い仮定）。系列相関を考慮した GLS 推定量が変量効果（RE）推定量である。

単純な OLS はこの場合に不偏となるが、合成残差 \(v_{it} = a_i + u_{it}\) が系列相関を持つため効率的でない。また OLS の通常の分散共分散行列も正しくない（ただしクラスタリングにより修正可能）。効率性を重視するならば、この系列相関を考慮した GLS 推定量を用いる。

RE 推定量の変換

パラメータ \(\lambda\) を定義

\(\lambda = 1 - \left(\dfrac{\sigma_u^2}{\sigma_u^2 + T\sigma_a^2}\right)^{1/2}\)。ここで \(\sigma_u\) は \(u\) の標準偏差、\(\sigma_a\) は \(a\) の標準偏差。

準 demeaning（quasi-demeaning）変換

元の方程式から \(\lambda\bar{y}_i = \lambda\bar{\mathbf{x}}_i\boldsymbol{\beta} + \lambda\bar{v}_i\) を引く： \((y_{it} - \lambda\bar{y}_i) = (\mathbf{x}_{it} - \lambda\bar{\mathbf{x}}_i)\boldsymbol{\beta} + (v_{it} - \lambda\bar{v}_i)\)

準 demeaned データに OLS を実行

変換後の残差 \((v_{it} - \lambda\bar{v}_i)\) は系列無相関となるため（証明は長く煩雑。Wooldridge, 2010, p.326 参照）、この OLS が変量効果（RE）推定量となり効率的である。

\(\lambda\) の解釈：パラメータ \(\lambda\) は未知であるため推定する必要がある（Wooldridge, 2010, p.295 に複数の推定方法が掲載）。\(\lambda \approx 0\) のとき（未観測効果が相対的に小さい、または \(T\) が小さい）は RE が単純 OLS に近づく。\(\lambda \approx 1\) のとき RE と FE の推定値は非常に似てくる。

SECTION 08

RE vs FE（FD） ― Hausman 検定

基本的に FE の方が望ましい選択肢である。RE で使われる「\(a_i\) が \(\mathbf{x}\) と無相関」という仮定はかなり制約的であるため、基本的には FE または FD を試みるべきである。

固定効果（FE / FD）

\(a_i\) が \(\mathbf{x}\) と相関していてよい（現実的な仮定）
\(a_i\) が \(\mathbf{x}\) と無相関でも相関でも一致推定量
時間不変変数を含められない
測定誤差問題に敏感（後述）
多くの実証研究で第一選択

変量効果（RE）

\(a_i\) が \(\mathbf{x}\) と無相関という強い仮定が必要
上記仮定の下で一致かつ効率的
\(a_i\) が \(\mathbf{x}\) と相関していると不一致
時間不変変数も推定できる
FE に比べ非推奨

Hausman 検定（Hausman Test）のアイデア：\(a_i\) が \(\mathbf{x}\) と無相関ならば、RE と FE はともに一致推定量である。一方、\(a_i\) が \(\mathbf{x}\) と相関していれば、RE は不一致だが FE は一致推定量となる。Hausman 検定は RE の推定値を FE の推定値と比較し、大きな差が発見されれば FE を使うべきであり、そうでなければ RE または FE のいずれを用いてもよい。

FE の欠点：時間不変変数を含められない

demeaning または1階差分によって時間不変変数が消去されてしまうため、性別などの時間不変変数のパラメータを直接推定することができない（時間不変変数の処理については次節で扱う）。

FE の欠点：測定誤差問題への感度

FE 推定量は測定誤差（measurement error）問題に敏感である（Griliches and Hausman, 1986, "Errors in Variables in Panel Data," Journal of Econometrics, 31, pp.93–118 参照）。

Professor Note ― 混合効果モデルとの混同に注意

「線形混合効果モデル（linear mixed-effects models）」（階層線形モデル・多水準モデルとも呼ばれる）は固定効果成分と変量効果成分の両方を持つが、その「固定効果」「変量効果」の意味はパネルデータの手法とは異なる。混合効果モデルにおける「固定効果」はパラメータが定数であることを、「変量効果」はパラメータがランダムであることを意味する。Greene の教科書または Stata マニュアルの "mixed" を参照。

脚注20（原典 P.71）。

SECTION 09

時間不変変数の処理

\(y_{it} = \mathbf{x}_{it}\boldsymbol{\beta} + \mathbf{w}_i\boldsymbol{\gamma} + a_i + u_{it}\) のように時間不変変数 \(\mathbf{w}_i\)（例：性別）を含むモデルでは、FE および FD は \(\mathbf{w}_i\) を消去してしまうため \(\boldsymbol{\gamma}\) を直接識別できない。

\(a_i\) は \(\mathbf{x}_{it}\) と相関するが、\(\mathbf{w}_i\) とは相関しないと信じる場合、OLS や RE に頼るのではなく、より良いアプローチとして以下の2段階手続きが考えられる。

Step 1：FE（または FD）によって \(a_i^* = \mathbf{w}_i\boldsymbol{\gamma} + a_i\) を推定

\(y_{it} = \mathbf{x}_{it}\boldsymbol{\beta} + a_i^* + u_{it}\) に FE（または FD）を適用し、推定された未観測効果を取得：\(\hat{a}_i^* = \bar{y}_i - \bar{\mathbf{x}}_i\hat{\boldsymbol{\beta}}\)

Step 2：\(\hat{a}_i^*\) を \(\mathbf{w}_i\) に回帰

\(\hat{a}_i^* = \mathbf{w}_i\boldsymbol{\gamma} + a_i\) に対して OLS を実行。これにより \(\boldsymbol{\gamma}\) の一致推定量が得られる。

\(a_i\) が \(\mathbf{w}_i\) と相関している場合：Hausman-Taylor 推定量と呼ばれる操作変数法を用いるべきである（Wooldridge, 2010, p.358 参照）。

SECTION 10

厳格外生性の違反と内生性（\(\mathbf{x}\) と \(u\) の相関）

\(a_i\) が \(\mathbf{x}_{it}\) と相関している場合、FE は厳格外生性が成立している限り有効である。しかし厳格外生性が成立しない場合、FE・FD・RE のいずれも不一致となる。

FD アプローチが要求する条件は \(E(\mathbf{x}_{it} u_{is}) = 0\)（\(s = t\) および \(t-1\)）であり、これは厳格外生性の下で成立する。しかし厳格外生性が成立しないケースが存在する。

例1：逐次外生性の違反（Sequential Exogeneity の違反）

\(\mathbf{x}_{it}\) が過去のショックに依存する場合：\(\mathbf{x}_{it} = u_{i,t-1} + e_{it}\)。この場合、\(\mathbf{x}_{it}\) は \(u_{i,t-1}\) と相関するため、逐次外生性が成立しない。

例2：内生性（欠落変数・測定誤差）

\(\mathbf{x}_{it}\) が \(u_{it}\) と（欠落変数や測定誤差によって）相関している場合：\(E(\mathbf{x}_{it} u_{it}) \neq 0\)。

解決策：これらのケースでは、操作変数法（Instrumental Variables）を用いるべきである（Wooldridge, 2010, ch.11）。生産関数の例を用いてこれらの状況を考察するとよい。

SECTION 11

動学パネル（Dynamic Panel）

被説明変数のラグ \(y_{i,t-1}\) を説明変数に含むモデルを動学パネルモデル（dynamic panel data model）という。1階差分を取っても、差分後の残差がラグ従属変数と相関するという新たな内生性問題が生じる。

\[ y_{it} = \beta_y y_{i,t-1} + \mathbf{x}_{it}\boldsymbol{\beta} + a_i + u_{it} \]

動学パネルモデル

例：成長モデル。\(y = \log(\mathrm{GDP})\)。

1階差分を取ってみる

\[ (y_{it} - y_{i,t-1}) = \beta_y(y_{i,t-1} - y_{i,t-2}) + (\mathbf{x}_{it} - \mathbf{x}_{i,t-1})\boldsymbol{\beta} + (u_{it} - u_{i,t-1}) \]

\(a_i\) は消去されるが、差分後の残差 \((u_{it} - u_{i,t-1})\) は \((y_{i,t-1} - y_{i,t-2})\) と一般に相関してしまう。なぜなら \(u_{i,t-1}\) は \(y_{i,t-1}\) に影響するからである（\(y_{i,t-1} = \beta_y y_{i,t-2} + \mathbf{x}_{i,t-1}\boldsymbol{\beta} + a_i + u_{i,t-1}\)）。

\[ u_{i,t-1} \uparrow \;\Rightarrow\; (u_{it} - u_{i,t-1}) \downarrow \]

\[ u_{i,t-1} \uparrow \;\Rightarrow\; y_{i,t-1} \uparrow \;\Rightarrow\; (y_{i,t-1} - y_{i,t-2}) \uparrow \]

\[ E\bigl[(u_{it} - u_{i,t-1})(y_{i,t-1} - y_{i,t-2})\bigr] < 0 \]

\(\beta_y\) の推定値は下方バイアス（Downward Bias）を持つ。このバイアスはデータを demeaning した場合も同様に生じる。

解決策：動学パネルデータモデル（system-GMM）

system-GMM：動学パネルデータモデルとして、ラグ \(y_{i,t-2}, y_{i,t-3}, \dots\) を \((y_{i,t-1} - y_{i,t-2})\) に対する操作変数として用いる system-GMM 推定量を使用する。

SECTION 12

参考文献（References）

Giesselmann, Marco, Schmidt-Catran, Alexander W. (2022). "Interactions in fixed effects regression models." Sociological Methods & Research, 51(3), 1100–1127.
Griliches, Zvi, Hausman, Jerry A. (1986). "Errors in Variables in Panel Data." Journal of Econometrics, 31, pp.93–118.
Wooldridge, Jeffrey M. Introductory Econometrics: A Modern Approach, ch.13, 14.
Wooldridge, Jeffrey M. (2010). Econometric Analysis of Cross Section and Panel Data, 2nd ed. MIT Press. ch.10, ch.11, ch.19.9.

出典：原典 P.68–73。