数量経済分析(9) 内生性 ― 全文和訳

図解で読む原文に忠実な和訳

Spring 2026 ／ Kentaro Kawasaki

動機Motivation

仮定 OLS.3 が破られると何が起こるだろうか。

内生性とは何かWhat is endogeneity?

\[ y_i = \beta_1 + \beta_2 x_{2i} + \beta_3 x_{3i} + \cdots + \beta_K x_{Ki} + u_i \]

内生性（endogeneity）：仮定 OLS.3 の破れ、すなわち \(E(u_i \mid X) \neq 0\)。

仮定 OLS.3 は \(\operatorname{Cov}(u_i, x_{ki}) = 0\) を含意する。なぜなら、

\[ \begin{aligned} \operatorname{Cov}(u_i, x_{ki}) &= E(u_i x_{ki}) - E(u_i)E(x_{ki}) \\ &= E\!\bigl[E(u_i x_{ki} \mid X)\bigr] - E\!\bigl[E(u_i \mid X)\bigr]E(x_{ki}) \quad (\text{全期待値の法則による}) \\ &= E\!\bigl[x_{ki}\,E(u_i \mid X)\bigr] - E\!\bigl[E(u_i \mid X)\bigr]E(x_{ki}) \quad (x_{ki} \text{ は } X \text{ に含まれるため}) \\ &= 0 \quad (E(u_i \mid X) = 0 \text{ であるため}) \end{aligned} \]

（Hayashi, pp.8-9）

したがって、内生性は \(\operatorname{Cov}(u_i, x_{ki}) \neq 0\) を含意する。すなわち、回帰変数の一部（\(x_k\)）と残差（\(u\)）が相関しているということである。

\(x\) が \(u\) と相関しているとき、\(x\) は内生変数（endogenous variable）と呼ばれる（そうでなければ、\(x\) は外生変数（exogenous variable）と呼ばれる）。

仮定 OLS.3 の破れは、バイアスのある（biased）・一致性のない（inconsistent）推定量をもたらす（不偏性と一致性が仮定 OLS.3 を必要とすることを思い出そう）。

\[ E(\hat{\beta} \mid X) = E\!\bigl[\beta + (X'X)^{-1}X'u \mid X\bigr] = \beta + (X'X)^{-1}X'\,\underbrace{E(u \mid X)}_{\neq\, 0}\ \neq\ \beta \]

内生性の問題があるとき、推定された係数は「因果性（causality）」を表さない。むしろそれらは単なる「因果性＋バイアス（causality + bias）」である。

計量経済学の目的は「因果性」を明らかにすることであった、ということを思い出そう。私たちは内生性の問題に十分な注意を払うべきである。

内生性の原因Causes of endogeneity

欠落変数（交絡変数）（omitted variable / confounder）：\(x\) と相関する観察されない要因が回帰から欠落している。
同時性バイアス（simultaneity bias）：\(x\) と \(y\) が同時に決定される（逆の因果性、すなわち \(x\) が \(y\) を引き起こし、\(y\) が \(x\) を引き起こす場合を含む）。
測定誤差（変数誤差）（measurement error / errors-in-variables）：\(x\) が誤差を伴って測定される。
非無作為標本（nonrandom sampling）
パラメータ異質性（parameter heterogeneity）：係数がデータ単位を通じて共通でない。

欠落変数Omitted variable

\(y\) に影響し、かつ \(x\) と相関する観察されない要因がある場合、この変数を欠落させると内生性が生じ、OLS 推定値にバイアスが生じる。

例：

\[ \begin{aligned} \mathrm{Wage}_i &= \beta_0 + \beta_1 \mathrm{Education}_i + u_i \\ &= \beta_0 + \beta_1 \mathrm{Education}_i + (\mathrm{Ability}_i + u_i^{*}) \end{aligned} \]

\[ \begin{aligned} \mathrm{Yield}_i &= \beta_0 + \beta_1 \mathrm{Fertilizer}_i + u_i \\ &= \beta_0 + \beta_1 \mathrm{Fertilizer}_i + (\text{Soil Quality}_i + u_i^{*}) \end{aligned} \]

したがって、できるだけ多くの回帰変数を用いることが重要である。無関係な変数を含めてもバイアスは生じない（ただし標準誤差は大きくなる）。

しかし「応答変数（response variable）」を含めてはならない。\(T\) が \(D\) に与える影響を知りたいとしよう。このとき、もし \(A\) が \(T\) によって影響を受けるならば、\(A\) を含めてはならない（下図のパネル A と D を参照）。

たとえば、\(T\) が教育で \(D\) が賃金である場合を考えよう。このとき労働者の産業（\(A\)）を制御すると、それは教育の影響を部分的に（あるいは大部分）捉えてしまうため、教育の係数は真の効果よりも小さくなる。

これは悪い制御の問題（bad control problem）と呼ばれる（Angrist and Pischke, ch.3.2.2）。

原典 P.51 には、変数間の関係を表す有向非巡回グラフ（DAG）の図（画像）が掲載されている。図は、\(T\)・\(D\)・\(A\)・\(Z\) の関係を示す 4 つのケース（A〜D）からなる。各ケースの判断は次のとおり。
・ケース A：\(A\) を制御してはならない（悪い制御）。
・ケース B：\(A\) を制御すべきである。
・ケース C：\(A\) または \(Z\) を制御すべきである。
・ケース D：\(A\) を制御してはならない（悪い制御）。
出典：Buckley, et al. (2014)。

バイアスの方向Direction of bias

単一回帰変数の場合（\(y_i = \beta_1 + \beta_2 x_{2i} + \beta_3 a_i + u_i\)）、変数 \(a\) が欠落したモデルに OLS を適用すると、次の結果が得られる。

\[ \hat{\beta}_2 = \beta_2 + \beta_3 \frac{\operatorname{cov}(x_{2i}, a_i)}{\operatorname{var}(x_{2i})} \]

したがって、\(x\) と \(\beta_3 a\) が正に相関していれば上方バイアス（upward bias）が生じ、負に相関していれば下方バイアス（downward bias）が生じる。

複数回帰変数の場合、バイアスの方向を導くのはより難しい（Greene 2012, p.96 を参照）。しかし上記の式は、起こりうるバイアスについての大まかな指針を与えてくれる（Wooldridge, IE, ch.3）。

発展的なヒント（Advanced tips）
バイアスの方向だけでなく、その大きさも推測できる。Altonji et al. (2005)、Bellows and Miguel (2009, 付録 A)、または Kahn and MacGarvie (2016) が示した手法を用いるとよい。
欠落変数バイアスの起こりうる程度は、Oster (2019) のアプローチによって評価できる。

同時性バイアスSimultaneity bias

例1．需要と供給Example 1. Supply and demand

30 の時点を記録した国レベルのマクロデータを用いて、次のモデルを推定したいとしよう。

\[ \begin{aligned} Q_i &= \alpha_0 + \alpha_1 P_i + v_i && \text{（需要関数）} \\ Q_i &= \beta_0 + \beta_1 P_i + u_i && \text{（供給関数）} \end{aligned} \]

観察されない需要ショック（\(v\)）は、市場均衡を通じて価格（\(P\)）に影響する。したがって、需要関数において \(P\) と \(v\) は相関する。供給関数についても同じことが当てはまる。

このことは、2 つの式を解くことで数学的に確認できる。

\[ P_i = \frac{\beta_0 - \alpha_0}{\alpha_1 - \beta_1} + \frac{u_i - v_i}{\alpha_1 - \beta_1} \]

\(Q\) を \(P\) に回帰しても、需要関数も供給関数も明らかにならない。

原典 P.52 には、同時性バイアスの考え方を示す 2 つの図（画像）が掲載されている。
・(a) 異なる時点における需要と供給：縦軸が価格（Price）、横軸が数量（Quantity）。複数時点の需要曲線（\(D_1\)・\(D_2\)）と供給曲線（\(S_1\)・\(S_2\)）が描かれ、各時点の均衡点（Period 1 equilibrium・Period 2 equilibrium）が示される。
・(b) 11 時点における均衡価格・数量：縦軸が価格、横軸が数量で、観測される均衡の散布が描かれる。

この問題は、国レベルのマクロデータではなく、個人（農場または消費者）レベルのデータを扱う場合には無視できることに注意したい。（ただし、製品特性のような別のメカニズムが、価格変数を内生的にする。「操作変数法（Instrumental Variable）」の節を参照。）

例2．逆の因果性Example 2. Reverse causality

\[ \begin{aligned} y_i &= \beta_0 + \beta_1 x_i + u_i \\ x_i &= \alpha_0 + \alpha_1 y_i + v_i \end{aligned} \]

いずれの式も内生性の問題に直面する。なぜなら、

\[ \begin{aligned} x_i &= \alpha_0 + \alpha_1(\beta_0 + \beta_1 x_i + u_i) + v_i \\ \Leftrightarrow\quad x_i &= \frac{\alpha_1}{1 - \alpha_1\beta_1}\,u_i + C \\ \Leftrightarrow\quad \operatorname{Cov}(x_i, u_i) &= E(x_i u_i) - E(x_i)E(u_i) = E\!\left[\left(\tfrac{\alpha_1}{1 - \alpha_1\beta_1}\,u_i\right) u_i\right] - 0 = \frac{\alpha_1}{1 - \alpha_1\beta_1}\,E(u_i^2)\ \neq\ 0 \end{aligned} \]

したがって、\(x\) と \(u\) は相関する。\(y\) を \(x\) に回帰しても \(\beta\) は明らかにならない（\(y\) と \(v\) についても同様の議論が成り立つ）。

測定誤差Measurement error

［参考文献］Wooldridge, IE, Ch.9

これまで \(x\) は誤差なく測定されると仮定してきたが、現実には経済データはしばしば測定誤差を伴う。一般に、回帰変数の測定誤差はバイアスをもたらすが、被説明変数の測定誤差はバイアスのある推定値をもたらさない（測定誤差が残差項 \(u\) に吸収されるためである）。

単一回帰変数のモデルを考える：\(y_i = \beta_0 + \beta_1 x_i^{*} + u_i\)。

真の \(x_i^{*}\) は観察できないと仮定する。その代わりに、誤って測定された \(x_i^{*}\) の値を観察する。

すなわち、\(x_i = x_i^{*} + e_i\) であり、\(e\) は \(E(e) = 0\) を満たす測定誤差である。

私たちは次の形を回帰する：\(y_i = \beta_0 + \beta_1 x_i + (u_i - \beta_1 e_i)\)。

\(u\) は \(x_i^{*}\) および \(x_i\) と無相関であると仮定する。

一般的に言えば、\(x\) は \(e\) と相関する。なぜなら、

\[ \operatorname{Cov}(x_i, e_i) = E(x_i e_i) - E(x_i)E(e_i) = E(x_i^{*} e_i) + E(e_i^2) = \operatorname{Cov}(x_i^{*}, e_i) + \operatorname{Var}(e_i) \]

ごく特殊な場合（\(\operatorname{Cov}(x_i^{*}, e_i) = -\operatorname{Var}(e_i)\)）を除けば、\(\operatorname{Cov}(x_i, e_i)\) はゼロではない。

したがって、\(x\) と全体の誤差項（\(u_i - \beta_1 e_i\)）は相関する。

測定誤差のもとでは、推定された係数はゼロに向かってバイアスを受ける（減衰バイアス（attenuation bias））。¹⁶

直観：測定誤差が重要であるほどバイアスは深刻になり、測定誤差がデータを完全に支配する極端な場合には、パラメータの真の値に関わらず、推定された係数はゼロに向かう。説明変数がゴミである（真の情報を含まない）ならば、何も説明できない（すなわち、非常に低い、あるいはゼロの係数が得られる）。

測定誤差には他にも多くの形がある。Abay et al. (2023) を参照。

パラメータ異質性Parameter heterogeneity

\(x_i\) のパラメータがデータ単位ごとに異なるとしよう。

\[ y_i = \beta + \alpha_i x_i + u_i = \beta + E[\alpha_i] x_i + \bigl[u_i + (\alpha_i - E[\alpha_i])\,x_i\bigr] \]

すべての個体について \(\alpha_i\) を推定することはできない。それでは、\(E[\alpha_i]\) は推定できるだろうか。

パラメータ異質性が \(x_i\) の大きさに依存する場合、すなわち（\(\alpha_i - E[\alpha_i]\)）と \(x_i\) が相関する場合、それは回帰変数 \(x_i\) が全体の誤差項 \([u_i + (\alpha_i - E[\alpha_i])\,x_i]\) と相関することを意味し、内生性を引き起こす。

（\(\alpha_i - E[\alpha_i]\)）と \(x_i\) が無相関であれば、OLS によって平均パラメータ \(E[\alpha_i]\) を一致推定できる。

発展的なヒント（Advanced tips）
固定効果モデルのもとでのパラメータ異質性については、推定された係数は \(\alpha_i\) の分散加重平均であって、\(E[\alpha_i]\) ではない。Carter et al. (2018) および Gibbons et al. (2018) を参照。

非無作為標本Nonrandom sampling

［参考文献］Wooldridge, IE, Ch.9

標本が非無作為に抽出される場合、OLS 推定値はバイアスを受けうる。

例：\(y\) を米の収量としよう。もし調査が極端に低い収量（たとえば \(y < 100\,\mathrm{kg}/10a\) の場合）を除外するならば、\(y\) の決定要因についての一致推定値を得ることはできない。この場合、非無作為性は調査の設計によって引き起こされる。

例：\(y\) を賃金としよう。賃金は実際に職に就いている者についてのみ観察可能である。この場合、非無作為性は個人の意思決定によって引き起こされる（自己選択（self selection）、または付随的選択（incidental selection））。

一般則：

\(y\)（または \(u\)）に基づく標本選択：バイアスあり
\(x\) に基づく標本選択：バイアスなし

原典 P.54 には、この考え方を示す図（画像）が掲載されている。観測値（黒い点）のなかで \(x\) がゼロに近づくとき \(E(u_i) > 0\) となること、すなわち \(E(u_i \mid X) = 0\) の破れが容易に見て取れる。

内生性への対処法Solutions to endogeneity

欠落変数バイアスを避けるため、できるだけ多くの回帰変数を用いる（ただし悪い制御の問題に注意すること）。
操作変数法（Instrumental variable method）。
固定効果、階差（fixed effect, first difference）（\(x\) が時間不変の観察不能要因と相関する場合に有効）。
標本選択モデル（sample selection model；Heckman's model）：背後にある選択メカニズムを特定する。操作変数に類する変数が必要となる。
処置効果モデル（treatment effects model）（傾向スコアマッチング、差の差法、合成コントロール、回帰不連続）：内生変数がダミー（0/1）である場合。

発展的な対処法（Advanced solutions）
コピュラ（Copula）：\(x\) と \(u\) のあいだの相関をモデル化し、その情報を尤度関数のなかで用いて一致推定値を得る（Park and Gupta 2012）。

Lewbel (2012)：外生的な操作変数に依存しない。誤差項の不均一分散に基づいてモデルを識別する。
LiNGAM（Shimizu 2014）：
https://blog.albert2005.co.jp/2015/02/24/a→bなのか、b→aなのかをデータから見抜くことは/

測定誤差については、全最小二乗法（total least squares, TLS）を用いることができる。

原典 P.55 には、全最小二乗法の考え方を示す図（画像）が掲載されている。出典：
https://en.wikipedia.org/wiki/Total_least_squares

代理変数Proxy variable

［参考文献］Wooldridge, IE, Ch.9.2

次のモデルを考える：\(y_i = \beta_1 + \beta_2 x_{2i} + \beta_3 a_i + u_i\)。

変数 \(a\) は観察できない。\(a\) が推定モデルから欠落すると、パラメータにバイアスが生じうる（欠落変数バイアス）。

\(a_i = \delta_1 + \delta_2 a_i^{*} + v_i\) を満たす代理変数（proxy variable） \(a_i^{*}\) を持っていて、\(y_i\) を \(x_{2i}\) と \(a_i^{*}\) に回帰するとしよう。\(\beta_2\) の一致推定値を得るためには、どのような仮定が必要だろうか。

推定モデルは次のようになる。

\[ \begin{aligned} \Leftrightarrow\quad y_i &= \beta_1 + \beta_2 x_{2i} + \beta_3(\delta_1 + \delta_2 a_i^{*} + v_i) + u_i \\ \Leftrightarrow\quad y_i &= (\beta_1 + \beta_3\delta_1) + \beta_2 x_{2i} + \beta_3\delta_2 a_i^{*} + (\beta_3 v_i + u_i) \end{aligned} \]

したがって、（\(v, u\)）が（\(x_2, a_i^{*}\)）と無相関であれば、OLS 推定量は \(\beta_2\) の一致推定値を与える。ただし、\(\beta_1\) と \(\beta_3\) は復元できないことに注意。

もし \(a_i\) が \(x_{2i}\) とも相関し、\(a_i = \delta_1 + \delta_2 a_i^{*} + \delta_3 x_{2i} + v_i\) であるならば、モデルは次のように書き換えられる。

\[ \begin{aligned} \Leftrightarrow\quad y_i &= \beta_1 + \beta_2 x_{2i} + \beta_3(\delta_1 + \delta_2 a_i^{*} + \delta_3 x_{2i} + v_i) + u_i \\ \Leftrightarrow\quad y_i &= (\beta_1 + \beta_3\delta_1) + (\beta_2 + \beta_3\delta_3) x_{2i} + \beta_3\delta_2 a_i^{*} + (\beta_3 v_i + u_i) \end{aligned} \]

したがって、\(\beta_2\) もまた復元できない。

それゆえ、\(a_i^{*}\) が制御されたうえで、\(a_i\) の期待値は他の回帰変数（この場合は \(x_2\)）と相関すべきではない。

例：賃金方程式を考える。

\[ \begin{aligned} \mathrm{Wage}_i &= \beta_0 + \beta_1 \mathrm{Education}_i + u_i \\ &= \beta_0 + \beta_1 \mathrm{Education}_i + (\mathrm{Ability}_i + u_i^{*}) \end{aligned} \]

もし IQ スコアを能力（ability）の代理変数として用いるならば、上記の主張は次を要求する。

\[ E(\text{ability} \mid \text{education}, \text{IQ}) = E(\text{ability} \mid \text{IQ}) = \delta_1 + \delta_2\,\mathrm{IQ} \]

これは現実において成り立ちそうだろうか。おそらく成り立つだろう。（能力は観察不能であるため、この主張を「検定」することはできない。）

参考文献References

Abay, K. A., Wossen, T., Abate, G. T., Stevenson, J. R., Michelson, H., & Barrett, C. B. (2023). Inferential and behavioral implications of measurement error in agricultural data. Annual Review of Resource Economics, 15(1), 63-83.
Altonji, Joseph G.; Elder, Todd E.; Taber, Christopher R. (2005) Selection on Observed and Unobserved Variables: Assessing the Effectiveness of Catholic Schools. Journal of Political Economy, February 2005, v. 113, issue. 1, pp. 151-84.
Bellows, J., & Miguel, E. (2009). War and local collective action in Sierra Leone. Journal of Public Economics, 93(11), 1144-1157.
Buckley, J. P., Samet, J. M., & Richardson, D. B. (2014). Commentary: Does air pollution confound studies of temperature?. Epidemiology, 25(2), 242-245.
Carter, C., Cui, X., Ghanem, D., & Mérel, P. (2018). Identifying the Economic Impacts of Climate Change on Agriculture. Annual Review of Resource Economics, 10, 361-380.
Gibbons, C. E., Serrato, J. C. S., & Urbancic, M. B. (2018). Broken or fixed effects?. Journal of Econometric Methods, 8(1).
Kahn, S., & MacGarvie, M. J. (2016). How Important is US Location for Research in Science?. Review of Economics and Statistics, 98(2), 397-414.
Lewbel, A. (2012). Using Heteroscedasticity to Identify and Estimate Mismeasured and Endogenous Regressor Models. Journal of Business & Economic Statistics, 30(1), 67–80.
Lobell, D. B. (2013). Errors in climate datasets and their effects on statistical crop models. Agricultural and Forest Meteorology, 170, 58-66.
Oster, E., (2019). Unobservable selection and coefficient stability: theory and evidence. J. Bus. Econ. Stat. 37 (2), 187-204.
Park, S. and Gupta, S. (2012). Handling endogenous regressors by joint estimation using copulas. Marketing Science, 31(4):567-586.
Shimizu, S. (2014). LiNGAM: Non-Gaussian methods for estimating causal structures. Behaviormetrika, 41(1), 65-98.

脚注

回帰変数が複数ある場合には、バイアスはゼロから遠ざかる方向にもなりうる（Lobell 2013）。直観的には、2 つの回帰変数が互いに相関し、一方が他方よりもはるかに大きな誤差を伴って測定される場合に、これが起こりうる。Lobell は、起こりうる測定誤差を補正するため、シミュレーションに基づくアプローチを適用している。↩