数量経済分析 図解ポータル
Chapter 9  ·  Part III 内生性と識別  ·  原典 P.50–56  ·  全文和訳

内生性 ― Endogeneity

本ページは、川崎賢太郎『数量経済分析』2026 S1 講義ノート第9章の原文に忠実な全文和訳である。要約・再構成は行わず、原文の論理展開・脚注・参考文献の順序をそのまま日本語に移している。直観的な理解には図解版を併用されたい。

川崎賢太郎(東京大学大学院農学生命科学研究科) 原典 P.50–56 全文和訳
図解で読む 原文に忠実な和訳

Spring 2026 / Kentaro Kawasaki

動機Motivation

仮定 OLS.3 が破られると何が起こるだろうか。

内生性とは何かWhat is endogeneity?

\[ y_i = \beta_1 + \beta_2 x_{2i} + \beta_3 x_{3i} + \cdots + \beta_K x_{Ki} + u_i \]

内生性(endogeneity)仮定 OLS.3 の破れ、すなわち \(E(u_i \mid X) \neq 0\)。

仮定 OLS.3 は \(\operatorname{Cov}(u_i, x_{ki}) = 0\) を含意する。なぜなら、

\[ \begin{aligned} \operatorname{Cov}(u_i, x_{ki}) &= E(u_i x_{ki}) - E(u_i)E(x_{ki}) \\ &= E\!\bigl[E(u_i x_{ki} \mid X)\bigr] - E\!\bigl[E(u_i \mid X)\bigr]E(x_{ki}) \quad (\text{全期待値の法則による}) \\ &= E\!\bigl[x_{ki}\,E(u_i \mid X)\bigr] - E\!\bigl[E(u_i \mid X)\bigr]E(x_{ki}) \quad (x_{ki} \text{ は } X \text{ に含まれるため}) \\ &= 0 \quad (E(u_i \mid X) = 0 \text{ であるため}) \end{aligned} \]

(Hayashi, pp.8-9)

したがって、内生性は \(\operatorname{Cov}(u_i, x_{ki}) \neq 0\) を含意する。すなわち、回帰変数の一部(\(x_k\))と残差(\(u\))が相関しているということである。

\(x\) が \(u\) と相関しているとき、\(x\) は内生変数(endogenous variable)と呼ばれる(そうでなければ、\(x\) は外生変数(exogenous variable)と呼ばれる)。

仮定 OLS.3 の破れは、バイアスのある(biased)・一致性のない(inconsistent)推定量をもたらす(不偏性と一致性が仮定 OLS.3 を必要とすることを思い出そう)。

\[ E(\hat{\beta} \mid X) = E\!\bigl[\beta + (X'X)^{-1}X'u \mid X\bigr] = \beta + (X'X)^{-1}X'\,\underbrace{E(u \mid X)}_{\neq\, 0}\ \neq\ \beta \]

内生性の問題があるとき、推定された係数は「因果性(causality)」を表さない。むしろそれらは単なる「因果性 + バイアス(causality + bias)」である。

計量経済学の目的は「因果性」を明らかにすることであった、ということを思い出そう。私たちは内生性の問題に十分な注意を払うべきである。

内生性の原因Causes of endogeneity

欠落変数Omitted variable

\(y\) に影響し、かつ \(x\) と相関する観察されない要因がある場合、この変数を欠落させると内生性が生じ、OLS 推定値にバイアスが生じる。

例:

\[ \begin{aligned} \mathrm{Wage}_i &= \beta_0 + \beta_1 \mathrm{Education}_i + u_i \\ &= \beta_0 + \beta_1 \mathrm{Education}_i + (\mathrm{Ability}_i + u_i^{*}) \end{aligned} \]
\[ \begin{aligned} \mathrm{Yield}_i &= \beta_0 + \beta_1 \mathrm{Fertilizer}_i + u_i \\ &= \beta_0 + \beta_1 \mathrm{Fertilizer}_i + (\text{Soil Quality}_i + u_i^{*}) \end{aligned} \]

したがって、できるだけ多くの回帰変数を用いることが重要である。無関係な変数を含めてもバイアスは生じない(ただし標準誤差は大きくなる)。

しかし「応答変数(response variable)」を含めてはならない。\(T\) が \(D\) に与える影響を知りたいとしよう。このとき、もし \(A\) が \(T\) によって影響を受けるならば、\(A\) を含めてはならない(下図のパネル A と D を参照)。

たとえば、\(T\) が教育で \(D\) が賃金である場合を考えよう。このとき労働者の産業(\(A\))を制御すると、それは教育の影響を部分的に(あるいは大部分)捉えてしまうため、教育の係数は真の効果よりも小さくなる。

これは悪い制御の問題(bad control problem)と呼ばれる(Angrist and Pischke, ch.3.2.2)。

原典 P.51 には、変数間の関係を表す有向非巡回グラフ(DAG)の図(画像)が掲載されている。図は、\(T\)・\(D\)・\(A\)・\(Z\) の関係を示す 4 つのケース(A〜D)からなる。各ケースの判断は次のとおり。
・ケース A:\(A\) を制御してはならない(悪い制御)。
・ケース B:\(A\) を制御すべきである。
・ケース C:\(A\) または \(Z\) を制御すべきである。
・ケース D:\(A\) を制御してはならない(悪い制御)。
出典:Buckley, et al. (2014)。

バイアスの方向Direction of bias

単一回帰変数の場合(\(y_i = \beta_1 + \beta_2 x_{2i} + \beta_3 a_i + u_i\))、変数 \(a\) が欠落したモデルに OLS を適用すると、次の結果が得られる。

\[ \hat{\beta}_2 = \beta_2 + \beta_3 \frac{\operatorname{cov}(x_{2i}, a_i)}{\operatorname{var}(x_{2i})} \]

したがって、\(x\) と \(\beta_3 a\) が正に相関していれば上方バイアス(upward bias)が生じ、負に相関していれば下方バイアス(downward bias)が生じる。

複数回帰変数の場合、バイアスの方向を導くのはより難しい(Greene 2012, p.96 を参照)。しかし上記の式は、起こりうるバイアスについての大まかな指針を与えてくれる(Wooldridge, IE, ch.3)。

発展的なヒント(Advanced tips)
バイアスの方向だけでなく、その大きさも推測できる。Altonji et al. (2005)、Bellows and Miguel (2009, 付録 A)、または Kahn and MacGarvie (2016) が示した手法を用いるとよい。
欠落変数バイアスの起こりうる程度は、Oster (2019) のアプローチによって評価できる。

同時性バイアスSimultaneity bias

例1.需要と供給Example 1. Supply and demand

30 の時点を記録した国レベルのマクロデータを用いて、次のモデルを推定したいとしよう。

\[ \begin{aligned} Q_i &= \alpha_0 + \alpha_1 P_i + v_i && \text{(需要関数)} \\ Q_i &= \beta_0 + \beta_1 P_i + u_i && \text{(供給関数)} \end{aligned} \]

観察されない需要ショック(\(v\))は、市場均衡を通じて価格(\(P\))に影響する。したがって、需要関数において \(P\) と \(v\) は相関する。供給関数についても同じことが当てはまる。

このことは、2 つの式を解くことで数学的に確認できる。

\[ P_i = \frac{\beta_0 - \alpha_0}{\alpha_1 - \beta_1} + \frac{u_i - v_i}{\alpha_1 - \beta_1} \]

\(Q\) を \(P\) に回帰しても、需要関数も供給関数も明らかにならない。

原典 P.52 には、同時性バイアスの考え方を示す 2 つの図(画像)が掲載されている。
・(a) 異なる時点における需要と供給:縦軸が価格(Price)、横軸が数量(Quantity)。複数時点の需要曲線(\(D_1\)・\(D_2\))と供給曲線(\(S_1\)・\(S_2\))が描かれ、各時点の均衡点(Period 1 equilibrium・Period 2 equilibrium)が示される。
・(b) 11 時点における均衡価格・数量:縦軸が価格、横軸が数量で、観測される均衡の散布が描かれる。

この問題は、国レベルのマクロデータではなく、個人(農場または消費者)レベルのデータを扱う場合には無視できることに注意したい。(ただし、製品特性のような別のメカニズムが、価格変数を内生的にする。「操作変数法(Instrumental Variable)」の節を参照。)

例2.逆の因果性Example 2. Reverse causality

\[ \begin{aligned} y_i &= \beta_0 + \beta_1 x_i + u_i \\ x_i &= \alpha_0 + \alpha_1 y_i + v_i \end{aligned} \]

いずれの式も内生性の問題に直面する。なぜなら、

\[ \begin{aligned} x_i &= \alpha_0 + \alpha_1(\beta_0 + \beta_1 x_i + u_i) + v_i \\ \Leftrightarrow\quad x_i &= \frac{\alpha_1}{1 - \alpha_1\beta_1}\,u_i + C \\ \Leftrightarrow\quad \operatorname{Cov}(x_i, u_i) &= E(x_i u_i) - E(x_i)E(u_i) = E\!\left[\left(\tfrac{\alpha_1}{1 - \alpha_1\beta_1}\,u_i\right) u_i\right] - 0 = \frac{\alpha_1}{1 - \alpha_1\beta_1}\,E(u_i^2)\ \neq\ 0 \end{aligned} \]

したがって、\(x\) と \(u\) は相関する。\(y\) を \(x\) に回帰しても \(\beta\) は明らかにならない(\(y\) と \(v\) についても同様の議論が成り立つ)。

測定誤差Measurement error

[参考文献]Wooldridge, IE, Ch.9

これまで \(x\) は誤差なく測定されると仮定してきたが、現実には経済データはしばしば測定誤差を伴う。一般に、回帰変数の測定誤差はバイアスをもたらすが、被説明変数の測定誤差はバイアスのある推定値をもたらさない(測定誤差が残差項 \(u\) に吸収されるためである)。

単一回帰変数のモデルを考える:\(y_i = \beta_0 + \beta_1 x_i^{*} + u_i\)。

真の \(x_i^{*}\) は観察できないと仮定する。その代わりに、誤って測定された \(x_i^{*}\) の値を観察する。

すなわち、\(x_i = x_i^{*} + e_i\) であり、\(e\) は \(E(e) = 0\) を満たす測定誤差である。

私たちは次の形を回帰する:\(y_i = \beta_0 + \beta_1 x_i + (u_i - \beta_1 e_i)\)。

\(u\) は \(x_i^{*}\) および \(x_i\) と無相関であると仮定する。

一般的に言えば、\(x\) は \(e\) と相関する。なぜなら、

\[ \operatorname{Cov}(x_i, e_i) = E(x_i e_i) - E(x_i)E(e_i) = E(x_i^{*} e_i) + E(e_i^2) = \operatorname{Cov}(x_i^{*}, e_i) + \operatorname{Var}(e_i) \]

ごく特殊な場合(\(\operatorname{Cov}(x_i^{*}, e_i) = -\operatorname{Var}(e_i)\))を除けば、\(\operatorname{Cov}(x_i, e_i)\) はゼロではない。

したがって、\(x\) と全体の誤差項(\(u_i - \beta_1 e_i\))は相関する。

測定誤差のもとでは、推定された係数はゼロに向かってバイアスを受ける(減衰バイアス(attenuation bias))。16

直観:測定誤差が重要であるほどバイアスは深刻になり、測定誤差がデータを完全に支配する極端な場合には、パラメータの真の値に関わらず、推定された係数はゼロに向かう。説明変数がゴミである(真の情報を含まない)ならば、何も説明できない(すなわち、非常に低い、あるいはゼロの係数が得られる)。

測定誤差には他にも多くの形がある。Abay et al. (2023) を参照。

パラメータ異質性Parameter heterogeneity

\(x_i\) のパラメータがデータ単位ごとに異なるとしよう。

\[ y_i = \beta + \alpha_i x_i + u_i = \beta + E[\alpha_i] x_i + \bigl[u_i + (\alpha_i - E[\alpha_i])\,x_i\bigr] \]

すべての個体について \(\alpha_i\) を推定することはできない。それでは、\(E[\alpha_i]\) は推定できるだろうか。

パラメータ異質性が \(x_i\) の大きさに依存する場合、すなわち(\(\alpha_i - E[\alpha_i]\))と \(x_i\) が相関する場合、それは回帰変数 \(x_i\) が全体の誤差項 \([u_i + (\alpha_i - E[\alpha_i])\,x_i]\) と相関することを意味し、内生性を引き起こす。

(\(\alpha_i - E[\alpha_i]\))と \(x_i\) が無相関であれば、OLS によって平均パラメータ \(E[\alpha_i]\) を一致推定できる。

発展的なヒント(Advanced tips)
固定効果モデルのもとでのパラメータ異質性については、推定された係数は \(\alpha_i\) の分散加重平均であって、\(E[\alpha_i]\) ではない。Carter et al. (2018) および Gibbons et al. (2018) を参照。

非無作為標本Nonrandom sampling

[参考文献]Wooldridge, IE, Ch.9

標本が非無作為に抽出される場合、OLS 推定値はバイアスを受けうる。

例:\(y\) を米の収量としよう。もし調査が極端に低い収量(たとえば \(y < 100\,\mathrm{kg}/10a\) の場合)を除外するならば、\(y\) の決定要因についての一致推定値を得ることはできない。この場合、非無作為性は調査の設計によって引き起こされる。

例:\(y\) を賃金としよう。賃金は実際に職に就いている者についてのみ観察可能である。この場合、非無作為性は個人の意思決定によって引き起こされる(自己選択(self selection)、または付随的選択(incidental selection))。

一般則:

原典 P.54 には、この考え方を示す図(画像)が掲載されている。観測値(黒い点)のなかで \(x\) がゼロに近づくとき \(E(u_i) > 0\) となること、すなわち \(E(u_i \mid X) = 0\) の破れが容易に見て取れる。

内生性への対処法Solutions to endogeneity

発展的な対処法(Advanced solutions)
コピュラ(Copula)\(x\) と \(u\) のあいだの相関をモデル化し、その情報を尤度関数のなかで用いて一致推定値を得る(Park and Gupta 2012)。

測定誤差については、全最小二乗法(total least squares, TLS)を用いることができる。

原典 P.55 には、全最小二乗法の考え方を示す図(画像)が掲載されている。出典:
https://en.wikipedia.org/wiki/Total_least_squares

代理変数Proxy variable

[参考文献]Wooldridge, IE, Ch.9.2

次のモデルを考える:\(y_i = \beta_1 + \beta_2 x_{2i} + \beta_3 a_i + u_i\)。

変数 \(a\) は観察できない。\(a\) が推定モデルから欠落すると、パラメータにバイアスが生じうる(欠落変数バイアス)。

\(a_i = \delta_1 + \delta_2 a_i^{*} + v_i\) を満たす代理変数(proxy variable) \(a_i^{*}\) を持っていて、\(y_i\) を \(x_{2i}\) と \(a_i^{*}\) に回帰するとしよう。\(\beta_2\) の一致推定値を得るためには、どのような仮定が必要だろうか。

推定モデルは次のようになる。

\[ \begin{aligned} \Leftrightarrow\quad y_i &= \beta_1 + \beta_2 x_{2i} + \beta_3(\delta_1 + \delta_2 a_i^{*} + v_i) + u_i \\ \Leftrightarrow\quad y_i &= (\beta_1 + \beta_3\delta_1) + \beta_2 x_{2i} + \beta_3\delta_2 a_i^{*} + (\beta_3 v_i + u_i) \end{aligned} \]

したがって、(\(v, u\))が(\(x_2, a_i^{*}\))と無相関であれば、OLS 推定量は \(\beta_2\) の一致推定値を与える。ただし、\(\beta_1\) と \(\beta_3\) は復元できないことに注意。

もし \(a_i\) が \(x_{2i}\) とも相関し、\(a_i = \delta_1 + \delta_2 a_i^{*} + \delta_3 x_{2i} + v_i\) であるならば、モデルは次のように書き換えられる。

\[ \begin{aligned} \Leftrightarrow\quad y_i &= \beta_1 + \beta_2 x_{2i} + \beta_3(\delta_1 + \delta_2 a_i^{*} + \delta_3 x_{2i} + v_i) + u_i \\ \Leftrightarrow\quad y_i &= (\beta_1 + \beta_3\delta_1) + (\beta_2 + \beta_3\delta_3) x_{2i} + \beta_3\delta_2 a_i^{*} + (\beta_3 v_i + u_i) \end{aligned} \]

したがって、\(\beta_2\) もまた復元できない。

それゆえ、\(a_i^{*}\) が制御されたうえで、\(a_i\) の期待値は他の回帰変数(この場合は \(x_2\))と相関すべきではない。

例:賃金方程式を考える。

\[ \begin{aligned} \mathrm{Wage}_i &= \beta_0 + \beta_1 \mathrm{Education}_i + u_i \\ &= \beta_0 + \beta_1 \mathrm{Education}_i + (\mathrm{Ability}_i + u_i^{*}) \end{aligned} \]

もし IQ スコアを能力(ability)の代理変数として用いるならば、上記の主張は次を要求する。

\[ E(\text{ability} \mid \text{education}, \text{IQ}) = E(\text{ability} \mid \text{IQ}) = \delta_1 + \delta_2\,\mathrm{IQ} \]

これは現実において成り立ちそうだろうか。おそらく成り立つだろう。(能力は観察不能であるため、この主張を「検定」することはできない。)

参考文献References

脚注
  1. 回帰変数が複数ある場合には、バイアスはゼロから遠ざかる方向にもなりうる(Lobell 2013)。直観的には、2 つの回帰変数が互いに相関し、一方が他方よりもはるかに大きな誤差を伴って測定される場合に、これが起こりうる。Lobell は、起こりうる測定誤差を補正するため、シミュレーションに基づくアプローチを適用している。