本ページは、川崎賢太郎『数量経済分析』2026 S1 講義ノート第6章の原文に忠実な全文和訳である。要約・再構成は行わず、原文の論理展開・数式・脚注・参考文献の順序をそのまま日本語に移している。直観的な理解には図解版を併用されたい。
Spring 2026 / Kentaro Kawasaki
[参考(Reference)]Wooldridge, IE, Ch.4, 5
前章では、OLS の点推定値(point estimates)を導いた。これらの推定されたパラメータは、平均すれば(on average)真のパラメータに等しい。これが「不偏性(unbiasedness)」の概念である。
しかし「平均」とは何を意味するのか。
それは、もし母集団から標本を無限回構成し(もちろん、これは非現実的な仮定である)、OLS を無限回実行できたとすれば、それらの推定値の平均が真のパラメータに等しくなる、という意味である。
しかし現実には、私たちは標本を1つしか持っていない。それは、推定されたパラメータが真のパラメータと厳密には等しくならないことを意味する。むしろ、それらは真のパラメータとは異なっているはずである。
そこで、真のパラメータの取りうる範囲について推測すること(この手続きを推論(inference)と呼ぶ)が重要になる。統計的推論を行うためには、OLS 推定量の分布(distribution)を知る必要がある。
議論は次のように進む。第一に、OLS 推定量の分散の公式を導出する。第二に、OLS 推定量の分布が正規(normal)であることを示す。正規性は、分布の正確な形を知るうえで最初の2つのモーメント(平均と分散)が十分統計量(sufficient statistics)であることを含意する(歪度(skewness)や尖度(kurtosis)のような高次のモーメントは、正規分布では0であるため不要である)。平均は真のパラメータである(OLS 推定量は不偏だからである)。一方、分散は第一の段階で与えられる。
OLS 推定量の分散を導出するために、次の仮定を追加する必要がある(これは後に緩めることができる)。
これらの条件は、仮定 OLS.3(\(E(u_j \mid \mathbf{X}) = 0\))の下で、次のことを含意する。
すなわち、分散は一定であり、相関(共分散の符号が同じであること)は0である。
同分散性は、\(u\) の分散が一定であることを含意する。この仮定が成り立たない場合、それは不均一分散(heteroskedasticity)と呼ばれる。
無相関は、ある主体の \(u\) が他の主体の \(u\) と相関していないことを含意する。
行列の形で書くと(簡単のため「\(\mathbf{X}\) を条件づける」という記号は省略する)、次のようになる。
OLS 推定量の分散共分散行列(variance/covariance matrix)を次のように定義する。
これは次のように計算できる(Hayashi, p.29)。
まとめると、OLS 推定量の分散共分散行列は、仮定 OLS.1 から OLS.5 の下で次のように与えられる。
しかし、なお1つの問題が残る。私たちは真の \(\sigma\) を観察できないため、推定された残差(estimated residuals)によってそれを推定しなければならない。
分母が \(n\) ではなく \(n-k\)(自由度(degree of freedom))であることに注意したい。その直観的な理由は、残差ベクトルを得る前に \(k\) 個のパラメータを推定しなければならないからである。
仮定 OLS.1 から OLS.5 の下で、これは母分散の不偏推定量である。すなわち \(E(\hat{\sigma}^2 \mid \mathbf{X}) = \sigma^2\)(証明は Hayashi, p.30 を参照)。
したがって、OLS 推定量の分散は次のようになる。
次に、OLS 推定量が正規分布に従うことを示す。これを示すには2つの戦略がある。
第一の戦略は、仮定 OLS.1 から OLS.5 に加えて、次の仮定を必要とする。
この仮定の下で、OLS 推定量は正規分布に従う。
証明:Wooldridge, IE, ch.3 appendix
しかし現実には、誤差項は正規でないかもしれない(たとえば被説明変数が正の値しか取らない場合)。
しかし標本サイズが大きいとき、中心極限定理(CLT)は、たとえ誤差項が正規でなくても、OLS 推定量の分布が近似的に正規(漸近的に正規(asymptotically normal))になりうることを予測する。
証明:Hayashi, ch.2, p.114
「大きい」とはどれくらいか。明確な答えはなく、モデルに依存する。
まとめると、仮定 OLS.1–5 の下で、かつ誤差項の正規性を仮定するか CLT に訴えるかのいずれかによって、OLS 推定量は正規分布に従う。
ここで \((\mathbf{X}'\mathbf{X})^{-1}_{jj}\) は \((\mathbf{X}'\mathbf{X})^{-1}\) の \((j, j)\) 成分である。
あるいは同値だが、次のように書ける。
ここでも問題は、真の \(\sigma\) を観察できないため、それを推定値で置き換えなければならないことである。未知の真の分散(\(\sigma\)。定数である)を推定された分散(\(\hat{\sigma}^2\)。確率変数である)で置き換えると、OLS 推定量は正規ではなく \(t\) 分布(t-distribution)に従う1。
ここで \(\displaystyle \hat{\sigma}^2 = \left( \sum_{i}^{n} \hat{u}_i^2 \right) \big/ (n-k) = \hat{\mathbf{u}}'\hat{\mathbf{u}} \,/\, (n-k) \) である。
これで OLS 推定量の分布を導出できた。私たちはいよいよ統計的推論を行う準備が整った。
真のパラメータが \(A\) であるか否かを検定しよう。数式では「\(H_0:\ \beta_j = A\)」と書け、これを帰無仮説(null hypothesis)と呼ぶ。
経済学者は通常「\(H_0:\ \beta_j = 0\)」(すなわち \(A = 0\))を検定する。これは、\(x_j\) が \(y\) に対して因果的な影響を持たないことを意味する。
基本的な考え方:\(H_0\) の確率を計算し、それが小さすぎる(\(p\) を下回る)ならば \(H_0\) を棄却する。
有意水準(significance level) \(p\)、すなわち帰無仮説が棄却される確率の閾値は、通常 \(p = 10\%,\ 5\%,\ 1\%\) に設定される。
手続きは3つあるが、いずれの方法でも同じ結論に達する。
\(\beta_j\) の \((100-p)\%\) 信頼区間(confidence intervals)は次のように計算できる。
ここで \(c\) は \(t\) 表における \(p/2\,\%\) の臨界値(critical value)を表し(多くの教科書はこの表を巻末に掲載している)、また
である。
CI は、真のパラメータがこの区間内にある確率が \((100-p)\%\) であることを含意する。
もし \(A\) が信頼区間の外にあれば、それは \(\beta_j = A\) である確率が \(p\%\) 未満であることを意味するので、\(\beta_j\) は \(A\) と有意に異なる(significantly different)と結論できる(帰無仮説を棄却する)。
そうでなければ、帰無仮説を採択する(棄却しない)。
t 統計量(t-statistics)を計算する。
\(t\) 表における \(p/2\,\%\) の臨界値 \(c\) を見つける。
計算された t 統計量が絶対値で \(c\) より大きければ、\(\beta_j\) は \(A\) と有意に異なると結論できる(帰無仮説 \(\beta_j = A\) を棄却する)。
そうでなければ、帰無仮説を採択する。
t 統計量を計算する。
この t 統計量に対応する確率を \(t\) 表で見つけ、その確率を2倍する。これが p 値(p-value)であり、その t 統計量を観察する確率を示す。
p 値が有意水準 \(p\) より小さければ、\(\beta_j\) は \(A\) と有意に異なると結論できる(帰無仮説 \(\beta_j = A\) を棄却する)。
そうでなければ、帰無仮説を採択する。
次の推定結果が得られたとしよう。括弧内は標準誤差(standard errors)である。
\(p = 5\%\) の下で帰無仮説 \(H_0:\ \beta_2 = 0\) を検定しよう。
自由度が28、\(p = 0.05\) なので、臨界値 \(c\) は \(t\) 表で2.048である。
\(p = 5\%\) かつ \(n - k > 20\) ならば \(c\) はおよそ2である、と覚えておくと便利である。
したがって、95% CI は \(5.2 \pm 2.048 \times 1.3 = [2.53,\ 7.86]\) である。ここでは0が区間の外にあるので、\(H_0\) を棄却でき、\(x\) の係数は0と有意に異なると結論できる。
あるいは、t 統計量を計算する。
これは絶対値で臨界値(2.048)より大きく、\(t = 4.0\) を得る確率が5%より低いことを意味する。したがって \(H_0\) を棄却できる。
あるいは、自由度 = 28 として \(t = 4.0\) に対応する p 値を見つける(一般に、p 値を求めるにはコンピュータを使うべきである)2。p 値 = 0.00042 が得られ、これは有意水準 \(p = 5\%\) をはるかに下回る。したがって \(H_0\) を棄却できる。
t 検定が「\(x\) の係数 = 0」という帰無仮説を棄却しないとき(すなわち表に「星(star)」記号が付かないとき)、\(x\) の影響は0であると結論する人がいる。しかしこれは常に正しいわけではない。それは検定の検定力(power)に依存する。
仮説検定は、帰無仮説の棄却または非棄却のいずれかに至る。\(H_0\) が偽のときに \(H_0\) を棄却する、または \(H_0\) が真のときに \(H_0\) を棄却しない場合、正しい判断がなされる。
有意性検定には、起こりうる2つの誤った判断がある。
| 判断 | \(H_0\) が真(\(x\) は影響を持たない) | \(H_0\) が偽(\(x\) は影響を持つ) |
|---|---|---|
| \(H_0\) を採択 | 正しい判断 ― 確率 \(1-p\) | 第二種の誤り ― 確率 \(1-\text{Power}\) |
| \(H_0\) を棄却 | 第一種の誤り ― 確率 \(p\)(有意水準) | 正しい判断 ― 確率 \(\text{Power}\) |
これら4つの状況を表すもう1つの一般的な方法(混同行列(Confusion matrix))。
| あなたの判断 | 真実:\(H_0\) は正しくない(\(b \neq 0\)) | 真実:\(H_0\) は正しい(\(b = 0\)) |
|---|---|---|
| 陽性(Positive) \(H_0\) を棄却 / \(b\) は有意 |
真陽性(True positive) | 偽陽性(False positive) |
| 陰性(Negative) \(H_0\) を採択 / \(b\) は非有意 |
偽陰性(False negative) | 真陰性(True negative) |
理想的には両方の誤りの確率が低いことが望ましいが、実際には、一方の種類の誤りの確率を下げることは、他方の確率を上げることと引き換えになる。
なぜトレードオフが生じるのか。有意水準を非常に低い水準、たとえば0.00001%に設定して第一種の誤りを減らそうとするとしよう。この場合、ほとんどの係数は0と有意に異なるとは判定されない(すなわち星記号が付かない)。つまり \(H_0\)(\(x\) の影響 = 0)を採択することになる。これは、\(x\) が実際に影響を持つ場合に問題となりうる。なぜなら、誤った判断をしやすくなる(すなわち \(\Pr[\text{第二種の誤り}]\) が大きくなる)からである。
古典的な解決策は、第一種の誤りの確率を特定の水準(通常0.05)に固定し、第二種の誤りの確率は特定しないままにしておくことである。
検定力の導出は Cameron, ch.7.6 で説明されており、Stata は検定力を計算するコマンドを提供している。
もし検定力が高い(すなわち第二種の誤りの確率が低い)ことが分かれば、t 検定が帰無仮説 \(\beta = 0\) を棄却しないときに \(\beta\) は0であると結論できる。そうでなければ、結論すべきではない。「\(\beta\) は0と有意に異ならない」とは言えるが、「\(\beta\) は0である」とか「\(x\) は \(y\) に影響を持たない」と結論すべきではない。
幼児期(0〜2歳)の栄養が15歳時の学業成績に与える影響に関心があるとしよう。これを行うために、それぞれ異なる結果変数(例:IQ スコア、数学のスコア、英語のスコアなど)を用いた10個の別々の回帰を推定する。
ここで \(s\)(\(s = 1, 2, \ldots, 10\))は結果変数の種類を表し、\(i\) は学生を表す。
いま、栄養が学業成績に影響を持たない(すなわちすべての \(s\) について \(\beta_{s1} = 0\))と仮定しよう。標準的な \(p < 0.1\) の閾値を用いると、平均して \(\beta_{s1}\) のうち何個が統計的に有意になるだろうか。
答えは \(1 = 10\) 個の結果 \(\times\) 第一種の誤り(偽陽性)の確率 10% である。
つまり、まったくの偶然によって、栄養が一部の学業成績に効果的であると誤って結論してしまうかもしれないのである。
このような問題を避けるために、q 値(q-value)を用いることができる。これは多重検定(multiple testing)を直接考慮した調整済み p 値である。
t 検定は単一の仮説を検定するのに使える。複数の仮説を同時に(jointly)検定するにはどうすればよいか。たとえば \(H_0:\ \beta_1 = \beta_2 = \beta_3 = 0\) はどう検定すればよいか。3つの別々の t 検定を用いるのは適切ではない。代わりに F 検定(F-test)が必要である。
例:\(H_0:\ \beta_1 + \beta_2 = 0\)、\(H_0:\ \beta_1 = \beta_2 + \beta_3\)
F 検定を行うには、制約なしモデル(unrestricted model)と制約付きモデル(restricted model)を定義しなければならない。
(回帰変数のリストから定数項、\(x_{2i}\)、\(x_{3i}\) を落とす。)
OLS モデルの仮定の下で、かつ誤差項の正規性を仮定するか中心極限定理に訴えるかのいずれかによって、次の比が、\(q\)(制約の数。上の例では \(q = 3\))と \(n-k\) を自由度とする \(F\) 分布に従うことが示せる。
ここで \(SSE_r\) は制約付きモデルの残差平方和、\(SSE_{ur}\) は制約なしモデルの残差平方和である。
計算された F 統計量が非常に大きく、右側の裾の棄却域に入るならば、帰無仮説は棄却される。
仮定 OLS.1–5 の下で、OLS 推定量は最良線形不偏推定量(Best Linear Unbiased Estimator, BLUE)である。
証明:Hayashi, p.29 を参照。
仮定 OLS.1–4 の下で、\(n \to \infty\) のとき \(\Pr[\,|\hat{\boldsymbol{\beta}} - \boldsymbol{\beta}| < \varepsilon\,] \to 1\) となる。ここで \(\varepsilon\) は非常に小さい数である。すなわち、
(plim:確率極限(probability limits))。これが一致性(consistency)の概念である。
証明:Wooldridge, IE, Ch.5 を参照。
言葉で言えば、標本サイズが大きいとき、OLS 推定量は真のパラメータと一致する(consistent)。
一致性を示すのに仮定 OLS.5(同分散かつ無相関な誤差)は必要とされないことに注意したい。
不偏性と一致性の違い: