Chapter 3 · Part I 基礎 · 原典 P.15–18

統計の復習

推定量には「よい推定量」の条件がある。不偏性・有効性・一致性の3性質を押さえ、大標本でのふるまい（漸近的性質）を理解することで、ばかげた推定量を排除できる。その土台の上に、仮説検定の3つの手順を積み上げる。

推定量漸近理論一致性仮説検定 p値

川崎賢太郎（東京大学大学院農学生命科学研究科）原典 P.15–18 Review of statistics

図解で読む原文に忠実な和訳

Contents

01. i.i.d.（独立同一分布）
02. 不偏性（Unbiasedness）
03. 有効性（Efficiency）
04. 漸近（大標本）的性質
05. 一致性（Consistency）
06. 大数の法則（LLN）
07. 中心極限定理（CLT）
08. 仮説検定の基本的考え方
09. 手順1：信頼区間
10. 手順2：t統計量
11. 手順3：p値
12. 参考文献

SECTION 01

独立同一分布（i.i.d.）

独立同一分布（independent and identically distributed; i.i.d.）とは、各確率変数が同一の確率分布に従い、かつすべてが互いに独立であることをいう。

たとえば、無作為に選ばれた個人 #1 と #2 について考えよう。

#1 と #2 は無作為に選ばれているため、#1 の値は #2 についての情報をもたらさない。したがって、両者は独立に分布している（independently distributed）。
#1 と #2 は同じ分布から抽出されている。すなわち、同一に分布している（identically distributed）。

以下で扱う推定量・大数の法則・中心極限定理はいずれも、観測値が i.i.d. であるという仮定のもとで成立する。

参照：Wooldridge, Introductory Econometrics, Appendix C。

SECTION 02

不偏性（Unbiasedness）

真のパラメータ \(\theta\) の推定量 \(W\) が不偏（unbiased）であるとは、 \(E(W) = \theta\) が成り立つことをいう。

母集団の平均を \(\mu\)、分散を \(\sigma^2\) とする。この母集団から無作為標本 \(\{Y_1, Y_2, \ldots, Y_n\}\) を抽出した場合、母平均 \(\mu\) と母分散 \(\sigma^2\) の不偏推定量はそれぞれ次のように与えられる。

\[ \bar{Y} = \frac{1}{n}\sum_{i} Y_i \]

\[ S^2 = \frac{1}{n-1}\sum_{i}(Y_i - \bar{Y})^2 \]

分母が \(n-1\) である理由。直感的には、分散を求める前にパラメータ \(\bar{Y}\) をひとつ推定する必要があるため、自由度が 1 だけ失われる。分母を \(n\) にすると推定量は偏ってしまう（過小推定になる）。

これら2つの推定量が不偏であることは、次の式で確認できる。

\[ E(\bar{Y}) = \mu \]

\[ E(S^2) = \sigma^2 \]

An estimator \(W\) of \(\theta\) (true parameter) is called unbiased if \(E(W) = \theta\).
（真のパラメータ \(\theta\) の推定量 \(W\) が不偏（unbiased）であるとは、\(E(W) = \theta\) が成り立つことをいう。）

SECTION 03

有効性（Efficiency）

\(\theta\) の2つの不偏推定量 \(W_1\) と \(W_2\) があるとき、\(\mathrm{Var}(W_1) < \mathrm{Var}(W_2)\) ならば \(W_1\) は \(W_2\) より有効（efficient）であるという。

\[ \mathrm{Var}(W_1) < \mathrm{Var}(W_2) \]

例： \(\mu\) の推定量として、第1観測値 \(Y_1\) と標本平均 \(\bar{Y}\) を比較しよう。どちらも不偏推定量であるが（\(E(Y_1) = \mu\)、\(E(\bar{Y}) = \mu\)）、標本平均 \(\bar{Y}\) のほうがより有効である。なぜなら \(\mathrm{Var}(\bar{Y}) = \sigma^2/n < \sigma^2 = \mathrm{Var}(Y_1)\) だからである（\(n > 1\) のとき）。

不偏推定量が複数存在する場合、分散の最も小さい推定量を選ぶことが「有効性」の基準である。最良線形不偏推定量（BLUE: Best Linear Unbiased Estimator）はこの基準に基づく。

SECTION 04

漸近（大標本）的性質

不偏性・有効性は有限標本における性質である。これに対して、漸近（大標本）的性質（asymptotic / large sample property）は、標本サイズ \(n \to \infty\) のときの推定量のふるまいを記述する。

漸近的性質を調べることで、ばかげた（silly）推定量を排除できる。たとえば「標本サイズがいくら大きくなっても真の値に近づかない」推定量は、それだけで候補から除外してよい。

原典では、漸近的性質として 一致性・大数の法則・中心極限定理 の3つが順に扱われる。

Topic 01

一致性（Consistency）

\(n \to \infty\) のとき、推定量 \(W_n\) が真のパラメータ \(\theta\) に確率収束する。

Topic 02

大数の法則（Law of Large Numbers）

標本平均は一致推定量である（\(\mathrm{plim}(\bar{Y}) = \mu\)）。一致性を支える基本定理。

Topic 03

中心極限定理（Central Limit Theorem）

標本サイズが大きいとき、標本平均の分布は母集団の形によらず正規分布に近づく。

SECTION 05

一致性（Consistency）

\(\theta\) の推定量 \(W_n\) が一致（consistent）であるとは、 \(n \to \infty\) のとき \(P(|W_n - \theta| > \varepsilon) \to 0\) が任意の \(\varepsilon > 0\) に対して成り立つことをいう。略記すると \(\mathrm{plim}(W_n) = \theta\)。

\[ P\!\left(|W_n - \theta| > \varepsilon\right) \to 0 \quad \text{as} \quad n \to \infty \]

略記：\(\mathrm{plim}(W_n) = \theta\)（確率極限、probability limit）

言葉で言い換えると、標本サイズが増えるにつれて \(W_n\) は真の値 \(\theta\) の周りにますます集中していく。

別の言い方をすれば、ある推定量が不偏（\(E(W) = \theta\)）であり、かつその分散がゼロに収束（\(\mathrm{Var}(W) \to 0\)）するならば、その推定量は一致推定量となる。

一致性は不偏性より弱い概念であることに注意。不偏推定量は有限標本でも偏りがないが、一致推定量は大標本においてはじめて偏りがなくなる（有限標本では偏りがあってもよい）。

連続関数の確率極限

確率極限には次の重要な性質がある。

\[ \mathrm{plim}\, g(W_n) = g\!\left(\mathrm{plim}\, W_n\right) \]

ただし \(g(\cdot)\) は連続関数。

例：標本分散と標本標準偏差。 標本分散 \(S^2 = \frac{1}{n-1}\sum_i(Y_i - \bar{Y})^2\) は真の分散 \(\sigma^2\) の不偏推定量である。一方、その平方根 \(S = \sqrt{S^2}\) は真の標準偏差 \(\sigma\) の不偏推定量ではない（\(E(\sqrt{S^2}) \neq \sigma\)。平方根は非線形関数であり、Jensenの不等式から \(E(\sqrt{S^2}) \leq \sqrt{E(S^2)} = \sigma\) となるため、過小推定になる）。しかし \(\mathrm{plim}\,g(W_n) = g(\mathrm{plim}\,W_n)\) が成り立つので、\(S^2\) も \(S\) もともに一致推定量である。

Professor Note ― 標本標準偏差が偏る理由

\(S^2\) は \(\sigma^2\) の不偏推定量だから \(E(S^2) = \sigma^2\)。しかし平方根は凹関数なので、Jensenの不等式から \(E(\sqrt{S^2}) \leq \sqrt{E(S^2)} = \sigma\) となる。よって \(S\) は \(\sigma\) を系統的に過小推定する（偏りがある）。すべての母集団分布に対して不偏となる標準偏差の推定量は存在しない（偏りは分布の形状に依存する）。ただし正規分布を仮定する場合、補正係数を用いた不偏推定量が知られている。

原典 P.16 脚注 3。

SECTION 06

大数の法則（Law of Large Numbers）

大数の法則（LLN）：標本平均は一致推定量である。すなわち、 \(\mathrm{plim}(\bar{Y}) = \mu\)。

\[ \mathrm{plim}(\bar{Y}) = \mu \]

言葉で言えば、標本サイズを増やすほど標本平均 \(\bar{Y}\) は真の母平均 \(\mu\) の周りに集中していく。大数の法則と連続関数の確率極限の性質を組み合わせると \(\mathrm{plim}\, g(W_n) = g(\mathrm{plim}\, W_n)\) も成り立つ。

大数の法則は計量経済学の多くの一致性の証明の基礎になる。OLS推定量の一致性を示すときも、この法則が核心的な役割を果たす。

SECTION 07

中心極限定理（Central Limit Theorem）

母集団の分布の形状によらず、標本サイズ \(n\) が大きくなると、標本平均 \(\bar{Y}\) の標本分布は正規分布に近づく。これが中心極限定理（CLT）である。

Let \(\{Y_1, Y_2, \ldots, Y_n\}\) be a random sample from the population where mean is given by \(\mu\) and variance by \(\sigma^2\). CLT states that as \(n\) gets larger, the distribution of \(\bar{Y}\) is close to the normal distribution with mean \(\mu\) and variance \(\sigma^2/n\) regardless of the shape of the population distribution.
（母平均 \(\mu\)、母分散 \(\sigma^2\) の母集団から無作為標本 \(\{Y_1, \ldots, Y_n\}\) を抽出するとき、\(n\) が大きくなるにつれて、\(\bar{Y}\) の分布は母集団分布の形状によらず、平均 \(\mu\)・分散 \(\sigma^2/n\) の正規分布に近づく。）

\[ \bar{Y} \sim N\!\left(\mu,\, \frac{\sigma^2}{n}\right) \]

標準化すると、次のように標準正規分布に近づく。

\[ \frac{\bar{Y} - E(\bar{Y})}{\sqrt{\mathrm{Var}(\bar{Y})}} = \frac{\bar{Y} - \mu}{\sigma/\sqrt{n}} \sim N(0,1) \]

大標本における \(\bar{Y}\) の標本分布の性質

分布の集中（大数の法則）

\(n\) が大きくなるにつれて、\(\bar{Y}\) の分布は真の平均 \(\mu\) の周りにますます集中していく。

正規性への収束（中心極限定理）

さらに、\(\bar{Y}\) の分布は正規分布に近づく。

例：ベルヌーイ分布（Bernoulli distribution）。 \(Y\) が確率 \(p\) で 1、確率 \(1-p\) で 0 をとるベルヌーイ分布（\(\mu = .78\) の例）に従う場合、\(n\) が小さいとき \(\bar{Y}\) の標本分布は単純ではないが、\(n\) が大きくなると正規分布で近似できるようになる。

Professor Note ― ベルヌーイ分布

ベルヌーイ分布（Bernoulli distribution）は、確率 \(p\) で値 1、確率 \(1 - p\) で値 0 をとる分布である。

原典 P.16 脚注 4。

SECTION 08

仮説検定の基本的考え方

母集団の平均 \(\mu\) がある値 \(\mu_0\) に等しいかどうかを検定したいとする。これを帰無仮説（null hypothesis）と呼び、\(H_0 : \mu = \mu_0\) と表記する。

中心極限定理によれば、\(n\) が大きいとき \(\bar{Y}\) の分布は正規分布に近似できる。帰無仮説が正しければ、

\[ \bar{Y} \sim N\!\left(\mu_0,\, \frac{\sigma^2}{n}\right) \]

観測された \(\bar{Y}\) の値が \(N(\mu_0, \sigma^2/n)\) の形状に照らして稀（rare）であるならば、帰無仮説は正しくないと判断する。

実際には真の \(\sigma\) は既知でないため、推定値で代替する。\(\sigma\) を推定値で置き換えると、分布は正規分布からt分布（t-distribution）に変わる（ただし \(n\) が大きければ両者の違いは無視できる）。

検定の手順は複数あるが（以下の3手順）、本質的にはいずれも同じ結果を与える。いずれの手順でも、最初に有意水準 \(p\)（significance probability）を決める必要がある。計量経済学では通常 \(p = 10\%\)、\(5\%\)、または \(1\%\) が用いられる。

第一種の誤り（Type I error）。帰無仮説が実際には正しいにもかかわらず、棄却してしまう誤り。有意水準 \(p\%\) を設定するとは、「帰無仮説が正しいとき、それを誤って棄却する確率を \(p\%\) 以下に抑える」という基準を定めることに他ならない。

SECTION 09

手順1：信頼区間（Confidence Interval）

母平均の \((100 - p)\%\) 信頼区間を構築し、帰無仮説の値 \(\mu_0\) がその外に落ちれば帰無仮説を棄却する。

まず標準誤差 \(sd\) を計算する。

\[ sd = \left(\frac{1}{n}\cdot\frac{1}{n-1}\sum_{i}\!\left(Y_i - \bar{Y}\right)^2\right)^{1/2} = \sqrt{\frac{S^2}{n}} \]

ここで \(S^2 = \frac{1}{n-1}\sum_i(Y_i - \bar{Y})^2\) は標本分散。

次に、t分布における \(p/2\,\%\) 点（critical value）を \(c\) とする。母平均の \((100 - p)\%\) 信頼区間は次のように表される。

\[ \left[\bar{Y} - c \cdot sd,\; \bar{Y} + c \cdot sd\right] \]

棄却ルール。仮説上の値 \(\mu_0\) がこの信頼区間の外側に位置する場合、母平均が \(\mu_0\) である確率は \(p\%\) 未満（すなわち \(\Pr(\bar{Y} = \mu_0) < p\)）となる。この場合、\(\bar{Y}\) は \(\mu_0\) と有意に異なると結論づけ、帰無仮説を棄却する（reject the null hypothesis）。

帰無仮説を受容することの意味。\(\mu_0\) が信頼区間の内側にある場合は帰無仮説を受容（accept）する。ただし、これは帰無仮説が正しいことを意味するのではなく、「現時点の証拠では棄却できない」という暫定的な受容である。追加的な証拠によって後から棄却される可能性は常にある。仮説検定は、帰無仮説を棄却するか、棄却に失敗するかのいずれかとして定式化できる。

SECTION 10

手順2：t統計量（t-statistics）

t統計量を計算し、その絶対値が臨界値 \(c\) を超えるかどうかで帰無仮説を棄却するかを決める。

t統計量は次のように計算する。

\[ t = \frac{\bar{Y} - \mu_0}{sd} \]

t分布表から \(p/2\,\%\) 点に対応する臨界値 \(c\) を求める。

目安：\(p = 5\%\)、\(n > 20\) のとき、\(c \approx 2\)。

棄却ルール。t統計量の絶対値が \(c\) より大きい場合（\(|t| > c\)）、\(\mu\) は \(\mu_0\) と有意に異なると結論し、帰無仮説 \(H_0 : \mu = \mu_0\) を棄却する。そうでない場合は帰無仮説を受容する。

Professor Note ― t分布の図（原典 P.18）

原典 P.18 には 自由度 14 のときの t分布のグラフが掲載されている。白い部分の面積が 95% にあたり、臨界値 \(\pm 2.145\) の外側（左右合わせて 5%、片側 2.5%）と \(\pm 2.977\) の外側（左右合わせて 1%、片側 0.5%）が棄却域として示されている。図にはこの例の観測 t統計量 \(-1.29\) も示されており、これは棄却域に入らない（帰無仮説を棄却できない）。標本が大きくなるほど t分布は標準正規分布に近づき、臨界値は約 2（標準正規分布では 1.96）に収束する。

原典 P.18 図（t分布のグラフ）参照。

SECTION 11

手順3：p値（p-value）

p値とは、帰無仮説が正しいと仮定したもとで、実際に観測された t統計量の絶対値以上の値が得られる確率（両側）のことである。

まず t統計量を計算する。

\[ t = \frac{\bar{Y} - \mu_0}{sd} \]

次に、t分布表においてこの t統計量に対応する確率を求め、それを2倍する。これが p値である。

棄却ルール。p値が有意水準 \(p\) より小さい場合、\(\mu\) は \(\mu_0\) と有意に異なると結論し、帰無仮説 \(H_0 : \mu = \mu_0\) を棄却する。そうでない場合は帰無仮説を受容する。

3手順の対応関係

仮説検定の3手順まとめ（\(H_0: \mu = \mu_0\)）
手順	計算するもの	棄却条件
1. 信頼区間	\((100-p)\%\) CI \(= [\bar{Y} - c\cdot sd,\; \bar{Y} + c\cdot sd]\)	\(\mu_0\) が CI の外にある
2. t統計量	\(t = (\bar{Y} - \mu_0)/sd\)	\(\|t\| > c\)
3. p値	t統計量に対応する確率×2	p値 \(< p\)

3手順は本質的に同じ結果を与える。どれを使っても棄却・受容の結論は変わらない。実務では手順2（t統計量）と手順3（p値）が最もよく用いられる。

SECTION 12

参考文献（References）

Wooldridge, Jeffrey M. Introductory Econometrics: A Modern Approach. Appendix C: Fundamentals of Mathematical Statistics.（本章の主要参照先）

出典：原典 P.15 参照リスト。