数量経済分析 図解ポータル
Chapter 3  ·  Part I 基礎  ·  原典 P.15–18  ·  全文和訳

統計の復習 ― Review of statistics

本ページは、川崎賢太郎『数量経済分析』2026 S1 講義ノート第3章の原文に忠実な全文和訳である。要約・再構成は行わず、原文の論理展開・脚注・参考文献の順序をそのまま日本語に移している。直観的な理解には図解版を併用されたい。

川崎賢太郎(東京大学大学院農学生命科学研究科) 原典 P.15–18 全文和訳
図解で読む 原文に忠実な和訳

Spring 2026 / Kentaro Kawasaki

[参考文献]Wooldridge, IE, Appendix C

独立同一分布(i.i.d.)Independent and identically distributed (i.i.d.)

各確率変数が他のすべての確率変数と同一の確率分布をもち、かつそれらが相互に独立であるとき、これらの確率変数は独立同一分布(independent and identically distributed, i.i.d.)に従うという。

個体 #1 と個体 #2 は無作為に選ばれているので、#1 の値は #2 について何の情報内容ももたない。したがって、両者は独立に分布(independently distributed)している。

また #1 と #2 は同一の分布から得られている。すなわち、両者は同一に分布(identically distributed)している。

不偏性Unbiasedness

\(\theta\)(真のパラメータ)の推定量 \(W\) は、\(E(W) = \theta\) であるとき不偏(unbiased)であるという。

平均が \(\mu\)、分散が \(\sigma^2\) である母集団から、無作為標本 \(\{Y_1, Y_2, \ldots, Y_n\}\) が抽出されたとする。母平均および母分散に対する不偏推定量は何か。

\[ \bar{Y} = n^{-1}\sum_i Y_i \]
\[ S^2 = (n-1)^{-1}\sum_i (Y_i - \bar{Y})^2 \]

分母が \(n\) ではなく \(n-1\) であることに注意したい。直観的な理由は、分散を求める前に、1つのパラメータ(\(\bar{Y}\))を推定しておかなければならないからである。

これらは不偏推定量である。

\[ E(\bar{Y}) = \mu \]
\[ E(S^2) = \sigma^2 \]

効率性Efficiency

\(W_1\) と \(W_2\) を \(\theta\) の2つの不偏推定量とする。このとき、

\[ \mathrm{Var}(W_1) \le \mathrm{Var}(W_2) \]

が成り立つならば、\(W_1\) は \(W_2\) に対して効率的(efficient)であるという。

例:\(\theta\) の推定量として \(Y_1\)(最初の観測値)と \(\bar{Y}\) を比べる。いずれも不偏であるが、後者のほうがより効率的である。

漸近(大標本)的性質Asymptotic (large) sample property

漸近(大標本)的性質を調べることで、ばかげた推定量を排除することができる。

一致性Consistency

\(\theta\) の推定量 \(W\) は、

\[ P\big(\lvert W_n - \theta \rvert > \varepsilon\big) \to 0 \quad \text{as } n \to \infty \]

であるとき一致(consistent)であるという(略記すると \(\operatorname{plim}(W_n) = \theta\))。

言葉で言えば、標本サイズが大きくなるにつれて、\(W_n\) は \(\theta\) のまわりにますます集中していく。

言い換えれば、ある推定量が不偏(\(E(W) = \theta\))であり、かつその分散がゼロに近づく(\(\mathrm{Var}(W) = 0\))ならば、\(W\) は一致しているという。

大数の法則Law of large numbers

大数の法則(LLN)標本平均は一致推定量である。すなわち \(\operatorname{plim}(\bar{Y}) = \mu\)。

\[ \operatorname{plim} g(W_n) = g\big(\operatorname{plim} W_n\big) \]

例:標本分散

\[ S^2 = (n-1)^{-1}\sum_i (Y_i - \bar{Y})^2 \]

と、その平方根 \(\sqrt{S^2}\) を考える。\(S^2\) は真の分散の不偏推定量であるが、\(\sqrt{S^2}\) は真の標準偏差の偏った推定量4である(\(E\big(g(x)\big) \neq g\big(E(x)\big)\))。しかし、\(\operatorname{plim} g(W_n) = g\big(\operatorname{plim} W_n\big)\) であるため、両者はともに一致推定量である。

中心極限定理(CLT)Central limit theorem (CLT)

\(\{Y_1, Y_2, \ldots, Y_n\}\) を、平均が \(\mu\)、分散が \(\sigma^2\) で与えられる母集団からの無作為標本とする。中心極限定理(CLT)は次のことを述べる。すなわち、\(n\) が大きくなるにつれて、母集団分布の形にかかわらず、\(\bar{Y}\) の分布は平均 \(\mu\)・分散 \(\sigma^2/n\) の正規分布に近づく。

言い換えれば、

\[ \frac{\bar{Y} - \mu}{\sigma/\sqrt{n}} \]

は標準正規分布に近づく。

\[ \bar{Y} \sim N\!\left(\mu,\ \frac{\sigma^2}{n}\right) \]
\[ \frac{\bar{Y} - E(\bar{Y})}{\sqrt{\mathrm{Var}(\bar{Y})}} = \frac{\bar{Y} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1) \]

\(n\) が大きいときの \(\bar{Y}\) の標本分布The sampling distribution of \(\bar{Y}\) when \(n\) is large

標本サイズが小さいとき、\(\bar{Y}\) の分布は複雑である。しかし \(n\) が大きいときには、標本分布は単純になる。

  1. \(n\) が増えるにつれて、\(\bar{Y}\) の分布は真の平均のまわりにより緊密に集中していく(大数の法則)。
  2. さらに、\(\bar{Y}\) の分布は正規分布に近づく(中心極限定理)。

例:\(Y\) がベルヌーイ分布5(\(\mu = 0.78\))に従うときの \(\bar{Y}\) の標本分布。

原典 P.16 には、\(n = 5,\ 25,\ 100,\ 1000\) と標本サイズを増やしたときの \(\bar{Y}\) の標本分布(ベルヌーイ分布、\(\mu = 0.78\))を示すヒストグラム図(画像)が掲載されている。\(n\) が大きくなるにつれて分布が真の平均 \(0.78\) のまわりに集中し、かつ正規分布へと近づいていく様子が描かれている。

仮説検定Hypothesis testing

基本的な考え方Basic idea

1. 信頼区間を用いるUse confidence interval

母平均の \((100-p)\%\) 信頼区間(confidence interval)は、

\[ \big[\,\bar{Y} - c \cdot sd,\ \ \bar{Y} + c \cdot sd\,\big] \]

として計算される。ここで \(c\) は \(t\) 分布における \(p/2\,\%\) の臨界値(critical value)を表し、

\[ sd = \left[\frac{1}{n}\cdot\frac{1}{n-1}\sum_i (Y_i - \bar{Y})^2\right]^{0.5} \]

である。

仮説上の値 \(\mu_0\) がこの信頼区間の外側にあるならば、それは母平均が

\(\mu_0\) である確率が \(p\%\) 未満であること(\(\Pr(\bar{Y} = \mu_0) < p\))を意味する。この場合、\(\bar{Y}\) は \(\mu_0\) と有意に異なる(significantly different)と結論する(帰無仮説を棄却する)。

そうでなければ、帰無仮説を受容する。

受容は帰無仮説が真であることを意味しない、という点に注意したい。むしろそれは、追加的な証拠にもとづいて後に棄却されるかもしれないという認識のもとで、暫定的に受容されるにすぎない。仮説検定は、帰無仮説を棄却するか、あるいは棄却しそこなうか、という形で提示することができる。

2. \(t\) 統計量を用いるUse t-statistics

原典 P.18 には、自由度 14 のときの \(t\) 分布の密度曲線と棄却域を示す図(画像)が掲載されている。白い部分の面積が 95% にあたり、臨界値 \(\pm 2.145\) の外側(左右合わせて 5%、片側 2.5%)と \(\pm 2.977\) の外側(左右合わせて 1%、片側 0.5%)が棄却域として示される。緑色で、この例の観測 \(t\) 統計量 \(-1.29\) も示されている。

3. \(p\) 値を用いるUse p-value

脚注
  1. これが母標準偏差の偏った推定量であることを見る1つの方法は、次の結果から出発することである。すなわち、母分散が存在し、標本値が復元抽出によって独立に得られているならば、\(s^2\) はその母集団の分散 \(\sigma^2\) の不偏推定量である。平方根は非線形な関数であり、期待値をとる操作と可換になるのは線形関数だけである。平方根は凹関数であるから、イェンセンの不等式(Jensen's inequality)により、標本分散の平方根は過小評価となる。すべての母集団分布について不偏となるような標準偏差の推定量を見つけることはできない。偏りは個々の分布に依存するからである。以下の議論の多くは、正規分布を仮定した推定に関わるものである。
  2. ベルヌーイ分布(Bernoulli distribution)は、確率 \(p\) で値 1 を、確率 \(1-p\) で値 0 をとる。