Chapter 8 · Part II 線形回帰 · 原典 P.44–49

標準誤差と不均一分散

OLS.5 仮定が破れたとき、OLS 推定量は依然として不偏・一致だが、標準誤差・信頼区間・t 統計量はすべて無効になる。変数変換による GLS と任意の不均一分散を許容する頑健標準誤差という2つのアプローチを軸に、加重最小二乗・クラスター標準誤差・空間相関標準誤差まで体系的に整理する。

不均一分散 GLS 頑健標準誤差クラスター空間相関

川崎賢太郎（東京大学大学院農学生命科学研究科）原典 P.44–49 Standard errors, Heteroskedasticity

図解で読む原文に忠実な和訳

Contents

01. 動機 ― OLS.5 仮定の内容と違反
02. 不均一分散下の OLS
03. 一般化最小二乗法（GLS）
04. 実行可能 GLS（FGLS）
05. 加重最小二乗法（WLS）
06. 加重が必要な場合① ― 集計データ
07. 加重が必要な場合② ― 標本ウェイト
08. 頑健標準誤差
09. クラスター標準誤差
10. 空間 HAC 標準誤差
11. 空間相関モデル
12. パラメータの線形・非線形結合の標準誤差
13. 参考文献

SECTION 01

動機 ― OLS.5 仮定の内容と違反

OLS の不偏性・一致性を保証する仮定は OLS.1〜OLS.4 である。しかし OLS.5 が破れると、標準誤差・信頼区間・検定統計量がすべて無効になる。

OLS.5 仮定：\(E(u_i^2 \mid \mathbf{X}) = \sigma^2\)（均一分散）および \(E(u_i u_j \mid \mathbf{X}) = 0,\; \forall i \neq j\)（無相関）。

分散共分散行列（行列形式）

OLS.5 が成立するとき、誤差ベクトルの条件付き分散共分散行列は次の形になる。

\[ V(\mathbf{u} \mid \mathbf{X}) = E(\mathbf{u}\mathbf{u}' \mid \mathbf{X}) = \begin{bmatrix} \sigma^2 & 0 & \cdots & 0 \\ 0 & \sigma^2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \sigma^2 \end{bmatrix} = \sigma^2 \mathbf{I}_n \]

OLS.5 の2種類の違反

違反①：不均一分散（Heteroskedasticity）

\[ V(\mathbf{u} \mid \mathbf{X}) = \begin{bmatrix} \sigma_1^2 & 0 & \cdots & 0 \\ 0 & \sigma_2^2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \sigma_n^2 \end{bmatrix} \]

対角要素が観測単位 \(i\) によって異なる（誤差分散が \(i\) に依存）。
非対角要素はゼロのまま（観測間の相関なし）。

違反②：系列相関（Serial/Autocorrelation）

\[ V(\mathbf{u} \mid \mathbf{X}) = \sigma^2 \begin{bmatrix} 1 & \rho_{12} & \cdots & \rho_{1n} \\ \rho_{12} & 1 & \cdots & \rho_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ \rho_{1n} & \rho_{2n} & \cdots & 1 \end{bmatrix} \]

非対角要素が非ゼロ（異なる観測単位の誤差に相関）。
本章は主に不均一分散を扱い、系列相関は空間 HAC で対処する。

出典：Wooldridge, Introductory Econometrics, Ch.8 ／原典 P.44。

SECTION 02

不均一分散下の OLS

OLS は依然として不偏かつ一致だが、係数の分散の推定量にバイアスが生じ、標準誤差・信頼区間・t 統計量が無効になる。

OLS 推定量の不偏性・一致性の証明に必要な仮定は OLS.1〜OLS.4 であり、OLS.5 はそこで役割を果たさない。したがって、不均一分散や系列相関があっても、OLS 推定量 \(\hat{\boldsymbol{\beta}}\) は不偏かつ一致のままである。

しかし、係数の分散 \(\mathrm{Var}(\hat{\boldsymbol{\beta}})\) の推定量は、OLS.5 なしではバイアスをもつ。つまり OLS の標準誤差、信頼区間、t 統計量はもはや有効でない。

この問題はサンプルサイズを大きくしても解消されない。

Gauss-Markov 定理（OLS が最良線形不偏推定量 BLUE であること）も OLS.5 に依拠している。OLS.5 が破れると OLS は BLUE でなくなり、より効率的な推定量（分散がより小さい）が存在しうる。

アプローチ 1

一般化最小二乗法（GLS）

変数変換によって均一分散を成立させる。分散共分散構造 \(V\) が既知の場合に適用でき、BLUE を回復する。

アプローチ 2

頑健（ロバスト）標準誤差

不均一分散の具体的な形を特定せずに、任意の形の不均一分散に対して有効な標準誤差を計算する。

SECTION 03

一般化最小二乗法（GLS）

誤差の分散共分散構造 \(V\) が既知のとき、変数変換によって OLS.5 を成立させ、一般化回帰モデルの BLUE を得る。

If the error is not homoskedastic, the values of the diagonal elements of \(V(\mathbf{u}\mid\mathbf{X})\) are not the same, and if there is correlation in the error term between observations, the values of the off-diagonal elements are not zero.

誤差が均一分散でなければ \(V(\mathbf{u}\mid\mathbf{X})\) の対角要素は等しくなく、観測間に相関があれば非対角要素はゼロではない。

正のスカラー \(\sigma^2\) と \(n \times n\) 行列 \(\mathbf{V}\) を定義し、次のように分解する。

\[ V(\mathbf{u} \mid \mathbf{X}) = E(\mathbf{u}\mathbf{u}' \mid \mathbf{X}) = \sigma^2 \mathbf{V} \]

\(E(\mathbf{u}\mathbf{u}' \mid \mathbf{X})\) を \(\sigma^2\) と \(\mathbf{V}\) に分解する理由は、効率的な推定のために \(\sigma^2\) の値を知る必要がないからである。OLS.5 を \(E(\mathbf{u}\mathbf{u}' \mid \mathbf{X}) = \sigma^2 \mathbf{V}\) に置き換えたモデルを一般化回帰モデル（generalized regression model）と呼ぶ。

GLS の導出：変数変換による均一分散化

\(\mathbf{V}\) は分散共分散行列であるから対称かつ正定値であり、\(\mathbf{V}^{-1} = \mathbf{C}'\mathbf{C}\) を満たす非特異な \(n \times n\) 行列 \(\mathbf{C}\) が存在する。

変数変換

元のモデル \(\mathbf{y} = \mathbf{X}\boldsymbol{\beta} + \mathbf{u}\) に左から \(\mathbf{C}\) を掛けて変換する。

\[ \mathbf{y}^* = \mathbf{X}^*\boldsymbol{\beta} + \mathbf{u}^* \]

\(\mathbf{y}^* = \mathbf{C}\mathbf{y},\quad \mathbf{X}^* = \mathbf{C}\mathbf{X},\quad \mathbf{u}^* = \mathbf{C}\mathbf{u}\)

変換後の誤差が OLS.5 を満足することの確認

\(\mathbf{X}^*\) と \(\mathbf{X}\) は同じ情報を含むから \(E(\mathbf{u}^*\mathbf{u}^{*\prime} \mid \mathbf{X}^*) = E(\mathbf{u}^*\mathbf{u}^{*\prime} \mid \mathbf{X})\) であり、

\[ E(\mathbf{u}^*\mathbf{u}^{*\prime} \mid \mathbf{X}) = E(\mathbf{C}\mathbf{u}\mathbf{u}'\mathbf{C}' \mid \mathbf{X}) = \mathbf{C} E(\mathbf{u}\mathbf{u}' \mid \mathbf{X}) \mathbf{C}' = \mathbf{C}(\sigma^2 \mathbf{V})\mathbf{C}' = \sigma^2 \mathbf{C}\mathbf{V}\mathbf{C}' = \sigma^2 \mathbf{I}_n \]

最後の等式は \(\mathbf{V}^{-1} = \mathbf{C}'\mathbf{C}\) より \(\mathbf{C}\mathbf{V}\mathbf{C}' = \mathbf{I}_n\) が成り立つことによる（\((\mathbf{A}\mathbf{B})^{-1} = \mathbf{B}^{-1}\mathbf{A}^{-1}\) および \(\mathbf{I}_n^{-1} = \mathbf{I}_n\) を利用）。

変換モデルへの OLS 適用

変換後の誤差 \(\mathbf{u}^*\) は OLS.5 を満たす。変換モデル \(\mathbf{y}^* = \mathbf{X}^*\boldsymbol{\beta} + \mathbf{u}^*\) に OLS を適用すると、元のモデルへの OLS より効率的な推定量（BLUE）が得られ、正しい t・F 統計量も産出される。

Professor Note ― \(\mathbf{C}\) の非一意性

\(\mathbf{V}^{-1} = \mathbf{C}'\mathbf{C}\) を満たす \(\mathbf{C}\) の選択は唯一ではない。しかし以下の議論から明らかなように、\(\mathbf{C}\) の選択によって推定量は変わらない。

原典 P.45 脚注13。

参考文献：Hayashi, Econometrics, Ch.1.6 ／原典 P.45。

SECTION 04

実行可能 GLS（FGLS）

実際には \(\mathbf{V}\) の正確な形は未知である。残差 \(\hat{u}_i\) から \(\mathbf{V}\) の未知パラメータを一致推定し、その推定値を使って GLS を実行するのが実行可能 GLS（FGLS：Feasible GLS）である。

\(\mathbf{V}\) には \(n(n+1)/2\) 個の追加パラメータがあり、\(n\) 個の観測値では推定できない。何らかの構造を課す必要がある。

観測間の誤差に相関はなく（\(\mathbf{V}(\mathbf{u}\mid\mathbf{X})\) は対角行列）、不均一分散のみが存在する特殊ケースを考える。

ここでは次のように分散が説明変数 \(\mathbf{x}_i\) に依存すると仮定する。

\[ \mathrm{Var}(u_i \mid \mathbf{x}_i) = \sigma^2 \exp(\mathbf{x}_i \boldsymbol{\delta}) \]

指数関数を使う理由は、分散が必ず正になるからである。

FGLS の手順

\(y\) を \(\mathbf{x}\) に回帰し、残差 \(\hat{u}_i\) を取得

OLS によって \(\hat{u}_i = y_i - \mathbf{x}_i\hat{\boldsymbol{\beta}}\) を計算し、\(\log(\hat{u}_i^2)\) を作成する。

\(\log(\hat{u}_i^2)\) を \(\mathbf{x}\) に回帰し、パラメータ \(\hat{\boldsymbol{\delta}}\) を推定

\(\log(\hat{u}_i^2)\) を被説明変数、\(\mathbf{x}_i\) を説明変数として OLS を実行する。

予測値 \(\exp(\mathbf{x}_i\hat{\boldsymbol{\delta}})\) を重みとして GLS（WLS）を実行

変換変数を次のように定義して OLS を実行する。

\[ y_i^* = \frac{y_i}{\exp(\mathbf{x}_i\hat{\boldsymbol{\delta}})^{0.5}},\quad \mathbf{x}_i^* = \frac{\mathbf{x}_i}{\exp(\mathbf{x}_i\hat{\boldsymbol{\delta}})^{0.5}},\quad u_i^* = \frac{u_i}{\exp(\mathbf{x}_i\hat{\boldsymbol{\delta}})^{0.5}} \]

変換モデル \(y_i^* = \mathbf{x}_i^*\boldsymbol{\beta} + u_i^*\) を OLS で推定する。

FGLS は一致推定量であり、大標本では OLS より漸近的に効率的である。

Professor Note ― 最尤法による推定

\(\mathbf{V}\) の推定には 2 段階 GLS のほかに最尤法もある。最尤推定については Greene, ch.14 を参照。

原典 P.45 脚注14。

SECTION 05

加重最小二乗法（WLS）

観測単位ごとの分散 \(\sigma_i^2\) が既知のとき、各残差二乗を \(1/\sigma_i\) で加重した残差二乗和を最小化する推定量が加重最小二乗法（WLS：Weighted Least Squares）である。

観測間の誤差に相関はないが不均一分散が存在するとし、\(\mathrm{Var}(u_i \mid \mathbf{x}_i) = \sigma_i^2\) とする。\(\sigma_i\) が既知のとき、次の変換変数を定義して OLS を実行すると、OLS より効率的な推定量が得られる。

\[ y_i^* = \frac{y_i}{\sigma_i},\quad \mathbf{x}_i^* = \frac{\mathbf{x}_i}{\sigma_i},\quad u_i^* = \frac{u_i}{\sigma_i} \]

WLS の名称は、\(\hat{\boldsymbol{\beta}}\) が加重残差二乗和 \(\sum_i \frac{1}{\sigma_i}(y_i - \mathbf{x}_i\boldsymbol{\beta})^2\) を最小化することに由来する。誤差分散が大きい観測には小さい重みを与えるという考え方である。WLS は GLS の特殊ケースである。

SECTION 06

加重が必要な場合① ― 集計（グループ）データ

個票データの代わりにグループ・地域平均データしか利用できない場合、集計方程式には自然に不均一分散が生じる。

個票レベルの方程式が均一分散仮定を満たし、かつ \(\mathrm{Cov}(u_{gi}, u_{gj}) = 0\) であるとする。

\[ y_{gi} = \mathbf{x}_{gi}\boldsymbol{\beta} + u_{gi},\quad \mathrm{Var}(u_{gi} \mid \mathbf{x}_{gi}) = \sigma^2 \]

ここで \(g\) はグループ、\(i\) は個人を表す。グループ平均に集計した方程式は次のようになる。

\[ \bar{y}_g = \bar{\mathbf{x}}_g\boldsymbol{\beta} + \bar{u}_g \]

ここで \(\bar{y}_g\) は \(y_{gi}\) のグループ平均である。\(\mathrm{Var}(a X) = a^2 \mathrm{Var}(X)\) および \(\mathrm{Var}(X + Y) = \mathrm{Var}(X) + \mathrm{Var}(Y) + 2\mathrm{Cov}(X, Y)\) を用いると、集計誤差の分散は次のようになる。

\[ \mathrm{Var}(\bar{u}_g) = \mathrm{Var}\!\left(\frac{1}{m_g}\sum_{i=1}^{m_g} u_{gi}\right) = \frac{1}{m_g^2} \sum_{i=1}^{m_g} \mathrm{Var}(u_{gi}) = \frac{\sigma^2}{m_g} \]

集計方程式は不均一分散を持ち、グループ内個体数 \(m_g\) が増えるほど分散は減少する。この場合、\(m_g\) を重みとする加重最小二乗法が最も効率的な手順である。

Professor Note ― 交差項がある場合の集計

交差項がある場合、集計は単純でない。詳細は Blundell and Stoker (2007) "Models of Aggregate Economic Relationships That Account for Heterogeneity," in J. Heckman (ed.) Handbook of Econometrics, Chapter 68, pp.4609–4666 を参照。

原典 P.46 脚注15。

SECTION 07

加重が必要な場合② ― 標本ウェイト

調査コスト削減や特定部分母集団の推定精度向上のために、非ランダムサンプリングデザイン（層化抽出等）が採用されることが多い。加重の必要性は状況による。

たとえば農家経済調査では、農場規模（1〜2 ha、2〜3 ha 等）や農場種別（稲作農場、酪農農場等）によって複数の部分母集団に区分（層化）し、部分母集団ごとに異なるサンプリング率で標本を抽出することが多い。

加重の必要性に関する一般ルール

詳細は Wooldridge (2010), Ch.20 を参照。

加重不要：被説明変数に基づかない層化

層化が被説明変数の値に基づいていなければ、加重は不要である（例：農場規模・農場種別で層化し、被説明変数が農家所得の場合）。

加重必要：被説明変数に基づく層化（内生層化）

標本が被説明変数の値に一部依存して決まる場合（たとえば所得が被説明変数のとき低所得者を過剰抽出）には、加重推定が必要である。

加重常に必要：\(y\) の平均（集計）の予測

\(\hat{Y} = E[y] = \sum_{i=1}^N w_i \hat{y}_i\) のように予測 \(y\) の平均を知りたい場合は、加重が常に必要である。

線形モデルの偏微分（限界効果）：加重不要

モデルが線形（例：\(y = \beta_0 + \beta_1 x_1\)）であれば、\(x_1\) の偏微分は単純に \(\partial E[y]/\partial x_1 = \beta_1\) であり、加重は不要である。

非線形モデルの平均偏微分（APE）：加重必要

モデルが非線形（例：\(y = \beta_0 + g(\mathbf{x})\)）の場合、予測効果が評価点 \(\mathbf{x}\) に依存する。母集団の平均反応（APE：average partial effects）の推定量は次のとおりであり、標本ウェイト \(w_i\) が必要である。

\[ E\left[\frac{\partial y}{\partial \mathbf{x}}\right] \approx \sum_{i=1}^N w_i \, g'(\mathbf{x}_i) \]

参考文献：Cameron and Trivedi, Ch.24 ／原典 P.46–47。

SECTION 08

頑健標準誤差（Heteroskedasticity-Robust Standard Errors）

FGLS の弱点は分散決定要因の関数形の特定誤りによる非効率性である。この問題を回避するため、多くの研究者は任意の形の不均一分散に対して有効な頑健標準誤差を使用する。

頑健標準誤差は観測間の誤差の相関を許容しない（不均一分散のみに対応）。また、大標本においてのみ正当化される。

Stata では robust オプションを用いる。不均一分散の存在を検定するさまざまな方法は Wooldridge, IE Chapter 8 を参照。

頑健標準誤差の数学的導出

均一分散のもとでは、OLS 推定量の分散は次のように導出される。

\[ V(\hat{\boldsymbol{\beta}} \mid \mathbf{X}) = (\mathbf{X}'\mathbf{X})^{-1} \mathbf{X}' V(\mathbf{u} \mid \mathbf{X}) \mathbf{X} (\mathbf{X}'\mathbf{X})^{-1} = (\mathbf{X}'\mathbf{X})^{-1} \mathbf{X}' (\sigma^2 \mathbf{I}) \mathbf{X} (\mathbf{X}'\mathbf{X})^{-1} = \sigma^2 (\mathbf{X}'\mathbf{X})^{-1} \]

しかし不均一分散下では \(V(\mathbf{u})\) が上記のように簡略化できないため、この式は成立しない。

頑健標準誤差では、\(V(\mathbf{u})\) を残差 \(\hat{u}_i = y_i - \mathbf{x}_i\hat{\boldsymbol{\beta}}\) から次のように推定する。

\[ \widehat{V(\mathbf{u})} = \begin{bmatrix} \hat{u}_1^2 & 0 & \cdots & 0 \\ 0 & \hat{u}_2^2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \hat{u}_n^2 \end{bmatrix} \]

頑健標準誤差は、\(V(\hat{\boldsymbol{\beta}} \mid \mathbf{X}) = (\mathbf{X}'\mathbf{X})^{-1} \mathbf{X}' \widehat{V(\mathbf{u})} \mathbf{X} (\mathbf{X}'\mathbf{X})^{-1}\) をサンプルの残差から推定することで求まる。

SECTION 09

クラスター標準誤差（Clustered Standard Errors）

クラスター標準誤差は、「クラスター（グループ）」内の任意の形の不均一分散と相関を許容する。異なるクラスター間の相関はゼロと仮定する。

\(y\) を米収量、データ単位を市区町村とする。相関が生じる典型的なメカニズムは3つある。

空間相関①

都道府県内の空間相関

同じ都道府県内の市区町村は地域の共通条件を共有するため収量が相関する。都道府県でクラスタリングして対処できる。

空間相関②

同一年内の空間相関

同じ年の市区町村は年固有の気象条件を共有するため収量が相関する。年でクラスタリングして対処できる。

時間相関

時間的相関

同一地点の今年の収量と過去の収量には、土壌条件等の地点固有要因により相関がある。市区町村でクラスタリングして対処できる。

クラスター標準誤差の注意点

クラスター数が重要（標本サイズではない）

有限（小）標本バイアスは、標本サイズではなくクラスター数によって決まる。クラスター数が少ないと推定は誤解を招く（Angrist and Pischke ch.8.2.3; Cameron et al., 2008）。

クラスター数の目安

Kezdi (2004) は特定のモデルのシミュレーションに基づき、クラスター数 50 程度が正確な推測に十分近いことを示している。ただし、この結論は特定のモデルのシミュレーションから導かれたものである。

クラスター内観測数はクラスター頑健 SE の導出に影響しない

各クラスターのサイズ（クラスター内観測数）は、クラスター頑健標準誤差の導出において役割を果たさない（ただし、全クラスターが観測数 1 の場合は問題あり）。Cameron and Miller (2015) の式 (10)・(11) を参照。

クラスタリングの必要性の検定

クラスタリングの調整が本当に必要かどうかは検定で確認できる（Stata では cltest および xtcltest コマンドを使用）。

空間相関と時間相関の両方を扱いたい場合は、次節で説明する空間 HAC 標準誤差を使用する。

SECTION 10

空間 HAC 標準誤差（Spatial HAC Standard Errors）

パネルデータでは誤差に空間相関（近隣単位間の相関）と時間相関（過去との相関）が同時に存在しうる。さらに相関の「減衰」も仮定したい場合がある。

「減衰（decay）」とは、空間的または時間的距離が大きいほど相関が直線的に減少し、ある上限距離を超えるとゼロになるという仮定である。

こうした問題を扱うために、不均一分散・自己相関に一致的（HAC：Heteroskedasticity- and Autocorrelation-Consistent）な標準誤差を用いる。

Stata での実装：ユーザー記述コマンド acreg、ols_spatial_HAC、または reg2hdfespatial を使用する。詳細は Colella et al. (2020) を参照。

SECTION 11

空間相関モデル

空間相関の構造をより明示的に定式化したい場合、空間誤差モデル・空間ラグモデル・SLX モデルの3種類が用いられる。

空間ウェイト \(W_{ij}\)：既知と仮定される。典型的には、\(i, j\) が隣接するとき \(W_{ij} = 1\)、そうでなければ \(0\)。あるいは \(W_{ij}\) が空間距離の増加とともに減少するように設定することもある。

参考文献：Anselin (1988, 2001)、Brady and Irwin (2011)、LeSage and Pace (2009)。

空間誤差モデル（Spatial Error Model）

被説明変数は隣接単位の影響を受けず、誤差のみが空間相関を持つ。

\[ y_i = \mathbf{x}_i\boldsymbol{\beta} + u_i,\quad u_i = \lambda \sum_{j=1}^n W_{ij}\, u_j + v_i \quad \Leftrightarrow \quad \mathbf{u} = \lambda \mathbf{W}\mathbf{u} + \mathbf{v} \]

スカラー \(\lambda\) は空間自己回帰係数（spatial autoregression coefficient）であり、推定可能である。

SAR

空間自己回帰モデル（Spatial Autoregressive / Spatial Lag Model）

被説明変数の空間ラグ \(\sum_j W_{ij} y_j\) が右辺に入る。

\[ y_i = \rho \sum_{j=1}^n W_{ij}\, y_j + \mathbf{x}_i\boldsymbol{\beta} + u_i \quad \Leftrightarrow \quad \mathbf{y} = \rho \mathbf{W}\mathbf{y} + \mathbf{X}\boldsymbol{\beta} + \mathbf{u} \]

SLX

空間ラグ説明変数モデル（Spatially Lagged X / SLX Model）

近隣単位の説明変数の空間ラグ \(\sum_j W_{ij} \mathbf{x}_j\) が右辺に追加される。

\[ y_i = \mathbf{x}_i\boldsymbol{\beta} + \sum_{j=1}^n W_{ij}\, \mathbf{x}_j\, \boldsymbol{\gamma} + u_i \quad \Leftrightarrow \quad \mathbf{y} = \mathbf{X}\boldsymbol{\beta} + \mathbf{W}\mathbf{X}\boldsymbol{\gamma} + \mathbf{u} \]

モデルの選択

モデルの選択は、原理的には、モデル化しようとする相互作用の種類に依存する。たとえば Pinkse, Slade, and Brett (2002) のように、隣接競合他社の価格（\(y_j\)）が自社の価格設定（\(y_i\)）に影響するなら SAR モデルが正しい選択である。対照的に、隣接他社の製品特性（\(x_j\)）が関連すると仮定されるなら、SLX モデルが適切な選択である。

Gibbons and Overman (2012) は、多くの状況で SLX モデルが SAR モデルより信頼できる代替手段であると主張している。SAR モデルは識別問題を抱えている可能性があると彼らは論じる。

SECTION 12

パラメータの線形・非線形結合の標準誤差

推定された係数の線形結合の標準誤差は解析的に計算できるが、非線形結合（例：\(\beta_2/\beta_3\)）には特別な手法が必要である。

次のモデルを推定したとする。

\[ y_i = \beta_1 + \beta_2 x_{2i} + \beta_3 x_{3i} + \cdots + \beta_k x_{ki} + u_i \]

これにより各係数の標準誤差 \(\mathrm{se}(\hat{\beta}_k)\) が得られる。

線形結合：解析的に計算可能

公式 \(\mathrm{Var}(\hat{\beta}_2 + \hat{\beta}_3) = \mathrm{Var}(\hat{\beta}_2) + \mathrm{Var}(\hat{\beta}_3) + 2\mathrm{Cov}(\hat{\beta}_2, \hat{\beta}_3)\) を使う。
したがって \(\mathrm{se}(\hat{\beta}_2 + \hat{\beta}_3) = \sqrt{\mathrm{Var}(\hat{\beta}_2 + \hat{\beta}_3)}\)。
Stata では lincom コマンドを使用する。

非線形結合：特別な手法が必要

例：\(\mathrm{se}(\hat{\beta}_2 / \hat{\beta}_3)\) を求める場合。
デルタ法（Delta method）：1次テイラー展開による近似。
Krinsky-Robb 法。
ブートストラップ法（Bootstrap method）。
詳細は Holmes et al. (2017, p.163) を参照。

SECTION 13

参考文献（References）

Anselin, L. (1988) Spatial Econometrics: Methods and Models, Kluwer, Dordrecht.
Anselin, L. (2001) "Spatial econometrics", In ed. B. Baltagi ed, A Companion to Theoretical Econometrics. pp.310–330, Blackwell, Oxford.
Brady, M. & Irwin, E. (2011). Accounting for spatial effects in economic models of land use: Recent developments and challenges ahead. Environmental and Resource Economics, 48, 487–509.
Cameron, A. Colin, Jonah B. Gelbach, and Douglas L. Miller (2008) "Bootstrap-based improvements for inference with clustered errors." The Review of Economics and Statistics 90(3): 414–427.
Cameron and Miller (2015) "A Practitioner's Guide to Cluster-Robust Inference." The Journal of Human Resources 50(2).
Colella et al. (2020) "acreg: instructions and examples" https://acregstata.weebly.com/
Gibbons, S., and H.G. Overman (2012). Mostly Pointless Spatial Econometrics? Journal of Regional Science 52(2): 172–91.
Holmes, T. P., Adamowicz, W. L., & Carlsson, F. (2017). Choice experiments. In A primer on nonmarket valuation (pp.133–186). Springer, Dordrecht. (downloadable)
Kezdi, Gabor (2004) "Robust Standard Error Estimation in Fixed-Effects Panel Models." Hungarian Statistical Review Special(9): 96–116.
LeSage, J. P. and Pace, R. K. (2009) Introduction to Spatial Econometrics, Chapman & Hall/CRC, Boca Raton.
Pinkse, J., M.E. Slade, and C. Brett (2002). Spatial Price Competition: A Semiparametric Approach. Econometrica 70(3): 1111–53.
Wooldridge, J.M. (2010) Econometric Analysis of Cross Section and Panel Data, 2nd ed., MIT Press.

出典：原典 P.49。