数量経済分析(15) その他の制限従属変数モデル ― 全文和訳

図解で読む原文に忠実な和訳

Spring 2026 ／ Kentaro Kawasaki

その他の制限従属変数モデルOther Limited Dependent Variable Models

［参考文献］Wooldridge 2010, ch.16-19、Greene ch.19。

コーナー応答／打ち切りデータ／選択モデルCorner response / Censored data / Selection model

コーナー応答（corner response）：\(y\) の範囲の制限性により \(a \le y \le b\) となる場合をいう。

例：1日に何時間働くか？　\(0 \le y \le 24\)。

3つのアプローチがある（後者ほど柔軟である）：タイプ I トービット（Type I Tobit、または単にトービット）モデル、ハードルモデル（Hurdle model）、タイプ II トービット（Type II Tobit）モデル。

最後のものは選択モデル（selection model）（標本選択の問題は存在しないため、この名称は誤解を招く）または指数型タイプ II トービットモデル（exponential type II Tobit model）としても知られる。

コーナー応答の最も一般的な型は \(y \ge 0\) である。このとき、\(y > 0\) ならば \(s = 1\)、\(y = 0\) ならば \(s = 0\) と定義する。

タイプ I トービットは \(y_i = \max(0,\ x_i\beta + u_i)\) を仮定する。すなわち \(y\) と \(s\) は同一のメカニズム \((x_i\beta + u_i)\) に従う。

ハードルモデルとタイプ II トービットは、\(y\) と \(s\) に別々のメカニズムを仮定する：

\[ y = x_1\beta_1 + u_1 \qquad \text{および} \qquad s = \mathbf{1}[x_2\beta_2 + u_2 > 0] \]

\(u_1\) と \(u_2\) は、ハードルモデルでは無相関と仮定されるのに対し、タイプ II トービットでは相関すると仮定される。

ここでは欠測データの問題は生じない。ランダムに選ばれた観測について、\(y\) と \(x\) を完全に観察できる。

コーナー応答モデルを、いくつかの変数あるいは観測が欠落するような他の類似モデルと混同しないこと。

打ち切りデータCensored data

打ち切りデータ（censored data）：調査設計の都合により、\(y\) が不完全にしか観察されない（\(y\) が部分的に欠落する）。

例（区間打ち切り（interval censoring））：\(y\) が区間で記録される。1日に何時間勉強するか？　0〜1時間、1〜2時間、……。

例（下方または上方からの打ち切り（censoring from below or above））：\(y\) は資産であり、10億ドルで上限コード化（top-coded）される。真の資産は10億ドルを超えうるが、10億ドルとして観察される。

例（二値打ち切り（binary censoring））：真の \(y\) がある値より大きいか否かのみが分かる。森林破壊を防ぐために100ドル支払う意思があるか？　これはプロビット／ロジットモデルと似ているが、関心の対象となる変数が異なる。すなわち、ここでは潜在変数そのもの（真の支払意思額）が関心の対象であるのに対し、プロビットモデルでは潜在変数は関心の対象ではない。

以下の2つのケースは「標本選択モデル（sample selection model）」と呼ばれ、標本が非ランダムに抽出されることによって欠測データの問題が生じる。

切断データ（truncated data）：調査またはプログラムの設計により、標本が \(y\) の値に基づいて非ランダムに選ばれる。

例：所得が100万円未満の世帯のみが調査される。\(y\) と \(x\) の両方が欠落する。

偶発的切断（incidental truncation）：標本抽出の対象となる単位の行動または意思決定により、標本が非ランダムに選ばれる。

例：\(y\) = 賃金。このとき、就業している者についてのみ \(y\) を観察でき、就業するか否かの決定は個人によってなされる。

このモデルは次章でより詳しく扱う。

制限従属変数モデルの4類型
類型	欠測データ？	ランダムサンプリング？	とりうる解決策	Wooldridge (2010) 章
コーナー応答 Corner response	なし	あり	タイプ I トービット、ハードル、タイプ II トービット（選択モデル、または指数型タイプ II トービットモデル）	17
打ち切りデータ Censored data	あり（\(y\) が打ち切り）	あり	打ち切りメカニズムに依存（二値、区間、下限・上限）	19.2
切断データ Truncated data	あり（\(y\) と \(x\)）	なし（調査設計による）	切断トービット（切断正規回帰）	19.5
偶発的切断 Incidental Truncation	あり（\(y\)）	なし（標本抽出される単位の意思決定による）	ヘックマンモデル（Heckit、タイプ II トービット）および各種の拡張	19.6

カウント応答Count response

カウント応答（count response）：\(y = 0, 1, 2, 3, \ldots\)。

例：1年に何回医者にかかるか？

多項選択モデルとの違い：ポアソンモデルでは \(y\) が量的な意味をもつのに対し、多項選択モデルでは \(y\) は単に1つの選択を表すにすぎない。

Lord and Mannering (2010) は、カウントデータに対する各種の手法を整理している。

出典：Lord and Mannering (2010)。

原典 P.92 には、Lord and Mannering (2010) の表2「クラッシュ頻度データの分析に用いられる既存モデルの整理（Summary of existing models for analyzing crash-frequency data）」が画像として転載されている。同表は各手法の利点（advantages）と欠点（disadvantages）を対比したものであり、ポアソン、負の二項（ポアソン-ガンマ）、ポアソン-対数正規、ゼロ過剰ポアソン・負の二項、コンウェイ-マクスウェル-ポアソン、ガンマ、一般化推定方程式、一般化加法モデル、ランダム効果モデル、負の多項モデル、ランダムパラメータモデル、二変量・多変量モデル、有限混合・マルコフ転換モデル、存続期間モデル、階層・マルチレベルモデル、ニューラルネットワーク・ベイジアンニューラルネットワーク・サポートベクターマシン等のノンパラメトリック手法を列挙している。詳細は出典の表2を参照のこと。
出典：Lord, D., & Mannering, F. (2010), Transportation Research Part A, 44(5), Table 2.

存続期間（サバイバル）モデルDuration (survival) model

アウトカムは、ある事象が発生するまで／発生してからの経過時間である。

例：失業継続週数、医療処置後の生存時間。

フロンティアモデルFrontier model

\[ y = x\beta + u - v \qquad \text{ただし} \quad v \ge 0,\quad u \sim N(0,\ \sigma^2) \]

アウトカム（例：収量）は、フロンティア（\(x\beta\)）から非効率性項（inefficiency term）（\(v\)）を引いたものである。

一部の論者は、\(y\) が一側測定誤差（one-sided measurement error）を含む場合にフロンティアモデルを用いる（Millimet and Parmeter, 2022）。

順序モデルOrdered model

アウトカムが順序的な性質をもつ場合のモデルである。

例：数学のテストの成績。A、B、C、D または E？

例：健康状態。良い（good）、普通（normal）、悪い（poor）。

分数モデルFractional model

\(y\) が分数（シェア）である場合のモデルである：\(y = [0, 1]\)。

例：\(y\) = 試験に合格した学生の割合（％）。\(x\) = 教師・生徒比率、など。

トービットモデルとの違い：トービットモデルを適用するには、0または1をとる観測が十分に存在している必要がある。また、トービットモデルの正規性の仮定は、分数モデルでは必要とされない（Papke and Wooldridge 1996, 2008；Ramalho et al 2011）。

参考文献References

Lord, D., & Mannering, F. (2010). The statistical analysis of crash-frequency data: a review and assessment of methodological alternatives. Transportation Research Part A: Policy and Practice, 44(5), 291–305.
Millimet, D.L. & Parmeter, C.F. (2022) Accounting for Skewed or One-Sided Measurement Error in the Dependent Variable. Political Analysis. vol. 30: 66–88. DOI: 10.1017/pan.2020.45
Papke, L.E., and J.M. Wooldridge. 1996. Econometric Methods for Fractional Response Variables with an Application to 401(K) Plan Participation Rates. Journal of Applied Econometrics 11: 619–632.
Papke, L.E., and J.M. Wooldridge. 2008. Panel Data Methods for Fractional Response Variables with an Application to Test Pass Rates. Journal of Econometrics 145: 121–133.
Ramalho, E. A., Ramalho, J. J., & Murteira, J. M. (2011). Alternative estimating and testing empirical strategies for fractional regression models. Journal of Economic Surveys, 25(1), 19–68.