本ページは、川崎賢太郎『数量経済分析』2026 S1 講義ノート第15章の原文に忠実な全文和訳である。要約・再構成は行わず、原文の論理展開・表・参考文献の順序をそのまま日本語に移している。直観的な理解には図解版を併用されたい。
Spring 2026 / Kentaro Kawasaki
[参考文献]Wooldridge 2010, ch.16-19、Greene ch.19。
コーナー応答(corner response):\(y\) の範囲の制限性により \(a \le y \le b\) となる場合をいう。
例:1日に何時間働くか? \(0 \le y \le 24\)。
3つのアプローチがある(後者ほど柔軟である):タイプ I トービット(Type I Tobit、または単にトービット)モデル、ハードルモデル(Hurdle model)、タイプ II トービット(Type II Tobit)モデル。
最後のものは選択モデル(selection model)(標本選択の問題は存在しないため、この名称は誤解を招く)または指数型タイプ II トービットモデル(exponential type II Tobit model)としても知られる。
コーナー応答の最も一般的な型は \(y \ge 0\) である。このとき、\(y > 0\) ならば \(s = 1\)、\(y = 0\) ならば \(s = 0\) と定義する。
タイプ I トービットは \(y_i = \max(0,\ x_i\beta + u_i)\) を仮定する。すなわち \(y\) と \(s\) は同一のメカニズム \((x_i\beta + u_i)\) に従う。
ハードルモデルとタイプ II トービットは、\(y\) と \(s\) に別々のメカニズムを仮定する:
\(u_1\) と \(u_2\) は、ハードルモデルでは無相関と仮定されるのに対し、タイプ II トービットでは相関すると仮定される。
ここでは欠測データの問題は生じない。ランダムに選ばれた観測について、\(y\) と \(x\) を完全に観察できる。
コーナー応答モデルを、いくつかの変数あるいは観測が欠落するような他の類似モデルと混同しないこと。
打ち切りデータ(censored data):調査設計の都合により、\(y\) が不完全にしか観察されない(\(y\) が部分的に欠落する)。
例(区間打ち切り(interval censoring)):\(y\) が区間で記録される。1日に何時間勉強するか? 0〜1時間、1〜2時間、……。
例(下方または上方からの打ち切り(censoring from below or above)):\(y\) は資産であり、10億ドルで上限コード化(top-coded)される。真の資産は10億ドルを超えうるが、10億ドルとして観察される。
例(二値打ち切り(binary censoring)):真の \(y\) がある値より大きいか否かのみが分かる。森林破壊を防ぐために100ドル支払う意思があるか? これはプロビット/ロジットモデルと似ているが、関心の対象となる変数が異なる。すなわち、ここでは潜在変数そのもの(真の支払意思額)が関心の対象であるのに対し、プロビットモデルでは潜在変数は関心の対象ではない。
以下の2つのケースは「標本選択モデル(sample selection model)」と呼ばれ、標本が非ランダムに抽出されることによって欠測データの問題が生じる。
切断データ(truncated data):調査またはプログラムの設計により、標本が \(y\) の値に基づいて非ランダムに選ばれる。
例:所得が100万円未満の世帯のみが調査される。\(y\) と \(x\) の両方が欠落する。
偶発的切断(incidental truncation):標本抽出の対象となる単位の行動または意思決定により、標本が非ランダムに選ばれる。
例:\(y\) = 賃金。このとき、就業している者についてのみ \(y\) を観察でき、就業するか否かの決定は個人によってなされる。
このモデルは次章でより詳しく扱う。
| 類型 | 欠測データ? | ランダムサンプリング? | とりうる解決策 | Wooldridge (2010) 章 |
|---|---|---|---|---|
| コーナー応答 Corner response |
なし | あり | タイプ I トービット、ハードル、タイプ II トービット(選択モデル、または指数型タイプ II トービットモデル) | 17 |
| 打ち切りデータ Censored data |
あり(\(y\) が打ち切り) | あり | 打ち切りメカニズムに依存(二値、区間、下限・上限) | 19.2 |
| 切断データ Truncated data |
あり(\(y\) と \(x\)) | なし(調査設計による) | 切断トービット(切断正規回帰) | 19.5 |
| 偶発的切断 Incidental Truncation |
あり(\(y\)) | なし(標本抽出される単位の意思決定による) | ヘックマンモデル(Heckit、タイプ II トービット)および各種の拡張 | 19.6 |
カウント応答(count response):\(y = 0, 1, 2, 3, \ldots\)。
例:1年に何回医者にかかるか?
多項選択モデルとの違い:ポアソンモデルでは \(y\) が量的な意味をもつのに対し、多項選択モデルでは \(y\) は単に1つの選択を表すにすぎない。
Lord and Mannering (2010) は、カウントデータに対する各種の手法を整理している。
出典:Lord and Mannering (2010)。
アウトカムは、ある事象が発生するまで/発生してからの経過時間である。
例:失業継続週数、医療処置後の生存時間。
アウトカム(例:収量)は、フロンティア(\(x\beta\))から非効率性項(inefficiency term)(\(v\))を引いたものである。
一部の論者は、\(y\) が一側測定誤差(one-sided measurement error)を含む場合にフロンティアモデルを用いる(Millimet and Parmeter, 2022)。
アウトカムが順序的な性質をもつ場合のモデルである。
例:数学のテストの成績。A、B、C、D または E?
例:健康状態。良い(good)、普通(normal)、悪い(poor)。
\(y\) が分数(シェア)である場合のモデルである:\(y = [0, 1]\)。
例:\(y\) = 試験に合格した学生の割合(%)。\(x\) = 教師・生徒比率、など。
トービットモデルとの違い:トービットモデルを適用するには、0または1をとる観測が十分に存在している必要がある。また、トービットモデルの正規性の仮定は、分数モデルでは必要とされない(Papke and Wooldridge 1996, 2008;Ramalho et al 2011)。