数量経済分析(14) 選択モデル ― 全文和訳

図解で読む原文に忠実な和訳

Spring 2026 ／ Kentaro Kawasaki

選択モデルChoice Models

［参照文献］Train, ch.1–6, 13、または Greene, ch.18。

前節では、「YES/NO」という結果をどのようにモデル化するかを学んだ。本節では、複数の選択肢のあいだの「選択（choice）」を扱うことを可能にするモデルを導入する。

例：自動車の選択。Toyota Prius か？　Honda Accord か？　それとも Nissan Skyline か？

これらのモデルは「多項反応モデル（multinomial response model）」または「離散選択モデル（discrete choice model）」と呼ばれる。

基本的枠組み：ランダム効用モデル（RUMs）Basic framework: Random utility models (RUMs)

意思決定者（decision maker）を \(n\) と表す。意思決定者は \(J\) 個の選択肢（alternatives）のなかから選択を行う。意思決定者は、各選択肢から一定水準の効用（または利潤）を得る。意思決定者 \(n\) が選択肢 \(j\) から得る効用を \(U_{nj}\)（\(j = 1, 2, \ldots, J\)）と書く。意思決定者は、最も大きな効用をもたらす選択肢を選ぶ。すなわち、\(\forall j \neq i\) について \(U_{ni} > U_{nj}\) であるとき、かつそのときに限り、選択肢 \(i\) を選ぶ。

効用が次のように分解されるとしよう。

\[ U_{nj} = x_{nj}\beta_j + \varepsilon_{nj} \]

ここで \(x\) は意思決定者 \(n\) の特性および／または製品 \(j\) の特性を含む。

このとき、意思決定者 \(n\) が選択肢 \(i\) を選ぶ確率は次のようになる（もちろん \(U_{ni} > U_{ni}\) は除く）。

\[ \begin{aligned} P_{ni} &= \Pr(U_{ni} > U_{n1} \ \text{かつ} \ U_{ni} > U_{n2}, \ldots \ \text{かつ} \ U_{ni} > U_{nJ}) \\ &= \Pr(x_{ni}\beta_i + \varepsilon_{ni} > x_{n1}\beta_1 + \varepsilon_{n1} \ \text{かつ} \ \ldots \ \text{かつ} \ x_{ni}\beta_i + \varepsilon_{ni} > x_{nJ}\beta_J + \varepsilon_{nJ}) \\ &= \Pr(\varepsilon_{n1} - \varepsilon_{ni} < x_{ni}\beta_i - x_{n1}\beta_1 \ \text{かつ} \ \ldots \ \text{かつ} \ \varepsilon_{nJ} - \varepsilon_{ni} < x_{ni}\beta_i - x_{nJ}\beta_J) \end{aligned} \]

ランダムベクトルの同時密度 \(f(\varepsilon)\) を特定することで、上記の確率を最大化してパラメータ \(\beta\) を得ることができる。この密度の特定の仕方が異なれば、異なる離散選択モデルが得られる。

ロジットモデルLogit model

ロジットモデルは、次の確率密度関数（pdf）を仮定することで得られる。

\[ f(\varepsilon_{nj}) = \exp(-\varepsilon_{nj})\exp(-\exp(-\varepsilon_{nj})) \]

この分布は、ガンベル分布（Gumbel）あるいはタイプI極値分布（type I extreme value）と呼ばれる。

このとき、\(\varepsilon_{nj} - \varepsilon_{ni}\) はロジスティック分布に従い、その累積分布関数（cdf）は次のように与えられる。

\[ F(\varepsilon_{nj} - \varepsilon_{ni}) = \frac{\exp(\varepsilon_{nj} - \varepsilon_{ni})}{1 + \exp(\varepsilon_{nj} - \varepsilon_{ni})} \]

いくらかの代数的操作を行うと、閉じた形の表現が得られる。

\[ P_{ni} = \frac{\exp(x_{ni}\beta_i)}{\sum_j \exp(x_{nj}\beta_j)} \]

これはロジット選択確率（logit choice probability）と呼ばれる。この表現を用いると、対数尤度関数を定義し、最尤法（maximum likelihood method）によってモデルを推定することができる。

ロジットモデルは実装が簡単だが、いくつかの欠点をもつ。

代替パターンの拘束性（Restrictive substitution pattern）：任意の2つの選択肢 \(i\) と \(k\) について、選択確率の比は次のようになる。
\[ \frac{P_{ni}}{P_{nk}} = \frac{\exp(x_{ni}\beta_i)}{\exp(x_{nk}\beta_k)} \]
この比は、\(i\) と \(k\) 以外のいかなる選択肢にも依存しない。すなわち、他にどのような選択肢が利用可能であるか、また他の選択肢の属性がどうであるかにかかわらず、\(i\) を \(k\) よりも選ぶ相対オッズは同一である。これは IIA（無関係な選択肢からの独立性（independence from irrelevant alternatives））仮定と呼ばれる。
ロジットモデルは誤差項の相関を扱うことができず、したがってパネルデータに用いることができない。
すべての個人が同一の係数をもつ。

プロビットモデルProbit model

プロビットモデルは、\(f(\cdot)\) が多変量正規分布（multivariate normal）であるという仮定のもとで導かれる。

プロビットモデルは、ロジットモデルの3つの欠点すべてに対処する。すなわち、ランダム係数（random coefficient）を扱うことができ、任意の代替パターンを許容し、誤差が相関するパネルデータに適用可能である。

ロジットモデルとは異なり、得られる確率は閉じた形の解をもたない（すなわち積分が含まれる）。したがって、モデルはシミュレーション（シミュレーテッド最尤法（simulated maximum likelihood））またはベイズ法（Baysian method）を通じて数値的に解かれるべきである。

プロビットモデルの唯一の限界は、効用の観察されないすべての成分に正規分布を要求することである。

状況によっては、正規分布は不適切である。顕著な例は価格係数（price coefficient）に関わるものである。ランダム係数をもつプロビットモデルでは、価格の係数は母集団において正規分布に従うと仮定される。正規分布はゼロの両側に密度をもつため、このモデルは必然的に、一部の人々が正の価格係数（positive price coefficient）をもつことを含意してしまう。

混合ロジット（ランダム係数ロジット）Mixed logit (Random parameter logit)

混合ロジットは、\(\varepsilon\) が、研究者によって指定される任意の分布に従う部分と、iid な極値分布（iid extreme value）に従う部分とからなる、という仮定に基づいている。

混合ロジットは、任意のランダム効用モデルを近似できる、きわめて柔軟なモデルである。ランダム係数を許容し、代替パターンを制限せず、観察されない要因の時点間の相関を許容することによって、標準的なロジットの3つの限界を克服する。さらに、プロビットとは異なり、正規分布に限定されない。

混合ロジットモデルとは、選択確率を次の形で表せる任意のモデルである。

\[ P_{ni} = \int \frac{\exp(x_{ni}\beta)}{\sum_j \exp(x_{nj}\beta)}\, f(\beta)\, d\beta \]

この関数は、\(\beta\) が個人間で変動する（すなわちランダム係数である）ことを含意する。

統計学の文献では、複数の関数の加重平均を混合関数（mixed function）と呼ぶ。ここでは、確率が右辺の第1項であり、重みは \(f(\beta)\) によって与えられる。

\(f(\beta)\) には任意の分布を用いることができる。多くの場合、研究者は正規分布を仮定するが、価格係数のように、係数がすべての意思決定者について同じ符号をもつことが分かっている場合には、対数正規分布（lognormal distribution）が有用である。

あるいは、分布は離散的でもよい（例：\(\beta\) が \(b_1, \ldots, b_M\) とラベル付けされた \(M\) 個の取りうる値を、確率 \(s_m\) でとる）。この場合、混合ロジットは、心理学やマーケティングで長らく人気のある潜在クラスモデル（latent class model）になる。

三角分布、一様分布、あるいは切断正規分布（Triangular, uniform, or truncated normal distributions）は、両側で有界であるという利点をもつ。これにより、正規分布や対数正規分布で一部の意思決定者に対して不合理なほど大きな係数が生じうるという問題を回避できる。

Train (2016) は、スプライン（spline）や多項式（polynomials）のような、より柔軟な分布を開発している。

プロビットと同様に、モデルの推定にはシミュレーション（シミュレーテッド最尤法）またはベイズ法が必要である。

内生性Endogeneity

3つのアプローチがある。コントロール関数（Control function）、CML（FIML）、そして BLP である。

コントロール関数（Control function）：2段階アプローチ。第1に、内生変数を操作変数に回帰し、予測される誤差項を得る。第2に、その予測誤差項を追加の回帰変数として含めて、主たる方程式を推定する。

CML（FIML）：2段階の手続きを用いる代わりに、2つの方程式を1段階で推定することができる。より効率的だが、計算が複雑である。

コントロール関数アプローチと BLP アプローチの比較については、Petrin and Train (2010) を参照のこと。

BLP アプローチBLP approach

参照文献：Train, ch.13; Sudhir (2013); Bonnet, et al. (2020)。

Berry, Levinsohn, and Pakes (1995) によって開発された。

回帰変数には、内生的であると仮定される製品の価格が含まれる。操作変数は、コストシフター（cost-shifters）（例：燃料価格）と競合製品の特性である。これらは良い候補である。なぜなら、それらは考慮している製品の効用から独立している一方で（製品 \(j\) の効用は \(j\) の特性のみに依存する）、企業の戦略的行動を通じて価格を動かすからである。「操作変数」の章で示した例を参照のこと。

個票データ（選択行動）と地域別データ（各製品のマーケットシェア）の両方に適用可能である。

買い手と売り手の効用／利潤を最大化する行動（不完全競争）が明示的にモデル化される。²⁴　市場シミュレーションを行うために、産業組織論（IO）の文献で人気がある。

限界：一部の製品のマーケットシェアがゼロのときには適用できない。操作変数が弱いことがある。

本質的に、Berry (1994) は、本来的に非線形である選択モデルから内生性を取り出し、標準的な操作変数推定によって内生性を扱える線形回帰モデルへと移し替えられることを示した。この方法を適用するには、選択モデルにおいて非常に多くの定数を推定する必要がしばしば生じるが、これは最大化のための標準的な勾配ベースの方法では困難でありうる。この問題に対処するため、Berry, Levinsohn, and Pakes (1995) は「縮約（the contraction）」と呼ばれる、これらの定数の推定を容易にする手続きを提供した。これら2つの初期の論文は、集計モデル、すなわち集計されたシェアデータに基づいて推定されるモデルに依拠していた。しかし、その概念は個人水準の選択データ、あるいは集計データと個人水準データの組み合わせにも適用可能である。

選択実験Choice experiments

参照文献：Holmes, et al (2017)。相崎先生が R コードを提供している：http://lab.agr.hokudai.ac.jp/nmvr/index.html

選択モデルは、実際の購買行動だけでなく、「選択実験（choice experiments: CEs）」の仮想的な回答にも用いられる。²⁵

選択実験は、環境サービスや食品品質に対する消費者の需要（支払意思額（willingness to pay: WTP））を明らかにするために用いることができる。

例：平均的な消費者は、国立公園の鳥類、開発途上国における安全な飲料水、有機食品、放射線フリー食品、植物性代替肉などに対して、いくら支払う意思があるか。

選択実験では、消費者は仮想的な選択集合のなかから複数の選択肢のうち1つを選ぶよう求められる。異なる選択肢は、異なる水準の価格やその他の属性（特性）をもつ（画像については下記を参照）。

原典 P.89 上段は、選択実験の選択カードのサンプル画像である（培養肉・植物性代替肉などについて、価格やラベルの異なる選択肢を提示するもの）。
出典：Van Loo et al (2020)。

平均 WTP（mean WTP）および需要関数（demand functions）を導出することができる。

原典 P.89 下段は、選択実験から導出された需要曲線のグラフ（横軸：マーケットシェア、縦軸：価格。対照群条件 T1 のもとでの植物性代替肉・農場飼育肉などの需要曲線）である。
出典：Van Loo et al (2020)。

参考文献References

Angrist, J. D., & Pischke, J. S. (2010). The credibility revolution in empirical economics: How better research design is taking the con out of econometrics. Journal of Economic Perspectives, 24(2), 3–30.
Berry, Steven & Levinsohn, James & Pakes, Ariel, 1995. "Automobile Prices in Market Equilibrium," Econometrica, 63(4), pp. 841–90.
Berry, Steven (1994), "Estimating Discrete Choice Models of Product Differentiation," RAND Journal of Economics, 25, 242–262.
Bonnet, C., Trachtman, C., Van Dop, M., & Villas-Boas, S. B. (2020). Food markets' structural empirical analysis: a review of methods and topics. European Review of Agricultural Economics, 47(2), 819–847.
Holmes, T. P., Adamowicz, W. L., & Carlsson, F. (2017). Choice experiments. In A primer on nonmarket valuation (pp. 133–186). Springer, Dordrecht.（ダウンロード可）
Keane (2010) A Structural Perspective on the Experimentalist School. Journal of Economic Perspectives, 24(2): 47–58.
Petrin, A., and K. Train. 2010. A Control Function Approach to Endogeneity in Consumer Choice Models. Journal of Marketing Research 47: 3–13.
Rust (2010) Comments on: "Structural vs. atheoretic approaches to econometrics" by Michael Keane, Journal of Econometrics, 156(1): 21–24.
Sudhir, K (2013) "Demand Estimation Using Aggregate Data: Static Discrete Choice Models", Workshop handout.

Timmins, C., & Schlenker, W. (2009). Reduced-form versus structural modeling in environmental and resource economics. Annu. Rev. Resour. Econ., 1(1), 351–380.
Train, K. (2016). Mixed logit with a flexible mixing distribution. Journal of Choice Modelling, 19, 40–53.
Van Loo, E. J., Caputo, V., & Lusk, J. L. (2020). Consumer preferences for farm-raised meat, lab-grown meat, and plant-based meat alternatives: Does information or brand matter?. Food Policy, 95, 101931.

脚注

したがって、BLP は一種の「構造的アプローチ（Structural approach）」である。誘導形（reduced form）と構造的アプローチ（structural approach）の違いについては、Timmins and Schlenker (2009)、Angrist and Pischke (2010)、Keane (2010)、Rust (2010) を参照のこと。↩
選択実験は、オンライン調査会社（日本では例えばマクロミルや楽天リサーチ）によって実施できる。20問・200サンプルでおよそ20万円かかる。↩