Chapter 14 · Part IV 制限従属変数モデル · 原典 P.86–90

選択モデル

3つ以上の選択肢がある多項離散選択を扱うモデル群を解説する。ランダム効用モデルを基盤に多項ロジットの選択確率を導出し、IIA（無関係な選択肢からの独立性）という根本的制約を示したうえで、混合ロジット（ランダム係数ロジット）によりその制約を緩和する方法、内生性への対処（BLPアプローチ）、そして選択実験による支払意思額（WTP）推定まで一望する。

多項ロジット条件付きロジット IIA 混合ロジット WTP

川崎賢太郎（東京大学大学院農学生命科学研究科）原典 P.86–90 Choice Models

図解で読む原文に忠実な和訳

Contents

01. 導入 ― 多項離散選択の枠組み
02. 基本枠組み ― ランダム効用モデル
03. ロジットモデル ― 選択確率の導出
04. ロジットの欠点とIIA
05. プロビットモデル
06. 混合ロジット（ランダム係数ロジット）
07. 係数分布の選択
08. 内生性への対処
09. BLPアプローチ
10. 選択実験（Choice Experiments）とWTP
11. 参考文献

SECTION 01

導入 ― 多項離散選択の枠組み

前節では「YES/NO」という二値選択を扱った。本節では、 3つ以上の選択肢（multiple options）の中から1つを選ぶモデルを導入する。

例として、自動車の購入を考えよう。消費者が選択できる車種は1つではない ―― Toyota Prius か、Honda Accord か、それとも Nissan Skyline か。このように、選択肢が複数ある場合を扱うモデルが多項反応モデル（multinomial response model）あるいは離散選択モデル（discrete choice model）と呼ばれる。

参照文献：Train, ch.1–6, 13、または Greene, ch.18。

SECTION 02

基本枠組み ― ランダム効用モデル（RUM）

離散選択モデルの基盤となるのが、ランダム効用モデル（Random Utility Models, RUMs）である。意思決定者は各選択肢から得られる効用を比較し、最も高い効用をもたらす選択肢を選ぶと仮定する。

意思決定者 \(n\) は \(J\) 個の選択肢の中から1つを選ぶとする。意思決定者 \(n\) が選択肢 \(j\) から得る効用を \(U_{nj}\)（\(j = 1, 2, \ldots, J\)）と書く。意思決定者は最大の効用をもたらす選択肢を選ぶ。すなわち、\(\forall j \neq i\) に対して \(U_{ni} > U_{nj}\) であるとき、かつそのときに限り、選択肢 \(i\) を選ぶ。

\[ U_{nj} = \mathbf{x}_{nj}\boldsymbol{\beta}_j + \varepsilon_{nj} \]

ここで \(\mathbf{x}_{nj}\) は意思決定者 \(n\) の特性および/または選択肢 \(j\) の特性を含むベクトル、\(\varepsilon_{nj}\) は観察できない効用の成分（誤差項）である。

意思決定者 \(n\) が選択肢 \(i\) を選ぶ確率は次のように表される。

\[ P_{ni} = \Pr(U_{ni} > U_{n1} \text{ かつ } U_{ni} > U_{n2} \text{ かつ } \cdots \text{ かつ } U_{ni} > U_{nJ}) \]

これを効用の分解式 \(U_{nj} = \mathbf{x}_{nj}\boldsymbol{\beta}_j + \varepsilon_{nj}\) で展開すると、

\[ P_{ni} = \Pr\bigl(\varepsilon_{n1} - \varepsilon_{ni} < \mathbf{x}_{ni}\boldsymbol{\beta}_i - \mathbf{x}_{n1}\boldsymbol{\beta}_1 \text{ かつ } \cdots \text{ かつ } \varepsilon_{nJ} - \varepsilon_{ni} < \mathbf{x}_{ni}\boldsymbol{\beta}_i - \mathbf{x}_{nJ}\boldsymbol{\beta}_J\bigr) \]

誤差ベクトルの同時密度 \(f(\boldsymbol{\varepsilon})\) の仮定の仕方によって、異なる離散選択モデルが導かれる。この密度を特定したうえで、上記の確率を最大化することでパラメータ \(\boldsymbol{\beta}\) を推定する。

SECTION 03

ロジットモデル ― 選択確率の導出

ロジットモデルは、誤差項がガンベル分布（Gumbel distribution / Type I extreme value）に従うという仮定から導かれる。閉じた形の選択確率が得られるため、実装が容易である。

ロジットモデルは、次の確率密度関数（pdf）を仮定することで得られる。

\[ f(\varepsilon_{nj}) = \exp(-\varepsilon_{nj})\exp(-\exp(-\varepsilon_{nj})) \]

この分布はガンベル分布（Gumbel distribution）またはタイプI極値分布（type I extreme value distribution）と呼ばれる。このとき、差分 \(\varepsilon_{nj} - \varepsilon_{ni}\) はロジスティック分布に従い、その累積分布関数（cdf）は次のようになる。

\[ F(\varepsilon_{nj} - \varepsilon_{ni}) = \frac{\exp(\varepsilon_{nj} - \varepsilon_{ni})}{1 + \exp(\varepsilon_{nj} - \varepsilon_{ni})} \]

代数的変形を施すと、閉じた形の選択確率（logit choice probability）が得られる。

\[ P_{ni} = \frac{\exp(\mathbf{x}_{ni}\boldsymbol{\beta}_i)}{\displaystyle\sum_j \exp(\mathbf{x}_{nj}\boldsymbol{\beta}_j)} \]

これがロジット選択確率（logit choice probability）である。この式を用いて対数尤度関数を定義し、最尤法（maximum likelihood）でモデルを推定できる。

多項ロジットと条件付きロジットは同一の選択確率式から導かれる。多項ロジット（multinomial logit）では係数 \(\boldsymbol{\beta}\) が選択肢ごとに異なる（個人特性が説明変数）。条件付きロジット（conditional logit）では係数が選択肢間で共通で、選択肢の特性（価格など）が説明変数として入る。実際には混在させることも多い。

SECTION 04

ロジットの欠点とIIA（無関係な選択肢からの独立性）

ロジットモデルは実装が簡単な反面、3つの根本的な欠点をもつ。とくに IIA（Independence from Irrelevant Alternatives）仮定は、現実の代替パターンを著しく制約する。

欠点 1 ― 代替パターンの拘束性（IIA）

任意の2選択肢 \(i\) と \(k\) の選択確率の比は、次のように表される。

\[ \frac{P_{ni}}{P_{nk}} = \frac{\exp(\mathbf{x}_{ni}\boldsymbol{\beta}_i)}{\exp(\mathbf{x}_{nk}\boldsymbol{\beta}_k)} \]

この比は、\(i\) と \(k\) 以外のいかなる選択肢にも依存しない。すなわち、他の選択肢が何であるかに関係なく、\(i\) と \(k\) の相対的なオッズは一定となる。これが IIA（Independence from Irrelevant Alternatives：無関係な選択肢からの独立性）仮定である。

IIA の含意（限界）：原典はこれを「制約的な代替パターン（restrictive substitution pattern）」と表現する。2選択肢の選択確率の比が他のどの選択肢にも依存しないため、選択肢の集合が変わっても代替の仕方を柔軟に表現できない。この制約は後述の混合ロジット（ランダム係数ロジット）で緩和できる。

代替パターンの拘束性（IIA）

上述のとおり、選択肢間の代替弾力性がすべて等しいという非現実的な制約をもたらす。

誤差項の相関を扱えない ― パネルデータへの非適用

ロジットモデルは誤差項 \(\varepsilon_{nj}\) が独立同分布（iid）であることを仮定している。そのため、同一個人の複数時点の選択（パネルデータ）で生じる誤差項の系列相関を扱うことができない。

係数がすべての個人で同一

すべての意思決定者が同じ係数 \(\boldsymbol{\beta}\) をもつと仮定している。価格感度など係数が個人間で異なることを許容できない。

SECTION 05

プロビットモデル

多変量正規分布を仮定することで導かれるプロビットモデルは、ロジットの3つの欠点をすべて解消する。ただし、正規分布の仮定そのものが別の問題を生む場合がある。

プロビットの利点

ランダム係数（個人間の係数の異質性）を扱える
任意の代替パターンを許容する（IIA制約なし）
誤差項に相関があるパネルデータに適用可能

プロビットの限界

閉じた形の解が存在しない（積分が含まれる） ― シミュレーション（シミュレーテッド最尤法）またはベイズ法による数値的推定が必要
観察されないすべての効用成分に正規分布を仮定しなければならない
価格係数のような係数に正規分布を適用すると、一部の意思決定者で正の価格係数（価格が高いほど効用が上がる）が生じてしまい、非現実的である

Professor Note ― 正規分布と価格係数

正規分布は両側に裾をもつため、価格係数のような「符号が確定しているべき係数」に適用すると問題が生じる。たとえば価格係数が正規分布に従うとすると、必然的に一部の消費者で正の価格係数（「高いほど嬉しい」という非現実的な選好）が生じる。この問題を避けるには、対数正規分布（lognormal）や有界な分布を使うことが有効である。

SECTION 06

混合ロジット（Mixed Logit / ランダム係数ロジット）

混合ロジットは、任意のランダム効用モデルを近似できる非常に柔軟なモデルである。標準ロジットの3つの制約をすべて緩和し、かつプロビットと異なり正規分布に縛られない。

混合ロジットは、誤差項 \(\varepsilon\) が「研究者が任意に指定した分布に従う部分」と「iid 極値分布に従う部分」の和からなると仮定する。

混合ロジットモデルの選択確率は次の形で表せる。

\[ P_{ni} = \int \frac{\exp(\mathbf{x}_{ni}\boldsymbol{\beta})}{\displaystyle\sum_j \exp(\mathbf{x}_{nj}\boldsymbol{\beta})} \, f(\boldsymbol{\beta}) \, d\boldsymbol{\beta} \]

ここで \(f(\boldsymbol{\beta})\) は係数 \(\boldsymbol{\beta}\) の分布（混合分布）である。積分の内側は通常のロジット選択確率であり、\(f(\boldsymbol{\beta})\) を重みとして積分することで係数の分布を反映させる。これにより、係数が個人間で異なる（ランダム係数）ことを表現できる。

統計学の文脈では、複数の関数の加重平均を「混合関数（mixed function）」と呼ぶ。ここでは積分内のロジット確率が1つ目の要素であり、\(f(\boldsymbol{\beta})\) が重みである。

混合ロジットが克服する3つの制約：（1）ランダム係数を許容 ― 係数の個人間異質性を表現可能、（2）代替パターンを非制限 ― IIA仮定から解放される、（3）時点間の誤差相関を扱える ― パネルデータにも適用可能。

潜在クラスモデル（Latent Class Model）との関係：\(\boldsymbol{\beta}\) の分布として離散分布を仮定する場合（すなわち \(\boldsymbol{\beta}\) が \(b_1, \ldots, b_M\) の \(M\) 個の値をそれぞれ確率 \(s_m\) でとるとする場合）、混合ロジットは心理学やマーケティングで古くから用いられてきた潜在クラスモデル（latent class model）と等価になる。

SECTION 07

係数分布の選択 ― 各分布の特性と使い分け

\(f(\boldsymbol{\beta})\) にはどのような分布でも使えるが、実務上の特性から分布の選択が重要になる。とくに両側有界な分布（三角・一様・切断正規）は非現実的な係数値を防ぐ利点がある。

Normal

正規分布

最も広く使われる。対称・無界。価格係数など符号が確定している変数には不適（一部で符号が逆転）。

Lognormal

対数正規分布

価格係数など「すべての意思決定者で符号が同じ」ことが既知の場合に有用。ただし片側有界のため分布の裾が重い。

Triangular / Uniform / Truncated Normal

三角・一様・切断正規分布

両側有界（bounded on both sides）であることが利点。正規・対数正規で生じる「一部の意思決定者に非常に大きな係数が割り当てられる」問題を回避できる。

Professor Note ― スプラインや多項式による柔軟な分布

Train (2016) は、スプラインや多項式を用いた、より柔軟な混合分布の推定方法を開発している。

Train, K. (2016). Mixed logit with a flexible mixing distribution. Journal of Choice Modelling, 19, 40–53.

プロビットと同様に、混合ロジットも閉じた形の解をもたないため、シミュレーテッド最尤法（Simulated Maximum Likelihood）またはベイズ法を用いた数値的推定が必要である。

SECTION 08

内生性への対処

離散選択モデルにおいても内生性（endogeneity）は深刻な問題となる。主な対処法として、コントロール関数法・CML（FIML）・BLPアプローチの3つがある。

コントロール関数法（Control Function Approach）

2段階アプローチ。第1段階で内生変数を操作変数に回帰し、予測残差を取得する。第2段階で、その予測残差を追加の説明変数として含めたうえで主方程式を推定する。

CML（FIML）― 完全情報最尤法

2段階手順を使わず、2つの方程式を同時に（1段階で）推定する。より効率的だが、計算量が多い。

BLPアプローチ

Berry, Levinsohn, and Pakes (1995) が開発した構造推定アプローチ。次節で詳述。

Professor Note

コントロール関数法と BLP アプローチの比較については、Petrin and Train (2010) を参照。

Petrin, A., and K. Train. 2010. A Control Function Approach to Endogeneity in Consumer Choice Models. Journal of Marketing Research 47: 3–13.

SECTION 09

BLPアプローチ

BLP（Berry, Levinsohn, and Pakes）アプローチは、価格などの内生変数を含む選択モデルを構造的に推定する手法であり、産業組織論（IO）の分野で広く用いられる。

Berry, Levinsohn, and Pakes (1995) によって開発された手法である。参照文献は Train, ch.13; Sudhir (2013); Bonnet et al. (2020)。

基本的な発想（Berry, 1994）：本質的に非線形な選択モデルから内生性を取り出し、通常の操作変数法で対処できる線形回帰に移し替えることができる。これが BLP の核心的洞察である。

特徴と操作変数

説明変数に内生変数として価格が含まれる。操作変数の候補としては、コストシフター（例：燃料価格）と競合製品の特性が用いられる。これらが良い操作変数となる理由は以下のとおりである。すなわち、製品 \(j\) の効用は \(j\) 自身の特性にのみ依存するため、操作変数は注目する製品の効用から独立している（排除制約）。一方、企業の戦略的行動（価格付け）を通じて実際の価格に影響を与える（関連性）。

BLPの特長

個票データ（選択行動）と地域別データ（製品のマーケットシェア）の両方に適用可能
購買者・販売者の効用/利潤最大化行動（不完全競争）を明示的にモデル化
市場シミュレーション（合併の効果試算など）に対応 ― IO 分野で標準的に使用
非線形の選択モデルから内生性を線形回帰に移し替え、標準的IV推定で対処可能
「縮約（the contraction）」手順により、大量の定数の推定を容易にした（BLP 1995）

BLPの限界

一部の製品のマーケットシェアがゼロのとき適用不可
操作変数が弱い場合がある
多数の定数推定が必要で、勾配法による最大化が困難なことがある

Professor Note ― 誘導形 vs 構造推定

BLP は「構造的アプローチ（structural approach）」の一種である。誘導形（reduced form）と構造推定（structural estimation）の違いについては、Timmins and Schlenker (2009)、Angrist and Pischke (2010)、Keane (2010)、Rust (2010) を参照。

Timmins, C., & Schlenker, W. (2009). Reduced-form versus structural modeling in environmental and resource economics. Annu. Rev. Resour. Econ., 1(1), 351–380.

SECTION 10

選択実験（Choice Experiments）と支払意思額（WTP）

選択モデルは実際の購買行動だけでなく、仮想的な選択実験（Choice Experiments, CEs）にも応用される。これにより、市場取引のない環境サービスや食品品質に対する消費者の支払意思額（Willingness to Pay, WTP）を推定できる。

参照文献：Holmes et al. (2017)。R コードは相崎先生のサイト（http://lab.agr.hokudai.ac.jp/nmvr/index.html）で公開されている。

選択実験では、回答者に対して複数の選択肢（hypothetical choice set）の中から1つを選ぶよう求める。各選択肢は価格と様々な属性（特性）の異なる水準の組み合わせで構成される。

WTP推定の対象となる財・サービスの例

生態系サービス

国立公園の鳥類

生態系保護・生物多様性に対する平均的消費者の WTP。

開発途上国

安全な飲料水

途上国での安全な飲料水へのアクセスに対する WTP。

食品品質

有機食品・放射線フリー食品

食品安全性・栽培方法に対する消費者の WTP。

代替食品

植物性代替肉

従来の畜産肉・培養肉・植物性代替肉の間の WTP 比較。

選択実験から得られるもの

選択実験から、平均 WTP（mean WTP）と需要関数（demand functions）を導出できる。

原典 P.89 図（選択実験のサンプル画像・需要関数グラフ）：Van Loo et al. (2020) による選択実験の画面例と、肉の種類ごとの需要曲線のグラフが掲載されている。図版は数式の書き起こしを要さないため、詳細は原典 P.89 を参照されたい。

Professor Note ― 選択実験の実施コスト

選択実験はオンライン調査会社（日本ではマクロミルや楽天リサーチなど）を通じて実施できる。200サンプル・20問の場合、費用はおよそ 20 万円程度である。

表明選好と仮想評価 ― 選択実験の位置づけ

顕示選好（Revealed Preference）

実際の購買行動データを用いる
市場に存在しない財・サービスの WTP は推定できない
例：POS データ、選択行動データ

表明選好（Stated Preference）

仮想的な選択状況への回答を用いる
市場が存在しない財・サービス（環境、公共財など）にも適用可能
選択実験（CE）・仮想評価法（CVM）が代表的手法
仮想バイアス（hypothetical bias）に注意が必要

SECTION 11

参考文献（References）

Angrist, J. D., & Pischke, J. S. (2010). The credibility revolution in empirical economics: How better research design is taking the con out of econometrics. Journal of Economic Perspectives, 24(2), 3–30.
Berry, Steven & Levinsohn, James & Pakes, Ariel, 1995. "Automobile Prices in Market Equilibrium." Econometrica, 63(4), pp. 841–90.
Berry, Steven (1994). "Estimating Discrete Choice Models of Product Differentiation." RAND Journal of Economics, 25, 242–262.
Bonnet, C., Trachtman, C., Van Dop, M., & Villas-Boas, S. B. (2020). Food markets' structural empirical analysis: a review of methods and topics. European Review of Agricultural Economics, 47(2), 819–847.
Holmes, T. P., Adamowicz, W. L., & Carlsson, F. (2017). Choice experiments. In A Primer on Nonmarket Valuation (pp. 133–186). Springer, Dordrecht. （ダウンロード可）
Keane (2010). A Structural Perspective on the Experimentalist School. Journal of Economic Perspectives, 24(2): 47–58.
Petrin, A., and K. Train. 2010. A Control Function Approach to Endogeneity in Consumer Choice Models. Journal of Marketing Research 47: 3–13.
Rust (2010). Comments on: "Structural vs. atheoretic approaches to econometrics" by Michael Keane. Journal of Econometrics, 156(1): 21–24.
Sudhir, K. (2013). "Demand Estimation Using Aggregate Data: Static Discrete Choice Models." Workshop handout.
Timmins, C., & Schlenker, W. (2009). Reduced-form versus structural modeling in environmental and resource economics. Annu. Rev. Resour. Econ., 1(1), 351–380.
Train, K. (2009). Discrete Choice Methods with Simulation, 2nd ed. （無料ダウンロード可）
Train, K. (2016). Mixed logit with a flexible mixing distribution. Journal of Choice Modelling, 19, 40–53.
Van Loo, E. J., Caputo, V., & Lusk, J. L. (2020). Consumer preferences for farm-raised meat, lab-grown meat, and plant-based meat alternatives: Does information or brand matter?. Food Policy, 95, 101931.

出典：原典 P.86–90。