数量経済分析 図解ポータル
Chapter 1  ·  Part I 基礎  ·  原典 P.3–10

導入 ― 計量経済学とは何か

「科学」の中身は主として方法とルールであって、対象そのものではない。なぜ計量経済学が必要なのか。相関と因果の違いを有機農業と農家所得の例から説き起こし、回帰モデルの基本式と用語、データ構造、データソース、ソフトウェア、推薦文献までを一望する。

因果推論 相関≠因果 回帰モデル データ構造 内生性
川崎賢太郎(東京大学大学院農学生命科学研究科) 原典 P.3–10 Introduction
図解で読む 原文に忠実な和訳
Contents
  1. 01. なぜ計量経済学が必要か ― 推論と因果
  2. 02. 相関と因果 ― 有機農業の例
  3. 03. 計量経済学とは ― 4つの役割
  4. 04. 基本モデルと用語
  5. 05. データ構造の4類型
  6. 06. データソース
  7. 07. ソフトウェア
  8. 08. 推薦教科書
  9. 09. ジャーナル
  10. 10. 「無害な計量経済学」へ向けて
  11. 11. 参考文献
SECTION 01

なぜ計量経済学が必要か ― 推論と因果

科学の目的は 推論(inference) にある。すなわち、直接観察できる現象を超えて、合理的な推測を行うことである。 そして多くの場合、因果推論(causal inference) が重要な役割を果たす。

The content of "science" is primarily the methods and rules, not the subject matter.
(「科学」の中身は、対象そのものではなく、主として方法とルールである。)
King, Keohane, and Verba (1994) Designing Social Inquiry, p.9.

たとえば、有機農業(organic farming)が農家所得に与える効果を推定したいとしよう。この問いに答えるには、単なる平均の比較では不十分である。次節で、なぜ単純な比較が誤りを招くのかを順を追って見ていく。

SECTION 02

相関と因果 ― 有機農業は所得を増やすか

有機農業と慣行農業の所得を比べたくなる。だが 単純な比較は相関を示すだけで、因果は示さない。 層別比較でも、すべての要因をマッチングしても、依然として因果は得られない。

STEP 1 ― 全体の平均を比べる

まず、有機農業と慣行農業の平均所得を比べてみる。

表1 平均所得(円/時間)
有機農業慣行農業
平均(Mean)1000800
有機農業が所得を増やすと結論できるか? → No。この比較は、農場規模など所得に影響する他の要因を制御していない。これは相関を示すにすぎず、因果ではない。

STEP 2 ― 農場規模で層別する

では、農場規模ごとに分けて比べればどうか。「農場規模が大きいとき、有機農業は所得を増やす」と言えるか。

表2 規模別の平均所得(円/時間)
農場規模有機農業慣行農業
< 1 ha800800
1〜2 ha10001000
2〜3 ha1200900
> 3 ha15001100
やはり No。この比較は、作物構成(crop mix)・年齢・土地の種類など、所得に影響する他の要因を制御していない。

STEP 3 ― すべての要因をマッチングする

では、これらすべての要因を一致させて(マッチングして)平均所得を比べれば、有機農業の影響について何か結論できるか。残念ながら、答えはやはり No である。理由は3つある。

1

連続変数の完全マッチングは困難

農場規模のような連続変数では、値を完全に一致させること(exact matching)が難しい。

2

すべての要因は集めきれない

農家所得に影響するすべての要因を収集することは事実上不可能である。常に 観察できない要因(unobservable factor) が残る。

3

観察できない要因が選択と結果の双方に効く

農家のスキルのような観察できない要因が、有機農業への参加の意思決定農家所得の両方に影響する場合、単純な比較はミスリーディングになる。表は、有機農家と慣行農家の「スキルの差」を映しているだけかもしれない。スキルの高い農家が有機農業に従事しがちなら、有機農業が所得に寄与していなくても、有機農場の所得は慣行農場より高くなる。

これらの問題を克服するには、適切な計量経済学の手法が必要になる。本講義の主題は、まさにこの「内生性(endogeneity)」をいかに乗り越えるかにある。
Professor Note

相関と因果の違いについては、講義で動画が紹介されている。また丸山 (2014) も、因果と相関について良い解説を与えている。

参照:YouTube 動画(youtube.com/watch?v=gxSUqr3ouYA)。および 丸山士行 (2014)「出生体重が子どもの将来に与える影響」『経済セミナー』(原典 P.4・P.10)。
SECTION 03

計量経済学とは ― 4つの役割

計量経済学は、変数間の定量的(因果的)関係を扱う。その役割は大きく4つ ― 関係の把握・仮説検定予測政策評価である。

Role 01

定量的関係

変数間の量的(因果的)関係を、パラメータとして捉える。

Role 02

仮説検定

\(\beta_1 = 0\)? \(\beta_1 > 0\)? \(\beta_1 = 1\)? といった仮説を検証する。

Role 03

予測

\(x = 10\) のとき、\(y\) はどうなりそうか。

Role 04

政策評価

\(x\)=政策変数(例:補助金)、\(y\)=アウトカム(例:農場規模の拡大)。

SECTION 04

基本モデルと用語

計量経済学の基本モデルは、次の線形回帰式で表される。

\[ y_i = \beta_0 + \beta_1 x_i + u_i \]
記号呼称(英語の別名を併記)
\(i\)データ単位(個人・世帯・農場・都道府県・国など)。\(i = 1, 2, \dots, n\)
\(y\)被説明変数(dependent / outcome / response variable)
\(x\)説明変数(regressor / independent / explanatory / control variable, covariate, 右辺変数)
\(\beta\)パラメータ・係数(parameter, coefficient)
\(\beta_0\)切片(intercept)
\(\beta_1\)傾き(slope)
\(u\)観察できない要因・誤差項・撹乱項・残差(error / disturbance term, residual)

例として \(y\)=米の収量、\(x\)=労働時間 とする。\(y\) と \(x\) の定量的関係はパラメータ \(\beta_1\) で表される。すなわち \(\beta_1\) は、\(x\) が1単位増えたときの \(y\) の変化量である。\(\beta\) を推定する手続きを「回帰(regression)」と呼ぶ。

この式は「因果関係」を表している。したがって \(\beta\) を正しく推定できれば、\(y\) と \(x\) の因果関係がわかる。しかし多くの場合、不偏なパラメータを得るのは容易でない。本講義で見ていくように、多くの問題(とりわけ内生性)を乗り越える必要がある。

Professor Note ― 「回帰」の語源

"regress" とは「戻る、より原始的な状態へ復帰する」という意味である。統計用語としての "regression" は、ダーウィンのいとこである フランシス・ゴルトン(Francis Galton) が最初に用いたとされる。ゴルトンは、背の高い親の子は背が高い傾向にあるが、親ほどには高くないことに気づき、これを「平均への回帰(regression to the mean)」と呼んだ。

原典 P.5 脚注1。
SECTION 05

データ構造の4類型

データは、データ単位の数時点の数の組み合わせで4つに分類される。

Cross section

クロスセクションデータ

多数のデータ単位 × 1時点。

Panel

パネルデータ

多数のデータ単位 × 適度な数の時点。同じ単位を異なる時点にわたって追跡できる

Pooled cross section

プールド・クロスセクション

多数のデータ単位 × 適度な数の時点。ただし同じ単位を時点間で追跡できない

Time-series

時系列データ

1つのデータ単位 × 多数の時点(例:日次の株価)。

パネルデータは、時間不変の観察できない要因を制御できるため、クロスセクションやプールド・クロスセクションよりも優れている。ただし、クロスセクションを用いた研究も依然として数多く存在する。
SECTION 06

データソース ― 良いデータは良い論文の前提

良いデータセットは、良い論文に不可欠な入力である。たった1つの変数を構築するのにも、大いに労を惜しまないこと。

既存の統計・データ

  • 農林水産省統計(MAFF):農家経済調査、生産費調査、作物統計、農林業センサス 等。
  • 政府統計:e-Stat(e-stat.go.jp)。
  • 気候データ:気象庁の1500観測点、または1kmグリッド(メッシュ農業気象データ)。
  • POS(販売時点)データ:店舗レベルの売上。日経テレコン・POS Vision 等。
  • GIS:衛星データの一覧は Jain (2020) の表1を参照。
  • Kaggle.com:機械学習の練習に使われる各種データセット。

データ単位

  • 国レベル:FAOstat、世界銀行(Worldbank)。
  • 都道府県レベル:容易に入手可能。アイデアが必要。
  • 市町村レベル:e-Stat・MAFF 等でオンライン入手可。
  • 集落レベル(農山村地域調査):CD-ROM で入手可(有料)。
  • 農場レベル:政府統計は利用に許可が必要。
  • 東京大学社会科学研究所 SSJ データアーカイブ。一橋大学経済研究所:戦前期の農林省農家経済調査資料。

自分でデータセットを作る

オンライン調査 実験室実験(Laboratory experiments) フィールド調査(スーパー・農家への聞き取り 等) 未整理のオンラインデータの取得(オークション・家賃・Twitter・Google トレンド 等) 複数のデータベースの結合(merge)
未整理オンラインデータの活用については Edelman (2012) が良いレビューを与えている。出典:原典 P.6。
SECTION 07

ソフトウェア ― 良い実証研究者は良いプログラマ

良い実証研究者であるためには、良いプログラマであるべきだ。プログラミング技能があれば、複雑な生データも容易に整形できる。

推奨される環境

  • Stata:おそらく最も人気。サポートとマニュアルが優れる。学生版 Stata/IC は約 ¥20,000。
  • R:無料ソフト。人気も高い。
  • Python:無料ソフト。機械学習に強い。
  • matlab / gauss / ox:行列ベースの言語。一般的ではないが、特定の手法(例:BLPモデル)には便利。

推奨されない

  • excel / TSP / Eview:推奨しない。

一部のジャーナルはデータとプログラムコード(多くは Stata で書かれている)を提供している。Stata のマニュアル自体も回帰の手法を学ぶ良い教材である。

なぜプログラミング技能が重要か。たとえば貿易統計はかなり複雑で、1年あたり約50個のCSVファイルがあり、各ファイルに大量の生データが含まれる。プログラミング技能があれば、こうしたデータセットを容易に整理できる(原典 P.7 に生データ例の掲載あり)。
Professor Note ― "Stata" の発音

"Stata" の正しい発音は? ― day のように長い a で「ステイタ」と読む人、flat のように短い a で「スタタ」と読む人、ah のように長い a で「スタータ」と読む人がいる。正解は謎のままだが、Stata 社の社員は最初の「ステイタ」を使う。

原典 P.6 脚注2。
SECTION 08

推薦教科書 ― 複数を同時に読む

複数の教科書を同時並行で読むこと。レベル別・言語別に推薦が挙げられている。

英語(English)

入門 Introductory

  • Wooldridge, Introductory Econometrics: A Modern Approach
  • Stock and Watson, Introduction to Econometrics
  • Khandker, Koolwal, & Samad (2009) Handbook on Impact Evaluation(無料DL可)

中級 Intermediate

  • Verbeek (2013) A Guide to Modern Econometrics, 4th ed.
  • Cameron and Trivedi (2005) Microeconometrics: Methods and Applications
  • Angrist and Pischke (2008) Mostly Harmless Econometrics

上級 Advanced

  • Wooldridge (2010) Econometric Analysis of Cross Section and Panel Data, 2nd ed.
  • Greene, Econometric Analysis
  • Hayashi, Econometrics
  • Train (2009) Discrete Choice Methods with Simulation, 2nd ed.(無料DL可)

Stata 関連

  • Christopher F. Baum, An Introduction to Modern Econometrics Using Stata
  • Cameron and Trivedi, Microeconometrics Using Stata(Cameron and Trivedi 2005 を再現)
  • Christopher F. Baum, An Introduction to Stata Programming

Python / R

  • Heiss (2020) Using Python for Introductory Econometrics(Wooldridge を再現)
  • Heiss (2020) Using R for Introductory Econometrics(Wooldridge を再現)

日本語

初級

  • 田中隆一 (2015)『計量経済学の第一歩』オススメ。統計学の復習から始まり、パネル・操作変数法・マッチング・回帰不連続デザインもカバー。具体例も豊富。
  • 山本勲 (2015)『実証分析のための計量経済学』数式ほとんどなし。全体像を掴むイントロに良い。
  • 伊藤公一朗 (2017)『データ分析の力 因果関係に迫る思考法』数式ほとんどなし。因果推論の入門に良い。文庫で読みやすい。
  • 白砂堤津耶 (2007)『例題で学ぶ初歩からの計量経済学 第2版』古くからの定番。
  • 鹿野繁樹 (2015)『新しい計量経済学』数学的理解を深めたい初級〜中級向け。時系列なし。

中級・参考

  • 内生性や因果推論を包括的に扱う書。本講義とほぼ同水準なので、事前に読むと授業が理解しやすい。
  • 西山ほか (2019)『計量経済学 (New Liberal Arts Selection)』前半は本講義と構成が類似。後半は時系列。網羅的。
  • 森田果 (2014)『実証分析入門』数式はほとんど出てこない。分かりやすい。
  • 上田拓治 (2009)『44の例題で学ぶ統計的検定と推定の解き方』
  • 田中久稔 (2019)『計量経済学のための数学』
SECTION 09

ジャーナル ― 良い論文を多く読むこと

良い論文を書く最良の方法は、良い論文を多く読むことである。

分野別ジャーナル(Field)

  • 農業:AJAE, Agricultural Economics, ERAE, Food Policy 等
  • 環境・資源:JAERE, JEEM, ERE 等
  • 開発:JDE, EDCC, World Development 等
  • ジャーナルのランキングは Ham, Write, and Ye (2021, 付表B1) を参照。Rigby et al (2014) は農業経済学者の選好を調べ、キャリア形成上 AJAE が最上位とする。

一般・レビュー

  • 一般(実証応用中心):REStat, AEJ: Applied
  • レビュー(分野):Annual Review of Resource Economics, AJAE (2010) vol.92(2) 創刊100年特集号, Review of Environmental Economics and Policy
  • レビュー(一般):Annual Review of Economics, Journal of Economic Literature, Journal of Economic Perspectives, Journal of Economic Surveys, 経済セミナー(日本語)
  • レビュー書:Handbook シリーズ(例:Handbook of Agricultural Economics)
SECTION 10

「無害な計量経済学」へ向けて

コンピュータの進歩のおかげで、いまや誰でも簡単に回帰を走らせられる。だが 不注意な計量経済学の適用は、かなり有害になりうる

An official at Treasury asks three experts, "What's 200 billion plus 200 billion?" The first expert, a mathematician, immediately responds, "Four hundred billion, of course." The second, an economist says, "Well, that depends..." But the third expert, an econometrician, doesn't immediately answer. Instead, he gets up and quietly closes the office door. Once he's sure no one is listening, he leans over and whispers in the official's ear, "What do you want it to be?"
財務省の役人が3人の専門家に尋ねる。「2000億足す2000億は?」。数学者は即座に「もちろん4000億だ」。経済学者は「それは状況による…」。だが計量経済学者は即答せず、立ち上がってそっとドアを閉め、誰も聞いていないことを確かめてから役人の耳元でこう囁く ―「いくつにしたいんですか?
Keane (2010) "A Structural Perspective on the Experimentalist School." Journal of Economic Perspectives, 24(2): 47-58.
変数の構築と仮定の細部に十分な注意を払うこと。「神は細部に宿る(God is in the details.)」
Professor Note ― この講義ノートについて

この講義ノートは、さまざまな教科書や研究論文から有用な情報を集めたものである。参考文献リストは各章末、または上記「推薦教科書」に示される。

原典 P.9。
SECTION 11

参考文献(References)

  • 丸山士行 (2014)「出生体重が子どもの将来に与える影響─非実験データからわれわれは何を学ぶのか?」『経済セミナー』2014年2・3月号、通巻676号、pp.29-35.
  • Edelman, Benjamin (2012) "Using Internet Data for Economic Research", Journal of Economic Perspectives 26(2) 189-206.
  • Ham, Write, and Ye (2021) Appendix of "New Rankings of Economics Journals". https://app.scholarsite.io/s/1c5e5f
  • Jain M. (2020) "The benefits and pitfalls of using satellite data for causal inference." Rev. Environ. Econ. Policy 14(1):157-69.
  • Rigby, D., Burton, M., & Lusk, J. L. (2014) "Journals, preferences, and publishing in agricultural and environmental economics." AJAE 97(2), 490-509.
出典:原典 P.10。