本稿は、経済政策分野で使用されてきた計量経済学ツールに関する整理を行うという包括的サーベイ論文である。
質的選択モデルやセレクションバイアスなどは、労働経済のアイディアから発展した計量経済学の分野である。このツールを用いる研究は爆発的に蓄積されたが、ツール自体はどれも1986年以前に開発されていたものである。しかし、今後増えてくと思われる(?)シミュレーション、ノンセミパラに関する研究はほとんどない。労働経済学では全体的に、より制約が少なく、よりロバストなテクニックを使う傾向にある。
Binary choiceについて
linear probability model (LPM)で確率が0~1に入らないという問題は、致命的ではない。 データの平均周りではyのフィットは0-1区間に入り、平均周りでは予測などにおいても問題とならない(本当にそんなことを言っていいのか??)。LPMを用いる理由は、真のモデルの線形近似、すなわち、
y = E(y|x) + u = F(Xβ) + u
の非線形関数F(Xβ)の線形近似であると考えるためである。LPMは、∂E(y|x)/∂X をダイレクトに計算すると考えることができ、βを推定するというより、βとFの組み合わせを推定するものといえよう。関数のパラメータ(βそのもの)よりも、y=1の確率の限界効果に興味があるなら、LPMは選択肢として入いれてよい。ただし、線形近似によって落とされた非線形性を考えるならXの高次の項を入れることも考えられるが、ノンパラ回帰を行うことになる。kernel regeressionでのyのXへの回帰は、yがバイナリであっても使える。しかし、ノンパラ回帰はほとんど行われていない。その理由としては、ソフトウェアに入っていないことも理由だが、説明変数が多いと計算が重い、サンプルサイズが大きいと収束が遅い、bandwidthの選択が推定に大きく影響するが適切なbandwidth選択のルールがない、などのためだろう。
限界効果よりもβに興味があるなら、プロビットやロジットを使うが、いくつか問題が指摘されている。1つは、潜在変数が正規・ロジスティック分布をするという制約がみたされないとβの推定値は一致性がないこと。ただ、分布がunimodalなど若干の乖離なら推定に大きく影響しないと、これまでの研究で示されている。2つめはheteroskedasticityで、これがあるとやはり一致性がない。この対処法としては、1つはheteroにパラメトリックな形を入れて( Var(e|X) = (Xδ)2)尤度関数をたてる。しかしながら、もっと根本的な同定問題がある。yの期待値は、(1)Fが正規CDFでパラメータがXと独立に正規分布、(2)インデックスがパラメータに関して線形という2つの仮定に依存している。これらがみたされないとなると、Xで条件付けたyの期待値は、
E(y|X) = F[h(X,β); X]
という(heteroのある)Xに依存するパラメータを持つCDFのFと、未知関数hで与えられる。誘導型ではhとFを分けることができず、問題を解決できない(Xの増加によるyの平均の増加が、潜在変数が変化したためか、Xの変化で誤差項の分布が変わったためかを区別できない)。このモデルは、適当な同定制約を課した構造型ととらえてもよい。しかしこうしたアプローチは得策ではない(たとえば、Xβの線形性を仮定することは線形性に吸収されない部分をすべてFに押し込めることになるし、推定技術も一般化されていない)。上のモデルで最も強い仮定は、uとXが独立(hetero がない)と仮定することだが、同定問題は残される。
Multinomial choiceについて
多値選択問題(multinomial logit)では主に、無関係な選択肢との独立性(IIA)問題がここ10年間議論されてきた。よく言われる例は代替的選択肢の問題だが、これは若干ミスリーディングで、IIA問題はもっと一般的に誤差項の相関問題、あるいはセレクションバイアスの問題ととらえるべきである。IIA仮定はjとj'を選んだサンプルだけを用いて一致推定ができる条件と考えてもよい。しかしこのsubpopulationが他のpopulationとシステマティックに異なっているなら、推定値にバイアスがかかり一致性を持たない。ではこのときどうするか。
1つの方法は、構造型での推定をあきらめ、誘導型で推定することである。誘導型では、選択肢jを選ぶ確率はXi、Zjだけでなくすべての選択肢に依存することになる。ただ、選択肢の数が多い、Zjの数が多いと、独立変数が多くなりすぎる。あるいは、各選択肢に個別にこのような推定を行うことは非効率でもある。しかし、Zがない、あるいは、変数Zの数が少なければ誘導型はfeasibleであり、yijをXi、Zjへ回帰させるLPMやNPが行える。ただし推定法の選択は、興味あるパラメータにもよる。IIA問題対処の2つ目に、最近多くなってきたネステッドロジット、GEVモデルがある。ただ、女性の労働参加などでは、通常労働するか否かとフルタイムかパートかは同時に決める問題であり、入れ子型と考えることには疑問がある。3つ目は、誤差項に相関を許した多値プロビットである。このモデルの問題は数値計算可能かという点だが、最近の研究では計算可能であることが示されている。
多値選択では未だmultinominal logitが主流である。シミュレーションツールがソフトウェアに組み込まれていないのも一つの理由だろう。しかしより重要な問題は、相関係数を同定する問題だろう。線形モデルでは方程式間の相関係数は残差のサンプル共分散から推定できたが、それが使えない。yijとyij'の共分散はゼロであり、個人は選択肢を一つ選ぶことで観測され、観測されない選択についての相関を見ることができないためである。
Censored regressionについて
女性の労働供給などでよく用いられるトービットだが、そのもろさがよく指摘される。1つは、homoskedasticityがみたされないと一致推定量とならない。2つ目は正規性の仮定がかなり強くきくことである。これらはプロビットやロジットでも同じことだが、yの条件付分布が切断正規に従うことを要求されるトービットでは致命的で、運用上はきつすぎる仮定となる。これに関連してノンパラを用いた改善を検討する議論があるが、以下とかぶるため次のサンプルセレクションで触れたい。
Sample selection biasについて
典型的なサンプルセレクションモデルは、εとvが平均0、分散σ2と1、相関ρの2変量正規分布に従う下で次のようなものである。
y = Xβ + ε (I = 1)
I* = Zδ + v (I = 1 if I* > 0, I = 0 if I* < 0)
このとき観測されたyについての条件付期待値は、θ=σρ、λ(Zδ) = f(Zδ)/F(Zδ)、Fとfは1変量cdfとpdfとして次の通り。
E(y|X, I = 1) = Xβ + E(ε|X, I = 1) = Xβ + θλ(Zδ)
このとき通常よく使われる推定方法は、yとI*に関する式を最尤法で推定するか、I*に関する式をプロビットで推定し、得られたZδを用いて上の条件付期待値の式をOLS(WLS)で推定する2段階推定という2通りになるだろう。しかしこの手法はあまり使われなくなってきた。理由の1つは、λ(Zδ)はXと相関しやすく、βの推定量が不安定で頑健でなくなる(Nelson(1984)参照)。2つ目は、2変量の正規性に関する仮定が保証されず、特にXとZの同時性の下ではみたされない点である。3つ目は、1、2点目のような相関や分布の問題があるとセレクションバイアスの重要性をとらえられないという点である。2段階推定においては、vが正規分布に従いεがvと線形関係にあることさえみたせばよいため、2変量の分布の仮定を緩めたセミパラ推定で解決できる。さらに、vの正規性の仮定もεとvの同時分布がXとZと独立であれば緩められ、εの条件付期待値はZδ(つまりPr(I = 1|Z) = F(Zδ))のみに依存する形になる。
E(y|X, I = 1) = Xβ + E(ε|X, I = 1) = Xβ + E(ε|v > -Zδ) = Xβ + h(Zδ) = Xβ + h'(p)
p = Pr(I = 1|Zδ)である、この式ではεやvについて何ら特別な仮定をおいていない。通常の2段階推定では、1段階目でZδかI=1の確率を推定し、これを入れて未知関数h(h')を推定する。こうした研究はいくつか行われていて、多くの研究が提唱するのは、I=1の確率をセミパラかノンパラで推定し、Zδやpを1段階目に得ておいて、これを代入して2段階目にh(h')をセミパラで推定するという方法である。また、セミパラとパラメトリックの折衷案として、2変量の分布を自由にしておきながら、パラメトリックな形を維持するというものもあり、比較的推定はしやすい。ただ、分布に関する仮定を置かないと、識別のためのexclusion restrictionが必要である(つまり、XとZに相関があるとβとh(h')を切り離せない)。
とはいうものの、こうした新しい手法に関連した研究はほとんど蓄積されていない。また、exclusion restrictionの問題についても研究を蓄積しなければならない。この問題はセレクションには影響するがyには直接影響しない変数を見つけるという、理論的というより実際上の問題だからである。