2008/07/03

Stochastic Frontier Method

 SFMは、通常のOLS推定 y = xβ+εの誤差項をε= v + u というホワイトノイズと非効率性の二つに再構成するものである。以下、そのことを確認する。

 いわゆる非効率性には技術非効率性と配分非効率性の二つがある。そのうち、ここでは技術非効率性に注目して分析を行う。通常、効率性を計算するには完全に効率的な生産関数が既知である必要があるが、無論非現実的である。そこで、完全に効率的な生産関数を推定するという作業が発生する。その推定方法には2つあり、(1)DEAのようなノンパラメトリック断片的線形化法による推定、(2)SFMのようなパラメトリックな関数型を使う推定、の2つである。
 今、ln yi = xiβ、yi は第i主体の生産量、x は第 i 主体のK個の投入ベクトルである生産関数を考える。
 ここで、各主体は所与の投入量の下で生産量を最大化していると仮定する(これがポイント)。その場合、生産量は xiβになるはずであり、これをフロンティア生産量 yF とする。しかし、実際の yi は yF よりも小さくなる。
 すなわち、ln yi < xiβである。書き直すと、ln yi = xiβ- ui と考えられる。すなわち、第 i 主体の観測できない何らかの技術非効率性があることを意味する。さて、所与の xi の下で、技術非効率性は、yi/yF であるから、

 yi / exp(xi b) = exp(xi b - ui) / exp(xi b) = 0 < exp(- ui)≦1

つまり技術非効率性の大きさが、第 i 主体の非効率性を表すことになる。

 さて、以上の議論から、技術非効率性は「非負」の確率変数である(ui≧0)。ln yi = xiβ- ui をそのまま推定しても他の誤差を含むので、iid な v~N(0,σ2)という誤差項を加えて、ln yi = xiβ+vi - ui 、v と u は独立、という関数の推定を行うことになる。u はhalf-normalの分布である。

 さて、yF はxiβ+ vi、yo はln yi = xiβ+vi - ui である。yF は主体によって異なり、yo は確率的な yF でバウンドされる。なので、Stochastic Frontier 呼ぶ。(vi - ui) という項の存在は、OLS、MLとも推定量に影響を与えない。

 SFMの理論的な面はわかりやすいが、実際の推定作業はなかなか表立って論じられることは少ない。v と u の2つの分布については通常、v i.i.d. N(0,σv2)、u i.i.d. truncations (at zero) N(0,σu2)を仮定する。Aigner et. al. (1977)では、分散のパラメータを、σ2 = σv2 + σu2、λ= [σu /σv]≧0 とした。Battese and Cora (1977)では、σ2 = σv2 + σu2、γ= (σu2 /σ2)∈[0,1] とする点が違う。どちらかというと、後者の方が、γの初期値を [0,1] の範囲から選んで収束計算を始められる点から好まれるようである。このとき、具体的な尤度関数は、

 ln L = -(n/2)ln(π/2) - (n/2)ln(σ2) + Σln[1 - Φ(zi)] - (1/2σ2)Σ(ln yi - xiβ)2

ただし、Φは累積分布関数、zi = [(ln yi - xiβ) /σ]√(γ/ 1-γ)。これを最大化するβ、σ2、γ(K+2)を求める。手順としては、OLSで、βとσの初期値を作り、γを[0,1]で選んで適当なアルゴリズムで収束計算を行う。こうして推定されたσとγを、E[exp(-ui)] = 2[1 - Φ(σ/γ )] exp(- γσ2/2)に代入することで、技術非効率性を計算する。