ロジットモデルとは

データ分析
データ分析統計計量経済学

本記事では離散選択モデルの1つであるロジットモデルについて紹介する。
また、プロビットモデルとの違いについても記述する。

スポンサーリンク

順序ロジットモデルと多項ロジットモデル

ロジットモデルは複数の選択肢から1つを選ぶ離散選択モデルの1つである。
本記事では順序ロジットモデルと多項ロジットモデルを扱う。

順序ロジットモデル

順序ロジットモデルは目的変数の取りうる値が3つ以上あり、それらになんらかの順序がある場合に適用される。
例えば、満足度を5段階で回答したアンケートなどの尺度を用いた選択肢に用いられる。

確率の定式化

ロジットモデルでは推定式 $Y_i^*=\beta X_i +u_i$ の誤差項 $u_i$ が次のロジスティック分布に従うとする。
$$f(x)=\frac{\exp \{-(x-\mu)/s \}}{s[1+\exp\{-(x-\mu)/s\}]^2}$$
$\mu$ は平均であり、$s$ は正のパラメータである。分散は $\pi^2 s^2/3$ と表される。
累積分布関数は、
$$F(x)=\frac{1}{1+\exp\{ -(x-\mu)/s\}}$$
である。
平均を0、分散を1とした確率密度関数を正規分布と比較したグラフを以下に示す。

目的関数 $Y_i$ が選択肢に応じて $0,1,2,\dots,J$ という値を取るとしたら、順序ロジットモデルの選択肢 $j$ をとる確率は、
$$P(Y_i=j)=P(y \le j) – P(y \le j -1)=F(k_j – x_i \beta) – F(k_{j-1} – x_i \beta)$$
と表現できる。
ここで、$k_j$ は閾値であり、潜在変数 $Y_i^*$ が $k_j \le Y_i^* < k_{j+1}$ となるとき、$Y_i=j$ と表される。

多項ロジットモデル

多項ロジットモデルは順序ロジットモデルと同様に目的変数の取りうる値が複数あるが、順序がない場合に適用される。(目的変数が2項の場合は二項ロジットモデルと呼ばれる。)
例えば、交通手段(バス・電車・自家用車など)や商品などの選択に用いられる。

確率の定式化

多項ロジットモデルは順序ロジットモデルとは異なり、誤差項 $u_i$ が次のガンベル分布に従うとする。
$$f(x)=\frac{1}{\eta}\exp \{-(x-\mu)/\eta\} \exp [-\exp\{-(x-\mu)/\eta\}]$$
$\mu$ はパラメータであり、$\eta$ は正のパラメータである。平均は $\mu+\gamma \eta$、分散は $\pi^2 \eta^2 / 6$と表される。
ただし、$\gamma=0.577 \dots$ はオイラーの定数である。
累積分布関数は、
$$F(x)=\exp [-\exp\{-(x-\mu)/\eta\}]$$
と表される。

互いに独立な$\epsilon_1,\epsilon_2$ がそれぞれ$(\eta_1,\mu),(\eta_2,\mu)$ のガンベル分布に従うとき、$\epsilon = \epsilon_1 – \epsilon_2$ がロジスティック分布に従う。

最終的な確率に至る証明は少々煩雑なので省略する。
結局、$J$ 個の選択肢の中から $j$ を選ぶ確率は次のように表せる。
$$P(Y_i=j) = \frac{\exp (x_i \beta_j)}{\displaystyle \sum_{r=1}^J \exp (x_i \beta_r)}$$

すべての選択肢の確率の和が1になることから、係数 $\beta_j$ はある選択肢に対する相対的な大きさ $\beta_j – \beta_{\rm base}$ で表示されることが多いことに注意する必要がある。
また、$\beta_{\rm base}=0$ としても一般性が失われないため、基準が書かれないことも普通である。

IIA特性

多項ロジットモデルの重要な特性としてIIA (Independence from Irrelevant Alternatives) 特性がある。
これはつまり、選択肢が無相関である必要があるということである。

例えば、バスと自家用車を選択する確率がともに50%だったとする。
次に、バスを赤バスと青バスに分けて選択される確率を考える。
このとき、直感的にはバスの確率が別れて25%、25%、50%になるような気がする。
しかし、これが自家用車にも影響を与えて、33.3%ずつになってしまう。

これを防ぐために様々なモデルが提案されているが、この記事では書ききれないので時間があるときに追記する。

スポンサーリンク

プロビットモデルとの比較

ロジットモデルと同様に代表的な離散選択モデルとしてプロビットモデルが挙げられる。
この章ではプロビットモデルとの比較について記述する。

詳しくは以下の記事にまとめた。

プロビットモデルは誤差項 $u_i$ の確率分布関数として正規分布を用いているが、ロジットモデルではロジスティック分布やガンベル分布を用いている。

参考書籍

2冊の参考書籍を載せておく。

1冊目は統計基礎の教科書で、2冊目は計量経済学の教科書である。
どちらも非常に良書である。

本記事の内容は2冊目の8章に書かれている。

スポンサーリンク
H-MEMO

コメント