指数分布

ポアソン過程
ポアソン過程確率分布統計
0

現実の様々な現象が指数分布に従っているという。
本記事では指数分布の基本的な情報や具体例、最尤推定法に関するメモしておく。

スポンサーリンク

指数分布とは

$\lambda > 0$ として、指数分布の確率密度関数は次のようになる。

$$f(x) = \lambda e^{- \lambda x} \quad (x \ge 0) \tag{1}$$

上式を積分して累積度数分布 $F(x)=1-e^{-\lambda x}$ を得る。
$f(x)$ と $F(x)$ のグラフは次のようになる。

無記憶性

指数分布は無記憶性という特徴を持つ分布である。
記憶がないというのは、 $t,s \ge 0$ に対して、

$$P(X>s+t|X>t)=P(X>s) \tag{2}$$

が成り立つことを言う。
これは例えば、コンビニにお客さんが来る間隔を$X$ 秒として「 $t$ 秒後にあるお客さんがきて、さらに $s$ 秒経つと次のお客さんが来る」という条件付き確率(左辺)は、時間 $t$ に関わらず「 $s$ 秒経つとお客さんが生じる」確率(右辺)に等しいということである。
実際に、条件付き確率の公式に従って式(2)を変形していくと式(1)を導くことができる。

「無記憶性」から容易に想定できるように、待ち時間とかイベントの発生間隔が「指数分布」に従うとされる。
例えば、地震の発生頻度、機械の故障の間隔(耐用年数)などである。

ポアソン分布との関係

上記のようなランダムに発生するイベントを「ポアソン過程」という。
そのイベントの発生回数は「ポアソン分布」に従う。
そのイベントの発生感覚が「指数分布」に従う。

この3つは同時に覚えてしまうのが良い。

スポンサーリンク

最尤推定

指数分布 $f(x)=\theta e^{-\theta x}$ に従う $n$ 個のデータ $x_1,x_2,\dots,x_n$ が与えられ、最尤推定量 $\hat{\theta}$ を求める。
すなわち、

\begin{align}
\hat{\theta} &= \argmax_\theta L(\theta) \\
&= \argmax_\theta \left( \theta e^{-\theta x_1} \times \theta e^{-\theta x_2} \times \dots \times \theta e^{-\theta x_n} \right) \\
&= \argmax_\theta \left( \theta^n e^{-\theta \left( x_1 + x_2 + \dots + x_n \right)} \right)
\end{align}

を求める。尤度方程式は次のようになる。

\begin{align}
\frac{\partial }{\partial \theta} \ln{L(\theta)} &= 0 \\
\frac{\partial }{\partial \theta} \ln{\theta^n e^{-\theta \left( x_1 + x_2 + \dots + x_n \right)}} &= 0 \\
\frac{\partial }{\partial \theta} (\ln{\theta^n} + \ln{e^{-\theta \left( x_1 + x_2 + \dots + x_n \right)}}) &= 0 \\
\frac{\partial }{\partial \theta} \left\{n\ln{\theta} -\theta \left( x_1 + x_2 + \dots + x_n \right)\right\} &= 0 \\
\frac{n}{\theta} – \left( x_1 + x_2 + \dots + x_n \right) &= 0 \\
\end{align}

よって、最尤推定量 $\hat{\theta}$ は次のように導かれる。

\begin{align}
\hat{\theta} = \frac{n}{x_1 + x_2 + \dots + x_n} = \frac{1}{\bar{x}}
\end{align}

ここで、 $\bar{x}$ は与えられたデータ$x_1,x_2,\dots,x_n$ の平均値である。
したがって、最尤推定量は平均値の逆数で与えられる。

スポンサーリンク
H-MEMO

コメント