最大値と最小値の差の分布(一様分布)

確率変数 X が一様分布に従うとき、その最大値と最小値の差がベータ分布に従う。

n 個の確率変数 Xi (i = 1, 2, ..., n) が最小値 0 かつ最大値 1 の一様分布に従うとする。すなわち、

\[ X_{i} = U(0, 1) \]

最大値の分布

Xi の最大値を M とする。Xi が一様分布に従うことに注意すると、M の累積分布関数は以下のように求められる。

\[ \begin{eqnarray} P(M \le x) &=& 1 - P(M \ge x) \\ &=& 1 - \prod_{i=1}^{n} P(X_{i} \ge x) \\ &=& 1- P(X \ge x)^{n} \\ &=& 1 - (1 - P(X \le x))^{n} \\ &=& 1 - (1 - x)^{n} \end{eqnarray} \]

よって、M の確率密度関数は以下のように求められる。

\[ \begin{eqnarray} f_{M}(x) &=& \frac{d}{dx}P(M \le x) \\ &=& n(1-x)^{n-1} \end{eqnarray} \]

最小値の分布

Xi の最小値を m とする。Xi が一様分布に従うことに注意すると、m の累積分布関数は以下のように求められる。

\[ \begin{eqnarray} P(m \le x) &=& \prod_{i=1}^{n} P(X_{i} \le x) \\ &=& P(X \le x)^{n} \\ &=& x^{n} \end{eqnarray} \]

よって、m の確率密度関数は以下のように求められる。

\[ \begin{eqnarray} f_{m}(x) &=& \frac{d}{dx}P(m \le x) \\ &=& nx^{n-1} \end{eqnarray} \]

最大値と最小値の差が従う分布

最大値と最小値の差 D を従う分布は、M と m が独立でないので、fD(x) = fDM - fDm として求めることがでいない。

ここで、確率変数 Xi の範囲を d とし、d と最大値 y は以下の二通りに分けて考えることができる。

  1. x < 1 - d のとき、確率変数 Xi は [x, x+d] に含まれる。このとき、最大値 Y = x を除いた残りの n - 1 個の確率変数が [x, x+d] に一様分布する確率は d/(1-x) である。これをイベント E とする。
  2. x > 1 - d のとき、確率変数 Xi は [x, 1] = [1 - d, 1] に含まれる。このとき、すべての点が範囲 d に含まれる。

このとき、最大値と最小値の差 D の累積分布関数は以下のように二つの場合に分けて求められる。

\[ \begin{eqnarray} P(D\le d) &=& \int_{0}^{1-d} f_{M}P(E)dx + P(M \ge 1 - d) \\ &=& \int_{0}^{1-d} n(1-x)^{n-1}\left( \frac{d}{1-x} \right)^{n-1}dx + d^{n} \\ &=& \int_{0}^{1-d} nd^{n-1}dx + d^{n} \\ &=& nd^{n-1}(1-d)+d^{n} \end{eqnarray} \]

また、確率密度関数は以下のように計算できる。

\[ \begin{eqnarray} f_{D}(x) &=& \frac{d}{dx}P(D\le d) \\ &=& (1-x)x^{n-2}(n-1)n \\ &=& \frac{x^{n-2}(1-x)}{\frac{n - (n + 1)}{(n-1) n}} \\ &=& \frac{x^{n-2}(1-x)}{\int_{0}^{1}t^{n-2}(1-t)dt}\\ &\sim& \mathbf{Beta} (n-1, 2) \end{eqnarray} \]

従って、確率変数 X が一様分布に従うとき、その最大値と最小値の差がベータ分布に従うことが確認できる。

References

  1. João Neto. Distribution of max, min and ranges for a sequence of uniform rv’s. Website