多項分布

試行の結果が m 種類のカテゴリに分けられるとき、それぞれのカテゴリに属する要素の数は多項分布に従う。

ここで、試行結果が m 種類のカテゴリ Ci (i=1,2,...,m) のいずれかに属するものとする。また、カテゴリに Ci に属する確率を pi とする。また、n 回の試行のあとに Ci に含まれる要素の数を Xi とする。

このとき、Xi (i=1,2,...,n) は多項分布に従う。その同時確率関数は次のようになる。

\[ P(X_{1}=k_{1}, \cdots, X_{m}=k_{m}) = \frac{n!}{k_{1}!\cdots k_{m}!}p_{1}^{k_{1}}\cdots p_{m}^{k_{m}} \]

多項分布の期待値と分散。

\begin{eqnarray} E(X_{i}) &=& np_{i}\\ V(X_{i}) &=& np_{i}(1-p_{i}) \end{eqnarray}

確率変数 Xi と Xj の共分散は次のように計算される。試行回数 n を固定したとき、Xi が増加すると、Xj は変化なしまたは減少するかのどちらかとなる。したがって、共分散は負の値を取る。

\[ Cov(X_{i},X_{j}) = -p_{i}p_{j} \]