十分統計量

ポアソン分布のパラメーター推定のところでは、最尤法により λ は以下のように推定できる。

\[ \lambda = \frac{1}{n}\sum_{i=1}^{n}x_{i} \]

この式をみると、λ を推定するのに個々のデータ(x1, x2, ..., xn)は必ずしも必要ではないことがわかる。その一方で、\(\sum x_{i}\) があれば、十分に λ を推定することができる。このような統計量(この場合は合計値)のことを、十分統計量 sufficient statistic という。

同様に正規分布のパラメーター推定においては、平均と分散は次の 2 式によって推定することができる。

\[ \begin{eqnarray} \mu &=& \frac{1}{n}\sum_{i=1}^{n}x_{i} \\ \sigma^{2} &=& \frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^2\\ &=& \frac{1}{n}\sum_{i=1}^{n}x_{i}^{2} - \bar{x}^{2} \end{eqnarray} \]

この式からは平均および分散を推定するのに個々のデータ(x1, x2, ..., xn)は必ずしも必要ではないことがわかる。その一方で、\(\sum x_{i}^{2}\) と \(\bar{x}=\frac{1}{n}\sum x_{i}\) があれば、十分に λ を推定することができる。正規分布の場合、十分統計量は \(\left(\sum x_{i}^{2}, \sum x_{i}\right)\) となる。

References

  1. 十分統計量. Wikipedia
  2. a_bicky. 十分統計量(Sufficient Statistics)って何なのさ?. 2014. あらびき日記
  3. 土居. 最尤法と十分統計量. PDF