一般化線形モデル

回帰分析、分散分析、t 検定などは一般線形モデルによってモデル化することができる。これらはすべて、以下の式によってモデル化することができる。

\[ Y = \mathbf{X}\mathbf{\beta} + \epsilon \]

例えば回帰分析の場合は、Y は従属変数であり、X は独立変数であり、β は各独立変数の係数であり、ε は誤差を表すとなる。また、分散分析の場合も同様に、Y はすべての従属変数(観測値)であり、X はデザイン行列(どの観測値がどの実験群に属しているかを示す行列)であり、β は全平均、各群の平均を表している。

一般線形モデルの期待値は以下のように求めることができる。

\[ E(Y) = \mathbf{ X}\mathbf{ \beta} \]

これに対して、正規分布に従わないデータの場合は、上式はそのままでは成り立たない。そこで、まず最初に、左辺と右辺をそれぞれ別々に計算する。

\[ E(Y) = \mu \] \[ \mathbf{X}\mathbf{\beta} = \eta \]

次に、μ と η の間に線形関係が成り立つための関数 G を考える。すなわち、

\[ G(\mu) = \eta \]

このようにモデル化できるモデルを一般化線形モデルという。ここで用いた関数 G をリンク関数という。データが指数型分布族の分布に従えば、その分布に対応するリンク関数は少なくとも 1 つ存在する。

一般化線形モデルの構成要素は上述した指数分布族に属する従属変数 Y、線形予測し ν、リンク関数 G からなる。また、重要なこととしては、従属変数 Y の分散は、平均の関数として表される。

References

  1. Müller M. Generalized Linear Models. 2004. PDF
  2. 一般線形モデル Wikipedia
  3. 山村. 一般線形モデル. 2013. PDF