FDR制御法(BH)

FDR は false discovery rate の略で、真の帰無仮説を棄却した割合の期待を表す。例えば、FDR = 0.1 のとき、棄却した帰無仮説が 100 個のとき、このうち 10 個の真の帰無仮説が含まれる可能性がある。言い換えると、棄却すべきでない仮説を、間違って棄却した数は 10 個となる可能性がある。

FDR 制御法(FDR-controlling procedure)は次の手順で計算する。想定するデータは次のように配置されているものとする。

group         A group         B group
sample      1    2    3     1    2    3
gene 1     a11  a12  a13   b11  b12  b13
gene 2     a21  a22  a23   b21  b22  b23
  :  :      :    :    :     :    :    :
gene m     am1  am2  am3   bm1  bm2  bm3

FDR 制御法

  1. m 個の遺伝子のデータからそれぞれの p 値を計算する。P=(p1, p2, ..., pm) とし、pi は遺伝子 i のデータから計算された p 値とする。
  2. p値を昇順に並べます。p(1), p(2), ..., p(m) とする。
  3. 次の定義に従い q' を計算する。 \[ q'_{i(k)} = \frac{mp_{i(k)}}{i} \]
  4. 次の定義に従い、i = m-1, m-2, ... , 2, 1 に対して q 値を計算します。ただし、q(m)=q'(m) とする。 \[q_{(i)} = min\{ q'_{(i)}, q_{(i+1)} \}\]
  5. FDR を α% 以下に抑えたい場合、q(i)≤α を満たす仮説 H(i) を棄却する。

FDR制御法(図)

R による q-value の計算

R では q-value を計算できる関数 p.adjust が用意されています。

# p値を用意
p.values <- runif(100)

# BH法に基づいてq-valueを計算
q.values <- p.adjust(p.values, method = "BH")

References

  • Benjamini Y and Hochberg Y. Controlling the false discovery rate: a practical and powerful approach to multiple testing. J. Roy. Statist. Soc. Ser. 1995, B57:289-300. JSTOR