FDR制御法(BY)

BY 法は q' 値を求める式だけが BH 法と異なり、そのほかは BH 法と同じステップである。想定するデータは次のように配置されているものとする。

group         A group         B group
gene 1     a11  a12  a13   b11  b12  b13
gene 2     a21  a22  a23   b21  b22  b23
  :  :      :    :    :     :    :    :
gene m     am1  am2  am3   bm1  bm2  bm3

gene 1、gene 2、...、gene m の p-value をそれぞれ計算した上で、FDR を計算する。

  1. m 個の遺伝子のデータからそれぞれの p 値を計算する。P=(p1, p2, ..., pm)ととし、pi は遺伝子 i のデータから計算された p 値とする。
  2. p値を昇順に並べます。p(1), p(2), ..., p(m) とする。
  3. 次の定義に従い q' を計算する。 \[ q'_{i(k)} = \frac{mp_{i(k)}}{ i \sum_{j=1}^{m}\left(\frac{1}{j} \right) } \]
  4. 次の定義に従い、i = m-1, m-2, ... , 2, 1 に対して q 値を計算します。ただし、q(m)=q'(m) とする。 \[q_{(i)} = min\{ q'_{(i)}, q_{(i+1)} \}\]
  5. FDR を α% 以下に抑えたい場合、q(i)≤α を満たす H(i) を棄却する。

R による q-value の計算

R の p.adjust を利用することで q-value を計算できる。

# p値を用意
p.values <- runif(100)

# BY法に基づいてq-valueを計算
q.values <- p.adjust(p.values, method = "BY")

References

  • Benjamini Y and Hochberg Y. Controlling the false discovery rate: a practical and powerful approach to multiple testing. J. Roy. Statist. Soc. Ser. 1995, B57:289-300. JSTOR
  • Benjamini Y and Yekutieli D. The control of the false discovery rate in multiple testing under dependency. Ann. Statist. 2001, 29:1165-88. Project Euclid