ベイズの定理は条件確率の応用で、通常の確率では「ある条件下Xの元(原因)で事象Yが起こる確率(結果)」
を求めるが、
本定理を使うことで、「事象Yが起きた(結果)時のある条件X(原因)」
を求めることができる。
つまり、ベイズの定理は逆方向の問題
を解くことに相当する。
条件付き確率
$X$が起こった条件下で$Y$が起こる確率を$P$で表すと以下の通り($P(X,Y)$は$X$かつ$Y$)
$$ P(Y|X) = \frac{P(X, Y)}{P(X)} $$
$P(Y|X)$のように右側に条件が来ることに注意!
ベイズの定理
条件付き確立の式を以下の通り変形する
$(i)\ XとY$を入れ替える($P(X,Y)$は順不同なのでそのままにする) $$ P(X|Y) = \frac{P(X, Y)}{P(Y)} $$
$(ii)\ P(X, Y)$を条件付き確率の式に基づき変形する $$ P(X, Y) = P(Y|X)P(X)$$
$(iii)\ (ii)を(i)に代入する$ $$ P(X|Y) = \frac{P(Y|X)P(X)}{P(Y)} $$
これがベイズの定理の公式
例題
罹患率0.02%
の病気で、実際に罹患している人が「陽性」と診断される確率は95%
、
実際に罹患していないけど「陽性」と診断される確率は8%
の診断がある。
この時「陽性」と診断された患者が、実際に罹患している確率
を求める。
この問題では、原因と結果は以下のように定義されていると考えられる
原因 | 結果 |
---|---|
罹患 | 診断結果 |
関係
問題文から、罹患と診断の関係を表にします。(あとで式にしやすいようにそれぞれにX, Yの変数を与えておきます)
陽性($Y_P$) | 陰性($Y_N$) | |
---|---|---|
罹患($X_P$) | 95% | 5% |
非罹患($X_N$) | 8% | 92% |
ここで、ベイズの定理より以下の式を解くことが、本問題を解くこととイコールになります。
$$ P(X_P | Y_P) = \frac{P(Y_P | X_P )(P_X)}{P(Y_P)}$$
$$ \begin{align} P(X_P | Y_P) = \frac{0.0002 \times 0.95}{ (0.0002 \times 0.95) + (0.0098 \times 0.08 ) } \ = 0.00236... \end{align}$$
よって、約0.2%とわかる