ベイズの定理についてのまとめ

Python, ML, Math16 January 2021

ベイズの定理は条件確率の応用で、通常の確率では「ある条件下Xの元(原因)で事象Yが起こる確率(結果)」を求めるが、
本定理を使うことで、「事象Yが起きた(結果)時のある条件X(原因)」を求めることができる。
つまり、ベイズの定理は逆方向の問題を解くことに相当する。

条件付き確率

$X$が起こった条件下で$Y$が起こる確率を$P$で表すと以下の通り($P(X,Y)$は$X$かつ$Y$)

$$ P(Y|X) = \frac{P(X, Y)}{P(X)} $$

$P(Y|X)$のように右側に条件が来ることに注意!

ベイズの定理

条件付き確立の式を以下の通り変形する

$(i)\ XとY$を入れ替える($P(X,Y)$は順不同なのでそのままにする) $$ P(X|Y) = \frac{P(X, Y)}{P(Y)} $$

$(ii)\ P(X, Y)$を条件付き確率の式に基づき変形する $$ P(X, Y) = P(Y|X)P(X)$$

$(iii)\ (ii)を(i)に代入する$ $$ P(X|Y) = \frac{P(Y|X)P(X)}{P(Y)} $$

これがベイズの定理の公式

例題

罹患率0.02%の病気で、実際に罹患している人が「陽性」と診断される確率は95%
実際に罹患していないけど「陽性」と診断される確率は8%の診断がある。
この時「陽性」と診断された患者が、実際に罹患している確率を求める。

この問題では、原因と結果は以下のように定義されていると考えられる

原因 結果
罹患 診断結果

関係

問題文から、罹患と診断の関係を表にします。(あとで式にしやすいようにそれぞれにX, Yの変数を与えておきます)

陽性($Y_P$) 陰性($Y_N$)
罹患($X_P$) 95% 5%
非罹患($X_N$) 8% 92%

ここで、ベイズの定理より以下の式を解くことが、本問題を解くこととイコールになります。

$$ P(X_P | Y_P) = \frac{P(Y_P | X_P )(P_X)}{P(Y_P)}$$

$$ \begin{align} P(X_P | Y_P) = \frac{0.0002 \times 0.95}{ (0.0002 \times 0.95) + (0.0098 \times 0.08 ) } \ = 0.00236... \end{align}$$

よって、約0.2%とわかる

tags: Python, ML, Math