ベイズの定理についてのまとめ

Python, ML, Math16 January 2021

ベイズの定理は条件確率の応用で、通常の確率では「ある条件下Xの元(原因)で事象Yが起こる確率(結果)」を求めるが、
本定理を使うことで、「事象Yが起きた(結果)時のある条件X(原因)」を求めることができる。
つまり、ベイズの定理は逆方向の問題を解くことに相当する。

条件付き確率

\(X\)が起こった条件下で\(Y\)が起こる確率を\(P\)で表すと以下の通り(\(P(X,Y)\)\(X\)かつ\(Y\)

$$ P(Y|X) = \frac{P(X, Y)}{P(X)} $$

\(P(Y|X)\)のように右側に条件が来ることに注意!

ベイズの定理

条件付き確立の式を以下の通り変形する

\((i)\ XとY\)を入れ替える(\(P(X,Y)\)は順不同なのでそのままにする)

$$ P(X|Y) = \frac{P(X, Y)}{P(Y)} $$

\((ii)\ P(X, Y)\)を条件付き確率の式に基づき変形する

$$ P(X, Y) = P(Y|X)P(X)$$

\((iii)\ (ii)を(i)に代入する\)

$$ P(X|Y) = \frac{P(Y|X)P(X)}{P(Y)} $$

これがベイズの定理の公式

例題

罹患率0.02%の病気で、実際に罹患している人が「陽性」と診断される確率は95%
実際に罹患していないけど「陽性」と診断される確率は8%の診断がある。
この時「陽性」と診断された患者が、実際に罹患している確率を求める。

この問題では、原因と結果は以下のように定義されていると考えられる

原因 結果
罹患 診断結果

関係

問題文から、罹患と診断の関係を表にします。(あとで式にしやすいようにそれぞれにX, Yの変数を与えておきます)

陽性(\(Y_P\) 陰性(\(Y_N\)
罹患(\(X_P\) 95% 5%
非罹患(\(X_N\) 8% 92%

ここで、ベイズの定理より以下の式を解くことが、本問題を解くこととイコールになります。

$$ P(X_P | Y_P) = \frac{P(Y_P | X_P )(P_X)}{P(Y_P)}$$
$$ \begin{align} P(X_P | Y_P) = \frac{0.0002 \times 0.95}{ (0.0002 \times 0.95) + (0.0098 \times 0.08 ) } \\ = 0.00236... \end{align}$$

よって、約0.2%とわかる

tags: Python, ML, Math