こんにちは、サーバーサイドエンジニアをしている yoshinak です。
こちらのブログでは、わたしが E資格を受験するにあたってお世話になった動画を紹介していきたいと思います。どうぞ、よろしくお願いいたします。
それでは、始めてまいりましょう。今回からご紹介させていただく、チャンネルは、こちらです。
受験前、「ベイズ統計」シリーズ、「深層学習」シリーズについて、毎日の様に試聴させていただきました。
「深層学習」シリーズの「GPT-3」を拝見したとき、 AI の可能性に改めて感化され、学習のモチベーションがさらに上がったこと記憶しております。合格はまさにこちらのお陰と言っても過言ではないほど勉強させいただきました。
今回からは、こちらの動画の「ベイズ統計」シリーズを順次、ご紹介させていただきたいと思います。
ベイズ統計といいますか、条件付き確率のところ、何となくイメージできなくて、計算問題ではまっていたのですよね。こちらのシリーズで「時間の流れ」をイメージできるようになって、理解できるようになりました。ぜひそのあたりを体験していただければ幸いです。
ベイズ統計シリーズのお品書き
ベイズ統計シリーズは、全部で6つの動画になります。
【ベイズ統計その①】条件付き確率と Bayes の定理【時間の流れを意識せよ!】 #VRアカデミア #014 – YouTube
【ベイズ統計その②】この推定、もっとももっともらしいってよ…!【最尤推定のお話だよ!】 #VRアカデミア #015 – YouTube
【ベイズ統計その③】宇宙一わかりやすいベイズ推定【本気の解説】 #VRアカデミア #016 – YouTube
【ベイズ統計④】ベイズ推定の気持ちと、指数型分布族と、共役事前分布【本気の解説】 #VRアカデミア #017 – YouTube
【ベイズ統計⑤】ベイズの定理とベイズ統計の気持ち【ベイズってるー?】 #VRアカデミア #020 – YouTube
【ベイズ統計⑥】最終回!階層ベイズとMCMC【してやんよ】 #VRアカデミア #021 – YouTube
間に最尤推定の話が入りますが、ここでの最尤推定との比較が理解を深めてくれます。
ベイズ統計その① 条件付き確率と Bayes の定理
それでは、1回目の「条件付き確率と Bayes の定理」について、ご紹介します。
動画の内容は以下の通りです。
1. 確率と条件付き確率
確率と条件付き確率の数式について、復習です。
\( 確率 = \frac{部分}{全体} \) なので、
\( U \) : 全体集合の中で、 \(A \) が起こる確率 \( P(A) \) は、
$$
P(A) = \frac{A}{U}
$$
そして、条件付き確率 \( A \) が起こる場合に \( B \) も起こる確率 \( P(B \mid A) \) は、
動画のベン図のイメージから、
$$
P( B \mid A) = \frac{P(A \cap B)}{P(B)}
$$
これから、変形した以下の式もおさえておきましょう。
\( A \) と \( B \) を逆にして、
$$
P( A \mid B) = \frac{P(B \cap A)}{P(A)}
$$
分母の \( A \) をはらって、
$$
P( A \cap B) = P(B \mid A) \times P(A)
$$
高校の確率統計から、お世話になっている数式ですが、これがなかなか理解できないところです。時間を意識せずに、ベン図からその時の結果の数としては分かるのですけれどね。引き続き、進めていきましょう。
2. Bayes の定理を示す
証明です。証明したい Bayes の定理の式は以下です。
$$
P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}
$$
ここで、右辺は、
\( A \) が起こって ( \( P(A) \) ) 、さらに \( A \) の場合に \( B \) が起こる確率 ( \( P(B \mid A) \) ) なので、
$$
\frac{P(B \mid A) P(A)}{P(B)} = \frac{P(A \cap B)}{P(B)}
$$
これは、 \( B \) が起こることに対して、 \( A \) かつ \( B \) が起こる確率なので、やはり条件付き確率になって、
$$
= P( A \mid B )
$$
と、左辺に一致します。
それで、証明は以上ですが、動画の中で言われている通り、ちょっと意味を理解できませんでした。そうですね。式の変形はいいとして、この式ができると何が嬉しいか? が分からないところです。その答えが、次からの説明になるので、楽しみに見ていきしまょう。
3. 時間順行と逆行
条件付き確率には、 2 種類あります。それを例題で考えていきましょう。
袋 X と Y がある。
X には赤玉 3 個 白玉 5 個、
Y には赤玉 1 個 白玉 3 個が入ってている。今あなたは、確率 \( \frac{1}{2} \) ずつで袋をえらび、
その中の玉をとる。袋 X を選ぶ事象を \( A \)
赤玉を引く事象を \( B \) とする。このとき、 \( P(A), P(B), P(A \cap B), \)
\( P(B \mid A), P(A \mid B) \)
を求めよう。
この 5 個の確率を計算してみます。
$$
P(A) = \frac{1}{2} \\
P(B \mid A) = \frac{3}{8}
$$
袋 X 、 Y を \( \frac{1}{2} \) で選んで、それぞれの中から赤玉を引く確率だから、
$$
P(B) = \frac{1}{2} \times \frac{3}{8} + \frac{1}{2} \times \frac{1}{4} = \frac{5}{16}
$$
A かつ B なので、積の法則から、
$$
P(A \cap B) = \frac{1}{2} \times \frac{3}{8} = \frac{3}{16}
$$
ここまでは、素直に求められます。
\( P( A \mid B) \) については、今回の条件付き確率の式を使って、
$$
P( A \mid B) = \frac{P(B \cap A)}{P(A)} = \frac{\frac{3}{16}}{\frac{5}{16}} = \frac{3}{5}
$$
ここで、それぞれの確率の意味を思い出してみましょう。
- \( P(A) \): 袋 X を選ぶ確率
- \( P(B) \): 赤玉を引く確率
- \( P(A \cap B) \): 袋 X を選んで、さらに赤玉を引く確率
- \( P(B \mid A) \): 袋 X を選んだときに、赤玉を引く確率
ここまではイメージしやすいですね。
最後、計算に条件付き確率の式を使った \( P( A \mid B) \) は、 - \( P(A \mid B) \): もし、赤玉を引いたときに、それが実は袋 X に入っていた確率
最後の( P( A \mid B) ) が表現しにくいですね。これは時間の流れに関係します。それぞれの確率を時間の流れで分類すると、 \( P( A \mid B) \) 以外は時間りに進行(順行)した結果です。一方、 \( P( A \mid B) \) は、「球は赤でした。では、その前に袋は X でしたか?」と、時間の流れに逆行します。
時間の流れに順番に起こる順行は、直観的に考えられやすいですよね。対して、逆行の方は、言葉でも表現しにくく、条件付き確率の式で求めました。この時間順行と逆行の違いが、Bayes の定理のありがたいところです。
4. Bayes の定理再び
もう一度、 Bayes の定理を書きます。
$$
P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}
$$
ここで、右辺の式は先程の時間順行の確率です。そして、左辺が時間逆行の確率です。
$$
時間逆行 = 時間順行
$$
時間逆行の確率を、時間順行の確率から計算できるのが、 Bayses の定理のメリットだったのですね。時間順行の確率の方が、分かりやすく計算しやすいです。対して、 \( P(A \mid B) \) は時間の流れが逆向きのことを聞かれています。高校の確率統計で、今回の例題の様な「球は赤でした。では、その前に袋は X でしたか?」がなかなかイメージできなかったところです。それで、統計で求められる確率は、結果から原因を求める時間逆行の方の確率が多いそうです。(今後の動画で勉強していきましょう)
Bayes の定理は、時間逆行の難しい確率を時間順行の確率から求められるのがすごいところだったのですね。
まとめ
今回は AIcia Solid Project さんの動画「ベイズ統計①」を紹介いたしました。 Bayes の定理とよくある問題のイメージがしにくいところは、時間逆行である原因の確率を求められているところでした。Bayes の定理のすごいところは、時間逆行の確率を時間順行の確率から求められることでした。
ここまでお読みいただき、ありがとうございました。今後もベイズ統計シリーズの動画を紹介していきたいと思います。また、次回もお読みいただければ、幸いです。
コメント