贝叶斯:起步(3)
概率论(英语:Probability theory)是研究概率、随机性及不确定性等现象的数学分支,而贝叶斯学派(Bayesians)又是其中有代表性的流派。每周四更新,本文为贝叶斯系列文章第 3 期,用一个完整的例子感受下贝叶斯公式的力量。贝叶斯:起步(3)
文章来自微信公众号“科文路”,欢迎关注、互动。转载须注明出处。
上周四,我们一起品味了这个贝叶斯公式,并且给出了一些术语的解释。
$$
P(A\mid B)={\frac {P(A)P(B\mid A)}{P(B)}}
$$
有细心的读者也指出了其中一些问题。这让我感觉有些读者还是不太清晰这些概念,那还是停一停。这里我画个表格,明确一下。
术语再理解
假设有两个外边看不见内部的盒子(不多说了,你应该知道啥意思),盒 1 有 5 个球,3 黄 2 红;盒 2 有 7 个球,4 黄 3 红。
下面再看这些概念,
概念 | 符号 | 通俗理解 |
---|---|---|
事件 | A | 某种特定的情况,比如“从盒 1 拿出一个球(这里是确定的),这个球是黄色的”(A) |
先验概率 | $P(A)$ | 当下就知道的某个事件的发生概率,上面说的拿出黄球的概率 $P(A)=3/5$ |
联合概率 | $P(A\bigcap B)$ | A事件和B事件同时发生的概率;A和B之间是没有关联的;比如“同时从盒1、2中拿出黄球”的联合概率$P(A\bigcap B)=P(A)\times P(B)=12/35$ |
重要理论
- 统计独立性
- 当且仅当两个随机事件A与B统计独立的,这样联合概率可以表示为各自概率的简单乘积
- 简单讲,就是 A 和 B 的发生没有关联
- 比如上面,分别从盒1、2中取球,两次取球就是独立的
好了,接下面是重头戏,一般是问题中比较烧脑的部分。
条件概率(后验概率)
$P(A\mid C_\text{box1})$,$C_\text{box1}$ 事件发生的情况下,A 事件发生的概率。
条件概率等价于后验概率,这个说的比较笼统,但我不觉得有什么不妥。条件概率是从形式上说的,后验概率是从陈述性表达上理解的。
先来个简单的,“随机(相当于蒙住了盒子号码)选择盒子,选择了盒子1,并从中拿出一个球,这个球是黄色”,可以表述为符号 $P(A\mid C_\text{box1})$,
- $A$ 事件,取出一个球(不管哪个盒子),这个球是黄色
- $C_\text{box1}$ 事件,随机选到盒子1
所以 $P(A\mid C_\text{box1})$ 就是说,我随机选择了盒子1($C_\text{box1}$),拿出的球是黄色($A$)的概率。因为两个事件独立,所以算这个概率很简单,
$P(A\mid C_\text{box1})=P(A)\times P(C_\text{box1})=3/5\times 1/2=3/10$
就是说,随便选一个盒子,这个盒子是盒 1 且拿出来的球是黄球概率是 0.3。
贝叶斯的力量
上面那种情况好算吧,但往往我们需要求解另一种更烧脑的情况——反过来。
比如,$P(C_\text{box1}\mid A)$,“取出了一个黄球($A$),这个黄球来自盒1($C_\text{box1}$)”的概率。
这种需求很常见,但是怎么算呢?这就要利用贝叶斯公式。
代入贝叶斯公式,
$$
P(C_\text{box1}\mid A) = \frac{P(A\mid C_\text{box1})\times P(C_\text{box1})}{P(A)}
$$
右边,
- $P(A\mid C_\text{box1})$ 上面算过了,$3/10$
- $P(C_\text{box1})$,$1/2$
- $P(A)=P(A\mid C_\text{box1}) + P(A\mid C_\text{box2})$
- $=3/5\times 1/2 + 4/7\times 1/2=41/70$
体会到神奇之处了吗,对于这个烧脑的问题,居然可以通过贝叶斯“逆向”计算出来,结果是 $21/82$,就是说拿出黄球,黄球来自盒1 的概率是 $25.6%$ 左右!
时间仓促,不知道写对没有,欢迎斧正!
下期我们再列几个现实生活中的例子~
~~
都看到这儿了,不如关注每日推送的“科文路”、互动起来~
至少点个赞再走吧~