条件概率

条件概率

The probability of AA is pp, given that BB occurs. 即在事件 BB 发生的条件下,事件 AA 发生的概率 pp,称为条件概率。

对于离散均匀分布的情况

p=ABB=AB/ΩB/Ω=Pr(AB)Pr(B)p = \dfrac{|A \cap B|}{|B|} = \dfrac{|A \cap B| / |\Omega|}{|B| / |\Omega|} = \dfrac{\Pr(A \cap B)}{\Pr(B)}

AA 是一个事件,BB 是一个非零概率事件,即 Pr(B)>0\Pr(B) > 0,则 AABB 条件下的概率(conditional probability)定义为

Pr(AB)=Pr(AB)Pr(B)\Pr(A \mid B) = \dfrac{\Pr(A \cap B)}{\Pr(B)}

条件概率是概率
  • 样本空间是 BB
  • ΣB={ABAΣ}\Sigma^B = \left\lbrace A \cap B \mid A \in \Sigma \right\rbraceσ\sigma-代数
  • 概率测度 Pr(B)\Pr(\cdot \mid B) 满足概率公理

辛普森悖论是指一个总体中的两组数据分别满足某一规律,但是当这两组数据合并后,这一规律却被打破的现象。

在概率论中,可以构造事件 A,BA, B 与样本空间 Ω\Omega 的划分 C1,C2,,CnC_1, C_2, \cdots, C_n 使得

  • 对于每个 CiC_iBB 的发生对 AA 有正向影响
    • Pr(ABCi)>Pr(ABcCi)\Pr(A \mid B \cap C_i) > \Pr(A \mid B^c \cap C_i) 对任意 ii 成立
  • 但总体上,BB 的发生对 AA 有负向影响
    • Pr(AB)<Pr(ABc)\Pr(A \mid B) < \Pr(A \mid B^c)

其他例子:

条件概率法则(Laws for Conditional Probability)

链式法则

链式法则(Chain Rule)

对于任意事件 A1,A2,,AnA_1, A_2, \cdots, A_n,有

Pr(i=1nAi)=i=1nPr(Aij<iAj)\Pr\left( \bigcap_{i=1}^n A_i \right) = \prod_{i=1}^n \Pr\left( A_i \biggm| \bigcap_{j < i} A_j \right)

证明

Pr(i=1nAi)=Pr(i=1nAi)Pr(i=1n1Ai)Pr(i=1n1Ai)Pr(i=1n2Ai)Pr(A1A2)Pr(A1)Pr(A1)\Pr\left( \bigcap_{i=1}^n A_i \right) = \frac{\Pr\left(\bigcap_{i=1}^{n} A_{i}\right)}{\Pr\left(\bigcap_{i=1}^{n-1} A_{i}\right)} \cdot \frac{\Pr\left(\bigcap_{i=1}^{n-1} A_{i}\right)}{\Pr\left(\bigcap_{i=1}^{n-2} A_{i}\right)} \cdots \frac{\Pr\left(A_{1} \cap A_{2}\right)}{\Pr\left(A_{1}\right)} \cdot \Pr\left(A_{1}\right)

链式法则,又称为 General Product Rule 或 Law of Successive Conditioning。

考虑均匀随机映射 f ⁣:[n][m]f\colon [n] \to [m],有 ff 为 1-1 映射(双射)的概率

Pr[f is 1-1]=m!/(mn)!mn=i=1n(1i1m)\Pr[f \text{ is 1-1}] = \dfrac{m! / (m-n)!}{m^n} = \prod_{i=1}^n \left(1 - \dfrac{i - 1}{m}\right)

中间的式子可以这样看:一共有 mnm^n 种映射,假设 [n][n] 就按 1,,n1, \dots, n 排列,为了要双射,需从 [m][m] 中选择 nn 个元素,然后排列,即 m!/(mn)!m! / (m-n)!

最后的式子可以看成化简的结果,也可以看成链式法则的计算。即在 j<ij < i 都已经是双射的情况下,第 ii 个元素不与前面的 i1i-1 个元素重复的概率。

Balls-into-bins 模型中,有 nn 个球随机放入 mm 个盒子,每个盒子最多放一个球的概率为 ϵ\epsilon,其中 n2mln(1/ϵ)n \approx \sqrt{2 m \ln(1 / \epsilon)}

Pr[每个球入一个空盒]=i=1nPr[球 i 入空盒每个球 j<i 在空盒]=i=1n(1i1m)exp(i=1ni1m)exp(n22m)\begin{aligned} \Pr[\text{每个球入一个空盒}] &= \prod_{i=1}^n \Pr[\text{球 $i$ 入空盒} \mid \text{每个球 $j < i$ 在空盒}]\\ &= \prod_{i=1}^n \left(1 - \dfrac{i - 1}{m}\right) \\ &\approx \exp\left(-\sum_{i=1}^n \dfrac{i - 1}{m}\right) \\ &\approx \exp\left(-\dfrac{n^2}{2m}\right) \end{aligned}

全概率法则

全概率法则(Law of Total Probability)

对于任意事件 AA 和样本空间 Ω\Omega 的划分 B1,B2,,BnB_1, B_2, \cdots, B_n,有

Pr(A)=i=1nPr(ABi)=i=1nPr(ABi)Pr(Bi)\begin{aligned} \Pr(A) &= \sum_{i=1}^n \Pr(A \cap B_i) \\ &= \sum_{i=1}^n \Pr(A \mid B_i) \Pr(B_i) \end{aligned}

证明

AB1,AB2,,ABnA \cap B_1, A \cap B_2, \cdots, A \cap B_n 互不相交,同时 A=i=1n(ABi)A = \bigcup\limits_{i=1}^n (A \cap B_i)

从而有 Pr(A)=i=1nPr(ABi)\Pr(A) = \displaystyle \sum_{i=1}^n \Pr(A \cap B_i)

Pr(ABi)=Pr(ABi)Pr(Bi)\Pr(A \cap B_i) = \Pr(A \mid B_i) \Pr(B_i)

三门问题

赌徒破产(Gambler's Ruin, 一维对称随机游走):一个赌徒玩一个公平的游戏,每一步他抛一枚硬币,正面得一分,反面失一分。他以 kk 分开始游戏,会一直玩直到分数为 00(失败)或 nn(胜利)。那么他最终破产的概率是多少?

解答

记事件

  • AA:赌徒失败。
  • BB:第一枚硬币为正面。

Prk\Pr_{k} 是赌徒以 kk 分开始游戏时最终破产的概率分布,有

Prk(A)=12Prk(AB)+12Prk(ABc)=12Prk+1(A)+12Prk1(A)\begin{aligned} \Pr\nolimits_{k}(A) &= \dfrac{1}{2} \Pr\nolimits_{k}(A \mid B) + \dfrac{1}{2} \Pr\nolimits_{k}(A \mid B^c)\\ &= \dfrac{1}{2} \Pr\nolimits_{k+1}(A) + \dfrac{1}{2} \Pr\nolimits_{k-1}(A) \end{aligned}

Prk(A)={12(Prk+1(A)+Prk1(A))if 0<k<n1if k=00if k=n\Pr\nolimits_{k}(A) = \begin{cases} \dfrac{1}{2}\left(\Pr_{k+1}(A) + \Pr_{k-1}(A)\right) & \text{if } 0 < k < n\\ 1 & \text{if } k = 0\\ 0 & \text{if } k = n \end{cases}

注意到

12(Prk+1(A)Prk(A))=12(Prk(A)Prk1(A))\dfrac{1}{2}(\Pr\nolimits_{k+1}(A) - \Pr\nolimits_{k}(A)) = \dfrac{1}{2}(\Pr\nolimits_{k}(A) - \Pr\nolimits_{k-1}(A))

Prk(A)\Pr_{k}(A) 是一个等差数列,从而有 Prk(A)=1kn\Pr_{k}(A) = 1 - \dfrac{k}{n}

贝叶斯定律

贝叶斯定律(Bayes' Law)

对于任意事件 AA 和样本空间 Ω\Omega 的划分 B1,B2,,BnB_1, B_2, \cdots, B_n,有

Pr(BiA)=Pr(Bi)Pr(ABi)Pr(A)=Pr(ABi)Pr(Bi)j=1nPr(ABj)Pr(Bj)\begin{aligned} \Pr(B_i \mid A) &= \dfrac{\Pr(B_i) \Pr(A \mid B_i)}{\Pr(A)} \\ &= \dfrac{\Pr(A \mid B_i) \Pr(B_i)}{\sum\limits_{j=1}^n \Pr(A \mid B_j) \Pr(B_j)} \end{aligned}