样本空间
样本空间(sample space)Ω 是一个集合,包含一次试验的所有可能结果。
每个 ω∈Ω 称为一个样本(sample)或基本事件(elementary event)。
离散概率空间
对于离散概率空间(即 Ω 有限或可数无穷):
- 概率质量函数(probability mass function, pmf)p:Ω→[0,1] 满足 ω∈Ω∑p(ω)=1;
- 事件 A⊆Ω 的概率(probability)定义为 Pr(A)=ω∈A∑p(ω)。即 Pr:2Ω→[0,1]。
样本空间与事件
事件(event)满足:
- ∅,Ω 都是事件(称为不可能事件和必然事件);
- 若 A 是事件,则 Ac 也是事件;
- 若 A1,A2,⋯ 是事件,则 ⋃iAi 也是事件。
σ-代数
Ω 的子集族 Σ⊆2Ω 称为 σ-代数(σ-algebra)或 σ-域(σ-field)满足:
- ∅∈Σ;
- A∈Σ⟹Ac∈Σ;
- A1,A2,⋯∈Σ⟹⋃iAi∈Σ。
概率空间的经典例子
- 古典概型(classic probability):离散均匀分布。对于有限样本空间 Ω,任意的结果 ω∈Ω 都有相同的概率。则对于任意事件 A⊆Ω,有 Pr(A)=∣Ω∣∣A∣。
- 几何概型(geometric probability):连续概率空间使得,对于任意事件 A∈Σ,有 Pr(A)=Vol(Ω)Vol(A)。
几何概型的例子有蒲丰投针问题(Buffon's Needle Problem),这个三年前有写过短篇笔记,方法比较粗糙,格式也比较差劲,但作为一段历史还是放在下面。
2021 年 7 月 4 日
下面是课件上的证明,记号有所不同。
记事件 A={(x,y)∈[0,π]×[0,2d]y⩽2lsinx},则
Pr(A)=Vol(Ω)Vol(A)=dπ2∫0π2lsinxdx=dπ2l
概率空间
一般而言,三元组 (Ω,Σ,Pr) 称为一个概率空间(probability space),若:
- 令 Σ⊆2Ω 为 σ-代数;
- 概率测度(probability measure),亦称概率律(probability law),是一个函数 Pr:Σ→[0,1] 满足:
- 归一性/标准化(unitary/normalized):Pr(Ω)=1;
- σ-可加性(σ-additive):若 A1,A2,⋯∈Σ 两两互斥(disjoint),则 Pr(⋃iAi)=∑iPr(Ai)。
可从上面的概率空间公理推导出以下性质:
- Pr(∅)=0(Pr(A)>0⟹A=∅);
- Pr(Ac)=1−Pr(A);
- Pr(A\B)=Pr(A)−Pr(A∩B);
- A⊆B⟹Pr(A)⩽Pr(B);
- Pr(A∪B)=Pr(A)+Pr(B)−Pr(A∩B)。
仅从上面的叙述似乎感觉不到这个定义的意义所在,下面通过两个例子阐释一下我的理解。
- 「任意一个自然数是偶数的概率为 21」
- 「[0,1] 中随机抽取一个实数是有理数的概率为 0」
解释
第一个是错误的,甚至是 not even wrong 的。因为无法定义这样的「均匀分布」。
若是要均匀分布,为其中每一个自然数分配一个概率 p,那么我们有
n=1∑∞p=1
这显然是不可能的。因此,我们无法定义一个均匀分布在自然数上的概率测度。
第二个是正确的。一开始我还有疑问,为什么这个就不会出现像上面那样,每个数概率为 0,但是和为 1 的无良定义的情况呢?于是我去问了 ChatGPT 得到了满意的答案,下面就是我的理解了:
原因就是上面的概率测度。面对不可数集时,常常使用连续概率分布,这时的概率并不是像之前的例子一样是离散的,在这种情况下,概率分布不是通过单个点的概率来处理,而是通过区间的长度来计算。因此「均匀分布」是有合理的定义在的。
存在不可数的 [0,1] 的子集,使得其概率为 0。答案是康托尔集。
并集界
并集界(Union bound, 布尔不等式)
对任意事件 A1,A2,⋯,An∈Σ,有
Pr(i=1⋃nAi)⩽i=1∑nPr(Ai)
Balls into bins 问题
将 n 个球随机扔到 n 个盒中,k 是盒中球最多的个数,则 k 高概率是 O(lnlnnlnn)。
证明
记
- 事件 A:存在盒接受到不少于 k 个球(k 是待定常数)
- 事件 Ai:盒-i 接受到不少于 k 个球
并集界有
Pr(A)=Pr(i=1⋃nAi)⩽i=1∑nPr(Ai)⩽n1
因为此时有 Pr(Ac)⩾1−n1,即具有最多球的盒中球的个数不超过 k 的概率至少为 1−n1,符合题意。
对于任意 S∈(k[n]),记事件 Ai,S 为盒-i 接受到所有 S 中的球。并集界有
Pr(Ai)=PrS∈(k[n])⋃Ai,S⩽S∈(k[n])∑Pr(Ai,S)=(kn)nk1⩽(ken)knk1⩽(ke)k⩽n21
可取 k=3lnlnnlnn 以实现彩色部分成立。
从而有 i=1∑nPr(Ai)⩽n1。
容斥原理
容斥原理(Principle of Inclusion-Exclusion)
对任意事件 A1,A2,⋯,An∈Σ,有
Pr(i=1⋃nAi)=i=1∑nPr(Ai)−i<j∑Pr(Ai∩Aj)+i<j<k∑Pr(Ai∩Aj∩Ak)−=∅=S⊆[n]∑(−1)∣S∣−1Pr(i∈S⋂Ai)
证明
两个事件的情况成立,即
Pr(A1∪A2)=Pr(A1)+Pr(A2)−Pr(A1∩A2)
采用数学归纳法,假设对于 n 个事件 A1,A2,…,An,有
Pr(i=1⋃nAi)=∅=S⊆[n]∑(−1)∣S∣−1Pr(i∈S⋂Ai)
则对于 n+1 个事件 A1,A2,…,An,An+1 有
Pr(i=1⋃n+1Ai)=Pr(i=1⋃nAi∪An+1)=Pr(i=1⋃nAi)+Pr(An+1)−Pr(i=1⋃nAi∩An+1)=∅=S⊆[n]∑(−1)∣S∣−1Pr(i∈S⋂Ai)+Pr(An+1)−Pr(i=1⋃n(Ai∩An+1))=∅=S⊆[n]∑(−1)∣S∣−1Pr(i∈S⋂Ai)+S⊆[n]∑(−1)∣S∣Pr(i∈S⋂Ai∩An+1)=∅=S⊆[n]∑(−1)∣S∣−1Pr(i∈S⋂Ai)+{n+1}⊆S′⊆[n+1]∑(−1)∣S′∣−1Pr(i∈S′⋂Ai)=∅=S⊆[n+1]∑(−1)∣S∣−1Pr(i∈S⋂Ai)
由布尔不等式可得事件并集的上下界。
布尔-邦费罗尼不等式(Boole-Bonferroni inequality)
对任意事件 A1,A2,⋯,An∈Σ 与任意 k>0,有
S⊆[n]1⩽∣S∣⩽2k∑(−1)∣S∣−1Pr(i∈S⋂Ai)⩽Pr(i=1⋃nAi)⩽S⊆[n]1⩽∣S∣⩽2k+1∑(−1)∣S∣−1Pr(i∈S⋂Ai)
Kounias 不等式
i=1∑nPr(Ai)−1⩽i<j⩽n∑Pr(Ai∩Aj)⩽Pr(i=1⋃nAi)⩽i=1∑nPr(Ai)−i=2∑nPr(A1∩Ai)
证明
先证明 n=2 时的情形,即
Pr(A1)+Pr(A2)−Pr(A1∩A2)⩽Pr(A1∪A2)⩽Pr(A1)+Pr(A2)−Pr(A1∩A2)
显然成立,而且是恒为等号。
采用数学归纳法,假设对于 n 个事件 A1,A2,…,An,有
i=1∑nPr(Ai)−1⩽i<j⩽n∑Pr(Ai∩Aj)⩽Pr(i=1⋃nAi)⩽i=1∑nPr(Ai)−i=2∑nPr(A1∩Ai)
现在考虑 n+1 个事件 A1,A2,…,An,An+1。分别证明两个不等式,先证明左边的不等式,即
i=1∑n+1Pr(Ai)−1⩽i<j⩽n+1∑Pr(Ai∩Aj)=i=1∑nPr(Ai)+Pr(An+1)−1⩽i<j⩽n∑Pr(Ai∩Aj)−i=1∑nPr(Ai∩An+1)⩽Pr(i=1⋃nAi)+Pr(An+1)−i=1∑nPr(Ai∩An+1)⩽Pr(i=1⋃nAi)+Pr(An+1)−Pr(i=1⋃nAi∩An+1)=Pr(i=1⋃n+1Ai)
再证明右边的不等式,即
Pr(i=1⋃n+1Ai)=Pr(i=1⋃nAi)+Pr(An+1)−Pr(i=1⋃nAi∩An+1)⩽i=1∑n+1Pr(Ai)−i=2∑nPr(A1∩Ai)−Pr(i=1⋃nAi∩An+1)⩽i=1∑n+1Pr(Ai)−i=2∑nPr(A1∩Ai)−Pr(A1∩An+1)=i=1∑n+1Pr(Ai)−i=2∑n+1Pr(A1∩Ai)
错排问题(Derangement)
随机排列 π:[n]1-1 onto[n] 不存在不动点的概率。
解答
令 Ai 是 π(i)=i 的事件,有
Pr(i=1⋃nAi)=k=1∑nS∈(k[n])∑(−1)k−1Pr(i∈S⋂Ai)=k=1∑nS∈(k[n])∑(−1)k−1n!(n−∣S∣)!=k=1∑n(kn)(−1)k−1n!(n−k)!=−k=1∑nk!(−1)k
则
Pr[π 没有不动点]=Pr(i=1⋂nAic)=1−Pr(i=1⋃nAi)=1+k=1∑nk!(−1)k=k=0∑nk!(−1)k→e1(n→∞)
概率测度的连续性(continuity of probability measures)*
记 A1⊆A2⊆⋯ 是一个递增的事件序列,并记 A 是它们的极限
A=i=1⋃∞Ai=n→∞limAn
于是
Pr(A)=n→∞limPr(An)
证明
将 A 表示为不相交的并集
A=A1⊎(A2\A1)⊎(A3\A2)⊎⋯
于是
Pr(A)=Pr(A1)+i=1∑∞Pr(Ai+1\Ai)=Pr(A1)+n→∞limi=1∑n−1[Pr(Ai+1−Pr(Ai))]=n→∞limPr(An)
类似地,记 B1⊇B2⊇⋯ 是一个递减的事件序列,并记 B 是它们的极限
B=i=1⋂∞Bi=n→∞limBn
于是
Pr(B)=n→∞limPr(Bn)
证明
考虑它们的补集 Bnc,有 B1c⊆B2c⊆⋯,于是这是一个递增的事件序列,根据上面的结论得证。
几乎从不和几乎必然事件*
- 一个事件 A∈Σ 称为 null(几乎从不),若 Pr(A)=0;
- null 事件并不一定是 impossible(不可能) 事件 ∅
- 一个事件 A∈Σ almost sure(a.s., 几乎必然) 发生,若 Pr(A)=1;
- 一个事件 a.s. 发生,并不一定是 certain(必然) 事件 Ω
- 一个概率空间称为 complete,若 Σ 包含 null 事件集的所有子集。
- 不失一般性,我们仅考虑 complete 概率空间(因为若考虑 incomplete 的,可以将其 complete 而不改变其概率)