随机过程
随机过程
一个随机过程(random/stochastic process)是一个随机变量的集合 {Xt:t∈T}。
其中 T 是一个指标集(set of indices),通常视为时间(time):
- 离散时间:T 可数,常用 N 或 Z+;
- 连续时间:T 不可数,常用 [0,∞)。
Xt 在状态空间 S 中取值:
- 离散空间:S 可数;
- 连续空间:S 不可数。
例子:
- 伯努利过程(Bernoulli process):伯努利试验 X0,X1,…,Xn∈{0,1};
- 随机树过程(Branching (Galton-Watson) process):X0=1,Xn+1=j=1∑Xnξj(n),其中 {ξj(n):n,j⩾0} 是 i.i.d. 自然数值随机变量;
- 泊松过程(Poisson process):连续时间过程 {N(t)∣t⩾0} 使得 N(t)=max{n∣X1,…,Xn⩽t},其中 {Xi} 是指数随机变量,参数 λ>0。
鞅
亏损加仓投注赌博策略也称为「鞅」(Martingale)策略。
定义
鞅
鞅是一个随机过程,其条件期望是给定过去所有信息的期望。
令 {Xn:n⩾0} 是一个随机过程,若 {Yn:n⩾0} 对任意 n 有「鞅性质」(martingale property):
E[Yn+1∣X0,X1,…,Xn]=Yn
且 E[∣Yn∣]<∞,则称序列 {Yn:n⩾0} 是一个鞅(martingale)。
根据定义,Yn 是 X0,X1,…,Xn 的函数。
鞅是一个公平的过程,因为在任意时刻 n,Yn 的期望等于 Yn−1 的期望。另有:
- 上鞅(super-martingale):E[Yn+1∣X1,…,Xn]⩽Yn
- 下鞅(sub-martingale):E[Yn+1∣X1,…,Xn]⩾Yn
{Xn:n⩾0} 定义在概率空间 (Ω,Σ,Pr) 上,有:
- (X0,X1,…,Xn) 定义了一个子 σ-代数 Σn⊆Σ;
- 也是最小的使得 (X0,…,Xn) 是 Σn 可测的 σ-代数。
- {Σn:n⩾0} 是 Σ 的一个过滤(filtration),即 Σ0⊆Σ1⊆⋯⊆Σ;
- 鞅性质可表示为 E[Yn+1∣Σn]=Yn。
随着 n 的增大,Σn 表示越来越多的已知信息。Σn 包含了从 t=0 到 t=n 的所有信息。
例子
- Doob 鞅
- 公平赌博游戏
- 公平一维随机游走(unbiased 1D random walk)
- 棣莫弗鞅
- Polya 的瓮:瓮有不同颜色的弹珠,每轮均匀随机选择一个弹珠,然后换成 k 个相同颜色的弹珠。
研究
- 鞅的测度集中(尾不等式):在什么情况下有 Pr(∣Yn−Y0∣⩾t)⩽?。
- 可选停止定理(OST, optional stopping theorem
original sound track):在什么情况下对于一个停止时 τ 有 E[Yτ]=E[Y0]。
鞅尾不等式
吾妻不等式(Azuma's inequality)
若序列 {Yn:n⩾0} 是对某个序列 {Xn:n⩾0} 的一个鞅,且对任意 n⩾1 有
∣Yn−Yn−1∣⩽cn
则对任意 n⩾1 与 t>0 有
Pr(∣Yn−Y0∣⩾t)⩽2exp(−∑i=1nci22t2)
该不等式以日本数学家「吾妻一兴」(Azuma Kazuoki)命名。
证明
差分 Di=Yi−Yi−1 与和 Sn=i=1∑nDi=Yn−Y0,则目标是证明
Pr(∣Sn∣⩾t)⩽2exp(−∑i=1nci22t2)
{Yn:n⩾0} 是鞅 w.r.t. {Xn:n⩾0},则有
E[Dn∣X0,…,Xn−1]=E[Yn−Yn−1∣X0,…,Xn−1]=E[Yn∣X0,…,Xn−1]−E[Yn−1∣X0,…,Xn−1]=Yn−1−Yn−1=0
由于 Di 是有界的,则
Dn=Yn−Yn−1∈[−an,bn]
其中 bn−an=cn。
霍夫丁引理有,因为 E[Dn∣X0,…,Xn−1]=0 与 Dn∈[−an,bn] 对于 bn−an=cn,则有
E[eλDn∣X0,…,Xn−1]⩽eλ2cn2/8
而
E[eλSn]=E[E[eλSn∣X0,…,Xn−1]]=E[E[eλ(Sn−1+Dn)∣X0,…,Xn−1]]=E[eλSn−1E[eλDn∣X0,…,Xn−1]]⩽E[eλSn−1eλ2cn2/8]=eλ2cn2/8E[eλSn−1]
从而得
E[eλSn]⩽exp(8λ2i=1∑nci2)
上尾
Pr(Yn−Y0⩾t)=Pr(Sn⩾t)⩽Pr(eλSn⩾eλt)⩽e−λtE[eλSn]⩽exp(−λt+8λ2i=1∑nci2)=exp(−∑i=1nci22t2)(Markov 不等式)(λ=∑i=1nci24t)
下尾(类似,不过 λ<0)
Pr(Yn−Y0⩽−t)=Pr(Sn⩽−t)⩽Pr(e−λSn⩾e−λt)⩽eλtE[e−λSn]⩽exp(λt+8λ2i=1∑nci2)=exp(−∑i=1nci22t2)(Markov 不等式)(λ=−∑i=1nci24t)
Doob 序列与吾妻不等式可得到 McDiarmid 不等式:
若随机向量 X=(X1,…,Xn) 的函数 f(X) 满足平均情况差分有界性质(average-case bounded differences property):
∣E[f(X)∣X1,…,Xi]−E[f(X∣X1,…,Xi−1)]∣⩽ci
则有对任意 t>0 有
Pr(∣f(X)−E[f(X)]∣⩾t)⩽2exp(−∑i=1nci22t2)
若 Xi∈Xi 相互独立,且 f:X1,…,Xn→R 满足有界差分性质,那么 f(X) 满足平均情况差分有界性质,从而有 McDiarmid 不等式。
随机图
图参数(graph parameter)f(G) 可以是:上色数、团数等。
边 exposure 鞅是
Yi=E[f(G)∣X1,…,Xi],1⩽i⩽(2n)
其中 X1,…,X(2n) 是以 p 为参数的 i.i.d. 伯努利随机变量,使得 Xi 是第 i 条边是否在图中的指示随机变量。
点 exposure 鞅是
Yi=E[f(G)∣X1,…,Xi],1⩽i⩽n
其中 Xi=G[{1,…,i}] 是 G 的一个从开始 i 个顶点诱导出来的子图。
上色数(chromatic number)χ(G) 是最小的颜色数去涂色 G 的顶点,使得相邻的顶点颜色不同。
任意顶点都可以指定一个新的颜色,即 ∣Yi−Yi−1∣⩽1,于是吾妻不等式有
Pr(∣χ(G)−E[χ(G)]∣⩾cn)⩽2e−2c
公平赌博游戏
若 {Yn:n⩾0} 是鞅,则
E[Yn]=E[Y0]
证明
全期望有
E[Yn]=E[E[Yn∣X0,X1,…,Xn−1]]=E[Yn−1]
停止时间
序列 {Xt:t∈N} 的停止时间(stopping time)是一个自然数值随机变量 T 使得对于任意 n⩾0,T=n 时的事件由 X0,X1,…,Xn 确定。
形式化来说,{Xt:t∈N} 定义了一个 σ-代数的过滤 Σ0⊆Σ1⊆… 使得 (X0,X1,…,Xn) 是 Σn 可测的。于是 T 是一个停止时间,若 {T=n}∈Σn 对任意 n⩾0。
即 T 是一个停止时间,若是否在 n 时停止是由 X0,X1,…,Xn 确定的。
停止的鞅
考虑鞅 {Yn:n⩾0} 与停止时间 T,停止的鞅(stopped martingale) {YnT:n⩾0} 定义为
YnT={Yn,YT,n⩽Tn>T
停止的鞅也是鞅。
证明
注意到事件 T⩾i 由 X0,…,Xi−1 唯一确定,同时有
YiT=Yi−1T+I(T⩾i)⋅(Yi−Yi−1)
于是有
E[Yi+1T∣X0,…,Xi]=E[YiT+I(T>i)⋅(Yi+1−Yi)∣X0,…,Xi]=E[YiT∣X0,…,Xi]+E[I(T>i)⋅(Yi+1−Yi)∣X0,…,Xi]=YiT+I(T>i)⋅(E[Yi+1∣X0,…,Xi]−Yi)=YiT+I(T>i)⋅(Yi−Yi)=YiT
于是 YnT 是一个鞅。
Optional Stopping Theorem (OST)
若 {Yn:n⩾0} 是鞅,T 是停止时间,则有
E[YT]=E[Y0]
当下列其一成立时:
- 有界时间:存在有限的 n 使得 T<n;
- 有界范围:T<∞ 几乎必然成立,同时存在有限的 c 使得对于任意 t⩽T 使得 ∣Yt∣⩽c;
- 有界差分:E[T]<∞,同时存在有限的 c 使得对任意 t⩾0 有 E[∣Yt+1−Yt∣∣X⩽t]<c。
一般条件(general condition),即下面所有条件成立:
- Pr(T<∞)=1;
- E[∣YT∣]<∞;
- n→∞limE[Yn⋅I[Y>n]]=0。
证明
对于第一个条件,即存在有限的 n 使得 T<n。则有 n⩽T⩽m。则有更强的等式
E[YT∣X0,…,Xn−1]=Yn
证明如下:
E[YT∣X<n]=E[E[YT∣X<m]∣X<n]=Ek∈[n,m]∑E[Yk⋅I(T=k)X<m]∣X<n=Ek∈[n,m)∑Yk⋅I(T=k)X<n+E[E[Ym⋅I(T=m)∣X<m]∣X<n]=Ek∈[n,m)∑Yk⋅I(T=k)X<n+E[E[Ym∣X<m]⋅I(T=m)∣X<n]=Ek∈[n,m)∑Yk⋅I(T=k)X<n+E[Ym−1⋅I(T=m)∣X<n]=E[Ymin{T,m−1}∣X<n]=⋯=E[Ymin{T,n}∣X<n]=E[Yn∣X<n]=Yn
对于第二个条件,Pr(T<∞)=1 且 E[maxt∣Yt∣]<∞ 对于任意 t⩽T 成立,于是
E[YT]=Y0
证明如下:
可以(不太严格地)证明
n→∞limE[Ymin{Tn}]−E[YT]=0
因此 E[YT]=n→∞limE[Ymin{T,n}]。
令 T′=min{T,n},于是有 T′∈[0,n],于是由第一个条件(有界时间的情况)可得 E[YT′]=Y0。
从而有 E[YT]=Y0。
而 n→∞limE[Ymin{Tn}]−E[YT]=0 的证明如下:
令 W=maxt∣Ymin{T,t}。根据假设有 E[∣YT∣]⩽E[W]<∞。则
E[Ymin{T,n}−E[YT]]⩽E[Ymin{T,n}−YT∣I(T⩾n)]⩽2E[W⋅I(T⩾n)]
而 Pr(T<∞)=1,E[W]<∞,于是
n→∞lim2E[W⋅I(T⩾n)]=0
从而有
n→∞limE[Ymin{T,n}−E[YT]]=0
对于第三个条件,E[T]<∞ 且存在有限的 c 使得对任意 t⩾0 有 E[∣Yt+1−Yt∣∣X⩽t]<c。加上 Pr(T<∞)=1,有
E[YT]=Y0
证明如下:
令 Zn=∣Yn−Yn−1∣,且 Z0=∣Y0∣,与 W=Z0+⋯+ZT。显然 W⩾∣YT∣。
则
E[W]=k⩾0∑E[Zk⋅I(T⩾k)]=k⩾0∑E[E[Zk⋅I(T⩾k)∣X<k]]=k⩾0∑E[I(T⩾k)⋅E[∣Yk−Yk−1∣∣X<k]]⩽k⩾0∑c⋅Pr(T⩾k)⩽c(1+E[T])<∞
一维对称随机游走
令 Yt=∑i=1tXi,其中 Xi∈{−1,1} 是 i.i.d. 均匀随机变量。令 T 表示第一个使得 Yt=−a 或 Yt=b 的时间 t。
则 {Yt:t⩾0} 是鞅,且 T 是停止时间,关于 {Xi:i⩾1}。
其满足 ∣Yt∣⩽max{a,b} 对任意 0⩽t⩽T,同时 T<∞ 几乎必然成立。于是 OST 可以应用于该过程,即 E[YT]=E[Y0]=0。
有
E[YT]=bPr(YT=b)−aPr(YT=b)=0
因此 Pr(YT=b)=a+ba。
Wald 等式
Wald's equation
若 {Xi} 是 i.i.d. 随机变量,且 μ=E[Xi]<∞,T 是关于 {Xi} 的停止时间。若 E[T]<∞,于是
E[i=1∑TXi]=μE[T]
证明
对于 t⩾1,令 Yt=∑i=1t(Xi−μ),则 Yt 是一个鞅。
注意到 E[T]<∞ 且 E[∣Yt+1−Yt∣∣X1,…,Xt]=E[∣Xt+1−μ∣]<∞,于是 OST 可以应用于该过程,即
E[YT]=E[i=1∑TXi]−μE[T]
故
E[i=1∑TXi]=μE[T]
马尔可夫链
定义
马尔可夫链(Markov chain)
一个离散时间随机过程 {X0,X1,…} 是一个马尔可夫链(Markov chain)若
Pr(Xt+1=xt+1∣Xt=xt,…,X0=x0)=Pr(Xt+1=xt+1∣Xt=xt)
即给定当前状态,未来状态的条件概率只与当前状态有关。
马尔可夫性质(无记忆性):
- 下一个状态 Xt+1 只与当前状态 Xt 有关,与如何到达 Xt 的历史 Xt−1,Xt−2,…,X0 独立;
- Xt+1 在给定 Xt 的条件下,(条件)独立于 X0,X1,…,Xt−1。
转移矩阵(Transition Matrix)
离散随机过程 X0,X1,… 是马尔可夫链,有
Pr(Xt+1=xt+1∣Xt=xt,…,X0=x0)=Pr(Xt+1=xt+1∣Xt=xt)=P(xt,xt+1)=P(t)(xt,xt+1)
这称为 Time Homogeneous(时间同质性)。
于是 P 称为转移矩阵(transition matrix),其中
P(x,y)=Pr(Xt+1=y∣Xt=x)
对任意 x,y∈S 成立,其中 S 是 X0,X1,… 取值的离散状态空间。
P 是一个(行/右)随机矩阵(stochastic matrix),有 P⩾0 与 P1=1,即每一行元素非负且和为 1。
转移矩阵「每行」代表「一个当前状态」,「每列」代表「每个下一个状态」。因此每行和为 1。
令 π(t)(x)=Pr(Xt=x) 是 Xt 的 pmf,全概率有
π(t+1)(y)=Pr(Xt+1=y)=x∈S∑Pr(Xt+1=y∣Xt=x)⋅Pr(Xt=x)=(π(t)P)y
即 π(t+1)=π(t)P:
π(0)Pπ(1)P⋯Pπ(t)Pπ(t+1)P…
从而有上面的
π(t)=π(0)Pt
稳态分布
稳态分布(Stationary Distribution)
状态空间 S 上的分布(pmf)π 称为马尔可夫链 P 的稳态分布(stationary distribution, 平稳分布),若
πP=π
π 是一个线性动态系统(linear dynamic system)的不动点(fixpoint, equilibrium)。
即 1 是 P 的一个特征值,对应的特征向量即为 π。
稳态分布一定存在,但不一定唯一,且不一定收敛。
如下图,状态 A,B 总会保持状态不变。稳态分布 π=λπA+(1−λ)πB,λ 可以是 [0,1] 中的任意值。即稳态分布不唯一。
再如下图,状态总是会从 x 转移到 y,再从 y 转移回 x,转移矩阵为 [0110]。稳态分布不收敛。
下面讨论马尔可夫链的收敛定理。
- 不可约性(irreducible):马尔可夫链是不可约的(irreducible, 可达的),若转移矩阵 P 是不可约矩阵(irreducible matrix);
- 即状态空间 S 在 P 下是强连通(strongly connected)的。
- 无周期性(aperiodic):马尔可夫链是遍历(ergodic)的,若所有状态都无周期(aperiodic),且正常返(positive recurrent)。
状态 x∈S 的周期(period)d(x) 定义为
d(x)=gcd{t⩾1∣P(t)(x,x)>0}
若 d(x)=1,则称 状态 x∈S 称为「非周期性」(aperiodic)的。若 d(x)>1,则称为「周期性」(periodic)的。
P(x,x)>0 能推出 x 是非周期性的。因为存在一步返回的情况,这时候返回时间的最大公约数是 1(实际上直接因为 P(1)∈{t⩾1∣P(t)(x,x)>0} 就能得出了)。
一个状态 x∈S 称为常返(reccurent)的,若
Pr(∃t⩾1,Xt=x∣X0=x)=1
即从 x 出发,几乎必然会回到 x。
更进一步,称为是正常返(positive recurrent)的,若
E[min{t⩾1∣Xt=x∣X0=x}]<∞
即从 x 出发,平均回到 x 的时间是有限的。
在有限状态空间 S 上,不可约可以推出任意状态都是正常返的。
马尔可夫链收敛定理(Convergence Theorem)
若马尔可夫链是不可约的(irreducible, 可达的)且无周期性(aperiodic, 遍历的)的,则存在唯一的 S 上的稳态分布 π 使得
π(x)=t→∞limPr(Xt=x∣X0=x0)
对任意 x0∈S 成立。
马尔可夫链的基本定理(Fundamental Theorem of MC)。
充分条件而非必要条件。
性质:
- Perron-Frobenius 定理
- 有限性(finitiness)⟹ 存在性(existence)
- 不可约性(irreduciblity)⟹ 唯一性(uniqueness)
- 遍历性(ergodicity)⟹ 收敛性(convergence)
证明
PageRank 是 Google 的搜索引擎排序算法。
任意一个网页 x∈S 赋以一个权重 r(x):
- 高权页有更强的影响;
- 若一个高权页指向 x,则 x 也有高权。
- 指向较少的页影响更强。
线性系统
r(x)=y→x∑d+(y)r(y)
其中 d+(y) 是 y 的出度。
解上面的方程比较复杂,可以转化为马尔可夫链的问题。
对于一个随机游走的稳态分布 rP=r,有
P(x,y)=⎩⎨⎧d+(y)1,0,x→yotherwise
时间可逆性(Time Reversibility)
马尔可夫链称为时间可逆(time reversible)或可逆(reversible),若其对于状态空间 S 上的某些分布 π,满足细致平衡条件(detailed balance condition, DBE),即
π(x)P(x,y)=π(y)P(y,x)
这样的 π 是一个更好(refined)的不动点,π 一定是一个稳态分布因为有
(πP)y=x∑π(x)P(x,y)=x∑π(y)P(y,x)=π(y)
时间可逆:假设 X0∼π,则 (X0,X1,…,Xn) 与 (Xn,…,X1,X0) 同分布。
收敛定理
有限马尔可夫链(有限状态空间 S 上):惰性(lazy, i.e. P(x,x)>0)与强连接(strongly connected)马尔可夫链 P 可以推出,其总是收敛到唯一的稳态分布 π=πP。
马尔可夫链的收敛速度
混合时间(Mixing time):令 πx(t)(y)=(1xPt)y=Pr(Xt=y∣X0=x),有
τ(ϵ)=x∈Smaxmin{t⩾1πx(t)−π1⩽2ϵ}
混合时间表示,从任意状态 x 出发,经过 τ(ϵ) 步后,分布 πx(τ(ϵ)) 与稳态分布 π 的距离不会超过 2ϵ。
其他随机过程
- 平稳过程:{Xt} 的联合分布在时间平移下不变,即 (Xt1,Xt2,…,Xtn)∼(Xt1+τ,Xt2+τ,…,Xtn+τ);
- Renewal 过程(counting processes, 计数过程):N(t)=max{n∣X1+⋯+Xn⩽t},其中 {Xi} 是 i.i.d. 非负值随机变量;
- 泊松随机过程(唯一的是 Renewal 过程的马尔可夫链)。
- Wiener 过程(Brownian motion):连续时间、连续空间 {W(t)∈R:t⩾0} 有着时间同质性(time homogeneity)与独立增量(independent increments)性质:
- W(si)−W(ti) 相互独立对于任意互不相交的区间 (si,ti] 成立;
- W(s+u)−W(s)∼N(0,u);
扩散过程(Diffusion Processes)
令 (Ω,Σ,Pr) 是一个概率空间,X:T×Ω→S 是以时间范围 T 与状态空间 S 的随机过程,其被称为扩散过程(diffusion process)若存在 A∈Σ 使得 Pr(A)=1,使得对所有 ω∈A 有
X(ω):T→S
是一个连续函数(在拓扑空间中,between topological spaces)。
Wiener 过程是一维扩散过程。
工具:伊藤微积分(Itô calculus)。