Continoal Expectation

条件期望是指,在给定条件的情况下,随机变量的期望值.条件期望可以表示成:

E[Y|X=a]

我们可以将条件期望看成是关于X的随即变量f(X)

假设X,Y,Z是三个任意的随机变量,f,g是任意的函数,则对于条件期望有如下的结论:

  1. E[X]=E[E[X|Y]].
  2. E[X|Z]=E[E[X|Y,Z]|Z]
  3. E[E[f(X)g(X,Y)|X]]=E[f(X)E[g(X,Y)|X]](条件于X,因此可以将f(X)看成是一个常数,根据期望的线性可加性,就能够把f(X)提出来了)

Martingales

Martingales描述的是一系列的随机变量,该序列的当前的随机变量依赖之前所有的历史随机变量1,如果当前的随机变量的期望不发生变化,则这整个随机过程就被称为是Martingales.

定义: Martingale

一个随机变量序列X0,,Xi1是一个Martingale当且仅当对于所有的i>0,都有:

E[Xi|X0,,Xi1]=Xi1

举例

假设我们投掷一个均匀的硬币,令Zj{1,1}表示第j次投掷的结果,令X0=0Xi=jiZj,则随机变量X0,X1,定义了一个Martingale.

证明:

E[Xi|X0,,Xi1]=E[Xi|Xi1]=E[Xi1+Zi|Xi1]=E[Xi1|Xi]+E[Zi|Xi1]=Xi1+E[Zi|Xi1]=Xi1+E[Zi]=Xi1

Generalizations

Martingale还有更加一般化的定义,它不再只是一个只关于自己的随机序列,而是关于另外一个随机序列。

定义 Generalized Martingale

一个随机变量序列Z0,Z1,是一个关于X0,X1,的Martingale,当且仅当对于任意的i>0,满足下述三个条件:

  1. ZiX0,X1,,Xi的函数
  2. E[|Zi|]=
  3. E[Zi+1|X0,X1,,Xi]=Zi

因此,如果一个随机变量序列X0,X1,是关于自己的Martingale,那么它自身就是一个Martingale.

Azuma's Inequality

关于Martingale有一个比较重要的不等式,称为Azuma's inequality,描述如下:

Azuma's inequality

假设X0,X1,是一个Martingale,且对于所有的k>1,都有:

|XkXk1|ck

Pr[|XnX0|t]2exp(t22nk=1c2k).

需要注意的是,在这个不等式中,是没有独立性要求的。

其中|XkXk1|ck的条件是整个不等式的核心,称为bounded difference condition.

该不等式描述的是,如果将X0,X1,看成是随时间变换的状态的话,那么如果每一步的状态转换都没有出现大的跳跃,那么该不等式就保证整个过程一直处于其初始点附近。

其中有一种特殊情况,当ck=c的时候,不等式可以写成:

假设X0,X1,是一个Martingale,且对于所有的k>1,都有:

|XkXk1|c

Pr[|XnX0|ctn]2et22

还有一般化的Azuma's Inequality:

Azuma's inequality(general version)

假设Y0,Y1,是关于X0,X1,的一个Martingale,且对于所有的k>1,都有:

|YkYk1|ck

Pr[|YnY0|t]2exp(t22nk=1c2k).

证明

Azuma's Inequality的证明过程和笔记5中证明Chernoff Bound的方法类似,先在Moment Generating Function 上使用Markov不等式,然后确定这个Moment Generating Function的上界,最终选取合适的参数。

在正式开始证明之前,我们先要证明一个引理:

引理

X为一个随机变量满足E[X]=0|X|c,则对于任何的λ>0,有:

E[eλX]eλ2c22

证明:

通过观察,我们可以看到函数eλX在定义域[c,c]上是一个凸函数,所以如果我们在点(c,eλc)(c,eλc)画一条直线,则eλX的曲线必然在直线的下方。也即:

eλXeλc+eλc2+X2c(eλceλc)

因为E[X]=0,因此:

E[eλX]E[eλc+eλc2+X2c(eλceλc)]=eλc+eλc2+eλceλc2cE[X]=eλc+eλc2eλ2c22

上式中的最后一个不等式是根据泰勒展开式得到的。

现在开始正式证明Azuma's Inequality2:

偏移之和

Yi=XiXi1,则:

E[Yi|X0,,Xi1]=E[XiXi1|X0,,Xi1]=E[Xi|X0,,Xi1]E[Xi1|X0,,Xi1]=Xi1Xi1=0

Zn=ni=1Yi,则

Zn=(X1X0)+(X2X1)++(XnXn1)=XnX0

现在我们就需要找出Zn的上界。

应用Markov不等式

Pr[Znt]=Pr[eλZneλt]E[eλZn]eλt

接下去就要寻找E[eλZn]的上界。

E[eλZn]=E[E[eλZn|X0,,Xn1]]=E[E[eλ(Zn1+Yn)|X0,,Xn1]]=E[E[eλZn1eλYn|X0,,Xn1]]=E[eλZn1E[eλYn|X0,,Xn1]]

又因为

E[Yn|X0,,Xn1]=0

|Yn|=|(XnXn1)|cn

,所以直接套用之前证明的引理:

E[eλYn|X0,,Xn1]eλ2c2n2

将其代回到E[eλZn]中:

E[eλZn]=E[eλZn1E[eλYn|X0,,Xn1]]E[eλZn1eλ2c2n2]=eλ2c2n2E[eλZn1]

将其递归展开:

E[eλ]nk=1eλ2c2n2=(λ2nk=1c2k2)

代回到Markov不等式中:

Pr[Znt]=E[eλZn]eλtexp(λ2nk=1c2k2λt)

选取合适的λ

λ=tnk=1c2k,则

exp(λ2nk=1c2k2λt)=exp(t22nk=1c2k)

所以:

Pr[XnX0t]=Pr[Znt]exp(λ2nk=1c2k2λt)=(t22nk=1c2k)

The Doob martingales

在Martingale中,有一类的Martingale比较重要,称为Doob Martingale.

首先,我们先定义Doob Sequence,其定义如下:

定义: Doob Sequence

函数f关于随机变量X1,X2,的Doob Sequence定义如下:

Yi=E[f(X1,,Xn)|X1,,Xi],0in

特别地,Y0=E[f(X1,,Xn)]Yn=f(X1,,Xn)

一个函数的Doob Sequence定义了一个Martingale,也就是说:

E[Yi|X1,,Xi1]=Yi1

证明:

E[Yi|X1,,Xi1]=E[E[f(X1,,Xn)|X1,,Xi]|X1,,Xi1]=E[f(X1,,Xn)|X1,,Xi1]=Yi1

Doob Martingale是一个估计函数值的随机过程,对于关于随机变量X1,,Xn的函数f(X1,,Xn)Y0,Y1,,Yn表示对函数值的一个估计,Yi表示,当已知X1,,Xi时,函数值f(X1,,Xn)的期望, 即Yi=E[f(X1,,Xn)|X1,,Xi].因此,Y0表示在X1,,Xn全都未知的情况下,f(X1,,Xn)的期望,即Y0=E[f(X1,,Xn)];而Yn表示在X1,,Xn全部已知的情况下,f(X1,,Xn)的期望,也就是其在自身的函数值,也即Yn=f(X1,,Xn).

举例

Edge Exposure Martingale

G表示一个有n个点的随机图,f为一个这个随机图的一个函数,这个函数可以是随机图的任意的性质,比如染色数、包含三角的数目等等。令e1,e2,,em,m=(n2)表示图中所有可能出现的边,令:

Xi={1ifeiG0otherwise

定义Yi=E[f(G)|X1,X2,,Xi],则Y0,Y1,,Yn形成了一个Doob Martingale,通常称为edge exposure martingale.

Vertex Exposure Martingale

在edge exposure martingale中我们是不断暴露出边,其实我们也可以不断暴露点,假设随机图的点集为[n],则令Xi表示由点集[i]组成的子图.令Yi=E[f(G)|X1,,Xi].则Y0,Y1,,Yn也定义了一个Doob Martingale,通常称为vertex exposure martingale.

Chromatic number

定理

GG(n,p),且χ(G)表示图G的染色数,则

Pr[|χ(G)E[χ(G)]|tn]2et22

证明:

考虑图G的vertex exposure martingale,Yi=E[χ(G)|X1,,Xi].

可以想像,每当我们暴露出一个点的时候,我们总可以用一种新的颜色去染色,也就是说它满足bounded difference condition

|YiYi1|1

因此,我们对Y0,,Yn直接套用Azuma's Inequality,就得到了上述的结论。

Hoeffding's Inequality

Hoeffding's Inequality

X=ni=1Xi,其中X1,,Xn是独立的随机变量,且aiXibi,对于所有的1in,令μ=E[X],则:

{% math %}Pr[\vert X-\mu \vert\ge t]\le 2exp\bigg( -\frac{2}{2\sum\limits_{i=1}^n(b_i-a_i)^2} \bigg){% endmath %}

证明:

定义Doob Sequence:Yi=E[nj=1Xj|X1,,Xi],很明显我们有Y0=μYn=X.

同时,|YiYi1|biai,所以,使用一般化的Azuma's Inequality,就能得到上述结论。

Stoppinng Times

在Martingale中,还有另外一种问题,称为Stoppinng Times,比如在赌博的时候,令Zi表示玩家在第i局之后的赢钱数,很显然Z1,Z2,形成了一个Martingale,如果玩家决定在第k3局之后就退出赌局,那么这个玩家期望的赢钱数是多少?

首先介绍一个引理:

引理

假设Z0,Z1,,Zn是关于X0,X1,,Xn的一个Martingale,则

E[Zn]=E[Z0]

证明:

根据Martingale的定义,我们有:

E[Zi+1|X0,,Xi]=Zi

两边同时取期望,得到:

E[E[Zi+1|X0,,Xn]]=E[Zi+1]=E[Zi]

不断重复上述过程,就能够得到:

E[Zn]=E[Z0]

有了上述的引理,我们就能说,如果在赌局开始之前就确定玩的轮数的话,那么期望的盈利就是0.

当然,一般在真实的场景中,情况要复杂得多,比如停止轮数是由当前的盈利状况来决定的。为了分析这种情况,我们需要引入Stoppinng Time的定义:

Stoppinng Time

{Zn,n0}为一个随机变量序列,T为一个非负的整数随机变量,如果事件T=n只依赖于Z0,Z1,,Zn,则T就是{Zn,n0}的一个Stoppinng Time.

结合上面关于Martingale的引理,如果赌局是公平的话,那么E[XT]=E[X0]=0一直成立。但是,如果Stoppinng Time T定义成第一次Zi>B,其中B是一个固定的常量,则此时期望的盈利应该是大于0的,然而此时的Stoppinng Time未必是有限的。

Martingale Stoppinng Theorem

如果Z0,Z1,是关于X0,X1,的Martingale,且TX1,X2,的一个Stoppinng Time,则:

当如下三个条件中的任意一个满足时:

  1. Zi是有界的,即存在一个常数c,使得对任意的i,都有|Zi|c

  2. T是有界的

  3. E[T]<且存在一个常数c使得E[|Zi+1Zi||X1,,Xi]<c

等式

E[ZT]=E[Z0]

成立

举例

考虑一个独立且公平的赌局,在每一轮的赌局中,玩家分别以12的概率赢得1元或输掉1元.令Xi表示第i轮所赢的数目,Zi表示第i轮之后一共赢得的数目,其中Z0=0,假设玩家第一次输掉l1元或赢得l2元时退出赌局,那么请问玩家在输掉l1元之前赢得l2元的概率是多少?4

分析:

T表示玩家第一次输掉l1元或赢得l2元时的轮数,则TX1,X2,的一个Stoppinng Time.而Z0,Z1,则是个Martingale.因为Zi是有界的,因此满足Martingale Stoppinng Theorem的条件,因此我们有:

E[ZT]=E[Z0]=0

q表示赢得l2元的概率,则:

E[ZT]=l2ql1(1q)=0

我们可以得到:

q=l1l1+l2

Wald's Equation

我们可以看到,在上述的Martingale Stoppinng Theorem中并没有要求随机变量必须是独立的,这体现出了Martingale的强大力量,但是如果随机变量是独立的,会发生什么呢?对于独立的随机变量的序列,我们有如下的定理:

Theorem: Wald's Equation

X1,X2,是非负,独立同分布的随机变量序列,且这些随机变量都服从分布X.令T表示这个序列的一个Stoppinng Time。如果TX的期望都是有界的,则:

E[Ti=1X]=E[T]E[X]

证明:

对于i1,令Zi=ij=1(XjE[X]),则

E[Zi+1|X1,X2,,Xi]=E[ij=1(XjE[X])+Xi+1E[X]|X1,X2,,Xi]=E[ij=1(XjE[X])|X1,X2,,Xi]+E[Xi+1E[X]|X1,X2,,Xi]=ij=1(XjE[X])+E[Xi+1E[X]]=ij=1(XjE[X])=Zi

所以,Z1,Z2,形成了一个关于X1,X2,的Martingale.又因为E[T]<且:

E[|Zi+1Zi||X1,,Xi]=E[|Xi+1E[X]|]2E[X].

因此,我们可以使用Martingale Stoppinng Theorem:

E[ZT]=E[Z1]=0

因为,我们可以做如下计算:

E[ZT]=E[Tj=1(XjE[X])]=E[(Tj=1Xj)TE[X]]=E[Tj=1Xj]E[T]E[X]=0

即得到:

E[Tj=1]=E[T]E[X]

关于独立随机变量序列,还有另外一种Stoppinng Time的定义:

定义:

Z0,Z1,,Zn是一个独立的随机变量序列,T是一个非负的,整数随机变量,如果事件T=n独立于

Zn+1,Zn+2,
,则T是当前序列的一个Stoppinng Time

举例

假设一个玩家参加一个赌局,他首先抛掷一个标准的骰子,得到的点数为X,则第二次他同时抛掷X个标准的骰子,假设这X个骰子所有点数之和为Z,问Z的期望是多少?

分析:

对于1iX,令Yi表示第i个骰子得到的点数,则E[Z]=E[Xi=1Yi],根据上述的定义,X是一个Stoppinng Time,因此根据Wald's Equation,我们得到:

E[Z]=E[X]E[Yi]=(72)=492

总结

本片文章主要介绍了有关Martingale的有关内容,首先从条件期望开始,引出了Martingales的定义,Martingales是一个比较有用工具,主要用来分析一个随机变量的序列.Martingales的一个优势就是,它不要求独立性,这就比较强大了。

Martingales的定义之后,我们介绍Azuma's inequality,这里比较重要的是bounded difference condition,它保证了Martingales的序列不会离开初始状态太"远".

接着说明了一类特殊的Martingales——Doob Martingale,它描述了当序列中的随机变量逐渐被确定时,其函数值期望的变化过程。

最后介绍了Martingales中的Stoppinng Time相关的内容,描述了序列停止时的性质。

参考资料


  1. 有点类似于Markov过程,只是依赖于之前所有的状态。 

  2. 这里只证明原始的Azuma's Inequality,一般化的证明过程基本类似. 

  3. 此处的k在赌局开始之前就已经确定了。 

  4. 《Probability and Computing》这本书的12.2.1节有一个更加复杂的例子,这里只举一个比较简单的例子。 

Share on: TwitterFacebookEmail


Flyaway is the owner of this blog.

Reading Time

~3 min read

Published

Category

randomized-algorithm

Tags

Contact