The Bounded Difference Method

在上一篇的笔记，我们分别讲到了Martingales中的Doob sequence和Azuma's inequality,如果把这两个工具放到一起，会发生什么呢？如果把这两个工具组合起来，我们就能够得到一个称为"the method of averaged bounded differences"的定理.

Theorem:Method of averaged bounded differences

令表示任意的随机变量序列，令表示关于的函数，并且对于所有的满足:

$ \big\vert E[f(\mathbf{X})\vert X_1,\cdots,X_i] - E[f(\mathbf{X})\vert X_1,\cdots,X_{i-1}]\big\vert \le c_i $

则

证明:

证明过程非常简单，需要定义为一个Doob Martingale，然后直接套用Azuma's inequality就行了。

但是，在实际情况中，上述定理的条件是很难验证的，这就大大影响了该定理的使用。因此，这里我们将会介绍另外一个比较好验证的条件，称为Lipschitz condition.其描述如下:

Lipschitz condition

一个函数对于任意的和满足:

则称其满足Lipschitz condition.

当随机变量序列满足Lipschitz condition时，有如下的定理(注意:该定理的条件中，随机变量必须是独立的!)

Theorem(Method of bounded differnces)

令表示个独立的随机变量，令表示一个满足Lipschitz condition的函数，则:

Method of bounded differnces可以理解成这样的组合:

独立性条件 Lipschitz condition 集中在它的期望附近。

它最大一个优势就是不需要知道具体的函数是什么形式的，就能得出其概率集中的结论。

Applications

小球问题

假设我们现在有个小球要以独立且均匀的分布投入到个箱子中，我们需要考察小球投掷完成之后，还剩多少个空箱子？根据我们之前期望的线性可加性，我们能比较简单的计算其期望值:

令表示第个箱子是否为空，表示箱子为空;否则为.则表示一共有多少空个箱子,则:

虽然我们求出了空箱子数目的期望，但是这还不够，我们希望能够得到更加精确的信息来描述随机变量.此时，我们就可以使用method of bounded differnces.

method of bounded differnces有两个条件:1. 独立 2. Lipschitz condition

而此时的显然是不独立的，因此我们需要重新假设我们的随机变量。令表示第个球落入到箱子的编号，则可以看成是的函数，即:

此时的是独立的。

而一个球的投掷，最多只能让一个箱子变得非空，每一次只改变一个变量，引起的变化最多为，即满足Lipschitz condition.因此，我们直接使用method of bounded differnces:

因此，对于小球投掷问题来说，空箱子的数目主要集中在附近。

模式匹配问题

令均匀且独立地从字符表中选取的字符序列，其中。令是任意一个固定长度的字符串。我们想要考察在中出现的次数。

令表示一共在中出现的次数, 表示是的起始位置，否则.其中，.则:

且，所以.

同样的，我们还需要知道是否有概率集中现象。我们可以将看成是的函数，且是独立的.

而又因为，的长度是，因此其中一个字符改变时，带来的变化最多为，因此满足Lipschitz condition.所以，直接使用method of bounded differnces:

参考资料

Flyaway is the owner of this blog.

随机算法学习笔记7-Concentraion of Measure

The Bounded Difference Method

Applications

小球问题

模式匹配问题

参考资料

Published

Category

Tags

Contact