Skip to main content

尾概率不等式及其应用

Merkov 不等式

XX 为样本空间 Ω\Omega 上的非负随机变量,对任意一个正实数 aa,都有:

其中 E(x)E(x) 为随机变量 XX 的期望。

P(Xa)E(X)aP(X \geq a) \leq \frac{E(X)}{a}

Chebyshev 不等式

其中 E(x)E(x)Var(X)Var(X) 分别为随机变量 XX 的期望和方差。

XX 为样本空间 Ω\Omega 上的随机变量,对任意一个正实数 rr,都有:

P(XE(X)r)Var(X)r2P(|X - E(X)| \geq r) \leq \frac{Var(X)}{r^2}

Chernoff 不等式

XiX_i 为定义在样本空间 Ω\Omega 上的 nn 个独立伯努利随机变量,且 P(Xi=1)=piP(X_i = 1) = p_i。令 X=i=1nXiX = \sum_{i=1}^{n} X_iμ=i=1npi\mu = \sum_{i=1}^n p_i,对任意小的 δ(0,1)\delta \in (0, 1),则拥有两个结论:

  • 结论 1
P(X<(1δ)μ)<exp(μδ22)P(X < (1 - \delta) \mu) < exp(\frac{-\mu\delta^2}{2})
  • 结论 2
P(X>(1+δ)μ)<exp(μδ24)P(X > (1 + \delta) \mu) < exp(\frac{-\mu\delta^2}{4})

Morris 与 Tug of War

Morris 算法

目的:当整数 nn 非常大时,用更少的空间来近似表示整数 nn

算法流程:

  1. 更新操作:事件发生时,以 12X\frac{1}{2^X} 的概率更新 XX 的值为 X+1X + 1,以 112X1 - \frac{1}{2^X} 的概率保持 XX 不变。
  2. 返回近似值 CCC=2X1C = 2^X - 1

缺陷:近似值的方差以二次多项式的形式在增加。

Morris+ 算法

优化点:通过多次取 Morris 算法的平均值可以获得波动更小的无偏估计。(可用 Chebyshev 不等式分析)

Morris+ 算法对事件的计数讲维护 nn 个 Morris 计数器,返回的近似值是这 nn 个计数的平均值。

Morris++ 算法

通过多次取 Morris+ 算法的中位数可以获得波动更小的无偏估计。(可用 Chernoff 不等式分析)

Morris+ 算法运行 n=O(1δϵ2)n = O(\frac{1}{\delta \epsilon^2}) 次 Morris 算法,取 nn 次输出平均值可用得到一个较好的近似估计。

优化点:Morris++ 算法只需要运行 n=O(ln(1/δ)ϵ2)n = O(\frac{ ln(1 / \delta)}{\epsilon^2}) 次 Morris 算法,就可以得到相同的精度。

Tug of War(拔河算法)

综合运用 Chebyshev 不等式和 Chernoff 不等式得到一个相对紧的概率上界的方法称为 Tug of War 技术。

tug-of-war.png