Skip to main content

第五章:大数定律与中心极限定理

如果说前四章是"修炼内功",第五章就是**"飞升成仙"**。它是概率论最辉煌、最震撼的一章。

这一章解决了一个终极哲学问题:在这个充满随机和混乱的世界里,为什么依然存在着某种铁一样的秩序?


一、大数定律 (Law of Large Numbers)

—— 别名叫"稳定":量变引起质变

它是啥意思?

你抛一次硬币,是正面还是反面?没人知道(纯随机)。

你抛一万次硬币,正面朝上的比例是多少?我很确定是 50% 左右(确定性)。

大数定律的核心:虽然单个个体的行为是随机的、不可预测的;但是只要数量足够多,群体的平均值就会死死地锁定在数学期望(理论值)附近。

Xˉn=1ni=1nXiPE(X)(n)\bar{X}_n = \frac{1}{n}\sum_{i=1}^{n} X_i \xrightarrow{P} E(X) \quad (n \to \infty)

现实中的"魔法":保险公司为什么不赔钱?

  • 对于某一个人:今天出不出车祸,是随机的。保险公司根本不知道你会不会出事。
  • 对于一百万人:保险公司极其确定,这一百万人里大概有 1% 的人会出车祸。
  • 结论:因为大数定律的存在,保险公司把"赌博"变成了"数学题"。他们只要收的保费总额覆盖掉那 1% 的赔款,就稳赚不赔。

几个著名的大数定律

定律条件特点
伯努利大数定律二项分布频率依概率收敛于概率 pp
切比雪夫大数定律方差有限最基础版本
辛钦大数定律期望存在条件最宽松

切比雪夫不等式

这是大数定律的保镖。它提供了一个数学证明,告诉你:偏离中心(期望)太远的可能性,是被严格限制住的。

P(XE(X)ε)D(X)ε2P(|X - E(X)| \ge \varepsilon) \le \frac{D(X)}{\varepsilon^2}

含义离谱的事情发生概率很小。


二、中心极限定理 (Central Limit Theorem, CLT)

—— 别名叫"归一":万法归宗

如果说大数定律告诉你"平均值会稳定",那中心极限定理就是告诉你**"它长什么样"**。

这是整个概率论里最妖孽、最不可思议的定理。

它是啥意思?

不管你原来的分布长什么样(不管是扔骰子、还是奇怪的三角形分布、梯形分布),只要你把大量独立的随机变量加起来,它们的总和(或平均值)的分布,最终都会变成正态分布(钟形曲线)

i=1nXinμnσdN(0,1)(n)\frac{\sum_{i=1}^{n} X_i - n\mu}{\sqrt{n}\sigma} \xrightarrow{d} N(0, 1) \quad (n \to \infty)

为什么说它神?

它给了我们一把万能钥匙

  • 在现实中,很多数据的分布我们是不知道的。
  • 但是,只要这个数据是由许多微小的独立因素共同影响产生的,我们就可以闭着眼睛默认它是正态分布

现实中的例子:身高的秘密

为什么全人类的身高分布是一个完美的钟形曲线(正态分布)?

因为身高不是由单一因素决定的。它是:基因 + 饮食 + 睡眠 + 运动 + 心情 + ...

中心极限定理说:只要是无数个微小因素叠加的结果,最终一定呈现正态分布。

这也解释了为什么误差通常服从正态分布,因为误差也是由无数个微小的抖动累加起来的。

两个经典的中心极限定理

定理条件适用场景
列维-林德伯格定理独立同分布通用版本
德莫佛-拉普拉斯定理二项分布B(n,p)B(n,p)nn 很大时近似正态

三、总结

第五章其实就告诉你两句话,这两句话是统计学的基石

定理核心含义
大数定律做得多了,频率就能当概率
中心极限定理加得多了,什么妖魔鬼怪最后都会变成正态分布

四、全书大结局

到这里,**《概率论》**核心部分就结束了。

章节主题一句话总结
第一章随机事件与概率学语言(事件、概率)
第二章一维随机变量数字化(把事情变成数)
第三章多维随机变量看关系(两个变量怎么玩)
第四章数字特征抓特征(期望、方差)
第五章极限定理看极限(大数定律、CLT)

接下来的扩展章节会介绍概率论在深度学习中的具体应用。