跳到主要内容

第二章:一维随机变量及其分布

如果说第一章是在学**"算命"(算某一次运气的概率),那第二章就是教你"做大数据分析"**。

它的核心就两个字:数字化


一、核心思想:把"事情"变成"数字"

第一章我们还在纠结"硬币正面还是反面"、"下雨还是晴天"。这些是文字描述,没法做加减乘除,没法画函数图像,更没法求导积分。

随机变量(Random Variable, XX 就是一个翻译官

  • 它把"正面"翻译成 1
  • 它把"反面"翻译成 0
  • 它把"射中靶心"翻译成 10环

一旦变成了数字,数学家们最擅长的工具(微积分、函数)就可以全用上了。


二、两个阵营:数得清 vs 数不清

第二章把世界上的随机现象分成了两派。这是这一章的分类逻辑

1. 离散型(Discrete)—— 台阶式

  • 特征:结果是一个个孤立的点,像上台阶一样。能用手指头一个个数出来。
  • 例子:抛硬币的次数(1次、2次...)、生孩子的数量(1个、2个...)、电话响的次数。
  • 核心工具分布律(列表格)。
    • 比如:P(X=1)=0.3,P(X=2)=0.7P(X=1) = 0.3, P(X=2) = 0.7。就像列菜单一样清晰。

2. 连续型(Continuous)—— 滑梯式

  • 特征:结果是连绵不断的,充满整个区间。你没法数,只能去"量"。
  • 例子:身高(可能是170.0001...)、寿命、温度、灯泡使用时间。
  • 核心工具概率密度函数(画曲线)。这部分要用到积分,是挂科重灾区。

三、关键难点:三个"魔法道具"

这一章有三个概念最容易混淆,但必须搞懂,否则后面没法学。

道具 1:分布律(只给离散型用)

这就是个**"概率清单"**。

  • XX 取 1 的概率是多少?取 2 的概率是多少?
  • 所有概率加起来必须等于 1
  • 通俗理解:分蛋糕。一块块切好,告诉你每块多大。

道具 2:概率密度函数 f(x)f(x)(只给连续型用)

这是最难理解的。对于连续变量(比如身高),单点概率是 0

  • 问:你身高精确等于 175.000000... cm 的概率是多少?
  • 答:0。因为精度无限细分下去,正好踩在那个点上的可能性不存在。

f(x)f(x) 是什么?

它是**"概率的浓缩度"**(密度)。

通俗理解:你可以把它想象成地形图

  • f(x)f(x) 曲线高的地方(山峰),代表大家的身高都集中在那儿(概率大)。
  • f(x)f(x) 曲线低的地方(平地),代表那儿没几个人(概率小)。

怎么算概率? 必须算面积(积分)。你想知道身高 170-175 的概率,就是求这段曲线下的面积。

道具 3:分布函数 F(x)F(x)(大家都通用)

  • 定义:F(x)=P(Xx)F(x) = P(X \le x)
  • 含义:**"累积"**的概念。
  • 通俗理解:玩游戏时的经验条xx 从负无穷大走到正无穷大,F(x)F(x) 就把路过的概率全吃进肚子里,从 0 一直吃到 1(满级)。

四、必须要认识的几位"大明星"

教材里会列出一堆分布,不要死记硬背,要记它们的人设

离散界的明星

0-1 分布(伯努利分布)

  • 人设抛硬币
  • 只有两个结果:成功/失败。一切复杂分布的基石。

二项分布 B(n,p)B(n, p)

  • 人设做选择题
  • 你连猜 nn 道题(重复 nn 次伯努利),猜对 kk 次的概率。
P(X=k)=Cnkpk(1p)nkP(X=k) = C_n^k p^k (1-p)^{n-k}

泊松分布 P(λ)P(\lambda)

  • 人设守株待兔
  • 单位时间内,发生了 kk 次稀有事件(比如出车祸、电话打进来)的概率。
  • 特点:主要用来算倒霉事稀奇事
P(X=k)=λkeλk!P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}

连续界的明星

均匀分布 U(a,b)U(a, b)

  • 人设盲猜
  • 在一个范围内,落在哪里机会都一样。比如等公交车,车每10分钟一趟,你随机到,等1分钟和等9分钟的概率密度是一样的。
f(x)={1ba,axb0,其他f(x) = \begin{cases} \frac{1}{b-a}, & a \le x \le b \\ 0, & \text{其他} \end{cases}

指数分布 E(λ)E(\lambda)

  • 人设无记忆性(电子产品的寿命)。
  • "这个灯泡用了5年没坏,它下一秒坏掉的概率,和它刚出厂时下一秒坏掉的概率是一样的。"(它不记仇,也不积劳)。
f(x)={λeλx,x00,x<0f(x) = \begin{cases} \lambda e^{-\lambda x}, & x \ge 0 \\ 0, & x < 0 \end{cases}

正态分布 N(μ,σ2)N(\mu, \sigma^2) —— 永远的神(YYDS)

  • 人设中庸之道
  • 图像是钟形曲线(中间高,两头低)。
  • 现实世界 90% 的事情都服从它:人的智商、身高、考试成绩、误差。
f(x)=12πσe(xμ)22σ2f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}
  • μ\mu (期望):决定山峰在哪里(平均水平)。
  • σ\sigma (标准差):决定山峰是胖还是瘦(大家的差距大不大)。

五、正态分布详解(重中之重)

正态分布简直就是概率论里的**"神"**。在数学家眼里,它是上帝创造世界时留下的"指纹"。

只有两个"旋钮"控制它

  1. 位置参数 μ\mu (均值):决定钟峰在哪里
  2. 形状参数 σ\sigma (标准差):决定钟是胖还是瘦
    • σ\sigma 大:钟很扁平,大家差距大。
    • σ\sigma 小:钟很尖瘦,大家都挤在一起。

3σ 原则(The 3-Sigma Rule)

这是正态分布最实用的地方:

范围覆盖比例含义
μ±1σ\mu \pm 1\sigma68%普通大众
μ±2σ\mu \pm 2\sigma95%绝大多数人
μ±3σ\mu \pm 3\sigma99.7%超过这个范围的就是妖孽(异常值)

为什么正态分布这么重要?

回到第五章的中心极限定理 (CLT):只要一个事情的结果是由无数个微小的、独立的随机因素共同累加造成的,它最终一定服从正态分布。

  • 身高:基因、营养、睡眠、运动... \rightarrow 正态分布
  • 考试成绩:智商、努力、心态、运气... \rightarrow 正态分布
  • 测量误差:手抖、尺子热胀冷缩... \rightarrow 正态分布

六、总结

第二章其实就是**"兵器谱"**。

  1. 把现实问题数字化(设 XX)。
  2. 看看它是离散的还是连续的。
  3. 从"兵器谱"里挑一个合适的模型(比如它是做题模型,就选二项分布;它是测量误差,就选正态分布)。
  4. 套公式算概率。

这一章的精髓: 别自己瞎算,套用前辈们总结好的经典分布,能解决世间绝大多数问题。