第三章:多 维随机变量及其分布
如果说第二章是研究**"单身狗"(只看一个变量 ),那第三章就是研究"谈恋爱"**(同时看 和 两个变量,甚至更多)。
为什么要学这一章?因为现实世界里,事情往往不是孤立的:
- 只有身高()不够,还得看 体重(),这才能判断身材好不好。
- 只有期中成绩()不够,还得看期末成绩(),这才能决定会不会挂科。
这一章的核心精髓,就是搞清楚 和 到底是什么关系。
一、联合分布(Joint Distribution)
—— "上帝视角"的全景图
这是第三章的起点。我们不能只看 ,也不能只看 ,我们要看 这个整体。
离散型(填表格)
就是一个二维表格(棋盘)。比如: 是"学历", 是"工资"。格子 里填一个概率。
所有格子里的概率加起来必须等于 1。
连续型(堆山头)
第二章的概率密度 是一条线。第三章的联合概率密度 就变成了一个曲面(像一座山)。
- 地基是 平面。
- 山的高度代表概率的密度(这一块发生的可能性大小)。
- 要算概率?就是算这座山下方的体积(二重积分)。
二、边缘分布(Marginal Distribution)
— — "把另一半拍扁"
这是最容易晕的概念。边缘分布的意思是:虽然我有 的联合数据,但我现在只关心 ,我想假装 不存在。
怎么做?
- 离散型:把表格里每一行的数字加起来。(不管 取多少,把 时的所有可能性累加)
- 连续型:把"山"往墙上投影(积分)。
直观理解
你有一张全班同学"身高()"和"体重()"的散点图。
- 联合分布:看散点图本身。
- 边缘分布:把所有点垂直压扁到 轴上,不再看高低(体重),只看左右(身高)的分布。
三、条件分布(Conditional Distribution)
—— "切片看"
这是第一章"条件概率"的升级版。意思是:如果我已经固定了 (比如 ),那么 的分布长什么样?
操作方法
拿一把刀,沿着 这个位置,把那座"概率山"切一刀。切出来的那个截面,归一化修整一下,就是条件分布。
直观例子
- 联合分布:全人类的身高体重分布。
- 条件分布:我只要看体重=200斤( 固定)的那群人,他们的身高()分布。
四、独立性(Independence)
—— "我们不熟"
这是考试必考的判断题。我们要判断 和 是不是形同陌路。
定义的灵魂
如果 对所有点都成立。
即:联合分布 = 边缘分布 × 边缘分布。
通俗理解
- 不独立(相关):身高的分布和体重的分布是有纠缠的。你知道了身高,大致能猜出体重范围。
- 独立: 是"今天的气温", 是"抛硬币的结果"。气温怎么变,完全不影响硬币正反面的概率。
五、两个随机变量的函数(Z = X + Y)
—— "合体技"
这是第三章计算最痛苦的地方,通常叫**"卷积公式"**。
场景
我知道了 的分布,也知道了 的分布。现在我想求 的分布。
比如: 是你上午赚的钱, 是下午赚的钱,求总收入 的概率分布。
卷积公式
不要背公式,要理解它的物理意义:
- 我们要凑出和为 。
- 如果 取了 ,那么 必须取 。
- 把所有这种可能的组合(积分)加起来,就是 取 的概率。
重要结论:正态分布的生殖隔离
如果 ,,且它俩独立。
那么:
正态分布生的孩子还是正态分布!
六、常见的二维分布
二维均匀分布
在一个平面区域 内均匀分布:
其中 是区域 的面积。
二维正态分布
这是最重要的二维分布,公式很复杂,但关键要记住:
- 由 5 个参数决定:
- 其中 是相关系数
- 二维正态分布的边缘分布仍是正态分布
七、总结
第三章其实就是教你怎么处理**"关系"**。
| 概念 | 作用 |
|---|---|
| 联合分布 | 看整体关系 |
| 边缘分布 | 忽略关系,只看单方 |
| 条件分布 | 固 定一方,看另一方 |
| 独立性 | 判断有没有关系 |
| 卷积 | 两个关系叠加后的新结果 |
难点预警:这一章最劝退的是二重积分和确定积分区域。这其实是高等数学(微积分)的基本功问题,而不是概率论的问题。