Skip to main content

第三章:多维随机变量及其分布

如果说第二章是研究**"单身狗"(只看一个变量 XX),那第三章就是研究"谈恋爱"**(同时看 XXYY 两个变量,甚至更多)。

为什么要学这一章?因为现实世界里,事情往往不是孤立的:

  • 只有身高(XX)不够,还得看体重(YY),这才能判断身材好不好。
  • 只有期中成绩(XX)不够,还得看期末成绩(YY),这才能决定会不会挂科。

这一章的核心精髓,就是搞清楚 XXYY 到底是什么关系


一、联合分布(Joint Distribution)

—— "上帝视角"的全景图

这是第三章的起点。我们不能只看 XX,也不能只看 YY,我们要看 (X,Y)(X, Y) 这个整体。

离散型(填表格)

就是一个二维表格(棋盘)。比如:XX 是"学历",YY 是"工资"。格子 (X=本科,Y=5000)(X=\text{本科}, Y=5000) 里填一个概率。

所有格子里的概率加起来必须等于 1。

连续型(堆山头)

第二章的概率密度 f(x)f(x) 是一条线。第三章的联合概率密度 f(x,y)f(x,y) 就变成了一个曲面(像一座山)。

  • 地基是 xOyxOy 平面。
  • 山的高度代表概率的密度(这一块发生的可能性大小)。
  • 要算概率?就是算这座山下方的体积(二重积分)。

二、边缘分布(Marginal Distribution)

—— "把另一半拍扁"

这是最容易晕的概念。边缘分布的意思是:虽然我有 (X,Y)(X, Y) 的联合数据,但我现在只关心 XX,我想假装 YY 不存在

怎么做?

  • 离散型:把表格里每一行的数字加起来。(不管 YY 取多少,把 X=1X=1 时的所有可能性累加)
  • 连续型:把"山"往墙上投影(积分)。
fX(x)=+f(x,y)dyf_X(x) = \int_{-\infty}^{+\infty} f(x,y) \, dy

直观理解

你有一张全班同学"身高(XX)"和"体重(YY)"的散点图。

  • 联合分布:看散点图本身。
  • 边缘分布:把所有点垂直压扁XX 轴上,不再看高低(体重),只看左右(身高)的分布。

三、条件分布(Conditional Distribution)

—— "切片看"

这是第一章"条件概率"的升级版。意思是:如果我已经固定了 YY(比如 Y=y0Y=y_0),那么 XX 的分布长什么样?

操作方法

拿一把刀,沿着 Y=y0Y=y_0 这个位置,把那座"概率山"切一刀。切出来的那个截面,归一化修整一下,就是条件分布。

fXY(xy)=f(x,y)fY(y)f_{X|Y}(x|y) = \frac{f(x,y)}{f_Y(y)}

直观例子

  • 联合分布:全人类的身高体重分布。
  • 条件分布:我只要看体重=200斤YY 固定)的那群人,他们的身高XX)分布。

四、独立性(Independence)

—— "我们不熟"

这是考试必考的判断题。我们要判断 XXYY 是不是形同陌路

定义的灵魂

如果 f(x,y)=fX(x)fY(y)f(x,y) = f_X(x) \cdot f_Y(y) 对所有点都成立。

即:联合分布 = 边缘分布 × 边缘分布

通俗理解

  • 不独立(相关):身高的分布和体重的分布是有纠缠的。你知道了身高,大致能猜出体重范围。
  • 独立XX 是"今天的气温",YY 是"抛硬币的结果"。气温怎么变,完全不影响硬币正反面的概率。

五、两个随机变量的函数(Z = X + Y)

—— "合体技"

这是第三章计算最痛苦的地方,通常叫**"卷积公式"**。

场景

我知道了 XX 的分布,也知道了 YY 的分布。现在我想求 Z=X+YZ = X + Y 的分布。

比如:XX 是你上午赚的钱,YY 是下午赚的钱,求总收入 ZZ 的概率分布。

卷积公式

fZ(z)=+fX(x)fY(zx)dxf_Z(z) = \int_{-\infty}^{+\infty} f_X(x) f_Y(z-x) \, dx

不要背公式,要理解它的物理意义

  • 我们要凑出和为 zz
  • 如果 XX 取了 xx,那么 YY 必须取 zxz-x
  • 把所有这种可能的组合(积分)加起来,就是 ZZzz 的概率。

重要结论:正态分布的生殖隔离

如果 XN(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)YN(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2),且它俩独立。

那么:

X+YN(μ1+μ2,σ12+σ22)X + Y \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2)

正态分布生的孩子还是正态分布!


六、常见的二维分布

二维均匀分布

在一个平面区域 DD 内均匀分布:

f(x,y)={1SD,(x,y)D0,其他f(x,y) = \begin{cases} \frac{1}{S_D}, & (x,y) \in D \\ 0, & \text{其他} \end{cases}

其中 SDS_D 是区域 DD 的面积。

二维正态分布

这是最重要的二维分布,公式很复杂,但关键要记住:

  • 由 5 个参数决定:μ1,μ2,σ1,σ2,ρ\mu_1, \mu_2, \sigma_1, \sigma_2, \rho
  • 其中 ρ\rho 是相关系数
  • 二维正态分布的边缘分布仍是正态分布

七、总结

第三章其实就是教你怎么处理**"关系"**。

概念作用
联合分布看整体关系
边缘分布忽略关系,只看单方
条件分布固定一方,看另一方
独立性判断有没有关系
卷积两个关系叠加后的新结果

难点预警:这一章最劝退的是二重积分确定积分区域。这其实是高等数学(微积分)的基本功问题,而不是概率论的问题。