跳到主要内容

第四章:随机变量的数字特征

如果说前三章是在画**"藏宝图"(给你完整的分布律、密度函数),那么第四章就是扔掉地图,直接给你几个"GPS坐标"**。

这一章的逻辑是:"浓缩就是精华"

现实生活中,老板或客户通常不想听你讲复杂的函数曲线,他们只问两个问题:

  1. "这事平均大概赚多少?"(看期望)
  2. "这事风险大不大?"(看方差)

一、数学期望(Expectation, E(X)E(X)

—— 它是"中心",也是"公道价"

不要只把它当成"平均值"

虽然它和平均值很像,但平均值是事后算出来的(统计),期望是事前算出来的(预测)。

物理意义:重心

如果你把概率分布想象成一根形状不规则的木棍,期望 E(X)E(X) 就是你能用一个手指头把这根木棍顶起来的那个平衡点

通俗理解

你去赌场玩轮盘赌。你赢的概率极低,输的概率极高。

E(X)=(赢的钱×小概率)+(输的钱×大概率)E(X) = (\text{赢的钱} \times \text{小概率}) + (\text{输的钱} \times \text{大概率})

算出来结果肯定是负数。这就告诉你:长期玩下去,你必输。

性质:线性

E(aX+b)=aE(X)+bE(aX + b) = aE(X) + b

大家的工资都乘2再加1000,平均工资自然也是乘2加1000。

计算公式

  • 离散型E(X)=ixipiE(X) = \sum_i x_i p_i
  • 连续型E(X)=+xf(x)dxE(X) = \int_{-\infty}^{+\infty} x f(x) dx

二、方差(Variance, D(X)D(X)

—— 它是"波动",也是"风险"

核心含义

数据偏离中心的程度。

为什么要有它?

  • 射击选手A:打了两枪,一枪10环,一枪0环。平均5环。
  • 射击选手B:打了两枪,一枪5环,一枪5环。平均5环。

看期望(平均),两人水平一样。但显然B更。方差就是用来描述这个**"稳不稳"**的。

定义公式 vs 计算公式

定义公式(理解用):

D(X)=E[(XE(X))2]D(X) = E\left[ (X - E(X))^2 \right]

含义:每个数离平均值有多远,平方一下,再求期望。

计算公式(做题用):

D(X)=E(X2)[E(X)]2D(X) = E(X^2) - [E(X)]^2

口诀:方差 = 平方的期望 - 期望的平方

举例验证两个公式等价

假设三个数:1, 2, 3,平均值 E(X)=2E(X) = 2

方法一(定义法)

(12)2+(22)2+(32)23=1+0+13=23\frac{(1-2)^2 + (2-2)^2 + (3-2)^2}{3} = \frac{1 + 0 + 1}{3} = \frac{2}{3}

方法二(计算法)

E(X2)=1+4+93=143E(X^2) = \frac{1+4+9}{3} = \frac{14}{3} D(X)=1434=143123=23D(X) = \frac{14}{3} - 4 = \frac{14}{3} - \frac{12}{3} = \frac{2}{3}

结果一样!

标准差(Standard Deviation, σ\sigma

方差算出来单位是"平方",开个根号变成标准差,单位就变回去了。

金融圈最爱:股票的波动率其实就是标准差。标准差越大,股票上蹿下跳越厉害,风险就越大。


三、协方差与相关系数

—— 它是"默契度"

前两个是自己玩,这个是两个变量 (X,Y)(X, Y) 一起玩

协方差 Cov(X,Y)Cov(X, Y)

含义:看 XXYY 是不是同进退

Cov(X,Y)=E[(XE(X))(YE(Y))]=E(XY)E(X)E(Y)Cov(X, Y) = E[(X - E(X))(Y - E(Y))] = E(XY) - E(X)E(Y)
  • 正数:你涨我也涨(比如身高和体重)
  • 负数:你涨我就跌(比如杀虫剂用量和害虫数量)
  • :咱俩没啥线性关系

缺陷:它受单位影响太大。身高用"米"算和用"厘米"算,协方差会差100倍。

相关系数 ρXY\rho_{XY}(主角)

含义去掉了单位的协方差(标准化了)。

ρXY=Cov(X,Y)D(X)D(Y)\rho_{XY} = \frac{Cov(X, Y)}{\sqrt{D(X)} \cdot \sqrt{D(Y)}}

数值范围:永远在 -1 到 1 之间。

含义
ρ=1\rho = 1完美正相关(像镜子里的你,完全同步)
ρ=1\rho = -1完美负相关(跷跷板,你上它必下)
ρ=0\rho = 0不相关

最大的坑:不相关 ≠ 独立

这是考试必考的逻辑陷阱:

  • 独立:绝对没关系,路人甲。(\Rightarrow 相关系数一定是0)
  • 不相关 (ρ=0\rho=0):仅仅是**"没有直线关系"**。

例子Y=X2Y = X^2(抛物线关系)。

XX 变了,YY 肯定变(所以它俩不独立,有关系)。但是如果你去算 ρ\rho,算出来是 0,因为它们不是"直线"关系。

结论:独立一定不相关,但不相关不一定独立。


四、矩(Moments)

—— 更高级的特征

名称含义
一阶原点矩期望(描述中心)
二阶中心矩方差(描述胖瘦)
三阶中心矩偏度(Skewness):脸歪没歪
四阶中心矩峰度(Kurtosis):头顶尖不尖

五、常用分布的期望与方差

分布期望 E(X)E(X)方差 D(X)D(X)
0-1 分布ppp(1p)p(1-p)
二项分布 B(n,p)B(n,p)npnpnp(1p)np(1-p)
泊松分布 P(λ)P(\lambda)λ\lambdaλ\lambda
均匀分布 U(a,b)U(a,b)a+b2\frac{a+b}{2}(ba)212\frac{(b-a)^2}{12}
指数分布 E(λ)E(\lambda)1λ\frac{1}{\lambda}1λ2\frac{1}{\lambda^2}
正态分布 N(μ,σ2)N(\mu, \sigma^2)μ\muσ2\sigma^2

六、总结

第四章其实就是给了你一套**"体检报告"**的解读指南:

指标作用
期望 E(X)E(X)平均水平(是不是潜力股)
方差 D(X)D(X)发挥稳不稳(是不是神经刀)
相关系数 ρ\rho跟别人的关系(是不是猪队友)

掌握了这三个数,你就掌握了一个随机变量 80% 的脾气秉性,而不需要去研究它复杂的函数图像。