第一章:随机事件 与概率
第一章其实就讲了一件事:怎么给"运气"打分。
我们把它拆成四个最通俗的场景来看。
场景一:上帝的菜单(样本空间与事件)
想象你走进一家饭店(这个饭店叫"随机试验"),老板递给你一张菜单。
- 样本空间 ():就是这张菜单。这上面列出了这家店能做的所有菜(所有可能的结果)。比如菜单上只有:{番茄炒蛋,土豆丝,红烧肉}。
- 样本点:菜单上的一道菜。
- 随机事件:你想吃的那一类东西。
- 比如你想吃"素菜",那就是{番茄炒蛋,土豆丝}。
- 比如你想吃"满汉全席",菜单上没有,这就是不可能事件(概率为0)。
- 比如你说"只要是菜就行",那就是必然事件(概率为1)。
所谓"算概率",就是问:你想吃的菜,占整个菜单的比例是多少?
场景二:不管谁抽都一样(古典概型)
这是考试送分题,但有个大前提:公平。
想象一个箱子里有红球、白球、黑球。古典概型的核心就是:球没长眼,也没作弊。摸到每一个球的机会是完全均等的。
怎么算?
- 分子:你想要的球有几个。
- 分母:箱子里总共有几个球。
- 工具:这时候就要用到排列组合了。为什么要用它?因为球太多了,一个个手指头数不过来,排列组合就是帮你快速数数的工具。
场景三:如果你有了"小道消息"(条件概率)
这是第一章最反直觉也最重要的地方。
条件概率 其实就是:情报改变看法。
例子
你想猜你的同桌是不是富二代(事件A)。
- 情况1:你对他一无所知。他在你眼里就是普通人,概率可能是 1%。
- 情况2:突然,你看到他开了一辆法拉利来上学(事件B发生了)。
- 这时候,你再猜他是富二代的概率(),是不是瞬间飙升到 99%?
为什么?
因为"看到法拉利"这个情报,帮你排除了99%的穷人。你的分母(样本空间)变小了,不再是"全校学生",而是变成了"全校 开法拉利的学生"。
公式的本质:
深入理解条件概率公式
我们用**"圈地盘"的方法来讲。这就好比我们在玩一个"筛选游戏"**。
1. 分母的变化:世界变小了(关键点!)
分母:
在没有任何条件的时候,我们的分母是**"全人类"(或者"全校学生")。但在条件概率里,竖线 后面的内容()就是一道过滤网**。
- 以前的视野:你在大街上闭着眼睛随便抓一个人,他在人群中太渺小了,分母巨大。
- 现在的视野:你说"我只关心开法拉利的人"。那些骑自行车的、坐公交的、走路的人,统统被你踢出了局。你的世界里只剩下了一小撮人——开法拉利的人群。
2. 分子的锁定:在新世界里找目标
分子:
现在你的目光已经锁定在那些法拉利车主身上了(分母已定)。接下来,你要在这个小圈子里找谁?你要找富二代。
但这里有个逻辑陷阱:有些富二代很低调,骑共享单车,或者开宝马,他们不在你的"法拉利圈子"里,早就被踢出局了。所以,分子必须是两个圈子的交集。
3. 一个具体的数字例子
假设全校有 1000 人。
- 富二代总共有 100 人。(占比 10%)
- 开法拉利的总共有 10 人。
- 但这 10 个人里,不一定全是富二代。可能有一个是修车师傅在试车,有一个是租车装大款的。
- 所以,真正既是富二代又开法拉利的,只有 8 人。
现在我们套用公式:
- 普通的概率():在全校随便抓一个,是富二代的概率 = 。
- 条件概率():
- 分母:全校开法拉利的只有 10 人。
- 分子:这10人里,真富二代有 8 人。
- 计算:。
总结:本来要在"汪洋大海"(全样本)里捞针,现在条件告诉你针在"小碗"(条件B)里,你只需要算出这根针(交集AB)占这个碗(条件B)多大比例就行了。
场景四:侦探破案(全概率与贝叶斯)
这两个公式是双胞胎,一个是从前往后推,一个是从后往前推。
想象一个凶杀案现场:
1. 全概率公式(由因推果)
心态:预测未来。
- 你是个杀手,你有三种作案手法:下毒(30%用)、刀刺(50%用)、枪击(20%用)。
- 每种手法的成功率你都知道。
- 全概率公式问的是:你今天出任务,总体成功的概率是多少?
- 算法:把每条路算一遍加起来。
2. 贝叶斯公式(由果溯因)
心态:福尔摩斯。
- 现在人已经死了(结果发生了)。
- 贝叶斯公式问的是:警察想知道,到底是哪种手法干的?
- 比如:死者身上没有伤口(新情报)。那么"枪击"和"刀刺"的嫌疑瞬间下降,"下毒"的嫌疑瞬间飙升。
- 贝叶斯就是用来"事后诸葛亮"的,根据结果反推原因的可能性。
深入理解贝叶斯
贝叶斯公式难懂是因为它反直觉。它其实只讲了一个道理:
当你看到一个新证据时,你该怎么修改你的"老偏见"?
你可以把贝叶斯公式看作一个**"信念更新器"**:
- P(A) - 老偏见(先验概率):在没看证据之前,你觉得这事发生的概率有多大?
- B - 新证据:发生了一件新的事。
- P(A|B) - 新观点(后验概率):结合了"老偏见"和"新证据"后的结论。
最通俗的例子:它是狗还是狼?
想象你在北京三里屯(闹市区)遛弯。突然,前面闪过一个黑影,看起来像一只狼。
如果你不懂贝叶斯,你会想:"我看那东西长得像狼,那它肯定是狼!"
但贝叶斯会给你一巴掌,问你两个问题:
第一问:这事儿本来常见的可能性有多大?(先验概率)
老兄,这里是北京三里屯!不是非洲大草原。在这个地方出现狼的概率,本来就无限接近于 0。出现哈士奇 (狗)的概率非常高。
结论:不管它长得再像狼,只要是在三里屯,它大概率是只长得像狼的哈士奇。
最反直觉的例子:为什么"神医"也会误诊?
场景:
- 有一种罕见病,得病率只有 0.1%(一千个人里只有1个得病)。
- 医院有个试纸,准确率高达 99%。
- 现在,你去体检,试纸显示"阳性"(你得病了)。
- 请问:你真得病的概率是多少?
直觉:试纸99%准确,那我有99%的概率得病了!
贝叶斯:别怕!你真得病的概率其实只有 9% 左右。
为什么?
假设有 1000 个人来体检:
- 真病人:只有 1 个(0.1%)。他做测试,99%显示阳性。
- 健康人:有 999 个。试纸有 1% 的出错率(假阳性)。999 × 1% ≈ 10 个人被误诊。
医院里拿着"阳性化验单"的人,总共有 11 个(1个真病人 + 10个被误诊的健康人)。
贝叶斯就是一句警告:当你听到一个"惊人的消息"(证据),先别急着信。你要看看这事儿在"常理"(先验概率)上讲不讲得通。
还有个大坑:独立 vs 互斥
这是做判断题最容易翻车的地方:
1. 互斥(Mutually Exclusive):死对头
有你没我,有我没你。
例子:扔硬币,正面朝上和反面朝上。出了正面,反面就绝对不可能出。见面就打架。
2. 独立(Independent):路人甲
你干你的,我干我的,咱俩互不影响。
例子:我在北京吃包子,你在纽约喝咖啡。我噎住了,会不会影响你被烫到?完全不会。这叫独立。
这一章的精髓(三句话)
第一句:万物皆可数字化
——把"我觉得"变成"百分之几"。
第一章教你的第一件事,就是当一名**"翻译官"。它强迫你把生活中的模棱两可,翻译成 到 之间的精确数字**。
第二句:分母就是"世界观"
——屁股决定脑袋(位置决定概率)。
所有的概率计算,核心不在分子(你想要什么),而在分母(你在哪个圈子里找)。
- 你说"考清华很难",是因为你的分母是全省考生。
- 但如果你是全省前十名,你的分母变成了**"顶尖学霸圈"**,概率就很高。
精髓:任何概率都是相对的。谁掌握了定义分母的权力,谁就掌握了概率的话语权。
第三句:情报就是力量
——概率是活的,不是死的(贝叶斯思想)。
- 初学者认为:硬币抛出去,正面的概率永远是 50%,是死的。
- 高手知道:概率是随着信息流动的。
贝叶斯公式的灵魂:新的信息会不断修正旧的认知。
总结
第一章就是教你在信息不完整的情况下,如何理智地"瞎猜"。
- 什么都不知道?用古典概型猜。
- 知道了一点情报?用条件概率猜。
- 知道了结果想猜原因?用贝叶斯猜。