贝叶斯概率习题集
基础题目
题目1:条件概率基础
一个袋子中装有5个红球和3个蓝球。随机取出2个球(不放回),求第二个球是红球的概率。
题目2:简单贝叶斯公式应用
某种疾病在人群中的发病率为0.1%。对于患病者,某检测方法的阳性率为99%;对于未患病者,该检测方法的阴性率为98%。若某人检测结果为阳性,求该人患病的概率。
题目3:全概率公式
工厂有甲、乙两条生产线,甲生产线每天生产产品数量占总产量的60%,乙生产线占40%。甲生产线的产品合格率为98%,乙生产线的产品合格率为95%。若随机抽取一件产品,求:
(a) 该产品是合格品的概率
(b) 若抽取的产品是合格品,则它来自甲生产线的概率
中级题目
题目4:医学诊断问题
某种疾病在特定年龄段人群中的患病率为5%。诊断该疾病的测试有90%的敏感性(患病者测试呈阳性的概率)和80%的特异性(未患病者测试呈阴性的概率)。
(a) 若某人测试结果为阳性,求其患病的概率
(b) 若某人测试结果为阴性,求其未患病的概率
© 如果连续进行两次独立的测试,两次都呈阳性,求患病概率
题目5:贝叶斯更新
某学生参加一次多选题考试,题目有A、B、C、D四个选项,其中只有一个选项是正确的。学生对每道题的把握程度不同:
- 对25%的题目,学生认为自己有80%的把握选对
- 对50%的题目,学生认为自己有60%的把握选对
- 对25%的题目,学生认为自己是在完全猜测(即每个选项被选中的概率均为25%)
如果学生回答了一道题并且是正确的,求这道题属于三类题目(把握度分别为80%、60%和25%)的概率分别是多少?
题目6:法医学应用
在一起刑事案件中,犯罪现场留下的DNA与嫌疑人匹配。已知:
- DNA检测的误报率(即DNA实际上不匹配但检测结果显示匹配的概率)为0.1%
- 该地区有10万人口
- 假设除了真凶外,其他人的DNA与犯罪现场DNA匹配是随机的
求嫌疑人就是罪犯的概率。
高级题目
题目7:垃圾邮件过滤
一个邮件系统使用贝叶斯分类器来识别垃圾邮件。已知:
- 所有收到的邮件中,20%是垃圾邮件
- 垃圾邮件中,90%包含"促销"一词
- 正常邮件中,5%包含"促销"一词
- 垃圾邮件中,80%包含"点击"一词
- 正常邮件中,10%包含"点击"一词
假设"促销"和"点击"这两个词的出现是相互独立的,求:
(a) 一封同时包含"促销"和"点击"两个词的邮件是垃圾邮件的概率
(b) 一封仅包含"促销"但不包含"点击"的邮件是垃圾邮件的概率
题目8:多假设贝叶斯
某区域可能存在三种类型的地质构造A、B、C,先验概率分别为P(A)=0.5,P(B)=0.3,P©=0.2。地质勘探团队进行了一项测试,对不同地质构造的测试结果如下:
- 当地质构造为A类型时,测试呈阳性的概率为0.7
- 当地质构造为B类型时,测试呈阳性的概率为0.4
- 当地质构造为C类型时,测试呈阳性的概率为0.1
如果测试结果呈阳性,求该区域为A、B、C三种地质构造类型的后验概率分别是多少?
题目9:连续贝叶斯更新
一个质量控制工程师在监控一条生产线。该生产线有两种可能的状态:正常运行或故障状态。根据历史数据,生产线在任何时刻处于故障状态的先验概率为0.05。
工程师使用一种检测设备进行监测,该设备有以下特性:
- 当生产线处于正常状态时,检测结果为"正常"的概率为0.95
- 当生产线处于故障状态时,检测结果为"故障"的概率为0.9
工程师连续进行了三次独立检测,结果分别为"正常"、“故障”、“故障”。求三次检测后,生产线处于故障状态的后验概率。
题目10:贝叶斯网络
考虑一个简单的贝叶斯网络,描述一个农场的情况:
- 下雨®的概率P®=0.3
- 如果下雨,自动喷灌系统(S)关闭的概率P(S=off|R)=0.9;如果不下雨,自动喷灌系统开启的概率P(S=on|not R)=0.8
- 地面湿润(W)的概率在下雨和喷灌系统开启的情况下为P(W|R,S=on)=1;在下雨但喷灌系统关闭的情况下为P(W|R,S=off)=0.9;在不下雨但喷灌系统开启的情况下为P(W|not R,S=on)=0.7;在不下雨且喷灌系统关闭的情况下为P(W|not R,S=off)=0.1
如果观察到地面湿润,求:
(a) 下雨的后验概率P(R|W)
(b) 自动喷灌系统开启的后验概率P(S=on|W)