当前位置:网站首页>机器学习相关 概率论重点笔记
机器学习相关 概率论重点笔记
2022-08-02 03:28:00 【Code_LT】
A事件发生的概率,记为 P ( A ) P(A) P(A)或 P r ( A ) Pr(A) Pr(A)。
1. 联合概率、条件概率、边缘概率
1.1 联合概率 joint probability
联合概率:指两个事件A,B同时发生的概率。记为 P ( A , B ) P(A,B) P(A,B),或 P ( A B ) P(AB) P(AB),或 P ( A ∩ B ) P(A\cap B) P(A∩B)。
当A,B相互独立时,有 P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B)
1.2 条件概率 conditional probability
条件概率:B发生的前提下,A发生的概率。记为 P ( A ∣ B ) P(A|B) P(A∣B)。
条件概率公式: P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B)=\frac{P(AB)}{P(B)} P(A∣B)=P(B)P(AB)
当A,B相互独立时, P ( A ∣ B ) = P ( A ) P(A|B)=P(A) P(A∣B)=P(A),即B发不发生,不影响A。
乘法公式: P ( A B ) = P ( A ∣ B ) P ( B ) P(AB)=P(A|B)P(B) P(AB)=P(A∣B)P(B)
1.3 边缘概率 marginal probability
边缘概率:指事件A发生的概率。通常可以用全概率公式(见后面解释)来表示:
P ( A ) = ∑ i P ( A ∣ B i ) P ( B i ) P(A)=\sum_iP(A|B_i)P(B_i) P(A)=i∑P(A∣Bi)P(Bi)
完备事件组
设 S S S为试验 E E E的样本空间, B 1 , B 2 , ⋯ , B n B_1,B_2,\cdots,B_n B1,B2,⋯,Bn为 E E E的一组事件。若
- B i ∩ B j = ∅ ( i ≠ j ) B_i\cap B_j=\empty (i\neq j ) Bi∩Bj=∅(i=j);
- B 1 ∪ B 2 ∪ ⋯ ∪ B n = S B_1\cup B_2\cup\cdots \cup B_n=S B1∪B2∪⋯∪Bn=S
则称 B 1 , B 2 , ⋯ , B n B_1,B_2,\cdots,B_n B1,B2,⋯,Bn为 E E E为样本空间 S S S的一个完备事件组(划分)。
全概率定理
{ B i } \{B_i\} { Bi}为一完备事件组,则对该样本空间中的任意事件A有全概率公式:
P ( A ) = ∑ i P ( A ∩ B i ) = ∑ i P ( A ∣ B i ) P ( B i ) P(A)=\sum_{i}P(A\cap B_i)=\sum_{i}P(A|B_i)P(B_i) P(A)=i∑P(A∩Bi)=i∑P(A∣Bi)P(Bi)
全概率公式的作用:把一个问题分解成多个可能更简单的问题来解决。
贝叶斯公式
是一个求条件概率的公式。
P ( A ∣ B ) = P ( A B ) P ( B ) = 乘法公式替换 全概率公式替换 = P ( B ∣ A ) P ( A ) ∑ A i P ( B ∣ A i ) P ( A i ) P(A|B)=\frac{P(AB)}{P(B)}=\frac{乘法公式替换}{全概率公式替换}=\frac{P(B|A)P(A)}{\sum_{A_i}P(B|A_i)P(A_i)} P(A∣B)=P(B)P(AB)=全概率公式替换乘法公式替换=∑AiP(B∣Ai)P(Ai)P(B∣A)P(A)
2. 常见函数概念
2.1 概念解释
PDF:常记为 f X ( t ) f_X(t) fX(t)。概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。
常见的连续随机变量分布的PDF函数:均匀分布,指数分布,Gamma分布和正态分布等。PMF :也记为 f X ( t ) f_X(t) fX(t)。概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。
常见的离散随机变量分布的PMF函数:伯努利分布,二项分布,泊松分布。CDF : 记为 F X ( t ) F_X(t) FX(t)。累积分布函数 (cumulative distribution function),又叫分布函数(distribution function),是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。
不管是什么类型(连续/离散/其他)的随机变量,都可以定义它的累积分布函数。
2.2 数学表示
PDF:如果 X X X是连续型随机变量,概率密度函数PDF定义为 f X ( t ) f_X(t) fX(t),用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率:
P r ( a ≤ X ≤ b ) = ∫ a b f X ( t ) d t Pr(a \leq X \leq b )=\int_{a}^{b}f_X(t)dt Pr(a≤X≤b)=∫abfX(t)dt
PMF:如果 X X X是离散型随机变量,则 概率质量函数PMF f X ( t ) f_X(t) fX(t)为:
f X ( t i ) = P r ( X = t i ) ,即 X 为 t i 的概率 f_X(t_i)=Pr(X=t_i),即X为t_i的概率 fX(ti)=Pr(X=ti),即X为ti的概率
CDF:累积分布函数
F X ( t ) = P r ( X ≤ t ) = { ∫ − ∞ t f X ( x ) d x ,连续型 ∑ x i ≤ t P r ( X = x i ) = ∑ x i ≤ t f X ( x i ) ,离散型 F_X(t)=Pr(X\leq t)= \begin{cases} \int_{-\infty}^{t}f_X(x)dx,连续型\\ \sum\limits_{x_i\leq t}Pr(X=x_i)=\sum\limits_{x_i\leq t}f_X(x_i), 离散型 \end{cases} FX(t)=Pr(X≤t)=⎩⎨⎧∫−∞tfX(x)dx,连续型xi≤t∑Pr(X=xi)=xi≤t∑fX(xi),离散型
说明:
- PDF的取值本身不是概率,它是一种趋势(密度)只有对连续随机变量的取值进行积分后才是概率,也就是说对于连续值确定它在某一点的概率是没有意义的;
- PMF的取值本身代表该值的概率。
参考:
https://blog.csdn.net/Anne033/article/details/114327608
https://blog.csdn.net/lanchunhui/article/details/52965391
边栏推荐
- Arduino D1----Mlx90614红外温度传感器接线和安装包
- 解决flex布局warp自动换行下最后一行居中问题
- Visual Studio2022创建setup项目
- The first time to tear the code by hand, how to solve the problem of full arrangement
- Anaconda报错:An unexpected error has occurred. Conda has prepared the above report 解决办法
- 记账凭证的种类、记账凭证的基本内容、记账凭证的填制要求、记账凭证的审核
- 解密:链动2+1的商业模式
- SQL注入(7)
- 中国大陆开源镜像站汇总
- 借贷记账法下的账户结构、借贷记账法的记账规则、借贷记账法下的账户对应关系与会计分录
猜你喜欢
随机推荐
会计账簿、会计账簿概述、会计账簿的启用与登记要求、会计账簿的格式和登记方法
完整安装 Laravel-Admin 框架
php laravel框架生成二维码
Nest 的实现原理?理解了 reflect metadata 就懂了
SGDP(2)——声纳寻宝游戏
Windows下MySQL数据库报“ERROR 2003 (HY000): Can‘t connect to MySQL server on ‘localhost:8000‘ (10061)”错误解决
蓝桥杯:国二选手经验贴 附蓝桥杯历年真题
Acwing:哈夫曼树(详解)
Binder机制详解(一)
树莓派4b安装win11/10过程全教程(附蓝屏inaccessible boot device解决办法)
Uniapp | compatibility problems in the development of (to be continued)
laravel-admin 列表图片点击放大
C# Form按ESC关闭窗体
分布式消息队列平滑迁移技术实战
借贷记账法下的账户结构、借贷记账法的记账规则、借贷记账法下的账户对应关系与会计分录
Go 程序太大了,能要个延迟初始化不?
Dart-Flutter DateTime日期转换
阿里技术官手码12W字面试小册
会计凭证概述、原始凭证、原始凭证的种类、原始凭证的基本内容、原始凭证的填制要求、原始凭证的审核
中国大陆开源镜像站汇总