当前位置:网站首页>朴素贝叶斯
朴素贝叶斯
2022-08-05 10:55:00 【Ding Jiaxiong】
12. 朴素贝叶斯
文章目录
12.1 简介
分类
12.2 概率基础
12.2.1 概率定义
- 一件事情发生的可能性
- P(X) : 取值在[0, 1]
12.2.2 联合概率
- 包含多个条件,且所有条件同时成立的概率
- 记作:P(A,B)
12.2.3 条件概率
- 事件A在另外一个事件B已经发生条件下的发生概率
- 记作:P(A|B)
12.2.4 相互独立
- 如果P(A, B) = P(A)P(B),则称事件A与事件B相互独立
12.2.5 贝叶斯公式
12.2.6 朴素贝叶斯
- 假定了特征与特征之间相互独立的贝叶斯公式
12.3 API
sklearn.naive_bayes.MultinomialNB(alpha = 1.0)
- 朴素贝叶斯分类
- alpha:拉普拉斯平滑系数
12.4 算法总结
12.4.1 优点
- 朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率
- 对缺失数据不太敏感,算法也比较简单,常用于文本分类
- 分类准确度高,速度快
12.4.2 缺点
- 由于使用了样本属性独立性的假设,所以如果特征属性有关联时其效果不好
- 需要计算先验概率,而先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳
12.4.3 NB原理
朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法
- 对于给定的待分类项xx,通过学习到的模型计算后验概率分布,
- 即:在此项出现的条件下各个目标类别出现的概率,将后验概率最大的类作为xx所属的类别。
12.4.4 为什么朴素
- 在计算条件概率分布P(X=x∣Y=c_k)时,NB引入了一个很强的条件独立假设,即,当Y确定时,X的各个特征分量取值之间相互独立
12.4.5 为什么引入条件独立性假设
- 为了避免贝叶斯定理求解时面临的组合爆炸、样本稀疏问题
12.4.6 在估计条件概率P(X∣Y)时出现概率为0的情况怎么办
引入λ
- 当λ=0时,就是普通的极大似然估计
- 当λ=1时称为拉普拉斯平滑
12.4.7 朴素贝叶斯与LR的区别
一
- 朴素贝叶斯是生成模型
- LR是判别模型
二
- 朴素贝叶斯是基于很强的条件独立假设(在已知分类Y的条件下,各个特征变量取值是相互独立的)
- LR则对此没有要求
三
- 朴素贝叶斯适用于数据集少的情景
- LR适用于大规模数据集
边栏推荐
- PCB layout must know: teach you to correctly lay out the circuit board of the op amp
- 【名词】什么是PV和UV?
- sqlserver编写通用脚本实现获取一年前日期的方法
- 第五章:activiti流程分流判断,判断走不同的任务节点
- 5G NR 系统消息
- E-sports, convenience, efficiency, security, key words for OriginOS functions
- 双因子与多因子身份验证有什么区别?
- Chapter 5: Multithreaded Communication—wait and notify
- RT - Thread record (a, RT, RT Thread version - Thread Studio development environment and cooperate CubeMX quick-and-dirty)
- 数据可视化(二)
猜你喜欢
智能算力的枢纽如何构建?中国云都的淮海智算中心打了个样
abc262-D(dp)
负载均衡应用场景
E-sports, convenience, efficiency, security, key words for OriginOS functions
MySQL 中 auto_increment 自动插入主键值
Huawei's lightweight neural network architecture GhostNet has been upgraded again, and G-GhostNet (IJCV22) has shown its talents on the GPU
字节一面:TCP 和 UDP 可以使用同一个端口吗?
Http-Sumggling缓存漏洞分析
数据可视化(一)
Scaling-law和模型结构的关系:不是所有的结构放大后都能保持最好性能
随机推荐
工程设备在线监测管理系统自动预警功能
012_SSS_ Improving Diffusion Model Efficiency Through Patching
数分面试(一)----与业务相关
E-sports, convenience, efficiency, security, key words for OriginOS functions
第六章:activiti流程分流判断之排它网关和并行网关
提取人脸特征的三种方法
负载均衡应用场景
Go编译原理系列6(类型检查)
Huawei's lightweight neural network architecture GhostNet has been upgraded again, and G-GhostNet (IJCV22) has shown its talents on the GPU
2022 Hangzhou Electric Power Multi-School Session 6 1008.Shinobu Loves Segment Tree Regular Questions
软件测试之集成测试
Voice-based social software development - making the most of its value
Three methods for extracting facial features
【深度学习】mmclassification mmcls 实战多标签分类任务教程,分类任务
化繁为简!阿里新产亿级流量系统设计核心原理高级笔记(终极版)
L2-042 老板的作息表
FPGA:基础入门按键控制LED灯
Go compilation principle series 6 (type checking)
图像分割模型——segmentation_models_pytorch和albumentations 组合实现多类别分割
OpenHarmony如何查询设备类型