当前位置:网站首页>朴素贝叶斯
朴素贝叶斯
2022-08-05 10:55:00 【Ding Jiaxiong】
12. 朴素贝叶斯
文章目录
12.1 简介
分类
12.2 概率基础
12.2.1 概率定义
- 一件事情发生的可能性
- P(X) : 取值在[0, 1]
12.2.2 联合概率
- 包含多个条件,且所有条件同时成立的概率
- 记作:P(A,B)
12.2.3 条件概率
- 事件A在另外一个事件B已经发生条件下的发生概率
- 记作:P(A|B)
12.2.4 相互独立
- 如果P(A, B) = P(A)P(B),则称事件A与事件B相互独立
12.2.5 贝叶斯公式
12.2.6 朴素贝叶斯
- 假定了特征与特征之间相互独立的贝叶斯公式
12.3 API
sklearn.naive_bayes.MultinomialNB(alpha = 1.0)
- 朴素贝叶斯分类
- alpha:拉普拉斯平滑系数
12.4 算法总结
12.4.1 优点
- 朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率
- 对缺失数据不太敏感,算法也比较简单,常用于文本分类
- 分类准确度高,速度快
12.4.2 缺点
- 由于使用了样本属性独立性的假设,所以如果特征属性有关联时其效果不好
- 需要计算先验概率,而先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳
12.4.3 NB原理
朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法
- 对于给定的待分类项xx,通过学习到的模型计算后验概率分布,
- 即:在此项出现的条件下各个目标类别出现的概率,将后验概率最大的类作为xx所属的类别。
12.4.4 为什么朴素
- 在计算条件概率分布P(X=x∣Y=c_k)时,NB引入了一个很强的条件独立假设,即,当Y确定时,X的各个特征分量取值之间相互独立
12.4.5 为什么引入条件独立性假设
- 为了避免贝叶斯定理求解时面临的组合爆炸、样本稀疏问题
12.4.6 在估计条件概率P(X∣Y)时出现概率为0的情况怎么办
引入λ
- 当λ=0时,就是普通的极大似然估计
- 当λ=1时称为拉普拉斯平滑
12.4.7 朴素贝叶斯与LR的区别
一
- 朴素贝叶斯是生成模型
- LR是判别模型
二
- 朴素贝叶斯是基于很强的条件独立假设(在已知分类Y的条件下,各个特征变量取值是相互独立的)
- LR则对此没有要求
三
- 朴素贝叶斯适用于数据集少的情景
- LR适用于大规模数据集
边栏推荐
- poj2287 Tian Ji -- The Horse Racing(2016xynu暑期集训检测 -----C题)
- 第八章:activiti多用户任务分配
- In-depth understanding of timeout settings for Istio traffic management
- SkiaSharp 之 WPF 自绘 投篮小游戏(案例版)
- 记2022年七夕感慨
- Import Excel/CSV from Sub Grid within Dynamics 365
- 012_SSS_ Improving Diffusion Model Efficiency Through Patching
- MMDetection实战:MMDetection训练与测试
- 第九章:activit内置用户组设计与组任务分配和IdentityService接口的使用
- Chapter 4: In the activiti process, variable transmission and acquisition process variables, setting and acquiring multiple process variables, setting and acquiring local process variables "recommende
猜你喜欢
随机推荐
[Android] How to use RecycleView in Kotlin project
trie树模板
智源社区AI周刊No.92:“计算复杂度”理论奠基人Juris Hartmanis逝世;美国AI学生九年涨2倍,大学教师短缺;2022智源大会观点报告发布[附下载]
产品太多了,如何实现一次登录多产品互通?
PostgreSQL 2022 报告:流行度上涨,开源、可靠性和扩展是关键
负载均衡应用场景
【翻译】混沌网+SkyWalking:为混沌工程提供更好的可观察性
七夕来袭!还要做CDH数据迁移怎么办?来看看DistCp
智能算力的枢纽如何构建?中国云都的淮海智算中心打了个样
[Translation] Chaos Net + SkyWalking: Better observability for chaos engineering
poj2935 Basic Wall Maze (2016xynu暑期集训检测 -----D题)
linux下oracle常见操作以及日常积累知识点(函数、定时任务)
Nature:猪死亡1小时后,器官再次运转
MMDetection实战:MMDetection训练与测试
自定义过滤器和拦截器实现ThreadLocal线程封闭
In-depth understanding of timeout settings for Istio traffic management
GPU-CUDA-图形渲染分析
张朝阳对话俞敏洪:一边是手推物理公式,一边是古诗信手拈来
【MySQL基础】-【数据处理之增删改】
学生信息管理系统(第一次.....)











