当前位置:网站首页>ML自学笔记5
ML自学笔记5
2022-07-29 05:22:00 【十九岁的花季少女】
集成算法与随机森林
集成算法
集成算法一般就用树模型做的。
Bagging就是训练多个树模型,每个树模型预测一个结果,对所有树模型的结果进行求和后求均值,一个典型的例子就是随机森林,稍后讲到。
Boosting(提升算法),是每次加入一棵树,最后并不求均值
随机森林
简介
- 随机:数据随机采样,比如建立每一棵树随机选择80%的样本;特征随机采样:每个树随机选择80%的样本特征(随即比列可以指定);
- 森林:多个树,对每个树结果求和后求均值。

随机森林优点和

给出Negev特征重要可以通过下图过程判断。先求出原始特征建模的错误率,将想要判断的特征的特征值进行修改(打乱或者改值)然后其他特征不变再建模计算错误率;两次结果近似说明此特征不重要,第二次结果远大于第一次结果说明此特征很重要。也可以通过特征在树的位置判断重要性,越靠近根节点越重要(是直接通过算法得出的)。
树模型也不是越多越好,达到一定数量后准确率差不多上下浮动了。
提升算法(Boosting)概述
算法简介
假如第一个树预测950(标签为1000),那么B就提升A的,B预测的就不是1000了,是做弥补A没做好的,B的目标就是1000-950=50,假设B预测了30,轮到C时,C树把前面当成整体,预测结果希望得到1000-950-30=20,假设C预测18,D也是,预测标签为2。
提升算法公式
前面部分是之前的树的预测结果,后面部分是当前这一个树模型,之前结果Fm-1(xi)加上当前树的结果h(xi)与原来结果yi比较,如果改进了就加上,如果没改进就不加。保证了加入一棵树,一定会比原来强。
模型代表

- AdaBoost:如果第一次划分是图一结果,有一个三角形划分错了,那么下一轮就会把这个三角形的权重加大

- Xgboost算法就是之前提到的ABCD树如何提升的。
堆叠模型(stacking)
模型概述
使用多个分类器,比如LR(逻辑回归),DT(决策树),RF(随机森林),进行分别预测结果,然后将结果作为输入再用一种模型进行运算。
边栏推荐
- pip安装后仍有解决ImportError: No module named XX
- Transformer回顾+理解
- Spring, summer, autumn and winter with Miss Zhang (1)
- 第一周任务 深度学习和pytorch基础
- Yum local source production
- Wechat built-in browser prohibits caching
- GA-RPN:引导锚点的建议区域网络
- 虚假新闻检测论文阅读(一):Fake News Detection using Semi-Supervised Graph Convolutional Network
- Research on the implementation principle of reentrantlock in concurrent programming learning notes
- 迁移学习——Low-Rank Transfer Subspace Learning
猜你喜欢

C # judge whether the user accesses by mobile phone or computer
![[target detection] generalized focal loss v1](/img/8b/458d51422df8dcda65cb6afaa10b3f.png)
[target detection] generalized focal loss v1

备份谷歌或其他浏览器插件

How to obtain openid of wechat applet in uni app project

虚假新闻检测论文阅读(五):A Semi-supervised Learning Method for Fake News Detection in Social Media

电脑视频暂停再继续,声音突然变大

【Attention】Visual Attention Network

【图像分类】如何使用 mmclassification 训练自己的分类模型

研究生新生培训第三周:ResNet+ResNeXt

Improve quality with intelligence financial imaging platform solution
随机推荐
【目标检测】6、SSD
深入理解MMAP原理,让大厂都爱不释手的技术
虚假新闻检测论文阅读(一):Fake News Detection using Semi-Supervised Graph Convolutional Network
[target detection] KL loss: bounding box progression with uncertainty for accurate object detection
【Transformer】TransMix: Attend to Mix for Vision Transformers
"Full flash measurement" database acceleration solution
Interesting talk about performance optimization thread pool: is the more threads open, the better?
迁移学习笔记——Adapting Component Analysis
【语义分割】语义分割综述
【图像分类】如何使用 mmclassification 训练自己的分类模型
第三周周报 ResNet+ResNext
第一周任务 深度学习和pytorch基础
The third week of postgraduate freshman training: resnet+resnext
【比赛网站】收集机器学习/深度学习比赛网站(持续更新)
Reporting Services- Web Service
Analysis on the principle of flow
fastText学习——文本分类
ASM piling: after learning ASM tree API, you don't have to be afraid of hook anymore
三、如何搞自定义数据集?
Android studio login registration - source code (connect to MySQL database)