当前位置:网站首页>机器学习 Out-of-Fold 折外预测详解 | 使用折外预测 OOF 评估模型的泛化性能和构建集成模型
机器学习 Out-of-Fold 折外预测详解 | 使用折外预测 OOF 评估模型的泛化性能和构建集成模型
2022-06-29 12:41:00 【叶庭云】
一、引言
机器学习算法的模型评估通常使用重采样技术,如 K 折交叉验证。
机器学习模型可以使用 K-Fold 交叉验证技术来提高模型的预测精度。在交叉验证过程中,预测是在拆分出来的没有用于模型训练的测试集上进行的(模型训练没有见过它)。这些预测被称为折外预测(out-of-fold predictions)。折外预测在机器学习中发挥着重要作用,可以提高模型的泛化性能,以及构建集成模型。
总结如下:
- 折外预测是算对不用于训练模型的数据进行的一种样本外预测;
- 在对看不见的数据进行预测时,折外预测常用于模型评估,证明模型的泛化性能;
- 折外预测可用于构建集成模型,称为堆叠泛化或堆叠集成。
下面详细介绍使用折外预测 OOF 评估模型的泛化性能和构建集成模型
二、什么是折外预测?
使用重采样技术例如 K-Fold 来评估机器学习算法在数据集上的性能是一种很常见的方法。K-Fold 过程包括将训练数据集分成 K 组,然后在使用 K 组样本中的每一个作为测试集,而其余样本用作训练集。这意味着训练和评估了 K 个不同的模型。这个过程可以总结如下:
- 随机打乱数据集;
- 将数据集分成 K 组(有时候可能需要按标签的分布分层划分);
- 对于每个独特的组:将该组作为一个保留数据用做测试,将剩余的组作为训练数据集,在训练集上拟合模型并在测试集上进行评估,重
边栏推荐
- 开户可以在网上开么?能安全吗
- 思科模拟器简单校园网设计,期末作业难度
- Write it down once Net analysis of a property management background service stuck
- ##Mondo Rescue制作镜像文件(有利于镜像损坏恢复)
- Cvpr2022 | a convnet for the 2020s & how to design neural network Summary
- Qitai observation: professional elites must step on the huge pit of entrepreneurship - learning effect pit
- 力扣:合并两个有序链表
- Ordinary users use vscode to log in to SSH and edit the root file
- pdb符号库文件详解
- 【系统设计】邻近服务
猜你喜欢

从零搭建Pytorch模型教程(五)编写训练过程--一些基本的配置

思科模拟器简单校园网设计,期末作业难度

Force buckle: merging two ordered linked lists

CVPR上百人中招新冠,emoji成“呈堂证供”,M2 MBP被曝硬盘降速,今日更多大新闻在此...

【毕业季】这四年一路走来都很值得——老学长の忠告

Another "provincial capital university", coming!

Lecun published a research plan for the next decade: AI autonomous intelligence with a 62 page paper

从零搭建Pytorch模型教程(四)编写训练过程--参数解析

Leetcode game 299

Learn from the official motor and BLDC control strategies, and make money as soon as you learn
随机推荐
Openssl证书工具使用手册
B+ tree | MySQL index usage principle
神经网络各个部分的作用 & 彻底理解神经网络
Shell judges whether the command is executed successfully
B+树|MYSQL索引使用原则
Yolo series combs (IX) first taste of newly baked yolov6
Cvpr2022 𞓜 loss problem in weakly supervised multi label classification
Weserver Publishing Map Service
【无标题】安装依赖报错:Refusing to install package with name “***“ under a package
商品搜索引擎—推荐系统设计
AOSP ~ logcat persistence
Aurora · Huffman tree generation (segment tree structure non pointer) (imitating adjacency table)
The scale of 360 digital new energy special products exceeded 6billion
@Table爆红
DeeCamp2022正式开营!李开复、张亚勤亲授大师课 | 创新事
June training (day 29) - divide and rule
[untitled] error in installation dependency: refusing to install package with name "* * *" under a package
Review questions of project management
安装terraform-ovirt插件为ovirt提供自动化管理
System.currentTimeMillis() 和 System.nanoTime() 哪个更快?大部分人都会答错!