当前位置:网站首页>机器学习在竞赛和工业界应用区别
机器学习在竞赛和工业界应用区别
2022-07-30 13:44:00 【毛飞龙】
机器学习在竞赛和工业界应用是有很大区别的,竞赛通常关注极致的评价指标,而工业应用会在满足应用标准的前提下,会更加关注模型的稳定性、可解释性和领域专家知识的应用
竞赛
通常为了取的比赛名次,极致地通过各种方法提升评价指标
- 数据质量:数据源不变,不关注数据质量提升
- 模型应用:使用新模型、复杂模型、模型融合的方法
- 特征工程:使用计算代价很高的数据增强
- 调参:进行大量的模型调参工作
- 稳定性:离线模型,对稳定性要求低
- 领域专家知识:很多竞赛甚至会对原始数据进行脱敏(如字段名称重新标记),防止专家知识的运用,因此竞赛中的领域专家知识运用较少
工业应用
通常在满足应用场景的条件下,更加关注模型的稳定性,注重数据质量的不断提升
- 数据质量:数据是不断变化的,因此关注数据质量提升
- 模型应用:一般使用主流、相对简单的模型,较少使用复杂模型、模型融合的方法,这对于模型的可解释性以及问题debug会有帮助
- 特征工程:关注工程性能,一般不会使用计算代价很高的数据增强
- 调参:超参数固定后,较长时间不动(一般一年调几次)
- 稳定性:生产环境线上实时模型部署,对稳定性要求高
- 领域专家知识:会运用专家知识、理论模型进行建模
边栏推荐
- [Advanced ROS] Lecture 11 Robot co-simulation based on Gazebo and Rviz (motion control and sensors)
- cpu/CS and IP
- CF1320E Treeland and Viruses
- 电池包托盘有进水风险,存在安全隐患,紧急召回52928辆唐DM
- Jenkins自动化部署项目
- libudev 使用说明书
- Skywalking入门
- LeetCode二叉树系列——116.填充每个节点的下一个右侧指针
- AT4108 [ARC094D] Normalization
- LeetCode二叉树系列——145.二叉树的后序遍历
猜你喜欢

以unity3d为例解读:游戏数据加密

00 testers of seasoning after nearly a year, whether to change careers or to learn the software testing students summarized the following heart advice

cpu / CS 和 IP

Flask框架——Flask-Mail邮件

OFDM Sixteen Lectures 3- OFDM Waveforms

The way of programmers' cultivation: do one's own responsibilities, be clear in reality - lead to the highest realm of pragmatism

数据中台建设(五):打破企业数据孤岛和提取数据价值

百家号取消接口发文功能:插外链获权重被堵死

TaskDispatcher source code parsing

Flask框架——Sijax
随机推荐
Study Notes - Becoming a Data Analyst in Seven Weeks "Week 2: Business": Business Analysis Metrics
05 | login background: based on the password login mode (below)
jsArray array copy method performance test 2207292307
pytorch学习记录(六):循环神经网络 RNN & LSTM
CF338E Optimize!
redis6.0 源码学习(五)ziplist
近两年激光雷达运动物体分割论文阅读小结
3年软件测试经验面试要求月薪22K,明显感觉他背了很多面试题...
How awesome is the "12306" architecture?
jsArray数组复制方法性能测试2207292307
shell脚本流程控制语句
The way of programmers' cultivation: do one's own responsibilities, be clear in reality - lead to the highest realm of pragmatism
LeetCode二叉树系列——145.二叉树的后序遍历
jsArray array copy method performance test 2207300823
数据中台建设(五):打破企业数据孤岛和提取数据价值
电池包托盘有进水风险,存在安全隐患,紧急召回52928辆唐DM
SQL 26 calculation under 25 years of age or older and the number of users
【自校正控制】自校正PID
LeetCode二叉树系列——199二叉树的右视图
2022年,目前大环境下还适合转行软件测试吗?