当前位置:网站首页>机器学习在竞赛和工业界应用区别
机器学习在竞赛和工业界应用区别
2022-07-30 13:44:00 【毛飞龙】
机器学习在竞赛和工业界应用是有很大区别的,竞赛通常关注极致的评价指标,而工业应用会在满足应用标准的前提下,会更加关注模型的稳定性、可解释性和领域专家知识的应用
竞赛
通常为了取的比赛名次,极致地通过各种方法提升评价指标
- 数据质量:数据源不变,不关注数据质量提升
- 模型应用:使用新模型、复杂模型、模型融合的方法
- 特征工程:使用计算代价很高的数据增强
- 调参:进行大量的模型调参工作
- 稳定性:离线模型,对稳定性要求低
- 领域专家知识:很多竞赛甚至会对原始数据进行脱敏(如字段名称重新标记),防止专家知识的运用,因此竞赛中的领域专家知识运用较少
工业应用
通常在满足应用场景的条件下,更加关注模型的稳定性,注重数据质量的不断提升
- 数据质量:数据是不断变化的,因此关注数据质量提升
- 模型应用:一般使用主流、相对简单的模型,较少使用复杂模型、模型融合的方法,这对于模型的可解释性以及问题debug会有帮助
- 特征工程:关注工程性能,一般不会使用计算代价很高的数据增强
- 调参:超参数固定后,较长时间不动(一般一年调几次)
- 稳定性:生产环境线上实时模型部署,对稳定性要求高
- 领域专家知识:会运用专家知识、理论模型进行建模
边栏推荐
- LeetCode二叉树系列——102.二叉树的层序遍历
- jsArray array copy method performance test 2207300823
- ENVI Image Processing (6): NDVI and Vegetation Index
- cpu / CS 和 IP
- Jenkins自动化部署项目
- Self-tuning PID self-tuning control 】 【
- VLAN实验
- ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略
- TaskDispatcher source code parsing
- pytorch学习记录(五):卷积神经网络的实现
猜你喜欢

cpu/CS and IP

电池包托盘有进水风险,存在安全隐患,紧急召回52928辆唐DM

无代码开发平台应用可见权限设置入门教程

3 years of software testing experience, the interview requires a monthly salary of 22K, obviously he has memorized a lot of interview questions...

还在说软件测试没有中年危机?9年测试工程师惨遭淘汰

js背景切换时钟js特效代码

创意loadingjs特效小点跳跃动画

桌面软件开发框架大赏

人社部公布“数据库运行管理员”成新职业,OceanBase参与制定职业标准

时序数据库在船舶风险管理领域的应用
随机推荐
MQTT网关读取西门子PLC数据传输到阿里云平台案例教程
ESP32 反复重启问题 Arduino屏蔽断电探测器
电池包托盘有进水风险,存在安全隐患,紧急召回52928辆唐DM
ARC115F Migration
戴墨镜的卡通太阳SVG动画js特效
华为7年经验的软件测试总监,给所有想转行学软件测试的朋友几点建议
jsArray数组复制方法性能测试2207300823
ARC115F Migration
shell script flow control statement
无代码开发平台全部应用设置入门教程
[Advanced ROS] Lecture 11 Robot co-simulation based on Gazebo and Rviz (motion control and sensors)
地形分析的主要内容(流浪地球的特效水平)
eclipse连接SQL server数据库「建议收藏」
数据中台建设(五):打破企业数据孤岛和提取数据价值
逻辑漏洞----权限类漏洞
Flask框架——Flask-Mail邮件
TaskDispatcher源码解析
CF1677E Tokitsukaze and Beautiful Subsegments
libudev manual
LeetCode二叉树系列——515.最每个树行中找最大值