当前位置:网站首页>「小样本深度学习图像识别」最新2022综述
「小样本深度学习图像识别」最新2022综述
2022-07-06 19:44:00 【智源社区】
图像识别是图像研究领域的核心问题, 解决图像识别问题对人脸识别、自动驾驶、机器人等各领域研究都有重要意义. 目前广泛使用的基于深度神经网络的机器学习方法, 已经在鸟类分类、人脸识别、日常物品分类等图像识别数据集上达到了超过人类的水平, 同时越来越多的工业界应用开始考虑基于深度神经网络的方法, 以完成一系列图像识别业务. 但是深度学习方法极度依赖大规模标注数据, 这一缺陷极大地限制了深度学习方法在实际图像识别任务中的应用. 针对这一问题, 越来越多的研究者开始研究如何基于少量的图像识别标注样本来训练识别模型. 为了更好地理解基于少量标注样本的图像识别问题, 广泛地讨论了几种图像识别领域主流的少量标注学习方法, 包括基于数据增强的方法、基于迁移学习的方法以及基于元学习的方法, 通过讨论不同算法的流程以及核心思想, 可以清晰地看到现有方法在解决少量标注的图像识别问题上的优点和不足. 最后针对现有方法的局限性, 指出了小样本图像识别未来的研究方向.
地址:
http://www.jos.org.cn/jos/article/abstract/6342?st=article_issue
现在的机器学习方法, 尤其是基于深度神经网络的机器学习方法已经在人脸识别[1]、自动驾驶[2]、机器人[3] 等图像识别相关领域取得了巨大的成就, 有的甚至已经超过人类目前的识别水平. 然而在深度学习取得巨大成就 的同时, 人们发现把其应用到实际问题中却困难重重. 首先是标注数据的问题, 目前的深度学习方法需要大量的标 注数据来进行训练[4] , 但是实际应用中数据获取往往是困难的, 这之中既有个人隐私的问题, 比如人脸数据, 也有 问题对象本身就很少的问题, 比如识别珍稀保护动物的问题, 除此之外, 数据标注工作往往需要耗费大量人力物力, 从而阻碍了深度学习技术在图像识别领域的落地. 其次是算力问题, 深度学习方法在提高算法性能的同时, 往往伴随着庞大的网络运算, 这也就使得深度学习的方法很难部署在计算资源受限的设备上, 因此在一些算力受限 的应用场景, 比如自动驾驶、机器人、道路监控等问题中, 图像识别任务目前大多还是使用一些低智能化、低算力消耗的技术完成的, 这同样严重阻碍了智能化图像识别技术的发展.
与之相反, 人类的识别却是相对轻量的, 即并不需要收集大量的数据来进行学习, 更不需要长时间的思考或者 计算[5] . 比如父母教新生婴儿识字, 分辨动物, 只需要简单地在家里贴上一两幅相应的字画即可, 小孩很快就会认 识上面的内容. 如何在保留现在的深度学习方法强大的知识表示能力的同时, 使其可以快速从少量样本中学习到 有用的知识, 这种基于小样本的图像识别问题已经逐渐引起了人们的注意.
本文将按照下面的顺序来展开讨论, 首先在第 1 节介绍小样本图像识别的问题描述, 然后会在第 2 节介绍基 于数据增强的小样本学习算法, 在第 3 部分介绍基于迁移学习的算法, 在第 4 节介绍基于元学习的算法, 会在第 5 节介绍现在广泛使用的小样本图像识别问题评价指标, 并对比上面介绍的算法在该问题基准上的性能, 最后会在 第 6 部分指出现有算法的不足以及未来的发展方向.
边栏推荐
- New benchmark! Intelligent social governance
- How does C language (string) delete a specified character in a string?
- The solution of unable to create servlet file after idea restart
- Detailed explanation of 19 dimensional integrated navigation module sinsgps in psins (initial assignment part)
- oracle连接池长时间不使用连接失效问题
- Redis入门完整教程:AOF持久化
- Cglib agent in agent mode
- 2022年信息安全工程师考试大纲
- 硬件之OC、OD、推挽解释
- Classify the features of pictures with full connection +softmax
猜你喜欢
MOS transistor realizes the automatic switching circuit of main and auxiliary power supply, with "zero" voltage drop and static current of 20ua
A complete tutorial for getting started with redis: RDB persistence
Derivative, partial derivative, directional derivative
如何分析粉丝兴趣?
Redis入门完整教程:问题定位与优化
input_delay
How to write test cases for test coupons?
The annual salary of general test is 15W, and the annual salary of test and development is 30w+. What is the difference between the two?
[secretly kill little partner pytorch20 days] - [Day1] - [example of structured data modeling process]
Development of wireless communication technology, cv5200 long-distance WiFi module, UAV WiFi image transmission application
随机推荐
Shell 编程基础
leetcode
新标杆!智慧化社会治理
Summary of basic debugging steps of S120 driver
Qt蓝牙:QBluetoothDeviceInfo
The solution of unable to create servlet file after idea restart
tensorboard的使用
[secretly kill little partner pytorch20 days] - [Day1] - [example of structured data modeling process]
sshd[12282]: fatal: matching cipher is not supported: [email protected] [preauth]
杰理之播内置 flash 提示音控制播放暂停【篇】
2022年信息安全工程师考试大纲
从零安装Redis
Matlb| economic scheduling with energy storage, opportunity constraints and robust optimization
应用程序启动速度的优化
uniapp的表单验证
Number theory --- fast power, fast power inverse element
Cryptography series: detailed explanation of online certificate status protocol OCSP
Another million qubits! Israel optical quantum start-up company completed $15million financing
Form validation of uniapp
Redis入门完整教程:客户端管理