当前位置:网站首页>「小样本深度学习图像识别」最新2022综述
「小样本深度学习图像识别」最新2022综述
2022-07-06 19:44:00 【智源社区】

图像识别是图像研究领域的核心问题, 解决图像识别问题对人脸识别、自动驾驶、机器人等各领域研究都有重要意义. 目前广泛使用的基于深度神经网络的机器学习方法, 已经在鸟类分类、人脸识别、日常物品分类等图像识别数据集上达到了超过人类的水平, 同时越来越多的工业界应用开始考虑基于深度神经网络的方法, 以完成一系列图像识别业务. 但是深度学习方法极度依赖大规模标注数据, 这一缺陷极大地限制了深度学习方法在实际图像识别任务中的应用. 针对这一问题, 越来越多的研究者开始研究如何基于少量的图像识别标注样本来训练识别模型. 为了更好地理解基于少量标注样本的图像识别问题, 广泛地讨论了几种图像识别领域主流的少量标注学习方法, 包括基于数据增强的方法、基于迁移学习的方法以及基于元学习的方法, 通过讨论不同算法的流程以及核心思想, 可以清晰地看到现有方法在解决少量标注的图像识别问题上的优点和不足. 最后针对现有方法的局限性, 指出了小样本图像识别未来的研究方向.
地址:
http://www.jos.org.cn/jos/article/abstract/6342?st=article_issue
现在的机器学习方法, 尤其是基于深度神经网络的机器学习方法已经在人脸识别[1]、自动驾驶[2]、机器人[3] 等图像识别相关领域取得了巨大的成就, 有的甚至已经超过人类目前的识别水平. 然而在深度学习取得巨大成就 的同时, 人们发现把其应用到实际问题中却困难重重. 首先是标注数据的问题, 目前的深度学习方法需要大量的标 注数据来进行训练[4] , 但是实际应用中数据获取往往是困难的, 这之中既有个人隐私的问题, 比如人脸数据, 也有 问题对象本身就很少的问题, 比如识别珍稀保护动物的问题, 除此之外, 数据标注工作往往需要耗费大量人力物力, 从而阻碍了深度学习技术在图像识别领域的落地. 其次是算力问题, 深度学习方法在提高算法性能的同时, 往往伴随着庞大的网络运算, 这也就使得深度学习的方法很难部署在计算资源受限的设备上, 因此在一些算力受限 的应用场景, 比如自动驾驶、机器人、道路监控等问题中, 图像识别任务目前大多还是使用一些低智能化、低算力消耗的技术完成的, 这同样严重阻碍了智能化图像识别技术的发展.
与之相反, 人类的识别却是相对轻量的, 即并不需要收集大量的数据来进行学习, 更不需要长时间的思考或者 计算[5] . 比如父母教新生婴儿识字, 分辨动物, 只需要简单地在家里贴上一两幅相应的字画即可, 小孩很快就会认 识上面的内容. 如何在保留现在的深度学习方法强大的知识表示能力的同时, 使其可以快速从少量样本中学习到 有用的知识, 这种基于小样本的图像识别问题已经逐渐引起了人们的注意.
本文将按照下面的顺序来展开讨论, 首先在第 1 节介绍小样本图像识别的问题描述, 然后会在第 2 节介绍基 于数据增强的小样本学习算法, 在第 3 部分介绍基于迁移学习的算法, 在第 4 节介绍基于元学习的算法, 会在第 5 节介绍现在广泛使用的小样本图像识别问题评价指标, 并对比上面介绍的算法在该问题基准上的性能, 最后会在 第 6 部分指出现有算法的不足以及未来的发展方向.
边栏推荐
- 从零安装Redis
- HDU ACM 4578 Transformation->段树-间隔的变化
- Software testing -- common assertions of JMeter interface testing
- [secretly kill little partner pytorch20 days] - [Day1] - [example of structured data modeling process]
- Redis入门完整教程:复制拓扑
- Contribution of Writing Series
- mos管實現主副電源自動切換電路,並且“零”壓降,靜態電流20uA
- 换个姿势做运维!GOPS 2022 · 深圳站精彩内容抢先看!
- Matlab Error (Matrix dimensions must agree)
- [2022 national tournament simulation] polygon - computational geometry, binary answer, multiplication
猜你喜欢

What are the characteristics of the operation and maintenance management system

The 8 element positioning methods of selenium that you have to know are simple and practical

巴比特 | 元宇宙每日必读:IP授权是NFT的破圈之路吗?它的难点在哪里?Holder该如何选择合作平台?...

input_delay

Nuggets quantification: obtain data through the history method, and use the same proportional compound weight factor as Sina Finance and snowball. Different from flush

Error: could not find a version that satisfies the requirement xxxxx (from versions: none) solutions

硬件之OC、OD、推挽解释

尚硅谷JVM-第一章 类加载子系统

Le tube MOS réalise le circuit de commutation automatique de l'alimentation principale et de l'alimentation auxiliaire, et la chute de tension "zéro", courant statique 20ua

Don't you know the relationship between JSP and servlet?
随机推荐
Summary of research status of inertial navigation calibration at home and abroad (abridged version)
LeetCode 77:组合
opencv环境的搭建,并打开一个本地PC摄像头。
How to write test cases for test coupons?
从控制理论的角度谈数据分析
上个厕所的功夫,就把定时任务的三种调度策略说得明明白白
C language string sorting
c语言(字符串)如何把字符串中某个指定的字符删除?
2022 spring recruitment begins, and a collection of 10000 word interview questions will help you
Shell 编程基础
Don't you know the relationship between JSP and servlet?
Codeforces Round #264 (Div. 2) C Gargari and Bishops 【暴力】
C language exercises_ one
Derivative, partial derivative, directional derivative
知识图谱构建全流程
sshd[12282]: fatal: matching cipher is not supported: [email protected] [preauth]
How does C language (string) delete a specified character in a string?
Unity uses maskablegraphic to draw a line with an arrow
Code debugging core step memory
Qpushbutton- "function refinement"