当前位置:网站首页>「小样本深度学习图像识别」最新2022综述
「小样本深度学习图像识别」最新2022综述
2022-07-06 19:44:00 【智源社区】

图像识别是图像研究领域的核心问题, 解决图像识别问题对人脸识别、自动驾驶、机器人等各领域研究都有重要意义. 目前广泛使用的基于深度神经网络的机器学习方法, 已经在鸟类分类、人脸识别、日常物品分类等图像识别数据集上达到了超过人类的水平, 同时越来越多的工业界应用开始考虑基于深度神经网络的方法, 以完成一系列图像识别业务. 但是深度学习方法极度依赖大规模标注数据, 这一缺陷极大地限制了深度学习方法在实际图像识别任务中的应用. 针对这一问题, 越来越多的研究者开始研究如何基于少量的图像识别标注样本来训练识别模型. 为了更好地理解基于少量标注样本的图像识别问题, 广泛地讨论了几种图像识别领域主流的少量标注学习方法, 包括基于数据增强的方法、基于迁移学习的方法以及基于元学习的方法, 通过讨论不同算法的流程以及核心思想, 可以清晰地看到现有方法在解决少量标注的图像识别问题上的优点和不足. 最后针对现有方法的局限性, 指出了小样本图像识别未来的研究方向.
地址:
http://www.jos.org.cn/jos/article/abstract/6342?st=article_issue
现在的机器学习方法, 尤其是基于深度神经网络的机器学习方法已经在人脸识别[1]、自动驾驶[2]、机器人[3] 等图像识别相关领域取得了巨大的成就, 有的甚至已经超过人类目前的识别水平. 然而在深度学习取得巨大成就 的同时, 人们发现把其应用到实际问题中却困难重重. 首先是标注数据的问题, 目前的深度学习方法需要大量的标 注数据来进行训练[4] , 但是实际应用中数据获取往往是困难的, 这之中既有个人隐私的问题, 比如人脸数据, 也有 问题对象本身就很少的问题, 比如识别珍稀保护动物的问题, 除此之外, 数据标注工作往往需要耗费大量人力物力, 从而阻碍了深度学习技术在图像识别领域的落地. 其次是算力问题, 深度学习方法在提高算法性能的同时, 往往伴随着庞大的网络运算, 这也就使得深度学习的方法很难部署在计算资源受限的设备上, 因此在一些算力受限 的应用场景, 比如自动驾驶、机器人、道路监控等问题中, 图像识别任务目前大多还是使用一些低智能化、低算力消耗的技术完成的, 这同样严重阻碍了智能化图像识别技术的发展.
与之相反, 人类的识别却是相对轻量的, 即并不需要收集大量的数据来进行学习, 更不需要长时间的思考或者 计算[5] . 比如父母教新生婴儿识字, 分辨动物, 只需要简单地在家里贴上一两幅相应的字画即可, 小孩很快就会认 识上面的内容. 如何在保留现在的深度学习方法强大的知识表示能力的同时, 使其可以快速从少量样本中学习到 有用的知识, 这种基于小样本的图像识别问题已经逐渐引起了人们的注意.
本文将按照下面的顺序来展开讨论, 首先在第 1 节介绍小样本图像识别的问题描述, 然后会在第 2 节介绍基 于数据增强的小样本学习算法, 在第 3 部分介绍基于迁移学习的算法, 在第 4 节介绍基于元学习的算法, 会在第 5 节介绍现在广泛使用的小样本图像识别问题评价指标, 并对比上面介绍的算法在该问题基准上的性能, 最后会在 第 6 部分指出现有算法的不足以及未来的发展方向.
边栏推荐
- 杰理之开 BLE 退出蓝牙模式卡机问题【篇】
- Starting from 1.5, build a micro Service Framework -- log tracking traceid
- Electrical engineering and automation
- 左程云 递归+动态规划
- Kysl Haikang camera 8247 H9 ISAPI test
- How to verify accesstoken in oauth2 protocol
- How-PIL-to-Tensor
- 杰理之播内置 flash 提示音控制播放暂停【篇】
- 尚硅谷JVM-第一章 类加载子系统
- unrecognized selector sent to instance 0x10b34e810
猜你喜欢

Summary of basic debugging steps of S120 driver

Form validation of uniapp

杰理之播内置 flash 提示音控制播放暂停【篇】

Install redis from zero

A complete tutorial for getting started with redis: AOF persistence

leetcode

The first symposium on "quantum computing + application of financial technology" was successfully held in Beijing

Qt蓝牙:QBluetoothDeviceInfo

How to design interface test cases? Teach you a few tips to draft easily

Oauth2协议中如何对accessToken进行校验
随机推荐
How does C language (string) delete a specified character in a string?
uniapp的表单验证
Le tube MOS réalise le circuit de commutation automatique de l'alimentation principale et de l'alimentation auxiliaire, et la chute de tension "zéro", courant statique 20ua
如何分析粉丝兴趣?
New benchmark! Intelligent social governance
Redis getting started complete tutorial: replication topology
2022年信息安全工程师考试大纲
The first symposium on "quantum computing + application of financial technology" was successfully held in Beijing
How to verify accesstoken in oauth2 protocol
【2022国赛模拟】多边形——计算几何、二分答案、倍增
又一百万量子比特!以色列光量子初创公司完成1500万美元融资
【Swift】学习笔记(一)——熟知 基础数据类型,编码风格,元组,主张
The annual salary of general test is 15W, and the annual salary of test and development is 30w+. What is the difference between the two?
How to find file accessed / created just feed minutes ago
Redis入门完整教程:RDB持久化
Es6中Promise的使用
【Socket】①Socket技术概述
杰理之发射端在接收端关机之后假死机【篇】
Left path cloud recursion + dynamic planning
C language exercises_ one