当前位置:网站首页>CVPR 2022 | 大幅减少零样本学习所需的人工标注,马普所和北邮提出富含视觉信息的类别语义嵌入
CVPR 2022 | 大幅减少零样本学习所需的人工标注,马普所和北邮提出富含视觉信息的类别语义嵌入
2022-06-29 15:33:00 【智源社区】
零样本学习旨在模仿人类的推理过程,利用可见类别的知识,对没有训练样本的不可见类别进行识别。类别嵌入(class embeddings)是描述类别语义和视觉特征的向量,能够实现知识在类别间的转移,因而在零样本学习中发挥着不可替代的作用。

零样本分类图解
如上图所示,由于属性(attributes)能够被不同类别共享,促进了知识在类别间的转移,因此是使用最广泛的类别嵌入。并在其他计算机视觉任务(如面部识别、细粒度分类、时尚趋势预测)中被广泛用作辅助信息。
然而属性标注过程需要大量人力投入和专家知识,限制了零样本学习在新数据集上的拓展。此外,受限于人类的认知局限,其标注的属性无法遍历视觉空间,因而图像中一些具有辨别性的特征无法被属性捕捉,导致零样本学习效果不佳。
针对以上问题,来自北京邮电大学、马普所等机构的研究者提出了类别嵌入发掘网络(Visually-Grounded Semantic Embedding Network, VGSE),本文主要回答了两个问题:(1)如何从可见类图像中自动发掘具有语义和视觉特征的类别嵌入;(2)如何在没有训练样本的情况下,为不可见类别预测类别嵌入。

VGSE 模型结构图
边栏推荐
- MySQL为什么选择B+树存储索引
- Dynamically listening for DOM element height changes
- 极化SAR几种成像模式
- 《网络是怎么样连接的》读书笔记 - 服务器端的局域网中(四)
- curl: (56) Recv failure: Connection reset by peer
- C language big job - Matching System
- Motion capture system for apple picking robot
- C SQLite class library
- I am 35 years old. Can I change my career to be a programmer?
- Building SQL statements in Excel
猜你喜欢

curl: (56) Recv failure: Connection reset by peer

Paging SQL (rownum, row_number, deny_rank, rank)

13.TCP-bite

GWD:基于高斯Wasserstein距离的旋转目标检测 | ICML 2021

关于SQL+NoSQL : NewSQL数据库

Imgutil image processing tool class, text extraction, image watermarking

12.UDP协议-bite

《网络是怎么样连接的》读书笔记 - WEB服务端请求和响应(五)

EasyGBS调用获取实时快照接口时,出现白色方块该如何解决?

three.js和高德地图结合引入obj格式模型-效果演示
随机推荐
kotlin 注解聲明與使用
swoole TCP 分布式实现
深度学习网络的训练方式
List集合详细讲解
高分三号卫星(GF-3)简介
微信公告号自动回复使用图灵机器人实现智能回复
C#学习一:值类型与引用类型
动态监听DOM元素高度变化
C language homework - matching system
Scroll,你玩明白了嘛?
在shop工程中,实现一个菜单(增删改查)
Google 软件版本经历周期
Taro 小程序开启wxml代码压缩
明德扬XILINX-K7-325T/410T核心板数据手册
[data analysis] five common questions about learning SQL?
GWD:基于高斯Wasserstein距离的旋转目标检测 | ICML 2021
89.(cesium篇)cesium聚合图(自定义图片)
14.ip protocol -bite
EasyGBS调用获取实时快照接口时,出现白色方块该如何解决?
企业转型升级之道:数字化转型,思想先行