当前位置:网站首页>CVPR 2022 | 大幅减少零样本学习所需的人工标注,马普所和北邮提出富含视觉信息的类别语义嵌入
CVPR 2022 | 大幅减少零样本学习所需的人工标注,马普所和北邮提出富含视觉信息的类别语义嵌入
2022-06-29 15:33:00 【智源社区】
零样本学习旨在模仿人类的推理过程,利用可见类别的知识,对没有训练样本的不可见类别进行识别。类别嵌入(class embeddings)是描述类别语义和视觉特征的向量,能够实现知识在类别间的转移,因而在零样本学习中发挥着不可替代的作用。

零样本分类图解
如上图所示,由于属性(attributes)能够被不同类别共享,促进了知识在类别间的转移,因此是使用最广泛的类别嵌入。并在其他计算机视觉任务(如面部识别、细粒度分类、时尚趋势预测)中被广泛用作辅助信息。
然而属性标注过程需要大量人力投入和专家知识,限制了零样本学习在新数据集上的拓展。此外,受限于人类的认知局限,其标注的属性无法遍历视觉空间,因而图像中一些具有辨别性的特征无法被属性捕捉,导致零样本学习效果不佳。
针对以上问题,来自北京邮电大学、马普所等机构的研究者提出了类别嵌入发掘网络(Visually-Grounded Semantic Embedding Network, VGSE),本文主要回答了两个问题:(1)如何从可见类图像中自动发掘具有语义和视觉特征的类别嵌入;(2)如何在没有训练样本的情况下,为不可见类别预测类别嵌入。

VGSE 模型结构图
边栏推荐
- MySQL JSON array operation JSON_ array_ append、json_ array_ insert
- LeetCode-234-回文链表
- 复数卷积神经网络:CV-CNN
- swift JSONSerialization
- Google software version experience cycle
- 近期工作总结
- PostgreSQL source code learning (23) -- transaction log ④ - log assembly
- What are the advantages of intelligent chat robots? Senior independent station sellers tell you!
- 14.IP协议-bite
- C # learning 1: value type and reference type
猜你喜欢

PostgreSQL source code learning (24) -- transaction log ⑤ - log writing to wal buffer

数字图像处理复习

深度学习遥感数据集

CKS CKA ckad change terminal to remote desktop

File common tool class, stream related application (record)

curl: (56) Recv failure: Connection reset by peer
[data analysis] five common questions about learning SQL?

ImgUtil 图片处理工具类,文字提取,图片水印

《网络是怎么样连接的》读书笔记 - 服务器端的局域网中(四)

Paging SQL (rownum, row_number, deny_rank, rank)
随机推荐
C語言大作業——匹配系統
Cmake learning-2
Middle order and post order traversal to construct binary tree [recursive partition interval and backtracking splicing subtree + similarity and difference between middle post order and middle pre orde
Flink SQL任务TaskManager内存设置
如何使用SMS向客户传递服务信息?指南在这里!
CSDN无法复制问题
DataKit 作为本地获取数据的 API 服务器
明德扬XILINX-K7-325T/410T核心板数据手册
Leetcode notes: biweekly contest 81
中序和后序遍历构建二叉树[递归划分区间与回溯拼接子树+中后序和中前序的相似与不同]
Andorid Jetpack Hilt
关于SQL+NoSQL : NewSQL数据库
动态监听DOM元素高度变化
C language big job - Matching System
14.IP协议-bite
List集合详细讲解
Building SQL statements in Excel
GWD: rotating target detection based on Gaussian Wasserstein distance | ICML 2021
《网络是怎么样连接的》读书笔记 - 服务器端的局域网中(四)
taro3.*中使用 dva 入门级别的哦