当前位置:网站首页>多模态 参考资料汇总
多模态 参考资料汇总
2022-08-03 19:24:00 【friedrichor】
介绍
数据集
- The Interactive Emotional Dyadic Motion Capture (IEMOCAP) Database
数据库范围:情绪表达的识别与分析、人类二元互动分析、情绪敏感的人机界面和虚拟代理的设计
信息:关键词:情感、多模式、表演、二元;语言:英语;10名演员:5男5女;情绪激发技巧:即兴创作和脚本
可用的方式:动作捕捉人脸信息;演讲;视频;头部运动和头部角度信息;对话转录;词级、音节级和音素级对齐 - MS COCO (Microsoft Common Objects in Context)
MS COCO 数据集的第一个版本于 2014 年发布。它包含 164K 图像,拆分为训练 (83K)、验证 (41K) 和测试 (41K) 集。2015 年发布了额外的 81K 图像测试集,包括以前的所有测试图像和 40K 新图像。
目标检测:具有 80 个对象类别的边界框和每个实例的分割掩码,
字幕:图像的自然语言描述(参见 MS COCO 字幕),
关键点检测:包含超过 200,000 张图像和 250,000 个用关键点标记的人员实例(17 个可能的关键点,例如左眼、鼻子、右臀部、右脚踝),
填充图像分割: 具有 91 个填充类别的每像素分割掩码,例如草、墙、天空,
全景:全场景分割,有 80 个事物类别(例如人、自行车、大象)和 91 个事物类别的子集(草、天空、道路),
dense pose:超过 39,000 张图像和 56,000 个使用 DensePose 注释标记的人员实例——每个标记的人员都使用实例 ID 以及属于该人体的图像像素与模板 3D 模型之间的映射进行注释。注释仅对训练和验证图像公开可用。
论文+代码
- 多模态预训练模型综述(论文+代码汇总)
- Recent Advances in Vision and Language PreTrained Models (VL-PTMs)(视觉和语言预训练模型 (VL-PTM) 的最新进展)(论文+代码汇总,最后更新于2021/06/14)
…
边栏推荐
- Word另存为PDF后无导航栏解决办法
- 阿里巴巴政委体系-第九章、阿里政委启示录
- Rust:多线程并发编程
- Postgresql-xl global snapshot and GTM code walking (branch line)
- BinaryIndexedTrees树状数组
- Calculation of the array serial number of Likou brush questions (one question per day 7/28)
- 「游戏建模干货」建模大师几步操作,学习经典,赶紧脑补一下吧
- 线上一次JVM FullGC搞得整晚都没睡,彻底崩溃
- LeetCode 952. Calculate Maximum Component Size by Common Factor
- 盘点在线帮助中心对企业能够起到的作用
猜你喜欢

图像超分——Real-ESRGAN快速上手

Cobalt Strike (CS) 逆向初探

MySQL【变量、流程控制与游标】

阿里巴巴政委体系-第七章、阿里政委培育

Solution for no navigation bar after Word is saved as PDF
![[Notes] Introduction to machine learning](/img/69/e2acd3efd5f513c9c32fca701b66c0.png)
[Notes] Introduction to machine learning

建模该从哪一步开始?给你分析,给零基础的你一些学习建议

Line the last time the JVM FullGC make didn't sleep all night, collapse
手把手教你定位线上MySQL慢查询问题,包教包会

京东云发布新一代分布式数据库StarDB 5.0
随机推荐
idea——同一项目开启多个实例(不同端口)
MYSQL误删数据恢复
阿里巴巴政委体系-第七章、阿里政委培育
利用net-snmp的库实现snmpget,snmpset
Handler 源码解析
图像超分——Real-ESRGAN快速上手
力扣刷题之求两数之和
pg_memory_barrier_impl in Postgresql and C's volatile
CentOS 7 安装mysql
基于移动GIS的环保生态管理系统
Postgresql源码(65)新快照体系Globalvis工作原理分析
OneNote 教程,如何在 OneNote 中设置页面格式?
【微信小程序】NFC 标签打开小程序
微信小程序分享功能
MySQL读写分离的三种实现方案
Teach you to locate online MySQL slow query problem hand by hand, package teaching package meeting
如何理解即时通讯开发移动网络的“弱”和“慢”
Postgresql中的pg_memory_barrier_impl和C的volatile
unity3d-游戏物体控制方法
X86 function call model analysis