当前位置:网站首页>“多模态”概念
“多模态”概念
2022-07-06 23:35:00 【hei_hei_hei_】
模态 && 多模态
模态
每一种信息的来源或者形式,都可以称为一种模态。例如,人有触觉,听觉,视觉,嗅觉;信息的媒介,有语音、视频、文字等;多种多样的传感器,如雷达、红外、加速度计等。以上的每一种都可以称为一种模态。
同时,模态也可以有非常广泛的定义,比如我们可以把两种不同的语言当做是两种模态,甚至在两种不同情况下采集到的数据集,亦可认为是两种模态。
多模态
因此,多模态机器学习,英文全称 MultiModal Machine Learning (MMML),旨在通过机器学习的方法实现处理和理解多源模态信息的能力。目前比较热门的研究方向是图像、视频、音频、语义之间的多模态学习。
多模态学习从1970年代起步,经历了几个发展阶段,在2010后全面步入Deep Learning阶段。
人其实是一个多模态学习的总和,所以也有”砖家“说了,多模态学习才是真正的人工智能发展方向。
转自多模态定义
边栏推荐
- How does redis implement multiple zones?
- pytest测试框架——数据驱动
- Wonderful express | Tencent cloud database June issue
- 做自媒体视频剪辑,专业的人会怎么寻找背景音乐素材?
- 2039: [Bluebridge cup 2022 preliminaries] Li Bai's enhanced version (dynamic planning)
- 《2》 Label
- Make web content editable
- 痛心啊 收到教训了
- Two methods of thread synchronization
- Is it necessary to renew the PMP certificate?
猜你喜欢

带你遨游银河系的 10 种分布式数据库

10 distributed databases that take you to the galaxy

Two person game based on bevy game engine and FPGA

Intelligent annotation scheme of entity recognition based on hugging Face Pre training model: generate doccano request JSON format

HarmonyOS第四次培训
![[JS component] date display.](/img/26/9bfc752c8c9a933a8e33b59e0488a2.jpg)
[JS component] date display.

pytest测试框架——数据驱动

基于 hugging face 预训练模型的实体识别智能标注方案:生成doccano要求json格式

Pytest testing framework -- data driven

MySQL数据库学习(8) -- mysql 内容补充
随机推荐
c语言神经网络基本代码大全及其含义
SQL injection HTTP header injection
《5》 Table
【QT】自定义控件-Loading
Use Zhiyun reader to translate statistical genetics books
Auto. JS get all app names of mobile phones
Linkedblockingqueue source code analysis - initialization
EGR-20USCM接地故障继电器
app clear data源码追踪
Under the trend of Micah, orebo and apple homekit, how does zhiting stand out?
Longest common subsequence (LCS) (dynamic programming, recursive)
pmp真的有用吗?
DFS,BFS以及图的遍历搜索
MySQL数据库学习(7) -- pymysql简单介绍
最长公共子序列(LCS)(动态规划,递归)
AIDL 与Service
漏电继电器JOLX-GS62零序孔径Φ100
TabLayout修改自定义的Tab标题不生效问题
The sooner you understand the four rules of life, the more blessed you will be
高级程序员必知必会,一文详解MySQL主从同步原理,推荐收藏