当前位置：网站首页>“多模态”概念

“多模态”概念

2022-07-06 23:35:00 【hei_hei_hei_】

模态 && 多模态

模态

每一种信息的来源或者形式，都可以称为一种模态。例如，人有触觉，听觉，视觉，嗅觉；信息的媒介，有语音、视频、文字等；多种多样的传感器，如雷达、红外、加速度计等。以上的每一种都可以称为一种模态。
同时，模态也可以有非常广泛的定义，比如我们可以把两种不同的语言当做是两种模态，甚至在两种不同情况下采集到的数据集，亦可认为是两种模态。

多模态

因此，多模态机器学习，英文全称 MultiModal Machine Learning (MMML)，旨在通过机器学习的方法实现处理和理解多源模态信息的能力。目前比较热门的研究方向是图像、视频、音频、语义之间的多模态学习。
多模态学习从1970年代起步，经历了几个发展阶段，在2010后全面步入Deep Learning阶段。
人其实是一个多模态学习的总和，所以也有”砖家“说了，多模态学习才是真正的人工智能发展方向。

转自多模态定义

原网站

版权声明
本文为[hei_hei_hei_]所创，转载请带上原文链接，感谢
https://blog.csdn.net/hei_hei_hei_/article/details/125575051