当前位置:网站首页>HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态
HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态
2022-07-30 20:01:00 【nginx】

【精彩回顾】
1、抖音网红IP“虎墩小镖师”强势来袭
2、同声传译新亮相,底层技术大揭秘
3、AI翻译能力升级,语种扩充可播报
【专家观点】

Nicolas,华为2012实验室文本机器翻译高级专家
机器翻译暂时无法替代人类。目前需求不高的翻译需求可以依赖机器但要求较高的翻译需求还需要人工介入,人工可以做到点到面的全方位质量把控,比如说话地道与否、语言通顺与否,还可以贡献数据和知识,提升机器翻译质量。

Hardy,HMS Core ML Kit 资深产品经理
AI是智能机器的广义领域,而机器学习是AI的核心应用之一。它指的是任何能够自行“学习”的计算机应用程序或程序,而无需人类的明确规则。未来机器学习技术将会更注重情感体验,向多模态(语音、文字、视觉)、多技术(VR/AR等)、多平台多系统协同态势的方向发展。
【精彩答疑】
Q1:什么是TTS音色定制?TTS音色定制与虎墩在碰撞一起会有什么新玩法?
A:依托华为的数据积累和成熟算法,TTS音色定制在语音合成技术的加持下,只需要提供少量的干净录音数据,就可以进行模型训练,得到 高还原度、高清晰度、高稳定性的专属音库,助于提升产品特色、快速打造个性化的品牌特色。ML Kit的新能力TTS与 IP“虎墩小镖师”正在合作中,TTS通过机器训练还原虎墩的音色,后续将逐步 开放虎墩音色给开发者使用,助力开发者应用在各类个性化场景。
Q2:机器学习服务提供的翻译和同声传译能力,如何赋能App打造新“声”态?
A:文本翻译能力解决了用户因语言不通而导致交流不畅的痛点。比如通话场景,经过实时语音识别,可以 快速将识别的文字转化为目标语言文字;阅读场景,支持 提词翻译器功能,帮助用户快捷看到译文;视频类App集成文本翻译服务后,用户可以流畅体验 AI实时字幕功能。通过对语音识别、机器翻译、语音合成三项技术的有机整合, 同声传译能力有较低时延、较高准确率的特性,适用于会议、直播、演讲等实时性高的场景,支持应用将音频内容实时输出为目标语言文字,生成双语字幕,同时对目标语言文本进行实时播报,降低理解成本,兼具质量与效率。
Q3:除以上语音语言类能力,机器学习服务有新推出其它创新能力吗?
A:在金融电商领域,机器学习服务还提供了活体检测能力。 动作活体检测能力使用人脸关键点定位和人脸追踪等技术,通过指令配合动作的形式可以验证用户是否为真实活体本人操作。在银行、证券和借贷等实名制和安全性要求较高的金融领域,活体检测可作为用户远程注册和密码找回环节中的辅助验证,帮助用户甄别欺诈行为,有效抵御攻击行为,保障业务安全。
Q4:机器学习的宏观技术发展趋势是怎样的?
A:首先,机器学习会更加 注重情感体验。机器将具有识别、理解和表达喜怒哀乐的能力,识别用户的需求以及环境信息的变化,理解人的情感意图,做出适当反应;其次,是 多模态的发展。深度学习技术正从语音、文字、视觉等单模态向学习多模态智能学习发展。未来甚至可以对嗅觉、味觉、心理学等难以量化的信号进行融合,实现多个模态的联合分析,在更多场景、更多业务上辅助人类工作;再次, 是多技术的融合,比如VR/AR以及元宇宙等。相信未来AI还将呈现 多平台多系统协同态势,以实现更为广泛的赋能,将通用平台、行业平台和端侧应用的协同组合,以软硬一体的方式实现具体应用的功能定制和扩展。
欢迎登录HMS Core机器学习服务首页了解更多技术细节。
了解更多详情>>
访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee
关注我们,第一时间了解 HMS Core 最新技术资讯~
边栏推荐
- mysql慢查询优化
- 推荐系统:实时性【特征实时性:客户端实时特征(秒级,实时)、流处理平台(分钟级,近实时)、分布式批处理平台(小时/天级,非实时)】【模型实时性:在线学习、增量更新、全量更新】
- Install MySQL tutorial under Linux
- These services can't ali interview?Then don't go to, the basic notification, etc
- 移动web开发01
- MySQL performance optimization (hardware, system configuration, table structure, SQL statements)
- .eslintrc.js for musicApp
- 在jOOQ中获取数据的多种不同方式
- 普通的int main(){}没有写return 0;会怎么样?
- 线性结构:栈和队列
猜你喜欢
随机推荐
Recommender systems: overview of the characteristics of architecture: user/item engineering -- -- -- -- -- -- -- -- > recall layer > sort layer - > test/evaluation 】 【 cold start problems, real-time 】
阿里面试官:给我描述一下缓存击穿的现象,并说说你的解决思路?
利用go制作微信机器人
PHP低代码开发引擎—表单设计
WPS怎么独立窗口显示?wps单独窗口显示怎么操作?
基于人脸的常见表情识别(1)——深度学习基础知识
[Node implements data encryption]
MySQL six-pulse sword, SQL customs clearance summary
Linux download and install mysql5.7 version tutorial the most complete and detailed explanation
MySQL复制表结构、表数据的方法
linux下mysql8安装
Cesium加载离线地图和离线地形
MySQL Functions (Classic Collection)
[Private Series] All kinds of strange problems encountered in daily PHP
历史上的今天:Win10 七周年;微软和雅虎的搜索协议;微软发行 NT 4.0
MySQL数据库字段超长问题
MySQL六脉神剑,SQL通关大总结
Download and installation of the latest version of MySQL 8.0 under Linux (detailed steps)
M3SDA: Moment matching for multi-source domain adaptation
我是一名阿里在职9年软件测试工程师,我的经历也许能帮到处于迷茫期的你