当前位置:网站首页>HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态
HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态
2022-07-29 10:22:00 【HMS Core】
HMS Core 在AI领域最新的技术能力有哪些?本期Discovery直播以《与虎墩一起,玩转AI新“声”态》为主题,邀请了HMS Core 机器学习服务产品经理、机器翻译高级专家以及HMS Core的新朋友“虎墩”,为大家展示机器学习的语音语言创新技术,分享机器学习与人工智能的宏观发展趋势。一起回顾一下本期精彩内容!

【精彩回顾】
1、抖音网红IP“虎墩小镖师”强势来袭
2、同声传译新亮相,底层技术大揭秘
3、AI翻译能力升级,语种扩充可播报
【专家观点】
Nicolas,华为2012实验室文本机器翻译高级专家
机器翻译暂时无法替代人类。目前需求不高的翻译需求可以依赖机器但要求较高的翻译需求还需要人工介入,人工可以做到点到面的全方位质量把控,比如说话地道与否、语言通顺与否,还可以贡献数据和知识,提升机器翻译质量。
Hardy,HMS Core ML Kit 资深产品经理
AI是智能机器的广义领域,而机器学习是AI的核心应用之一。它指的是任何能够自行“学习”的计算机应用程序或程序,而无需人类的明确规则。未来机器学习技术将会更注重情感体验,向多模态(语音、文字、视觉)、多技术(VR/AR等)、多平台多系统协同态势的方向发展。
【精彩答疑】
Q1:什么是TTS音色定制?TTS音色定制与虎墩在碰撞一起会有什么新玩法?
A:依托华为的数据积累和成熟算法,TTS音色定制在语音合成技术的加持下,只需要提供少量的干净录音数据,就可以进行模型训练,得到高还原度、高清晰度、高稳定性的专属音库,助于提升产品特色、快速打造个性化的品牌特色。ML Kit的新能力TTS与 IP“虎墩小镖师”正在合作中,TTS通过机器训练还原虎墩的音色,后续将逐步开放虎墩音色给开发者使用,助力开发者应用在各类个性化场景。
Q2:机器学习服务提供的翻译和同声传译能力,如何赋能App打造新“声”态?
A:文本翻译能力解决了用户因语言不通而导致交流不畅的痛点。比如通话场景,经过实时语音识别,可以快速将识别的文字转化为目标语言文字;阅读场景,支持提词翻译器功能,帮助用户快捷看到译文;视频类App集成文本翻译服务后,用户可以流畅体验AI实时字幕功能。通过对语音识别、机器翻译、语音合成三项技术的有机整合,同声传译能力有较低时延、较高准确率的特性,适用于会议、直播、演讲等实时性高的场景,支持应用将音频内容实时输出为目标语言文字,生成双语字幕,同时对目标语言文本进行实时播报,降低理解成本,兼具质量与效率。
Q3:除以上语音语言类能力,机器学习服务有新推出其它创新能力吗?
A:在金融电商领域,机器学习服务还提供了活体检测能力。动作活体检测能力使用人脸关键点定位和人脸追踪等技术,通过指令配合动作的形式可以验证用户是否为真实活体本人操作。在银行、证券和借贷等实名制和安全性要求较高的金融领域,活体检测可作为用户远程注册和密码找回环节中的辅助验证,帮助用户甄别欺诈行为,有效抵御攻击行为,保障业务安全。
Q4:机器学习的宏观技术发展趋势是怎样的?
A:首先,机器学习会更加注重情感体验。机器将具有识别、理解和表达喜怒哀乐的能力,识别用户的需求以及环境信息的变化,理解人的情感意图,做出适当反应;其次,是多模态的发展。深度学习技术正从语音、文字、视觉等单模态向学习多模态智能学习发展。未来甚至可以对嗅觉、味觉、心理学等难以量化的信号进行融合,实现多个模态的联合分析,在更多场景、更多业务上辅助人类工作;再次,是多技术的融合,比如VR/AR以及元宇宙等。相信未来AI还将呈现多平台多系统协同态势,以实现更为广泛的赋能,将通用平台、行业平台和端侧应用的协同组合,以软硬一体的方式实现具体应用的功能定制和扩展。
欢迎登录HMS Core机器学习服务首页了解更多技术细节。
了解更多详情>>
访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee
关注我们,第一时间了解 HMS Core 最新技术资讯~
边栏推荐
- English grammar_ Indefinite pronouns - Common Phrases
- This is the right way for developers to open artifacts
- 这才是开发者神器正确的打开方式
- Big cloud service company executives changed: technology gives way to sales
- paho交叉编译
- 还是有机会的
- After eating Alibaba's core notes of highly concurrent programming, the backhand rose 5K
- Orbslam2 installation test and summary of various problems
- Docker安装Redis、配置及远程连接
- Summary of window system operation skills
猜你喜欢

综合设计一个OPPE主页--页面的底部

English grammar_ Indefinite pronouns - Common Phrases

MySQL optimization theory study guide
![[semantic segmentation] 2021-pvt iccv](/img/43/3756c0dbc30fa2871dc8cae5be9bce.png)
[semantic segmentation] 2021-pvt iccv

On memory computing integrated chip technology

Attachment of text of chenjie Report

Tell you from my accident: Mastering asynchrony is key
![[FPGA tutorial case 19] factorial operation through multiplier](/img/c0/f13806c6051377f8ce03ef96a377a6.png)
[FPGA tutorial case 19] factorial operation through multiplier

Intel joins hands with datawhale to launch learning projects!

关系型数据库之MySQL8——由内而外的深化全面学习
随机推荐
Summary of window system operation skills
Knowledge points of common interview questions: distributed lock
[AAAI] attention based spatiotemporal graph convolution network for traffic flow prediction
Where are those test / development programmers in their 30s? a man should be independent at the age of thirty......
Modulenotfounderror: no module named 'pywt' solution
There is still a chance
【日志框架】
Notes for Resume Writing
Follow teacher Tian to learn practical English Grammar (continuous update)
MySQL optimization theory study guide
那句话的作用
Static resource mapping
The latest translated official pytorch easy introduction tutorial (pytorch version 1.0)
Intel joins hands with datawhale to launch learning projects!
After eating Alibaba's core notes of highly concurrent programming, the backhand rose 5K
全面、详细的SQL学习指南(MySQL方向)
Does neural network sound tall? Take you to train a network from scratch (based on MNIST)
SAP Fiori @OData. Analysis of the working principle of publish annotation
[untitled]
[fortran]vscode configure FORTRAN to run Hello World