当前位置:网站首页>HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态
HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态
2022-07-29 10:22:00 【HMS Core】
HMS Core 在AI领域最新的技术能力有哪些?本期Discovery直播以《与虎墩一起,玩转AI新“声”态》为主题,邀请了HMS Core 机器学习服务产品经理、机器翻译高级专家以及HMS Core的新朋友“虎墩”,为大家展示机器学习的语音语言创新技术,分享机器学习与人工智能的宏观发展趋势。一起回顾一下本期精彩内容!

【精彩回顾】
1、抖音网红IP“虎墩小镖师”强势来袭
2、同声传译新亮相,底层技术大揭秘
3、AI翻译能力升级,语种扩充可播报
【专家观点】
Nicolas,华为2012实验室文本机器翻译高级专家
机器翻译暂时无法替代人类。目前需求不高的翻译需求可以依赖机器但要求较高的翻译需求还需要人工介入,人工可以做到点到面的全方位质量把控,比如说话地道与否、语言通顺与否,还可以贡献数据和知识,提升机器翻译质量。
Hardy,HMS Core ML Kit 资深产品经理
AI是智能机器的广义领域,而机器学习是AI的核心应用之一。它指的是任何能够自行“学习”的计算机应用程序或程序,而无需人类的明确规则。未来机器学习技术将会更注重情感体验,向多模态(语音、文字、视觉)、多技术(VR/AR等)、多平台多系统协同态势的方向发展。
【精彩答疑】
Q1:什么是TTS音色定制?TTS音色定制与虎墩在碰撞一起会有什么新玩法?
A:依托华为的数据积累和成熟算法,TTS音色定制在语音合成技术的加持下,只需要提供少量的干净录音数据,就可以进行模型训练,得到高还原度、高清晰度、高稳定性的专属音库,助于提升产品特色、快速打造个性化的品牌特色。ML Kit的新能力TTS与 IP“虎墩小镖师”正在合作中,TTS通过机器训练还原虎墩的音色,后续将逐步开放虎墩音色给开发者使用,助力开发者应用在各类个性化场景。
Q2:机器学习服务提供的翻译和同声传译能力,如何赋能App打造新“声”态?
A:文本翻译能力解决了用户因语言不通而导致交流不畅的痛点。比如通话场景,经过实时语音识别,可以快速将识别的文字转化为目标语言文字;阅读场景,支持提词翻译器功能,帮助用户快捷看到译文;视频类App集成文本翻译服务后,用户可以流畅体验AI实时字幕功能。通过对语音识别、机器翻译、语音合成三项技术的有机整合,同声传译能力有较低时延、较高准确率的特性,适用于会议、直播、演讲等实时性高的场景,支持应用将音频内容实时输出为目标语言文字,生成双语字幕,同时对目标语言文本进行实时播报,降低理解成本,兼具质量与效率。
Q3:除以上语音语言类能力,机器学习服务有新推出其它创新能力吗?
A:在金融电商领域,机器学习服务还提供了活体检测能力。动作活体检测能力使用人脸关键点定位和人脸追踪等技术,通过指令配合动作的形式可以验证用户是否为真实活体本人操作。在银行、证券和借贷等实名制和安全性要求较高的金融领域,活体检测可作为用户远程注册和密码找回环节中的辅助验证,帮助用户甄别欺诈行为,有效抵御攻击行为,保障业务安全。
Q4:机器学习的宏观技术发展趋势是怎样的?
A:首先,机器学习会更加注重情感体验。机器将具有识别、理解和表达喜怒哀乐的能力,识别用户的需求以及环境信息的变化,理解人的情感意图,做出适当反应;其次,是多模态的发展。深度学习技术正从语音、文字、视觉等单模态向学习多模态智能学习发展。未来甚至可以对嗅觉、味觉、心理学等难以量化的信号进行融合,实现多个模态的联合分析,在更多场景、更多业务上辅助人类工作;再次,是多技术的融合,比如VR/AR以及元宇宙等。相信未来AI还将呈现多平台多系统协同态势,以实现更为广泛的赋能,将通用平台、行业平台和端侧应用的协同组合,以软硬一体的方式实现具体应用的功能定制和扩展。
欢迎登录HMS Core机器学习服务首页了解更多技术细节。
了解更多详情>>
访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee
关注我们,第一时间了解 HMS Core 最新技术资讯~
边栏推荐
- 还是有机会的
- 那句话的作用
- Meituan senior technical expert: DDD's practice in the evolution of tourism e-commerce architecture
- Follow teacher Tian to learn practical English Grammar (continuous update)
- 根据给定字符数和字符,打印输出“沙漏”和剩余数
- SkiaSharp 之 WPF 自绘 弹动小球(案例版)
- Science fiction style, standard 6 airbags, popular · yachts from 119900
- Turn the evolutionary path of push
- MySQL optimization theory study guide
- 基于SSM实现高校后勤报修系统
猜你喜欢

The latest translated official pytorch easy introduction tutorial (pytorch version 1.0)

HTB-AdmirerToo

ECCV 2022 | CMU提出在视觉Transformer上进行递归,不增参数,计算量还少

Two MySQL tables with different codes (utf8, utf8mb4) are joined, resulting in index failure
![[wechat applet] interface generates customized homepage QR code](/img/9b/cccdb8ff6db61518402a27b94d0196.png)
[wechat applet] interface generates customized homepage QR code
![[semantic segmentation] 2021-pvt iccv](/img/43/3756c0dbc30fa2871dc8cae5be9bce.png)
[semantic segmentation] 2021-pvt iccv

【论文阅读】Q-BERT: Hessian Based Ultra Low Precision Quantization of BERT

跟着田老师学实用英语语法(持续更新)

MySQL优化理论学习指南

Follow teacher Wu to learn advanced numbers - function, limit and continuity (continuous update)
随机推荐
待人宽容大度
[fortran]vscode configure FORTRAN to run Hello World
PAHO cross compilation
[semantic segmentation] 2021-pvt2 cvmj
Be tolerant and generous
English语法_不定代词 - 常用短语
After the thunderstorm of two encryption companies: Celsius repayment guarantee collateral, three arrow capital closed and disappeared
Docker installation, redis configuration and remote connection
[IVI] 17.1 debugging pit FAQ (compilation)
How big is the bandwidth of the Tiktok server for hundreds of millions of people to brush at the same time?
TMS320C6000_ Tms320f28035 Chinese data manual
还是有机会的
关系型数据库之MySQL8——由内而外的深化全面学习
云服务大厂高管大变阵:技术派让位销售派
Big cloud service company executives changed: technology gives way to sales
函数——(C游记)
[jetson][reprint]pycharm installed on Jetson
remap_ Use of table in impdp
Knowledge points of common interview questions: distributed lock
【论文阅读】I-BERT: Integer-only BERT Quantization