当前位置:网站首页>HMS Core 机器学习服务打造同传翻译新“声”态,AI让国际交流更顺畅
HMS Core 机器学习服务打造同传翻译新“声”态,AI让国际交流更顺畅
2022-07-06 12:04:00 【HMS Core】
2022年6月,HMS Core机器学习服务面向开发者提供一项全新的开放能力——同声传译,通过AI语音技术减少资源成本,加强沟通交流,旨在帮助开发者制作丰富多样的同声传译应用。
HMS Core同声传译涵盖了机器学习服务的语音识别、翻译、语音合成等核心技术,首先把输入的实时语音转换成文字,然后再把文字翻译成另一种语言的文字,最后把翻译后的文字转换成语音播放。同声传译能力能够协助解决多种场景下的跨语言实时交流,支持中英文互译,提供多种音色语音播报,可以广泛应用于领域多样、环境复杂、实时性高的会议、直播等场景。

语音识别+机器翻译,兼具质量与效率
对于同声传译而言,准确的源语言输入+译文输出是其重要的衡量标准。而在面对同声传译主要的场景——大会演讲、字幕直播、会议访谈、智慧教育……往往伴随长时间持续输入的音频,端侧识别通过语音能量检测、静音检测、心跳检测等算法,实现长音频的有效断句,从而将有效语音片段送到语音识别模块,提升了语音识别的效率,同时缩小了同声传译时延,降低噪声对识别效果的影响。
另一方面,在语音转成文本后,存在部分识别错误、口语化表达、语气词较多、部分内容重复表达等导致文本不流利以及识别文本并未进行细致断句的问题。针对这些状况,机器学习服务在文本处理模块采用NLP语义理解、同音歧义处理、环境声音处理、口语化处理等纠错技术,来实现文本顺滑、自动断句等功能,确保返回高质量的翻译文本,从而实现语音识别和翻译功能加强,提升同声传译效果。
多种场景全覆盖,中英字幕双语输出
同声传译既能应用在面对面跨语言交流场景,也能在远程沟通中发挥作用。无论是面对面多语种会议、远程会议、还是观看外语视频,同声传译能力可以实时生成双语字幕,降低理解成本,提升工作与学习效率。
定制化语音播报,边听边看两不误
同声传译能力通过先进的深度神经合成技术,能够实时输出音频流数据,同时提供多种中、英文男、女音色选择,从而使发音达到更加真实自然的效果。通过实时语音播报降低延迟,结合实时字幕内容,为参会者提供视听一体的沉浸式同声传译体验。

通过对语音识别、机器翻译、语音合成三项技术的有机整合,HMS Core机器学习服务为开发者提供较低时延、较高准确率的同声传译能力,帮助用户更顺畅地进行国际交流,打造同声传译新“声”态。欢迎开发者可以登录机器学习服务主页,了解更详细的产品介绍与接入准备。
了解更多详情>>
访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee
关注我们,第一时间了解 HMS Core 最新技术资讯~
边栏推荐
- Unbalance balance (dynamic programming, DP)
- Alibaba data source Druid visual monitoring configuration
- Hudi vs Delta vs Iceberg
- Tencent Android interview must ask, 10 years of Android development experience
- [calculating emotion and thought] floor sweeper, typist, information panic and Oppenheimer
- 121. The best time to buy and sell stocks
- AsyncHandler
- Dom 操作
- Hudi vs Delta vs Iceberg
- 面试突击63:MySQL 中如何去重?
猜你喜欢

学习探索-无缝轮播图

Social recruitment interview experience, 2022 latest Android high-frequency selected interview questions sharing
![[translation] linkerd's adoption rate in Europe and North America exceeded istio, with an increase of 118% in 2021.](/img/09/106adc222c06cbd2f4f66cf475cce2.jpg)
[translation] linkerd's adoption rate in Europe and North America exceeded istio, with an increase of 118% in 2021.

Phoenix Architecture 3 - transaction processing

Spark foundation -scala

MySQL information schema learning (I) -- general table

redisson bug分析

《数字经济全景白皮书》保险数字化篇 重磅发布

Hudi vs Delta vs Iceberg
![[play with Linux] [docker] MySQL installation and configuration](/img/04/6253ef9fdf7d2242b42b4c7fb2c607.png)
[play with Linux] [docker] MySQL installation and configuration
随机推荐
golang的超时处理使用技巧
Standardized QCI characteristics
腾讯Android面试必问,10年Android开发经验
【翻译】Linkerd在欧洲和北美的采用率超过了Istio,2021年增长118%。
MySQL must know and learn
Microservice architecture debate between radical technologists vs Project conservatives
[calculating emotion and thought] floor sweeper, typist, information panic and Oppenheimer
Selenium advanced operations
Wonderful coding [hexadecimal conversion]
In depth analysis, Android interview real problem analysis is popular all over the network
Dom 操作
Unbalance balance (dynamic programming, DP)
A5000 vGPU显示模式切换
Example of shutter text component
Phoenix Architecture 2 - accessing remote services
爬虫(14) - Scrapy-Redis分布式爬虫(1) | 详解
redisson bug分析
Example of applying fonts to flutter
Learning and Exploration - Seamless rotation map
Mysql Information Schema 学习(二)--Innodb表