当前位置:网站首页>声纹技术(七):声纹技术的未来
声纹技术(七):声纹技术的未来
2022-06-25 07:37:00 【u013250861】
7.1 概述
第3 章~第6 章介绍了声纹技术的主要应用,包括声纹识别、声纹分割聚类,以及基于声纹的语音识别、语音合成、语音检测、人声分离等。这些应用很多都经历过数年甚至数十年的发展,已经变得十分成熟,并且被部署到了许多商业级别的系统、产品及服务中。
本章将眼光投向更长远的未来。首先,讨论现有声纹技术所面临的诸多挑战。然后,探讨未来的声纹系统如何解决其对数据的海量需求,并介绍一些声纹领域新兴的研究方向。在这些研究方向中,包含了目前还不够成熟,但可能会在未来得到普及的应用。
7.2 声纹技术的挑战
7.2.1 对信道变化的鲁棒性
从事过声纹领域研究的人员大概都会有这样的经历,在某一类数据集上,我们可以训练出准确率很不错的模型,但是一旦该模型被用于实际应用,就会发现准确率远远达不到预期。例如,如果用LibriSpeech 数据集[97] 训练我们的声纹识别模型,即使该模型可以在LibriSpeech 的测试集上达到非常高的准确率,一旦将该模型用于电话语音或网络视频语音的声纹识别,其准确率便会大幅下降。
造成这一现象的原因,在于实际应用中,我们将面对更复杂的信道,导致应用场景与训练数据之间的信道不匹配[26]。而声纹技术所面临的一大挑战,便是其对于信道变化的鲁棒性(robustness)。造成信道不匹配的原因可能有很多种,笔者列举一些最常见的原因:
(1)环境噪声的影响。在不同的应用场景中,可能存在不同类别的环境噪声。例如在交通工具上,可能存在汽车引擎的声音;在人群聚集的场所,可
边栏推荐
- Is it really safe to pay new debts? Is it risky
- 如何成为一名软件测试高手? 月薪3K到17K,我做了什么?
- Can I grant database tables permission to delete column objects? Why?
- What do various optimizers SGD, adagrad, Adam and lbfgs do?
- How to choose an account opening broker? Is it safe to open an account online?
- Is it safe to open a stock account online now?
- How to calculate the distance between texts: WMD
- 想要软件测试效果好,搭建好测试环境是前提
- What is the role of software validation testing? What is the price of the confirmation test report?
- 如何实现一个系统调用
猜你喜欢

在二叉树(搜索树)中找到两个节点的最近公共祖先(剑指offer)

Paper:Generating Hierarchical Explanations on Text Classification via Feature Interaction Detection

LVS-DR模式多网段案例

Exchange: manage calendar permissions

Exchange:管理日历权限

【515. 在每个树行中找最大值】

初识生成对抗网络(11)——利用Pytorch搭建WGAN生成手写数字

物联网毕设(智能灌溉系统 -- Android端)

Measure the current temperature

Nips 2014 | two stream revolutionary networks for action recognition in videos reading notes
随机推荐
leetcode. 13 --- Roman numeral to integer
打新债安全不 有风险吗
Find the nearest common ancestor (Sword finger offer) of two nodes in the binary tree (search tree)
初识生成对抗网络(11)——利用Pytorch搭建WGAN生成手写数字
Is it safe to open an account online? Xiaobai asks for guidance
Check whether the point is within the polygon
GPU calculation
How to calculate the information entropy and utility value of entropy method?
Advanced technology Er, meet internship position information
Data-centric vs. Model-centric. The Answer is Clear!
SharePoint:SharePoint Server 2013 与 ADRMS 集成指南
How to calculate critical weight indicators?
【操作教程】TSINGSEE青犀视频平台如何将旧数据库导入到新数据库?
现在网上开通股票账号安全吗?
检测点是否在多边形内
C language "recursive series": recursive implementation of 1+2+3++ n
Sharepoint:sharepoint 2013 with SP1 easy installation
Paper:Generating Hierarchical Explanations on Text Classification via Feature Interaction Detection
Index analysis of DEMATEL model
微信小程序_7,项目练习,本地生活