当前位置:网站首页>语音断点检测(短时改进子带谱熵)
语音断点检测(短时改进子带谱熵)
2022-06-21 20:49:00 【qq-120】
1. 音频分析
1.输出语音的切分时间点信息,时间点用毫秒表示;
2.把语音分割成多个wav文件;
端点检测:确定句子的时间起始点和终点,忽略中间少量的非语音帧,
用于语音识别。(Speech Endpoint Detection)
熵在信息论中是反映信息度量的一个量。某随机事件的随机性越大,
即不确定性越高,则熵值也越大,所以携带的信息量亦越大。
本次作业采用 谱熵法 对语音进行端点检测。
2. 谱熵法


3. 预处理

4. 双门限法端点检测

5. 实验结果





处理 PHONE_001.wav 得到的信息
(1)time.csv: 为语音切段信息;
(2)PHONE_001_vad.wav:为语音VAD处理后,语音段合成的wav;
(3)segmentation文件夹: 为语音分段后各小段的语音;
(4)main_VAD.m: 主函数;
(5)vad.m: 为双门限法端点检测函数;
(6)houzhichuli.m: 为间歇长度判定函数;
(7)frame2time.m: 为帧对于的时间函数;
边栏推荐
猜你喜欢
随机推荐
流式细胞分析Flowjo 10介绍以及超详细图文安装激活教程
专业字体设计编辑Glyphs 3
刷题笔记(十六)--二叉树:修改与构造
Uwp tablet inkcanvas
将字符串按长度截取成数组
[in depth understanding of tcapulusdb technology] how to realize single machine installation of tmonitor
分布式数据库使用逻辑卷管理存储之扩容
WPF 线程操纵UI问题
采样器合集
Five minutes, Xie Yunyuan
[deeply understand tcapulusdb technology] tmonitor module architecture
Text text associated with scroll scroll bar in Tkinter
WPF x:ArrayExtension
WPF 选择文件夹
class path resource [classpath*:mapper/*.xml] cannot be opened because it does not exist
fork-join线程池
Synplify Pro的常用选项及命令
Technology sharing | a clustering incremental statistical SQL requirement in MySQL
Introduction to software architecture
Use the for loop to calculate the odd and even sums in 1-100 [method 2]








![[deeply understand tcapulusdb technology] table management of document acceptance](/img/59/e435623ab9cc7d2aa164c2f08e135f.png)
