当前位置:网站首页>使用互相关进行音频对齐
使用互相关进行音频对齐
2022-07-31 16:04:00 【非典型废言】
在计算一些音频指标如SNR的时候,我们需要音频信号与参考信号对齐,但有时候我们处理后的或者录制的音频并不是与参考信号对齐的,这就需要找到一种方法将它们对齐。
I. 互相关函数
音频对齐可以转化为时延估计问题,我们以前有介绍过使用GCC-PHAT进行时延估计,这里我们采用一种更为简单的方式进行估计——互相关函数。我们在语音信号时域分析介绍过自相关函数,类似的对于离散时域信号互相关函数的计算公式为:

我们知道在频域互相关中我们对广义互相关进行了一个加权,PHAT起到了白化的结果使得其互相关函数峰值更加明显,类似的可以对公式(1)进行类似的操作来使得峰值更为明显:

互相关的计算其实和互相关类似,我找了个视频来解释这个计算过程。
II. Praat
很多编程语言都封装好了互相关函数,这里我们使用一个语音分析领域常用的软件叫Praat。由于语音长度是有限的Praat在互相关函数上进行了适当的修改,简单来说互相关序列的开始时间将是f 的开始时间减去g 的结束时间,结束时间将是f的结束时间减去g的开始时间,即第一个采样的时间是f 的第一个样本减去g的最后一个样本,最后一个样本的时间将是f的最后一个样本减去g 的第一个样本,自相关序列的长度是f和g的样本数之和减1。
我们下面来看下效果,首先我们有两个音频,如下图所示,可以明显看到两个轨道上的音频有明显的延迟。

我们通过Praat计算出两个音频的时间延迟大约是1.284s。

我们把第二个轨道的音频提前1.284s。

得到的结果如下,看起来两段音频基本对齐了。

本文相关代码,在公众号语音算法组菜单栏点击Code获取。
参考文献:
[1]. http://paulbourke.net/miscellaneous/correlate/
[2]. UCBS, Digital Speech Process
[3]. http://www.dsg-bielefeld.de/dsg_wp/wp-content/uploads/2014/10/video_syncing_fun.pdf
[4]. https://www.fon.hum.uva.nl/praat/manual/Sounds__Cross-correlate___.html
边栏推荐
- npm安装时卡在sill idealTree buildDeps,npm安装速度慢,npm安装卡在一个地方不动
- 第05章 存储引擎【1.MySQL架构篇】【MySQL高级】
- 长得很怪的箱图
- 在资源管理类中提供对原始资源的访问——条款15
- 7. Summary of common interview questions
- 软件实现AT命令操作过程
- The arm button controls the flashing of the led light (embedded button experiment report)
- Replication Latency Case (3) - Monotonic Read
- Implementing distributed locks based on Redis (SETNX), case: Solving oversold orders under high concurrency
- js的toString方法
猜你喜欢

研发过程中的文档管理与工具

EF Core 2.2中将ORM框架生成的SQL语句输出到控制台

After Grafana is installed, the web opens and reports an error

第二届中国PWA开发者日

外媒所言非虚,苹果降价或许是真的在清库存

Implementing distributed locks based on Redis (SETNX), case: Solving oversold orders under high concurrency

Kubernetes常用命令

Tencent Cloud Deployment----DevOps

The new BMW 3 Series is on the market, with safety and comfort

【C语言】LeetCode27.移除元素
随机推荐
2022年必读的12本机器学习书籍推荐
软件实现AT命令操作过程
TypeError: unhashable type: ‘list‘
单细胞测序流程(单细胞rna测序)
form 表单提交后,使页面不跳转[通俗易懂]
t-sne 数据可视化网络中的部分参数+
腾讯云部署----DevOps
i.MX6ULL驱动开发 | 33 - NXP原厂网络设备驱动浅读(LAN8720 PHY)
牛客 HJ17 坐标移动
Precautions and solutions when SIGABRT error is reported
update data table update
Qt practical cases (54) - using transparency QPixmap design pictures
ansible学习笔记02
使用 GraphiQL 可视化 GraphQL 架构
多主复制的适用场景(2)-需离线操作的客户端和协作编辑
Design and Implementation of Compiler Based on C Language
Baidu cloud web speed playback (is there any website available)
ansible study notes 02
复杂高维医学数据挖掘与疾病风险分类研究
Implement anti-shake and throttling functions