当前位置:网站首页>librosa音频处理教程

librosa音频处理教程

2022-07-06 06:43:00 andrew P

语音特征提取: 看懂梅尔语谱图(Mel-spectrogram)、梅尔倒频系数(MFCCs)的原理_BeichenLiu.Polaris的博客-CSDN博客_梅尔谱图

1.librosa.core.load(path,sr)对音频进行重新采样

librosa.core.load — librosa 0.7.2 documentation

librosa .core。负载路径 sr=22050单声道=真偏移量=0.0持续时间=无 dtype =<class 'numpy.float32'> res_type='kaiser_best' [资源]

将音频文件加载为浮点时​​间序列。

音频将自动重新采样到给定的速率(默认sr=22050)。

要保留文件的本机采样率,请使用sr=None

2.librosa.stft(),短时傅里叶变换

librosa.core.stft — librosa 0.7.2 documentation

短时傅里叶变换 ( STFT )。[1](第 2 章)

STFT通过在短重叠窗口上计算离散傅里叶变换 (DFT) 来表示时频域中的信号。

此函数返回一个复值矩阵 D 使得

  • np.abs(D[f, t])是 帧t处频率 bin f的幅度,并且

  • np.angle(D[f, t])是频率 bin f 在帧t的相位。

整数tf可以通过实用函数frames_to_sample和转换为物理单位fft_frequencies

原网站

版权声明
本文为[andrew P]所创,转载请带上原文链接,感谢
https://blog.csdn.net/qq_41166909/article/details/125584925