当前位置:网站首页>语音识别(ASR)论文优选:全球最大的中英混合开源数据TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech
语音识别(ASR)论文优选:全球最大的中英混合开源数据TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech
2022-07-06 11:48:00 【我叫永强】
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请注明出处。欢迎关注微信公众号:低调奋进。
TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech Recognition Baseline
本文是好未来在2022.06.27更新的文章,主要开源最大的中英混合训练语料,为语音识别的Code-switching方向研究做贡献。
(开源数据统计可参见http://yqli.tech/page/data.html)
由于本文主要工作是开源全球最大的中英混合数据,我们就不再介绍背景,直接查看数据集的情况。该数据集为好未来英语课授课音频,包含中英文混合讲话的情况,每条音频只有一位说话人,该数据集有100多说话人。(文件63.36G)该数据包含了如图1所示的句内和句间混合的样例。该数据中的中文汉字和英文单词之间的比例为13:1,其中top 20如图2所示。table 1展示了语库的训练集合测试集的划分情况,table 2展示使用该数据集在espnet和wenet上的实验结果。
| 数据规模 | 587小时音频 |
| 采样率 | 16KHz |
| 采样位声 | 16bit |
| 录制设备 | 普通麦克风 |
| 说话人 | 200+ |
| 录制时间 | 2019年 |
| 数据格式 | 音频:.wav;标注结果:.txt |
| 音频长度 | 1~60s |
| 数据类型 | 英语课教师授课音频 |



边栏推荐
- JDBC details
- Cereals Mall - Distributed Advanced p129~p339 (end)
- 算法面试经典100题,Android程序员最新职业规划
- 从sparse.csc.csr_matrix生成邻接矩阵
- Alibaba数据源Druid可视化监控配置
- Translation D28 (with AC code POJ 26:the nearest number)
- 冒烟测试怎么做
- How to access localhost:8000 by mobile phone
- zabbix 代理服务器 与 zabbix-snmp 监控
- [infrastructure] deployment and configuration of Flink / Flink CDC (MySQL / es)
猜你喜欢

Interview assault 63: how to remove duplication in MySQL?

spark基础-scala

腾讯Android面试必问,10年Android开发经验

Druid database connection pool details

冒烟测试怎么做

学习打卡web

Reflection and illegalaccessexception exception during application

Introduction to enterprise lean management system

潇洒郎: AttributeError: partially initialized module ‘cv2‘ has no attribute ‘gapi_wip_gst_GStreamerPipe

In simple terms, interview surprise Edition
随机推荐
腾讯T3手把手教你,真的太香了
[infrastructure] deployment and configuration of Flink / Flink CDC (MySQL / es)
It's enough to read this article to analyze the principle in depth
《数字经济全景白皮书》保险数字化篇 重磅发布
MySql必知必会学习
JDBC details
深入分析,Android面试真题解析火爆全网
思維導圖+源代碼+筆記+項目,字節跳動+京東+360+網易面試題整理
Alibaba data source Druid visual monitoring configuration
A5000 vGPU显示模式切换
凤凰架构3——事务处理
手把手教你学会js的原型与原型链,猴子都能看懂的教程
mod_wsgi + pymssql通路SQL Server座
Unbalance balance (dynamic programming, DP)
[translation] linkerd's adoption rate in Europe and North America exceeded istio, with an increase of 118% in 2021.
swagger2报错Illegal DefaultValue null for parameter type integer
面试突击63:MySQL 中如何去重?
Mysql Information Schema 学习(一)--通用表
系统性详解Redis操作Hash类型数据(带源码分析及测试结果)
LeetCode_ Gray code_ Medium_ 89. Gray code