当前位置:网站首页>语音识别(ASR)论文优选:全球最大的中英混合开源数据TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech
语音识别(ASR)论文优选:全球最大的中英混合开源数据TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech
2022-07-06 11:48:00 【我叫永强】
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请注明出处。欢迎关注微信公众号:低调奋进。
TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech Recognition Baseline
本文是好未来在2022.06.27更新的文章,主要开源最大的中英混合训练语料,为语音识别的Code-switching方向研究做贡献。
(开源数据统计可参见http://yqli.tech/page/data.html)
由于本文主要工作是开源全球最大的中英混合数据,我们就不再介绍背景,直接查看数据集的情况。该数据集为好未来英语课授课音频,包含中英文混合讲话的情况,每条音频只有一位说话人,该数据集有100多说话人。(文件63.36G)该数据包含了如图1所示的句内和句间混合的样例。该数据中的中文汉字和英文单词之间的比例为13:1,其中top 20如图2所示。table 1展示了语库的训练集合测试集的划分情况,table 2展示使用该数据集在espnet和wenet上的实验结果。
数据规模 | 587小时音频 |
采样率 | 16KHz |
采样位声 | 16bit |
录制设备 | 普通麦克风 |
说话人 | 200+ |
录制时间 | 2019年 |
数据格式 | 音频:.wav;标注结果:.txt |
音频长度 | 1~60s |
数据类型 | 英语课教师授课音频 |
边栏推荐
- Translation D28 (with AC code POJ 26:the nearest number)
- 信息系统项目管理师---第八章 项目质量管理
- Zero foundation entry polardb-x: build a highly available system and link the big data screen
- POJ 3207 Ikki's Story IV – Panda's Trick (2-SAT)
- 学习探索-函数防抖
- Use of map (the data of the list is assigned to the form, and the JSON comma separated display assignment)
- 数据的同步为每个站点创建触发器同步表
- [infrastructure] deployment and configuration of Flink / Flink CDC (MySQL / es)
- 通俗的讲解,带你入门协程
- USB host driver - UVC swap
猜你喜欢
蓝桥杯 微生物增殖 C语言
在解决了 2961 个用户反馈后,我做出了这样的改变...
A popular explanation will help you get started
《数字经济全景白皮书》保险数字化篇 重磅发布
Learn to explore - use pseudo elements to clear the high collapse caused by floating elements
零基础入门PolarDB-X:搭建高可用系统并联动数据大屏
(3) Web security | penetration testing | basic knowledge of network security construction, IIS website construction, EXE backdoor generation tool quasar, basic use of
理解 YOLOV1 第二篇 预测阶段 非极大值抑制(NMS)
【翻译】云原生观察能力微调查。普罗米修斯引领潮流,但要了解系统的健康状况仍有障碍...
Reflection and illegalaccessexception exception during application
随机推荐
zabbix 代理服务器 与 zabbix-snmp 监控
[infrastructure] deployment and configuration of Flink / Flink CDC (MySQL / es)
部门树递归实现
Phoenix Architecture 2 - accessing remote services
信息系统项目管理师---第八章 项目质量管理
In simple terms, interview surprise Edition
颜色(color)转换为三刺激值(r/g/b)(干股)
Tensorflow2.0 自定义训练的方式求解函数系数
map的使用(列表的数据赋值到表单,json逗号隔开显示赋值)
Dom 操作
10 schemes to ensure interface data security
How to do smoke test
【翻译】供应链安全项目in-toto移至CNCF孵化器
Understand yolov1 Part II non maximum suppression (NMS) in prediction stage
学习探索-函数防抖
CF960G - Bandit Blues(第一类斯特林数+OGF)
Leetcode 30. Concatenate substrings of all words
冒烟测试怎么做
Configuration and simple usage of the EXE backdoor generation tool quasar
CPU负载很低,loadavg很高处理方法