当前位置:网站首页>语音识别(ASR)论文优选:全球最大的中英混合开源数据TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech
语音识别(ASR)论文优选:全球最大的中英混合开源数据TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech
2022-07-06 11:48:00 【我叫永强】
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请注明出处。欢迎关注微信公众号:低调奋进。
TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech Recognition Baseline
本文是好未来在2022.06.27更新的文章,主要开源最大的中英混合训练语料,为语音识别的Code-switching方向研究做贡献。
(开源数据统计可参见http://yqli.tech/page/data.html)
由于本文主要工作是开源全球最大的中英混合数据,我们就不再介绍背景,直接查看数据集的情况。该数据集为好未来英语课授课音频,包含中英文混合讲话的情况,每条音频只有一位说话人,该数据集有100多说话人。(文件63.36G)该数据包含了如图1所示的句内和句间混合的样例。该数据中的中文汉字和英文单词之间的比例为13:1,其中top 20如图2所示。table 1展示了语库的训练集合测试集的划分情况,table 2展示使用该数据集在espnet和wenet上的实验结果。
| 数据规模 | 587小时音频 |
| 采样率 | 16KHz |
| 采样位声 | 16bit |
| 录制设备 | 普通麦克风 |
| 说话人 | 200+ |
| 录制时间 | 2019年 |
| 数据格式 | 音频:.wav;标注结果:.txt |
| 音频长度 | 1~60s |
| 数据类型 | 英语课教师授课音频 |



边栏推荐
- POJ 3207 Ikki's Story IV – Panda's Trick (2-SAT)
- Finally, there is no need to change a line of code! Shardingsphere native driver comes out
- [infrastructure] deployment and configuration of Flink / Flink CDC (MySQL / es)
- Elastic search indexes are often deleted [closed] - elastic search indexes gets deleted frequently [closed]
- Teach you to learn JS prototype and prototype chain hand in hand, a tutorial that monkeys can understand
- Social recruitment interview experience, 2022 latest Android high-frequency selected interview questions sharing
- 1805. 字符串中不同整数的数目
- CF960G - Bandit Blues(第一类斯特林数+OGF)
- Learning and Exploration - Seamless rotation map
- 【翻译】供应链安全项目in-toto移至CNCF孵化器
猜你喜欢

Hudi vs Delta vs Iceberg

手把手教你学会js的原型与原型链,猴子都能看懂的教程

IC设计流程中需要使用到的文件
In depth analysis, Android interview real problem analysis is popular all over the network

Vmware虚拟机无法打开内核设备“\\.\Global\vmx86“的解决方法

CPU负载很低,loadavg很高处理方法
深入分析,Android面试真题解析火爆全网

信息系统项目管理师---第八章 项目质量管理

Hudi vs Delta vs Iceberg

A5000 vGPU显示模式切换
随机推荐
测试用里hi
map的使用(列表的数据赋值到表单,json逗号隔开显示赋值)
Spark foundation -scala
在解决了 2961 个用户反馈后,我做出了这样的改变...
swagger2报错Illegal DefaultValue null for parameter type integer
Learning and Exploration - function anti shake
潇洒郎: AttributeError: partially initialized module ‘cv2‘ has no attribute ‘gapi_wip_gst_GStreamerPipe
1805. Number of different integers in the string
Understand yolov1 Part II non maximum suppression (NMS) in prediction stage
LeetCode_ Gray code_ Medium_ 89. Gray code
Low CPU load and high loadavg processing method
MySQL information schema learning (II) -- InnoDB table
Leetcode 30. 串联所有单词的子串
【翻译】Linkerd在欧洲和北美的采用率超过了Istio,2021年增长118%。
面试突击63:MySQL 中如何去重?
Tencent Android interview must ask, 10 years of Android development experience
Interview assault 63: how to remove duplication in MySQL?
usb host 驱动 - UVC 掉包
About image reading and processing, etc
How to access localhost:8000 by mobile phone