当前位置:网站首页>语音识别(ASR)论文优选:全球最大的中英混合开源数据TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech
语音识别(ASR)论文优选:全球最大的中英混合开源数据TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech
2022-07-06 11:48:00 【我叫永强】
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请注明出处。欢迎关注微信公众号:低调奋进。
TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech Recognition Baseline
本文是好未来在2022.06.27更新的文章,主要开源最大的中英混合训练语料,为语音识别的Code-switching方向研究做贡献。
(开源数据统计可参见http://yqli.tech/page/data.html)
由于本文主要工作是开源全球最大的中英混合数据,我们就不再介绍背景,直接查看数据集的情况。该数据集为好未来英语课授课音频,包含中英文混合讲话的情况,每条音频只有一位说话人,该数据集有100多说话人。(文件63.36G)该数据包含了如图1所示的句内和句间混合的样例。该数据中的中文汉字和英文单词之间的比例为13:1,其中top 20如图2所示。table 1展示了语库的训练集合测试集的划分情况,table 2展示使用该数据集在espnet和wenet上的实验结果。
| 数据规模 | 587小时音频 |
| 采样率 | 16KHz |
| 采样位声 | 16bit |
| 录制设备 | 普通麦克风 |
| 说话人 | 200+ |
| 录制时间 | 2019年 |
| 数据格式 | 音频:.wav;标注结果:.txt |
| 音频长度 | 1~60s |
| 数据类型 | 英语课教师授课音频 |



边栏推荐
- Phoenix Architecture 3 - transaction processing
- Carte de réflexion + code source + notes + projet, saut d'octets + jd + 360 + tri des questions d'entrevue Netease
- (3) Web security | penetration testing | basic knowledge of network security construction, IIS website construction, EXE backdoor generation tool quasar, basic use of
- 利用 clip-path 绘制不规则的图形
- After solving 2961 user feedback, I made such a change
- USB host driver - UVC swap
- C # - realize serialization with Marshall class
- 思维导图+源代码+笔记+项目,字节跳动+京东+360+网易面试题整理
- Introduction to enterprise lean management system
- 思維導圖+源代碼+筆記+項目,字節跳動+京東+360+網易面試題整理
猜你喜欢

利用 clip-path 绘制不规则的图形

企业精益管理体系介绍
时钟轮在 RPC 中的应用

Live broadcast today | the 2022 Hongji ecological partnership conference of "Renji collaboration has come" is ready to go

Learning and Exploration - Seamless rotation map

Mysql Information Schema 學習(一)--通用錶

深度剖析原理,看完这一篇就够了

Using clip path to draw irregular graphics
![[infrastructure] deployment and configuration of Flink / Flink CDC (MySQL / es)](/img/1e/b270a81c8457f1eae34f55c004a01a.png)
[infrastructure] deployment and configuration of Flink / Flink CDC (MySQL / es)

Druid database connection pool details
随机推荐
Vmware虚拟机无法打开内核设备“\\.\Global\vmx86“的解决方法
[pytorch] yolov5 train your own data set
How can my Haskell program or library find its version number- How can my Haskell program or library find its version number?
MySQL information Schema Learning (i) - - General table
350. 两个数组的交集 II
潇洒郎: AttributeError: partially initialized module ‘cv2‘ has no attribute ‘gapi_wip_gst_GStreamerPipe
Chic Lang: attributeerror: partially initialized module 'CV2' has no attribute 'GAPI_ wip_ gst_ GStreamerPipe
从sparse.csc.csr_matrix生成邻接矩阵
Live broadcast today | the 2022 Hongji ecological partnership conference of "Renji collaboration has come" is ready to go
Mysql Information Schema 学习(二)--Innodb表
学习探索-使用伪元素清除浮动元素造成的高度坍塌
【翻译】云原生观察能力微调查。普罗米修斯引领潮流,但要了解系统的健康状况仍有障碍...
Tencent Android interview must ask, 10 years of Android development experience
Swiftui game source code Encyclopedia of Snake game based on geometryreader and preference
121. 买卖股票的最佳时机
力扣101题:对称二叉树
Alibaba数据源Druid可视化监控配置
Use of map (the data of the list is assigned to the form, and the JSON comma separated display assignment)
LeetCode_双指针_中等_61. 旋转链表
系统性详解Redis操作Hash类型数据(带源码分析及测试结果)