当前位置:网站首页>开源数据标注工具
开源数据标注工具
2022-07-29 18:09:00 【just do it now】
一、开源数据标注工具
1. BRAT
安装环境:osx或者linux系统,windows(linux虚拟环境)
标注任务支持:实体识别、实体关系抽取、事件抽取标注
标注语言支持:可适配到中文标注
标注任务扩展:可适配到Aspect-Based Sentiment Analysis方向数据标注
相关:
官方介绍[1]
BRAT项目github地址[2]
brat使用[3]
2. prodigy
标注任务支持:实体识别、分类、情感分析
标注语言支持:只针对英文
特点:基于主动学习的标注工具
3. Chinese-Annotator
标注任务支持:中文命名实体识别、中文关系识别、中文文本分类
安装环境:面向OSX
特点:灵感来源Prodigy,基于主动学习的标注系统,同时支持用户标注
相关:
Chinese-Annotator项目github地址[4]
4. YEDDA
标注任务支持:实体识别、实体关系抽取、事件抽取
标注语言支持:支持大部分语言,包括英语、中文
特点:基于python2、可标记种类数只有7种
相关:
YEDDA项目github地址[5]
5. IEPY
标注任务支持:主要是关系抽取
相关:
IEPY项目github地址[6]
官方说明文档[7]
6. Doccano
标注任务支持:实体识别、情感分类、机器翻译
标注语言:多语言
Doccano项目github地址[8]
Doccano实体标注演示demo[9]
7. Deepdive
相关:
DeepDive[10]
8. snorkel
相关:
snorkel项目github地址[11]
二、总结
目前来看要做中文领域事件抽取样本标注,可选用的是YEDDA和BRAT。笔者已经使用过BRAT来进行事件抽取标注了,后续针对BRAT的使用方法会专门出一期文章。
三、其他参考资料:
2019常用NLP标注工具简单介绍[12]
中文文本标注工具调研以及BRAT安装使用[13]
语料标注工具1[14]
语料标注工具2[15]
语料标注工具3[16]
情感分析系列之《利用BRAT进行中文情感分析语料标注》[17]
参考资料
[1] 官方介绍: http://brat.nlplab.org/introduction.html
[2] BRAT项目github地址: https://github.com/nlplab/brat
[3] brat使用: https://blog.csdn.net/guofei_fly/article/details/104113217
[4] Chinese-Annotator项目github: https://github.com/deepwel/Chinese-Annotator
[5] YEDDA项目github地址: https://github.com/jiesutd/YEDDA
[6] IEPY项目github地址: https://github.com/machinalis/iepy
[7] 官方说明文档: https://iepy.readthedocs.io/en/latest/
[8] Doccano项目github地址: https://github.com/doccano/doccano
[9] Doccano实体标注演示demo: http://doccano.herokuapp.com/demo/named-entity-recognition/
[10] DeepDive: http://deepdive.stanford.edu/labeling
[11] snorkel项目github地址: https://github.com/snorkel-team/snorkel
[12] 2019常用NLP标注工具简单介绍:
https://blog.csdn.net/weixin_44912159/article/details/103654550
[13] 中文文本标注工具调研以及BRAT安装使用: https://www.jianshu.com/p/3a70ee9ad632
[14] 语料标注工具1: https://zhuanlan.zhihu.com/p/64513343
[15] 语料标注工具2: https://zhuanlan.zhihu.com/p/64574125
[16] 语料标注工具3: https://zhuanlan.zhihu.com/p/64745990
[17] 情感分析系列之《利用BRAT进行中文情感分析语料标注》
: https://blog.csdn.net/owengbs/article/details/49780225
边栏推荐
猜你喜欢

This week's investment report: CeFi accumulates venture capital attraction

支持向量机SVM

实现get/post请求调用第三方接口
![[Operation and maintenance] ssh tunneling relies on the 22 port of ssh to realize the interface service of accessing the remote server](/img/4a/7156470e8d96c7709001bac88e872c.png)
[Operation and maintenance] ssh tunneling relies on the 22 port of ssh to realize the interface service of accessing the remote server

字节跳动 Flink 单点恢复功能及 Regional CheckPoint 优化实践

The backslash \\ in MySQL is really a pit

如何实时计算日累计逐单资金流

MySQL 中的反斜杠 \\,真是太坑了

QMI8658 - 6轴传感器学习笔记

算力顶天地,存力纳乾坤:国家超级计算济南中心的一体两面
随机推荐
京东方Q1净利将超50亿!手机、电视等五大显示屏出货量全球第一
EasyNVR更新版本至(V5.3.0)后页面不显示通道配置该如何解决?
十大企业数据安全优秀实践
字节跳动使用 Flink State 的经验分享
公司无线规划设计及实施SOP
亿级用户背后的字节跳动云原生计算最佳实践
[Code Hoof Set Novice Village 600 Questions] Detailed explanation of pow() function
联发科天玑2000最快Q3量产,4G基带芯片将拿下Apple Watch订单
P4775 [NOI2018] Intelligence Center (Line Segment Tree Merging)
工业软件上云的矛与盾
In the Chinese ToB market, it is too difficult to choose the right supplier
Postgresql中的pg_memory_barrier_impl和C的volatile
剖析Mooncake的代理原理,实现快速提效
腾讯开源摘星计划培养开源贡献者的实践思考
This week's investment report: CeFi accumulates venture capital attraction
Xatlas source code parsing (7)
制作文件上传进度条
kubernetes之资源限制及QOS服务质量
恐造成下一个“千年虫”的闰秒,遭科技巨头们联合抵制
Setting right:0 after sticky positioning does not take effect