当前位置:网站首页>开源数据标注工具
开源数据标注工具
2022-07-29 18:09:00 【just do it now】
一、开源数据标注工具
1. BRAT
安装环境:osx或者linux系统,windows(linux虚拟环境)
标注任务支持:实体识别、实体关系抽取、事件抽取标注
标注语言支持:可适配到中文标注
标注任务扩展:可适配到Aspect-Based Sentiment Analysis方向数据标注
相关:
官方介绍[1]
BRAT项目github地址[2]
brat使用[3]
2. prodigy
标注任务支持:实体识别、分类、情感分析
标注语言支持:只针对英文
特点:基于主动学习的标注工具
3. Chinese-Annotator
标注任务支持:中文命名实体识别、中文关系识别、中文文本分类
安装环境:面向OSX
特点:灵感来源Prodigy,基于主动学习的标注系统,同时支持用户标注
相关:
Chinese-Annotator项目github地址[4]
4. YEDDA
标注任务支持:实体识别、实体关系抽取、事件抽取
标注语言支持:支持大部分语言,包括英语、中文
特点:基于python2、可标记种类数只有7种
相关:
YEDDA项目github地址[5]
5. IEPY
标注任务支持:主要是关系抽取
相关:
IEPY项目github地址[6]
官方说明文档[7]
6. Doccano
标注任务支持:实体识别、情感分类、机器翻译
标注语言:多语言
Doccano项目github地址[8]
Doccano实体标注演示demo[9]
7. Deepdive
相关:
DeepDive[10]
8. snorkel
相关:
snorkel项目github地址[11]
二、总结
目前来看要做中文领域事件抽取样本标注,可选用的是YEDDA和BRAT。笔者已经使用过BRAT来进行事件抽取标注了,后续针对BRAT的使用方法会专门出一期文章。
三、其他参考资料:
2019常用NLP标注工具简单介绍[12]
中文文本标注工具调研以及BRAT安装使用[13]
语料标注工具1[14]
语料标注工具2[15]
语料标注工具3[16]
情感分析系列之《利用BRAT进行中文情感分析语料标注》[17]
参考资料
[1] 官方介绍: http://brat.nlplab.org/introduction.html
[2] BRAT项目github地址: https://github.com/nlplab/brat
[3] brat使用: https://blog.csdn.net/guofei_fly/article/details/104113217
[4] Chinese-Annotator项目github: https://github.com/deepwel/Chinese-Annotator
[5] YEDDA项目github地址: https://github.com/jiesutd/YEDDA
[6] IEPY项目github地址: https://github.com/machinalis/iepy
[7] 官方说明文档: https://iepy.readthedocs.io/en/latest/
[8] Doccano项目github地址: https://github.com/doccano/doccano
[9] Doccano实体标注演示demo: http://doccano.herokuapp.com/demo/named-entity-recognition/
[10] DeepDive: http://deepdive.stanford.edu/labeling
[11] snorkel项目github地址: https://github.com/snorkel-team/snorkel
[12] 2019常用NLP标注工具简单介绍:
https://blog.csdn.net/weixin_44912159/article/details/103654550
[13] 中文文本标注工具调研以及BRAT安装使用: https://www.jianshu.com/p/3a70ee9ad632
[14] 语料标注工具1: https://zhuanlan.zhihu.com/p/64513343
[15] 语料标注工具2: https://zhuanlan.zhihu.com/p/64574125
[16] 语料标注工具3: https://zhuanlan.zhihu.com/p/64745990
[17] 情感分析系列之《利用BRAT进行中文情感分析语料标注》
: https://blog.csdn.net/owengbs/article/details/49780225
边栏推荐
- 【学习笔记】NOIP模拟赛
- 500强企业研发效能提升课,今晚开课啦!
- StarRocks 2.3 新版本特性介绍
- 华东师范大学副校长周傲英:数据赋能,从数据库到数据中台
- [Code Hoof Set Novice Village 600 Questions] Given an integer n, find all the values of x and y in floor(n/x)=y
- 恐造成下一个“千年虫”的闰秒,遭科技巨头们联合抵制
- 超声波传感器(CHx01) 学习笔记 Ⅲ-API介绍
- MySQL数据库的七种约束语法格式和使用详解&约束的总结
- 字节跳动基于 Iceberg 的海量特征存储实践
- P4769 [NOI2018] Bubble Sort (Combinatorics)
猜你喜欢

如何实时计算日累计逐单资金流

在宇宙中心五道口上班,是怎样一种体验

十大企业数据安全优秀实践
![[Operation and maintenance] ssh tunneling relies on the 22 port of ssh to realize the interface service of accessing the remote server](/img/4a/7156470e8d96c7709001bac88e872c.png)
[Operation and maintenance] ssh tunneling relies on the 22 port of ssh to realize the interface service of accessing the remote server

This week's investment report: CeFi accumulates venture capital attraction

QMI8658 - 6轴传感器学习笔记

华东师范大学副校长周傲英:数据赋能,从数据库到数据中台

KubeMeet 报名 | 「边缘原生」线上技术沙龙完整议程公布!
![[Deep Learning] Use yolov5 to pre-label data](/img/8d/ca1802131da6d2cba437d05e9c288c.png)
[Deep Learning] Use yolov5 to pre-label data

字节跳动 Flink 单点恢复功能及 Regional CheckPoint 优化实践
随机推荐
已经删除了的SQL节点,有没有办法恢复
Make a file upload progress bar
[Operation and maintenance] ssh tunneling relies on the 22 port of ssh to realize the interface service of accessing the remote server
无人驾驶与人工驾驶的对比,人工驾驶的优缺点
招聘|字节跳动云原生计算,期待你的加入
transformer通俗理解
[memory] grandma's song
公司无线规划设计及实施SOP
AI 通过了图灵测试,科学家反应冷淡:“很棒,但没必要”
AMD收购赛灵思已获两家公司股东同意
EasyNVR更新版本至(V5.3.0)后页面不显示通道配置该如何解决?
实现get/post请求调用第三方接口
【盘古Coder】:高性能函数级程序语言生成模型
KubeZoo:字节跳动轻量级多租户开源解决方案
5年迭代5次,抖音推荐系统演进历程
吴恩达撰文:公共数据的 “围墙”
字节跳动 Flink 状态查询实践与优化
为什么你的分布式数据中心需要一个全栈智能运维平台?
数据监控体系是什么?该怎么搭建?
KubeMeet 报名 | 「边缘原生」线上技术沙龙完整议程公布!