当前位置:网站首页>nlp模型-bert从入门到精通(二)
nlp模型-bert从入门到精通(二)
2020-11-06 01:22:00 【IT界的小小小学生】
命名实体识别
首先下载相应bert 模块
pip install bert-base==0.0.9 -i https://pypi.python.org/simple
也可参考官网处理
安装
软件包现在支持的功能
1.命名实体识别的训练
2.命名实体识别的服务C/S
3.继承优秀开源软件:bert_as_service(hanxiao)的BERT所有服务
4.文本分类服务
后续功能会继续增加
基于命名行训练命名实体识别模型:
安装完bert-base后,会生成两个基于命名行的工具,其中bert-base-ner-train支持命名实体识别模型的训练,你只需要指定训练数据的目录,BERT相关参数的目录即可。可以使用下面的命令查看帮助
训练的事例命名如下:
bert-base-ner-train \
-data_dir {your dataset dir}\
-output_dir {training output dir}\
-init_checkpoint {Google BERT model dir}\
-bert_config_file {bert_config.json under the Google BERT model dir} \
-vocab_file {vocab.txt under the Google BERT model dir}
参数说明
其中data_dir是你的数据所在的目录,训练数据,验证数据和测试数据命名格式为:train.txt, dev.txt,test.txt,请按照这个格式命名文件,否则会报错。
训练数据的格式如下:
海 O
钓 O
比 O
赛 O
地 O
点 O
在 O
厦 B-LOC
门 I-LOC
与 O
金 B-LOC
门 I-LOC
之 O
间 O
的 O
海 O
域 O
。 O
每行得第一个是字,第二个是它的标签,使用空格’ '分隔,请一定要使用空格。句与句之间使用空行划分。程序会自动读取你的数据。
output_dir: 训练模型输出的文件路径,模型的checkpoint以及一些标签映射表都会存储在这里,这个路径在作为服务的时候,可以指定为-ner_model_dir
init_checkpoint: 下载的谷歌BERT模型
bert_config_file : 谷歌BERT模型下面的bert_config.json
vocab_file: 谷歌BERT模型下面的vocab.txt
训练完成后,你可以在你指定的output_dir中查看训练结果。
更多操作:
https://blog.csdn.net/macanv/article/details/85684284
还有一个bert模型的封装
https://www.jianshu.com/p/1d6689851622
https://cloud.tencent.com/developer/article/1470051
https://www.h3399.cn/201908/714454.html

版权声明
本文为[IT界的小小小学生]所创,转载请带上原文链接,感谢
https://vip01.blog.csdn.net/article/details/100739168
边栏推荐
- Asp.Net Core學習筆記:入門篇
- Real time data synchronization scheme based on Flink SQL CDC
- 03_ Detailed explanation and test of installation and configuration of Ubuntu Samba
- Cos start source code and creator
- 分布式ID生成服务,真的有必要搞一个
- 面经手册 · 第12篇《面试官,ThreadLocal 你要这么问,我就挂了!》
- 连肝三个通宵,JVM77道高频面试题详细分析,就这?
- 【Flutter 實戰】pubspec.yaml 配置檔案詳解
- Ubuntu18.04上安裝NS-3
- 免费的专利下载教程(知网、espacenet强强联合)
猜你喜欢
TensorFlow2.0 问世,Pytorch还能否撼动老大哥地位?
中国提出的AI方法影响越来越大,天大等从大量文献中挖掘AI发展规律
用Keras LSTM构建编码器-解码器模型
Network programming NiO: Bio and NiO
Elasticsearch database | elasticsearch-7.5.0 application construction
怎么理解Python迭代器与生成器?
阿里云Q2营收破纪录背后,云的打开方式正在重塑
文本去重的技术方案讨论(一)
Jmeter——ForEach Controller&Loop Controller
做外包真的很难,身为外包的我也无奈叹息。
随机推荐
DTU连接经常遇到的问题有哪些
Menu permission control configuration of hub plug-in for azure Devops extension
Every day we say we need to do performance optimization. What are we optimizing?
Use of vuepress
TRON智能钱包PHP开发包【零TRX归集】
iptables基礎原理和使用簡介
数据产品不就是报表吗?大错特错!这分类里有大学问
恕我直言,我也是才知道ElasticSearch条件更新是这么玩的
Swagger 3.0 天天刷屏,真的香嗎?
接口压力测试:Siege压测安装、使用和说明
事半功倍:在没有机柜的情况下实现自动化
Basic principle and application of iptables
6.7 theme resolver theme style parser (in-depth analysis of SSM and project practice)
《Google軟體測試之道》 第一章google軟體測試介紹
ThreadLocal原理大解析
[译] 5个Vuex插件,给你的下个VueJS项目
前端模組化簡單總結
熬夜总结了报表自动化、数据可视化和挖掘的要点,和你想的不一样
解決pl/sql developer中資料庫插入資料亂碼問題
DevOps是什么