当前位置:网站首页>nlp模型-bert从入门到精通(二)
nlp模型-bert从入门到精通(二)
2020-11-06 01:22:00 【IT界的小小小学生】
命名实体识别
首先下载相应bert 模块
pip install bert-base==0.0.9 -i https://pypi.python.org/simple
也可参考官网处理
安装
软件包现在支持的功能
1.命名实体识别的训练
2.命名实体识别的服务C/S
3.继承优秀开源软件:bert_as_service(hanxiao)的BERT所有服务
4.文本分类服务
后续功能会继续增加
基于命名行训练命名实体识别模型:
安装完bert-base后,会生成两个基于命名行的工具,其中bert-base-ner-train支持命名实体识别模型的训练,你只需要指定训练数据的目录,BERT相关参数的目录即可。可以使用下面的命令查看帮助
训练的事例命名如下:
bert-base-ner-train \
-data_dir {your dataset dir}\
-output_dir {training output dir}\
-init_checkpoint {Google BERT model dir}\
-bert_config_file {bert_config.json under the Google BERT model dir} \
-vocab_file {vocab.txt under the Google BERT model dir}
参数说明
其中data_dir是你的数据所在的目录,训练数据,验证数据和测试数据命名格式为:train.txt, dev.txt,test.txt,请按照这个格式命名文件,否则会报错。
训练数据的格式如下:
海 O
钓 O
比 O
赛 O
地 O
点 O
在 O
厦 B-LOC
门 I-LOC
与 O
金 B-LOC
门 I-LOC
之 O
间 O
的 O
海 O
域 O
。 O
每行得第一个是字,第二个是它的标签,使用空格’ '分隔,请一定要使用空格。句与句之间使用空行划分。程序会自动读取你的数据。
output_dir: 训练模型输出的文件路径,模型的checkpoint以及一些标签映射表都会存储在这里,这个路径在作为服务的时候,可以指定为-ner_model_dir
init_checkpoint: 下载的谷歌BERT模型
bert_config_file : 谷歌BERT模型下面的bert_config.json
vocab_file: 谷歌BERT模型下面的vocab.txt
训练完成后,你可以在你指定的output_dir中查看训练结果。
更多操作:
https://blog.csdn.net/macanv/article/details/85684284
还有一个bert模型的封装
https://www.jianshu.com/p/1d6689851622
https://cloud.tencent.com/developer/article/1470051
https://www.h3399.cn/201908/714454.html
版权声明
本文为[IT界的小小小学生]所创,转载请带上原文链接,感谢
https://vip01.blog.csdn.net/article/details/100739168
边栏推荐
- 7.2.1 cache configuration of static resources
- 快快使用ModelArts,零基础小白也能玩转AI!
- Aprelu: cross border application, adaptive relu | IEEE tie 2020 for machine fault detection
- GBDT与xgb区别,以及梯度下降法和牛顿法的数学推导
- 有关PDF417条码码制的结构介绍
- 如何在Windows Server 2012及更高版本中將域控制器降級
- Details of dapr implementing distributed stateful service
- In depth understanding of the construction of Intelligent Recommendation System
- Asp.Net Core學習筆記:入門篇
- Vue 3 responsive Foundation
猜你喜欢
TRON智能钱包PHP开发包【零TRX归集】
Aprelu: cross border application, adaptive relu | IEEE tie 2020 for machine fault detection
通过深层神经网络生成音乐
安装Anaconda3 后,怎样使用 Python 2.7?
Swagger 3.0 天天刷屏,真的香嗎?
词嵌入教程
Don't go! Here is a note: picture and text to explain AQS, let's have a look at the source code of AQS (long text)
“颜值经济”的野望:华熙生物净利率六连降,收购案遭上交所问询
网络安全工程师演示:原来***是这样获取你的计算机管理员权限的!【维持】
GBDT与xgb区别,以及梯度下降法和牛顿法的数学推导
随机推荐
GDB除錯基礎使用方法
[译] 5个Vuex插件,给你的下个VueJS项目
Vue 3 responsive Foundation
Leetcode's ransom letter
Technical director, to just graduated programmers a word - do a good job in small things, can achieve great things
面经手册 · 第12篇《面试官,ThreadLocal 你要这么问,我就挂了!》
Network programming NiO: Bio and NiO
被老程式設計師壓榨怎麼辦?我不想辭職
业内首发车道级导航背后——详解高精定位技术演进与场景应用
多机器人行情共享解决方案
Use of vuepress
不吹不黑,跨平臺框架AspNetCore開發實踐雜談
DevOps是什么
hadoop 命令总结
文本去重的技术方案讨论(一)
【新閣教育】窮學上位機系列——搭建STEP7模擬環境
如何对Pandas DataFrame进行自定义排序
X Window System介紹
6.7 theme resolver theme style parser (in-depth analysis of SSM and project practice)
C language 100 question set 004 - statistics of the number of people of all ages