当前位置:网站首页>【BERT-多标签文本分类实战】之一——实战项目总览
【BERT-多标签文本分类实战】之一——实战项目总览
2022-07-29 09:10:00 【征途黯然.】
[1] 总览
【BERT-多标签文本分类实战】系列共六篇文章:
【BERT-多标签文本分类实战】之一——实战项目总览
【BERT-多标签文本分类实战】之二——BERT的地位与名词术语解释
【BERT-多标签文本分类实战】之三——数据集的挑选与预处理
【BERT-多标签文本分类实战】之四——BERT模型库的挑选与Transformers
【BERT-多标签文本分类实战】之五——数据加载
【BERT-多标签文本分类实战】之六——模型与训练-评估-测试
目前来看,如果方向是文本分类的话,英文文本分类、中文文本分类都需要掌握。
很多数据集都是英文的,比如多标签文本数据集、层次结构标签文本数据集,想在方向上更进一步的话,必须得学会处理英文文本。
而随着近些年的发展,bert算是表现超级好的几种模型之一,所以有必要跑一跑bert相关的模型。
[2] 代码获取地址
如果需要本组件的源代码,请扫描关注我的公众号,回复“bert实战”。
代码结构如图所示:本项目使用pytorch实现。
[3] 实战前需要掌握的知识
1、了解pytorch基本操作;
2、掌握嵌入层、预训练词向量的概念;
3、掌握神经网络模型相关的基本概念;
4、了解bert模型的相关知识;
[4] 另一个项目:【英文单标签文本分类实战】
您还可以浏览我的另外一个项目博客:【英文单标签文本分类实战】。
边栏推荐
- How to quickly experience oneos
- 数学建模——聚类
- (Video + graphic) introduction series to machine learning - Chapter 2 linear regression
- 文件上传及拓展
- AI is at the forefront | focusing on natural language processing, machine learning and other fields; From Fudan University, Institute of automation, Chinese Academy of Sciences and other teams
- MySQL error summary
- 英语高频后缀
- Information system project manager must recite the quality grade of the core examination site (53)
- Network knowledge summary
- 状态压缩dp
猜你喜欢
C # use database to bind listview control data
Floweable foundation Chapter 1
On the charm of code language
How does alternates achieve high-performance publish and subscribe?
2022年R2移动式压力容器充装考题模拟考试平台操作
机器学习之分类模型评估指标及sklearn代码实现
[C language] DataGridView binding data
用户身份标识与账号体系实践
Flowable 基础篇1
Fastjson's tojsonstring() source code analysis for special processing of time classes - "deepnova developer community"
随机推荐
Classic interview question: = = the difference between equals
Collation of ml.net related resources
Sword finger offer 50. the first character that appears only once
Excellent package volume optimization tutorial
Summary of some experiences in the process of R & D platform splitting
What is the difference between the pre training model and the traditional method in sorting?
Sudoku (DFS)
Rocky基础之编译安装apache
(视频+图文)机器学习入门系列-第1章 引言
LeetCode力扣题目总结(题目编号:53、3、141、面试题022、剑指offer链表中环的入口节点、20、19、牛客NC1、103、1143、牛客127)
LeetCode刷题(6)
AxureRP原型设计 快速开始
多标签用户画像分析跑得快的关键在哪里?
(Video + graphic) introduction series to machine learning - Chapter 2 linear regression
Regular expression verification version number
[unity entry program] collection of common learning websites
Excellent Allegro skill recommendation
Leetcode question brushing (6)
The use and Simulation of string function, character function and memory function
解决Base64 报错 Illegal base64 character