当前位置:网站首页>自我监督学习和BERT模型
自我监督学习和BERT模型
2022-08-03 05:23:00 【白小李】
目录
一、Self-supervised Learning
1、supervised

对于训练集,需要为其打上标签(lable),才能对模型(Model)进行正常训练。
2、Self-supervised

将训练集x分为两部分,一份作为训练输入数据,另一部分作为lable,输出的y和lable进行比较,越接近就越好。
二、BERT
1、对输入集的处理
BERT多用于自然语言处理部分,即输入大多数是一段文字,当然将语音或者影像都作为输入也是可以的。BERT基于 Transformer 的双向编码器表示,是一个预训练的语言表征模型。
BERT模型在训练的时候,输入一个句子,随机将其中的中文字盖起来。盖住文字有两种方法,一是用特地的代表盖住的符号或者随机用其他文字来将它盖住。
2、如何对BERT模型进行训练
BERT模型训练目的是要将被盖住的地方是什么文字,在训练时是BERT和Linear的mode一起进行训练。输出的值经过softmax函数处理,生产特征向量。

3、Next Sentence Prediction
从资料库中拿两个句子出来,用特定的符合对句子进行分割,以便于模型能识别出来是两个不同的句子。
[CLS]是用来预测这两个句子是否是相接的,yes代表相接,no不相接。
即预测两个句子是否应该接在一起。
三、如何使用BERT
1、Downstream Tasks
BERT的两个作用,一个是盖住一些输入的数据,二是预测两个句子是否能接在一起。 BERT在Downstream Tasks中发挥重要作用。
2、使用举例
输入一个句子,输出一个类别。例如:输入this is good,输出positive。、
CLS输出一个向量,之后乘上一个矩阵,通过softmax判断出类别。
输入一个sequence,输出另一个sequence,但二者长度是不一样的。经过BERT模型最后将输入的词汇判断为哪一种类别的词汇。
在BERT的encode部分的参数不是随机初始化,在之前已经找到一组比较好的初始化参数

输入两个句子,输出一个类别(以自然语言处理为例子)。给出假设和推论,然后给出两个句子之间的关系,是矛盾、包含或者自然等关系。
只需要将CLS部分输出的乘以Linear矩阵,即决定输出什么类别。需要有标注的资料才能对模型进行训练,BERT同样不是随机初始化。

3、Why does BERT work
输入文字后,输出的向量是每个文字的代表意思(Represent the meaning of word),意思越相近的字,它们的向量就越接近,如果上下文意思不同,同一个字的向量也不同。最后则通过向量关系来对文字进行类别判断。

边栏推荐
猜你喜欢

ansible的安装和部署详细过程,配置清单基本操作

对页码的使用总结

NFT租赁提案EIP-5006步入最后审核!让海外大型游戏的链改成为可能

Sqli-labs-master shooting range 1-23 customs clearance detailed tutorial (basic)

Gradle插件与代理服务器导致Sync Project失败的问题

Flask,1-2

Router-view

Delightful Nuxt3 Tutorial (1): Application Creation and Configuration

Apache2-XXE漏洞渗透

当奈飞的NFT忘记了web2的业务安全
随机推荐
MySQL 慢查询
中国生活垃圾处理行业十四五规划与投融资模式分析报告2022~2028年
Gradle插件与代理服务器导致Sync Project失败的问题
C# Base64加密
Mysql 外键详解(Foreign Key)
TypeError: Cannot read property ‘xxxx‘ of undefined的解决方法
Apache2-XXE vulnerability penetration
【Arduino】关于“&”和“|” 运算-----多个参数运算结果异常的问题解决
Ansible installation and deployment detailed process, basic operation of configuration inventory
动漫:海贼王女
C# 数组之回溯法
Kotlin 中的泛型介绍
Oracle 分区索引详解(local、global)
Kettle Spoon 安装配置详解
玩转Markdown(2) —— 抽象语法树的提取与操纵
opencv目标检测
request.getParameter的结果为on
极光推送 能否缓存 消息
The result of request.getParameter is on
图的最短路径的核心——松弛技术