当前位置:网站首页>NLP常用Backbone模型小抄(1)
NLP常用Backbone模型小抄(1)
2022-08-02 22:43:00 【Andy Dennis】
前言
自17年Transformer出现以来,NLP各大工作都出现它的身影。最近,斯坦福还专门为transformer开了一门课程CS25: 【Stanford】CS25 Transformers United | Fall 2021
刚入门NLP的人可以看看我之前写的一篇文章 研0_NLPer启程
对于对应的模型,可以去hugginface的transfomers库看看 transformers/models (github), 可以找到对应模型看看它的源码实现。
现在主要是结合上下文的动态词向量编码技术,很少使用word2vec, glove词表进行静态词向量映射了。
b站一个视频 吹爆!计算机博士【NLP自然语言处理】不愧是清华教授!5小时让我搞定了NLP自然语言处理! (虽然标题有些emm…但是看了一下目录啥的好像还行…
论文
Mass
Bart
T5
Exploring the Limits of Transfer Learning with a Unified
Text-to-Text Transformer
Bert
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
encoder结构。bert家族很多,如蒸馏版本distilBert, 变体Roberta等。
词向量输入构成:

transformer
著名的self-attention就出自这篇文章.
Attention Is All You Need
之前复现过这个模型: transformer结构复现__attention is all you need (pytorch)
encoder-decoder结构:
Attention模块:
边栏推荐
猜你喜欢

MySQL最大建议行数2000w, 靠谱吗?

2022暑假牛客多校1 (A/G/D/I)
![Yocto系列讲解[实战篇]85 - 制作ubi镜像和自动挂载ubifs文件系统](/img/96/beb34ce07f1e4c0fe932359e42e5c6.png)
Yocto系列讲解[实战篇]85 - 制作ubi镜像和自动挂载ubifs文件系统

漫画:怎么证明sleep不释放锁,而wait释放锁?

Rebound shell principle and implementation

Swift中的类型相关内容

科研用Cholesterol-PEG-NHS,NHS-PEG-CLS,胆固醇-聚乙二醇-活性酯

Ruoyi integrates minio to realize distributed file storage

【C语言】带头双向循环链表(list)详解(定义、增、删、查、改)

了解 NFT 质押:Web3 中赚取被动收益的另一种方式
随机推荐
基于STM32的FLASH读写实验含代码(HAL库)
最新真实软件测试面试题分享,收藏了还怕进入不了大厂?
Cholesterol-PEG-Amine,CLS-PEG-NH2,胆固醇-聚乙二醇-氨基脂两亲性脂质衍生物
markdown语法
创建型模式 - 单例模式Singleton
微信小程序(一)
反弹shell原理与实现
Auto.js脚本程序打包
基于两级分解和长短时记忆网络的短期风速多步组合预测模型
21天学习挑战赛(1)设备树的由来
【C语言】带头双向循环链表(list)详解(定义、增、删、查、改)
Week 7 - Distributional Representations
数据库主键一定要自增吗?有哪些场景不建议自增?
Jmeter二次开发实现rsa加密
R语言自学 1 - 向量
了解 NFT 质押:Web3 中赚取被动收益的另一种方式
学习基因富集工具DAVID(2)
FastCorrect:语音识别快速纠错模型丨RTC Dev Meetup
2022杭电多校第一场(K/L/B/C)
软件测试到底自学还是报班?