当前位置:网站首页>NLP常用Backbone模型小抄(1)
NLP常用Backbone模型小抄(1)
2022-08-02 22:43:00 【Andy Dennis】
前言
自17年Transformer出现以来,NLP各大工作都出现它的身影。最近,斯坦福还专门为transformer开了一门课程CS25: 【Stanford】CS25 Transformers United | Fall 2021
刚入门NLP的人可以看看我之前写的一篇文章 研0_NLPer启程
对于对应的模型,可以去hugginface的transfomers库看看 transformers/models (github), 可以找到对应模型看看它的源码实现。
现在主要是结合上下文的动态词向量编码技术,很少使用word2vec, glove词表进行静态词向量映射了。
b站一个视频 吹爆!计算机博士【NLP自然语言处理】不愧是清华教授!5小时让我搞定了NLP自然语言处理! (虽然标题有些emm…但是看了一下目录啥的好像还行…
论文
Mass
Bart
T5
Exploring the Limits of Transfer Learning with a Unified
Text-to-Text Transformer
Bert
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
encoder结构。bert家族很多,如蒸馏版本distilBert, 变体Roberta等。
词向量输入构成:

transformer
著名的self-attention就出自这篇文章.
Attention Is All You Need
之前复现过这个模型: transformer结构复现__attention is all you need (pytorch)
encoder-decoder结构:
Attention模块:
边栏推荐
- qt静态编译出现Project ERROR: Library ‘odbc‘ is not defined
- Based on two levels of decomposition and the length of the memory network multi-step combined forecasting model of short-term wind speed
- ZCMU--5230: 排练方阵(C语言)
- 基于STM32设计的老人防摔倒报警设备(OneNet)
- 学习基因富集工具DAVID(3)
- Kubernetes 进阶训练营 网络
- TCP三次握手与四次挥手
- Cholesterol-PEG-Amine,CLS-PEG-NH2,胆固醇-聚乙二醇-氨基脂两亲性脂质衍生物
- markdown语法
- 你离「TDengine 开发者大会」只差一条 SQL 语句!
猜你喜欢

B站回应“HR 称核心用户都是 Loser”:该面试官去年底已被劝退,会吸取教训加强管理

如何使用vlookup+excel数组公式 完成逆向查找?

MySQL 与InnoDB 下的锁做朋友 (四)行锁/记录锁
![[TypeScript] Deep Learning of TypeScript Classes (Part 1)](/img/47/34954f1e01b844816d74f3ac556f9b.png)
[TypeScript] Deep Learning of TypeScript Classes (Part 1)

Image recognition from zero to write DNF script key points

Find My技术|智能防丢还得看苹果Find My技术

FastCorrect:语音识别快速纠错模型丨RTC Dev Meetup

VS保存后Unity不刷新

你离「TDengine 开发者大会」只差一条 SQL 语句!

Swift中的类型相关内容
随机推荐
The only way to go from a monthly salary of 10k to 30k: automated testing
B站回应HR称用户是Loser:涉事面试官去年底已被劝退
无代码开发平台数据ID入门教程
Cholesterol-PEG-Acid,胆固醇-聚乙二醇-羧基保持在干燥、低温环境下
Week 7 - Distributional Representations
刚安装完win10专业工作站版,系统变量中Path默认值有哪些?重新建一个“PATH”变量名,会覆盖掉原先的“Path”。
程序员如何优雅地解决线上问题?
redis的学习笔记
VS保存后Unity不刷新
Word2Vec词向量训练、使用及可视化操作
2022第十一届财经峰会:优炫软件斩获双项大奖
Pytest配置项-pytest.ini
非关系型数据库MongoDB简介和部署
ROS2初级知识(9):bag记录过程数据和重放
别再用Field注入了
WebShell 木马免杀过WAF
【斯坦福计网CS144项目】Lab5: NetworkInterface
图像识别从零写出dnf脚本关键要点
最近公共祖先(LCA)学习笔记 | P3379 【模板】最近公共祖先(LCA)题解
Week 7 - Distributional Representations(分布表示)