当前位置:网站首页>NLP常用Backbone模型小抄(1)
NLP常用Backbone模型小抄(1)
2022-08-02 22:43:00 【Andy Dennis】
前言
自17年Transformer出现以来,NLP各大工作都出现它的身影。最近,斯坦福还专门为transformer开了一门课程CS25: 【Stanford】CS25 Transformers United | Fall 2021
刚入门NLP的人可以看看我之前写的一篇文章 研0_NLPer启程
对于对应的模型,可以去hugginface的transfomers库看看 transformers/models (github), 可以找到对应模型看看它的源码实现。
现在主要是结合上下文的动态词向量编码技术,很少使用word2vec, glove词表进行静态词向量映射了。
b站一个视频 吹爆!计算机博士【NLP自然语言处理】不愧是清华教授!5小时让我搞定了NLP自然语言处理! (虽然标题有些emm…但是看了一下目录啥的好像还行…
论文
Mass
Bart
T5
Exploring the Limits of Transfer Learning with a Unified
Text-to-Text Transformer
Bert
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
encoder结构。bert家族很多,如蒸馏版本distilBert, 变体Roberta等。
词向量输入构成:
transformer
著名的self-attention就出自这篇文章.
Attention Is All You Need
之前复现过这个模型: transformer结构复现__attention is all you need (pytorch)
encoder-decoder结构:
Attention模块:
边栏推荐
猜你喜欢
I have been in the software testing industry for nearly 20 years, let me talk to you about today's software testing
Swift中的类型相关内容
IDEA 重复代码的黄色波浪线取消设置
思源笔记 本地存储无使用第三方同步盘,突然打不开文件。
程序员的七夕浪漫时刻
如何使用vlookup+excel数组公式 完成逆向查找?
了解 NFT 质押:Web3 中赚取被动收益的另一种方式
数据库主键一定要自增吗?有哪些场景不建议自增?
centos7安装mysql5.7步骤(图解版)
Task 4 Machine Learning Library Scikit-learn
随机推荐
threejs 动态调整相机位置,使相机正好能看到对象
Based on two levels of decomposition and the length of the memory network multi-step combined forecasting model of short-term wind speed
数据库主键一定要自增吗?有哪些场景不建议自增?
创建型模式 - 简单工厂模式StaticFactoryMethod
mysql查询表中重复记录
Broadcast platform, the use of the node generated captcha image, and validate
【UE5 骨骼动画】全形体IK导致Two Bone IK只能斜着移动,不能平移
Find My技术|智能防丢还得看苹果Find My技术
00 -- jieba分词
APT level comprehensive free kill with Shell
Unity WallFxPack使用
了解 NFT 质押:Web3 中赚取被动收益的另一种方式
RuoYi-App Startup Tutorial
IDO代币预售合约系统开发技术详细
mysql根据多字段分组——group by带两个或多个参数
Token、Redis实现单点登录
mysql 错误:The driver has not received any packets from the server.
WAF WebShell Trojan free to kill
MySQL最大建议行数2000w, 靠谱吗?
Week 7 - Distributional Representations