当前位置：网站首页>【深度学习】Transformer模型详解

【深度学习】Transformer模型详解

2022-07-31 00:04:00 【一穷二白到年薪百万】

前言

本文为学习记录，其中的内容和图片多有借鉴其他文章的内容，相关博文在参考文献处一并给出链接。

整体架构

Encoder

Decoder

参考文献

[1]Self-Attention和Transformer
[2]详解Transformer （Attention Is All You Need）
[3]强烈推荐！台大李宏毅自注意力机制和Transformer详解！
[4]The Illustrated Transformer
[5]Transformer中Q，K，V的理解
 [6]transformer的self_attention中（KQV）中的V为什么也要乘一个Wv矩阵？
[8]transformer中QKV的通俗理解(渣男与备胎的故事)
[9]The Annotated Transformer

版权声明
本文为[一穷二白到年薪百万]所创，转载请带上原文链接，感谢
https://blog.csdn.net/zfhsfdhdfajhsr/article/details/126074773

边栏推荐

猜你喜欢

随机推荐