Transformer 相关资料列表
Encoder-Decoder框架 1
Transformer 模型 1
连续词袋模型(CBOW)
Word2vec
Transformer 模型中的positional encoding(位置编码)计算理解
Transformer 模型中的positional encoding(位置编码)计算理解(2)
self-attention自注意力机制
注意力机制 (2)
self-attention 自注意力机制 2, 多头自注意力机制
深入理解残差模块(残差函数,残差块block,residual模块,残差结构)
Transformer的代码
Transformer 优缺点分析
transformer如何实现并行
深入理解规范化(机器学习,深度学习,神经网络)批标准化 (Batch Normalization)pytorch torch.nn.BatchNorm1d