GitHub - JJASMINE22/Sequence-Transformer-for-Long-term-sequence-forecasting: Replace Linear MultiHeadAttention mechanism with GConv

Sequence Transformer based on Gconv-MultiHeadAttention --Pytorch

所需环境

Python3.7
PyTorch>=1.10.1+cu113
numpy==1.19.5
pandas==1.2.4
pyod==0.9.8
matplotlib==3.2.2
CUDA 11.0+

注意力结构

模型结构

Encoder
由全连接层、一维分组卷积多头注意力机制组成

Decoder
由全连接层、一维分组卷积多头注意力机制组成

Sequence Transformer
合并Encoder-Decoder，拼接全连接层

注意事项

时序数据推理，删除了标准Transformer的位置掩码、位置编码、前馈层等机制
使用一个正态分布变量替代起始序列特征
将Linear MultiHeadAttention替换为GConv MultiHeadAttention
训练时，并行推理解码序列；预测时，贯续推理解码序列
提出特殊的边界序列填充方法，克服卷积操作引发的差异性，保证训练、预测阶段的运算机制相同
保留三角掩码，防止特征泄露
加入权重正则化操作，防止过拟合

文件下载

链接：https://pan.baidu.com/s/13T1Qs4NZL8NS4yoxCi-Qyw 提取码：sets 下载解压后放置于config.py中设置的路径即可。

训练步骤

运行train.py即可开始训练。

预测效果

sequence_1

sequence_2

sequence_3

参考资料

https://arxiv.org/pdf/1706.03762.pdf

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
attention structure		attention structure
model structure		model structure
sample		sample
saved/checkpoint		saved/checkpoint
utils		utils
CustomLayers.py		CustomLayers.py
README.md		README.md
Transformer.py		Transformer.py
config.py		config.py
networks.py		networks.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sequence Transformer based on Gconv-MultiHeadAttention --Pytorch

目录

所需环境

注意力结构

模型结构

注意事项

文件下载

训练步骤

预测效果

参考资料

About

Releases

Packages

Languages

JJASMINE22/Sequence-Transformer-for-Long-term-sequence-forecasting

Folders and files

Latest commit

History

Repository files navigation

Sequence Transformer based on Gconv-MultiHeadAttention --Pytorch

目录

所需环境

注意力结构

模型结构

注意事项

文件下载

训练步骤

预测效果

参考资料

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages