MQRNN

Model of Paper: A Multi-Horizon Quantile Recurrent Forecaster

本仓库是对上述文章的MQRNN模型的复现，encoder、decoder以及损失函数都是严格按照文章的公式实现的，但没有添加文章中提出的初始线性层。该线性层用来处理不随时间变化的背景协变量，然后与样本数据进行拼接，之后导入Encoder中。模型结构如下：

Encoder是一个LSTM：input.shape 为 [seq_len,batch_size,1+covariate_size], output.shape 为 [seq_len,batch_size,hidden_size]
Globaldecoder是一个MLP：input.shape 为 [seq_len,batch_size,hidden_size+covariate_size], output.shape 为 [seq_len,batch_size,(horizon_size+1)*context_size]
Localdecoder是一个MLP：input.shape 为 [seq_len,batch_size,horizon_size,context_size*2+covariate_size], output.shape 为 [seq_len,batch_size,horizon_size,quantiles_size]
损失函数即为文章中的损失函数：然后对每个FCT、每个batch、每个horizon的每个quantile的损失进行求和。
模型评价：我用的是天池大赛的余额宝数据，只用了四月到八月的数据，150+个点。在调试的过程中，感觉到这个模型非常难训练，但是模型的结构和损失函数我都是严格按照论文来的，可能模型本身效果不是特别好，同时我这个数据也不是很好吧。还有一点就是，从头到尾只有1个样本，这样，模型只会朝拟合该样本的方向前进，但是训练loss很快就不降了，也是非常诡异。

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.gitignore		.gitignore
Decoder.py		Decoder.py
Encoder.py		Encoder.py
LICENSE		LICENSE
MQRNN.ipynb		MQRNN.ipynb
MQRNN.py		MQRNN.py
README.md		README.md
data.py		data.py
total_purchase_test.csv		total_purchase_test.csv
total_purchase_train.csv		total_purchase_train.csv
train.py		train.py

Provide feedback