Model of Paper: A Multi-Horizon Quantile Recurrent Forecaster
本仓库是对上述文章的MQRNN模型的复现,encoder、decoder以及损失函数都是严格按照文章的公式实现的,但没有添加文章中提出的初始线性层。该线性层用来处理不随时间变化的背景协变量,然后与样本数据进行拼接,之后导入Encoder中。模型结构如下:
-
Encoder是一个LSTM:input.shape 为 [seq_len,batch_size,1+covariate_size], output.shape 为 [seq_len,batch_size,hidden_size]
-
Globaldecoder是一个MLP:input.shape 为 [seq_len,batch_size,hidden_size+covariate_size], output.shape 为 [seq_len,batch_size,(horizon_size+1)*context_size]
-
Localdecoder是一个MLP:input.shape 为 [seq_len,batch_size,horizon_size,context_size*2+covariate_size], output.shape 为 [seq_len,batch_size,horizon_size,quantiles_size]
-
损失函数即为文章中的损失函数:
然后对每个FCT、每个batch、每个horizon的每个quantile的损失进行求和。 -
模型评价:我用的是天池大赛的余额宝数据,只用了四月到八月的数据,150+个点。在调试的过程中,感觉到这个模型非常难训练,但是模型的结构和损失函数我都是严格按照论文来的,可能模型本身效果不是特别好,同时我这个数据也不是很好吧。还有一点就是,从头到尾只有1个样本,这样,模型只会朝拟合该样本的方向前进,但是训练loss很快就不降了,也是非常诡异。
