- 假设我们想要预测T+1~T+d日期间的收益率
- 每行表示:某只股票在某交易日T的各类信息,是T日收盘
- TradingDay_Shift 表示d日后
- Target: T+1~T+d期间收益率
如果我们目前站在T日,我们只能获得T日以及T日以前的数据。因此,训练集需要的是,TraidngDay_Shift<=T,上述数据的Target只包括T日以及T日以前数据,不会偷看。另外,我们只考虑window长度的历史数据。
我们希望的是,训练周频的模型,为了节省时间。因此在T日的时候,我们将预测的是T+1日T+5日需要的未来收益率,也就是T+1T+5收益率,T+2T+6收益率,..., T+5T+9收益率。因此我们的测试集实际上就是T+9-seq_length+1 ~ T+9。我们实际上不再需要再测试更远以后的效果了。
window选取750天,seq_length选取为250天