# AlphaNet_v2

1. 扩充了6个比率类特征，“数据图片”维度变为15*30
2. 将池化层和全连接层替换为LSTM层，从而更好地学习特征的时序信息

In [1]:
import pickle
import numpy as np
import pandas as pd
from tqdm import tqdm

import math
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from audtorch.metrics.functional import pearsonr
from torch.utils.data import DataLoader, Dataset
from datetime import datetime, timedelta
from sklearn.preprocessing import StandardScaler

# 自定义卷积核(特征提取)

In [2]:
'''
过去d天X值构成的时序数列和Y值构成的时序数列的相关系数
'''

class ts_corr(nn.Module):
    def __init__(self, d=10, stride=10):
        super(ts_corr, self).__init__()
        self.d = d
        self.stride = stride

    def forward(self, X): #X:3D
        B, n, T = X.shape # 批量大小，特征数量，时间窗口长度
        
        w = (T - self.d) // self.stride + 1  # 窗口数量,例如T=10，d=3，stride=2时，w=4
        h = n * (n - 1) // 2  # 特征对的数量 C(n, 2)

        # 使用 unfold 提取滑动窗口 [形状: (B, n, w, d)]
        unfolded_X = X.unfold(2, self.d, self.stride)
        
        #生成C(n,2)组合数
        #例如当n=3时，rows = tensor([0,0,1]), cols = tensor([1,2,2])
        rows, cols = torch.triu_indices(n, n, offset=1)

        # 提取特征对数据得到x和y [形状: (B, h, w, d)]，分别对应batch维度，特征维度，窗口维度，时间维度
        #x为([[:,0,:,:],[:,0,:,:],[:,1,:,:])
        #y为([[:,1,:,:],[:,2,:,:],[:,2,:,:])
        
        x = unfolded_X[:, rows, :, :]
        y = unfolded_X[:, cols, :, :]
        
        x_mean = torch.mean(x, dim=3, keepdim=True) #keepdim维持原本维度不变,在维度3做mean
        y_mean = torch.mean(y, dim=3, keepdim=True)
        
        cov = ((x-x_mean)*(y-y_mean)).sum(dim=3) #(B, h, w)
        corr = cov / (torch.std(x, dim=3) * torch.std(y, dim=3)+ 1e-8) #分母添加极小值防止除零错误

        return corr

In [3]:
'''
过去d天X值构成的时序数列和Y值构成的时序数列的协方差
'''

class ts_cov(nn.Module):
    def __init__(self, d=10, stride=10):
        super(ts_cov, self).__init__()
        self.d = d
        self.stride = stride

    def forward(self, X):
        B, n, T = X.shape 
        
        w = (T - self.d) // self.stride + 1  
        h = n * (n - 1) // 2  

        unfolded_X = X.unfold(2, self.d, self.stride)
        
        rows, cols = torch.triu_indices(n, n, offset=1)

        x = unfolded_X[:, rows, :, :]
        y = unfolded_X[:, cols, :, :]
        
        x_mean = torch.mean(x, dim=3, keepdim=True)
        y_mean = torch.mean(y, dim=3, keepdim=True)
        
        cov = ((x-x_mean)*(y-y_mean)).sum(dim=3) 

        return cov

In [4]:
'''
过去d天X值构成的时序数列的标准差
'''

class ts_stddev(nn.Module):
    
    def __init__(self, d = 10, stride = 10):
        super(ts_stddev,self).__init__()
        self.d = d
        self.stride = stride
        
    def forward(self, X):
        #input:(B,n,T)，在T维度用unfold展开窗口，变为(B,n,w,d),w为窗口数量会自动计算
        unfolded_X = X.unfold(2, self.d, self.stride)
        #在每个窗口，即d维度上进行std计算
        std = torch.std(unfolded_X, dim=3) #输出形状为(B,n,w)
        
        return std

In [5]:
'''
过去d天X值构成的时序数列的平均值除以标准差
'''

class ts_zscore(nn.Module):
    
    def __init__(self, d = 10, stride = 10):
        super(ts_zscore,self).__init__()
        self.d = d
        self.stride = stride
        
    def forward(self, X):
        
        unfolded_X = X.unfold(2, self.d, self.stride)
        
        mean = torch.mean(unfolded_X, dim=3)
        std = torch.std(unfolded_X, dim=3)
        zscore = mean / (std + 1e-8)
        
        return zscore

In [6]:
'''
研报原话为：
(X - delay(X, d))/delay(X, d)-1, delay(X, d)为 X 在 d 天前的取值
这里可能有误，return为“收益率“，应该是误加了-1
为了保持代码一致性，这里计算的是(X - delay(X, d-1))/delay(X, d-1),  delay(X, d-1)为 X 在 d-1 天前的取值
在构造卷积核的逻辑上是相似的
'''

class ts_return(nn.Module):
    
    def __init__(self, d = 10, stride = 10):
        super(ts_return,self).__init__()
        self.d = d
        self.stride = stride
        
    def forward(self, X):
        
        unfolded_X = X.unfold(2, self.d, self.stride)
        return1 = unfolded_X[:,:,:,-1] /(unfolded_X[:,:,:,0] + 1e-8) - 1
        
        return return1

In [7]:
'''
过去d天X值构成的时序数列的加权平均值，权数为d, d – 1, …, 1(权数之和应为1，需进行归一化处理）
其中离现在越近的日子权数越大。 
'''

class ts_decaylinear(nn.Module):
    
    def __init__(self, d = 10, stride = 10):
        super(ts_decaylinear,self).__init__()
        self.d = d
        self.stride = stride
        #如下设计的权重系数满足离现在越近的日子权重越大
        weights = torch.arange(d, 0, -1, dtype = torch.float32) 
        weights = weights / weights.sum()
        #注册权重，不用在前向传播函数中重复计算
        #注册了一个形状为(d,)的一维张量，存放权重系数，以便在forward函数中使用
        self.register_buffer('weights', weights) 
        
    def forward(self, X):
        
        unfolded_X = X.unfold(2, self.d, self.stride)
        #view将一维张量广播为4D张量，并在时间维度上，将weights与unfoled_X相乘
        decaylinear = torch.sum(unfolded_X * self.weights.view(1,1,1,-1), dim=-1)
        
        return decaylinear

# v2神经网络结构设计 

路径(Path)：特征提取层→BN→LSTM层→BN→预测目标

In [8]:
'''
路径前半部分：特征提取层→BN
'''
class Path1(nn.Module):
    def __init__(self, extractor, bn_dim): #传入参数：卷积核，特征维度
        super().__init__()
        self.extractor = extractor
        self.bn = nn.BatchNorm1d(bn_dim)
        
    def forward(self, X):
        x = self.extractor(X) #extract
        x = self.bn(x) #BN

        return x

In [9]:
'''
路径后半部分：LSTM→BN→Output

帮助理解LSTM：https://blog.csdn.net/mary19831/article/details/129570030
LSTM的三个参数：
input_size: 输入特征的维度
hidden_size：隐藏状态的数量
output_size：输出的维度
num_layers：LSTM堆叠的层数

'''
class Path2(nn.Module): 
    #研报中定义，LSTM中，输出神经元数 = 30，time_step = 3
    def __init__(self, input_size, hidden_size = 30, num_layers = 1):
        super().__init__()
        
        '''
        若batch_first = True，则lstm模型的输入维度为（batch_size,seq_len,input_size)，
        输出维度为（batch_size,seq_len,input_size)。若默认，则batch_size与seq_len位置互换
        研报中指定time_step = 3(seq_len = 3)，这刚好跟卷积核输出维度中的w是一样的，因此可以直接变换维度带入
        '''
        
        self.lstm = nn.LSTM(input_size, hidden_size, num_layers, batch_first = True)
        self.bn = nn.BatchNorm1d(hidden_size)

    def forward(self, X):
        x = X.permute(0, 2, 1) #将（B，n，w）变为lstm需要的（B，w，n）
        x, _ = self.lstm(x) #形状（B，3，hidden_size）
        x = x[:,-1,:] # 取最后一个时间步作为输出 形状(B，hidden_size)
        x = self.bn(x) #(B,hidden_size)

        return x 

In [10]:
class AlphaNet_v2(nn.Module):

    def __init__(self, d=10, stride=10,n=15, T=30): #池化层窗口d=3，步长stride=3
        super(AlphaNet_v2, self).__init__()
        
        self.d = d 
        self.stride = stride 
        h = n * (n - 1) // 2 #手动计算cov和corr特征提取后的特征维度大小
        w = (T - d) // stride + 1 #手动计算特征提取层窗口数
        
        #特征提取层列表，共6个
        self.extractors = nn.ModuleList([
            ts_corr(d,stride),
            ts_cov(d,stride),
            ts_stddev(d,stride),
            ts_zscore(d,stride),
            ts_return(d,stride),
            ts_decaylinear(d,stride),
        ])
        

        # 初始化
        self.Path1s = nn.ModuleList()
        
        # 前2个特征提取器使用h维BN
        for i in range(2):
            self.Path1s.append(Path1(self.extractors[i], h))
            
        # 后4个特征提取器使用n维BN
        for i in range(2, 6):
            self.Path1s.append(Path1(self.extractors[i], n))
            
        self.head = nn.Sequential(
            Path2(input_size = h*2 + n*4),
            nn.Linear(30, 1)
        )

        # 初始化线性层和输出层
        self.initialize_weights()

    def initialize_weights(self):
        for m in self.modules():
            if isinstance(m, nn.Linear):
                
                #截断正态初始化
                fan_in = m.weight.size(1)
                std = math.sqrt(1.0 / fan_in)  # Xavier方差标准
                nn.init.trunc_normal_(m.weight, std=std, a=-2*std, b=2*std)
                nn.init.normal_(m.bias, std=1e-6)
                
                #Kaiming初始化
                #nn.init.kaiming_normal_(m.weight, mode='fan_in', nonlinearity='relu')
                
                #Xavier初始化
                #nn.init.xavier_uniform_(m.weight)
                #nn.init.normal_(m.bias, std=1e-6)
        
    def forward(self, X):
        
        features = [path(X) for path in self.Path1s] 
        features = torch.cat(features, dim=1)
        
        return self.head(features)

# 数据准备

In [11]:
X = np.load('npy_v2/X_fe.npy')
Y = np.load('npy_v2/Y_fe.npy')
dates = np.load('npy_v2/Y_dates.npy')

print('Shape of X: ', X.shape)
print('Shape of Y: ', Y.shape)

Shape of X:  (930008, 15, 30)
Shape of Y:  (930008,)


In [12]:
'''
对X进行窗口标准化
'''
class myDataset(Dataset):
    '''
    自定义数据集，将原始数据从 numpy arrays 转换成 float 格式的 tensors
    '''
    
    def __init__(self, X, y, scaler = None, is_train = True):
        super(myDataset, self).__init__()
        self.y = y.reshape(-1, 1)
        
        self.origin_shape = X.shape
        
        # (B, n, T) → (B*T, n)
        X_2d = X.reshape(-1, self.origin_shape[1]) 
        
        #训练模式，同时完成拟合（计算均值和标准差）和转换（应用标准化）
        if is_train: 
            self.scaler = StandardScaler()
            X_trans = self.scaler.fit_transform(X_2d)
            #X_trans = np.clip(X_trans, -5, 5)  # 限制标准化后的值在±5个标准差内
        
        #验证/测试模式，仅进行转换（应用标准化），不重新计算均值和标准差
        #预先计算好的均值和标准差存储在标准化器（StandardScaler）的内部属性中
        
        else: 
            self.scaler = scaler
            X_trans = self.scaler.transform(X_2d)
            
        self.X = X_trans.reshape(self.origin_shape)
        self.X = torch.as_tensor(self.X, dtype=torch.float32)
        self.y = torch.as_tensor(self.y, dtype=torch.float32)

    def __len__(self):
        return len(self.X)

    def __getitem__(self, idx):
        return self.X[idx], self.y[idx]
    
    def get_scaler(self):
        return self.scaler

In [13]:
alphanet_v2 = AlphaNet_v2(d=10, stride=10, n=15)

In [14]:
alphanet_v2(torch.tensor(X[:5]).float())

tensor([[ 0.8492],
        [ 1.1502],
        [-0.4877],
        [-0.3041],
        [-1.2076]], grad_fn=<AddmmBackward0>)

In [15]:
target_dates = np.array([datetime.strptime(str(date), '%Y-%m-%d').date() for date in dates])
unique_dates = sorted(np.unique(target_dates))

In [16]:
#用于得到不同的轮次,确保每个轮次为1626天

start_dates = []
starts, valid_starts, test_starts, ends,  = [], [], [], []

i, start, end = 0, 0, 0

k = int(1500*0.8) #按4：1划分训练集和测试集

while i + 1500 + 126 <= len(unique_dates):
    start_dates.append(i)
    
    start = sum(target_dates < unique_dates[i])
    starts.append(start)
    
    valid_start = sum(target_dates < unique_dates[i+k]) #训练集终点
    valid_starts.append(valid_start)
    
    test_start = sum(target_dates < unique_dates[i+1500]) #验证集重点（1500天）
    test_starts.append(test_start)
    
    end = sum(target_dates < unique_dates[i+1500+126]) #测试集终点（再126天）
    ends.append(end)
    
    i += 126

# 训练

In [None]:
#### 设置随机种子，保证训练结果一致
torch.manual_seed(42)
#torch.cuda.manual_seed_all(42)

# 设置训练参数：学习率、训练迭代次数、批量大小
lr = 0.0001
n_epoch = 100
batch_size = 2000
device = torch.device("cpu")

model_name = 'alphanet'

# 初始化一个字典，用来储存模型训练期间的表现
results = {}
results['round'] = []
results['train'] = []
results['valid'] = []
results['test'] = []

# 维护 cnt 变量，记录当前是第几个训练轮次
cnt = 0

# 滚动窗口
for start, valid_start, test_start, end in zip(starts, valid_starts, test_starts, ends):
    
    # 初始化损失函数和优化器
    net = AlphaNet_v2(d=10, stride=10, n=15)
    
    criterion = nn.MSELoss()
    optimizer = optim.Adam(net.parameters(), lr=lr)
    
    # 划分集
    train_set = myDataset(X[start:valid_start], Y[start:valid_start], is_train=True)
    train_scaler = train_set.get_scaler()
    
    valid_set = myDataset(X[valid_start:test_start], Y[valid_start:test_start], scaler = train_scaler, is_train=False)
    
    test_set = myDataset(X[test_start:end], Y[test_start:end], scaler = train_scaler, is_train=False)

    # 创建loader
    train_loader = DataLoader(train_set, batch_size=batch_size, shuffle=True)
    valid_loader = DataLoader(valid_set, batch_size=batch_size, shuffle=False)
    test_loader = DataLoader(test_set, batch_size=batch_size, shuffle=False)
    
    # 当前训练轮次的模型储存地址
    model_path = 'Models_v2/' + model_name + '_' + str(cnt) + '.pt'
    
    count = 0
    train_loss_lst, valid_loss_lst = [], []
    best_valid_loss = float('inf')
    patience = 10
    
    for epoch in range(n_epoch):
        
        # 训练
        net.train()
        train_loss = 0
        total_samples = 0
        for x, y in tqdm(train_loader):
            x, y = x.to(device), y.to(device)
            preds = net(x)
            loss = criterion(preds, y)
            train_loss += loss.item() * x.size(0)
            total_samples += x.size(0)
            
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
        train_loss /= total_samples
        
        # 验证
        net.eval()
        valid_loss = 0
        total_samples = 0
        with torch.no_grad():
            for x, y in tqdm(valid_loader):
                x, y = x.to(device), y.to(device)
                preds = net(x)
                loss = criterion(preds, y)
                valid_loss += loss.item() * x.size(0)
                total_samples += x.size(0)
        valid_loss /= total_samples

        # 监测训练效果
        print("Epoch: {}, Training Loss: {:.4f}, Validation Loss: {:.4f}".format(epoch+1, train_loss, valid_loss))
        
        # 记录训练效果
        train_loss_lst.append(train_loss)
        valid_loss_lst.append(valid_loss)
        
        # 更新本地模型
        if valid_loss < best_valid_loss - 1e-4:
            best_valid_loss = valid_loss
            torch.save(net.state_dict(), model_path)
            print("Saved model with validation loss of {:.4f}".format(best_valid_loss)) 
            count = 0
        else:
            count += 1
            
        # 早停：若累计有patience次迭代，模型都没有进步，停止本轮训练
        if count >= patience:
            break
    
    
    # 记录当前训练轮次的指标变动，并更新本地储存结果
    results['round'].append(str(cnt))          
    results['train'].append(train_loss_lst)   
    results['valid'].append(valid_loss_lst)   
    with open(f'Models_v2/train_results_{cnt}.pickle', 'wb') as f:
        pickle.dump(results, f)
    
    # 下一轮
    cnt += 1

100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.44it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.97it/s]


Epoch: 1, Training Loss: 0.1872, Validation Loss: 0.0591
Saved model with validation loss of 0.0591


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.41it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.84it/s]


Epoch: 2, Training Loss: 0.0557, Validation Loss: 0.0307
Saved model with validation loss of 0.0307


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.42it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.01it/s]


Epoch: 3, Training Loss: 0.0326, Validation Loss: 0.0195
Saved model with validation loss of 0.0195


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:16<00:00,  6.37it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:04<00:00,  7.06it/s]


Epoch: 4, Training Loss: 0.0235, Validation Loss: 0.0139
Saved model with validation loss of 0.0139


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:16<00:00,  6.21it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.30it/s]


Epoch: 5, Training Loss: 0.0180, Validation Loss: 0.0113
Saved model with validation loss of 0.0113


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.42it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.23it/s]


Epoch: 6, Training Loss: 0.0152, Validation Loss: 0.0096
Saved model with validation loss of 0.0096


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.45it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.01it/s]


Epoch: 7, Training Loss: 0.0127, Validation Loss: 0.0077
Saved model with validation loss of 0.0077


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.39it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.16it/s]


Epoch: 8, Training Loss: 0.0112, Validation Loss: 0.0071
Saved model with validation loss of 0.0071


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.55it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.15it/s]


Epoch: 9, Training Loss: 0.0099, Validation Loss: 0.0062
Saved model with validation loss of 0.0062


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.52it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.15it/s]


Epoch: 10, Training Loss: 0.0086, Validation Loss: 0.0053
Saved model with validation loss of 0.0053


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.51it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.14it/s]


Epoch: 11, Training Loss: 0.0079, Validation Loss: 0.0053


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.51it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.90it/s]


Epoch: 12, Training Loss: 0.0073, Validation Loss: 0.0046
Saved model with validation loss of 0.0046


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.45it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.88it/s]


Epoch: 13, Training Loss: 0.0068, Validation Loss: 0.0042
Saved model with validation loss of 0.0042


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.52it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.89it/s]


Epoch: 14, Training Loss: 0.0063, Validation Loss: 0.0039
Saved model with validation loss of 0.0039


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.51it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.01it/s]


Epoch: 15, Training Loss: 0.0060, Validation Loss: 0.0035
Saved model with validation loss of 0.0035


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.54it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.98it/s]


Epoch: 16, Training Loss: 0.0055, Validation Loss: 0.0034


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.53it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.03it/s]


Epoch: 17, Training Loss: 0.0053, Validation Loss: 0.0031
Saved model with validation loss of 0.0031


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.57it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.01it/s]


Epoch: 18, Training Loss: 0.0049, Validation Loss: 0.0028
Saved model with validation loss of 0.0028


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.55it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.03it/s]


Epoch: 19, Training Loss: 0.0046, Validation Loss: 0.0030


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.54it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.06it/s]


Epoch: 20, Training Loss: 0.0043, Validation Loss: 0.0028


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.53it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.06it/s]


Epoch: 21, Training Loss: 0.0042, Validation Loss: 0.0026
Saved model with validation loss of 0.0026


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.53it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.13it/s]


Epoch: 22, Training Loss: 0.0040, Validation Loss: 0.0026


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.53it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.19it/s]


Epoch: 23, Training Loss: 0.0038, Validation Loss: 0.0024
Saved model with validation loss of 0.0024


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.53it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.13it/s]


Epoch: 24, Training Loss: 0.0036, Validation Loss: 0.0023
Saved model with validation loss of 0.0023


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.44it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.52it/s]


Epoch: 25, Training Loss: 0.0034, Validation Loss: 0.0021
Saved model with validation loss of 0.0021


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.21it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.00it/s]


Epoch: 26, Training Loss: 0.0033, Validation Loss: 0.0020


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.46it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.00it/s]


Epoch: 27, Training Loss: 0.0033, Validation Loss: 0.0024


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.35it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.08it/s]


Epoch: 28, Training Loss: 0.0031, Validation Loss: 0.0019
Saved model with validation loss of 0.0019


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.38it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.97it/s]


Epoch: 29, Training Loss: 0.0030, Validation Loss: 0.0018
Saved model with validation loss of 0.0018


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.37it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.83it/s]


Epoch: 30, Training Loss: 0.0030, Validation Loss: 0.0018


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.41it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.07it/s]


Epoch: 31, Training Loss: 0.0029, Validation Loss: 0.0018


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.38it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.93it/s]


Epoch: 32, Training Loss: 0.0028, Validation Loss: 0.0017
Saved model with validation loss of 0.0017


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.44it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.04it/s]


Epoch: 33, Training Loss: 0.0027, Validation Loss: 0.0018


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.37it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.79it/s]


Epoch: 34, Training Loss: 0.0026, Validation Loss: 0.0016
Saved model with validation loss of 0.0016


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.29it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.99it/s]


Epoch: 35, Training Loss: 0.0026, Validation Loss: 0.0017


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.46it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.01it/s]


Epoch: 36, Training Loss: 0.0025, Validation Loss: 0.0016


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.28it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.81it/s]


Epoch: 37, Training Loss: 0.0024, Validation Loss: 0.0015


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.54it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  6.01it/s]


Epoch: 38, Training Loss: 0.0024, Validation Loss: 0.0017


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.39it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.88it/s]


Epoch: 39, Training Loss: 0.0023, Validation Loss: 0.0015


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.36it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.90it/s]


Epoch: 40, Training Loss: 0.0022, Validation Loss: 0.0014
Saved model with validation loss of 0.0014


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:18<00:00,  5.48it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.67it/s]


Epoch: 41, Training Loss: 0.0022, Validation Loss: 0.0013


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.33it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 32/32 [00:05<00:00,  5.88it/s]


Epoch: 42, Training Loss: 0.0022, Validation Loss: 0.0013


100%|████████████████████████████████████████████████████████████████████████████████| 104/104 [00:19<00:00,  5.35it/s]
 59%|████████████████████████████████████████████████▋                                 | 19/32 [00:03<00:02,  5.91it/s]

# 查看轮次对应的时间区间

In [None]:
def get_time_range(round_idx):
    # 获取指定轮次的时间区间
    train_start_date = unique_dates[starts[round_idx]]
    valid_start_date = unique_dates[valid_starts[round_idx]]
    test_start_date = unique_dates[test_starts[round_idx]]
    test_end_date = unique_dates[ends[round_idx]]
    
    return {
        "train": (train_start_date, valid_start_date - timedelta(days=1)),
        "valid": (valid_start_date, test_start_date - timedelta(days=1)),
        "test": (test_start_date, test_end_date)
    }

In [None]:
time_range = get_time_range(2)
print(f"""
训练集: {time_range['train'][0]} 至 {time_range['train'][1]}
验证集: {time_range['valid'][0]} 至 {time_range['valid'][1]}
测试集: {time_range['test'][0]} 至 {time_range['test'][1]}
""")