In [1]:
import pandas as pd
import numpy as np
# 读取CSV文件


import argparse

from tqdm import tqdm, trange
# tqdm函数用于为循环或迭代器创建进度条。
# 它可以用于显示需要很长时间才能完成的任务的进度，例如数据处理或模型训练。
# trange函数类似于Python中的range函数，但它还创建了有指定迭代次数的进度条。
# 这允许您实时查看循环的进度，因此可以更好地跟踪任务执行情况。




In [2]:
# import my_model   # my_model是自己写的一个文件
# import data # data是一个自己写的文件
import torch.nn as nn
"""
这里导入了pytorch深度学习的nn模块，这个模块提供了神经网络层、损失函数
和优化器等工具的类，通过这个模块可以方便地构建和训练神经网络模型。
"""
min_loss = float('inf')

In [3]:
criterion = nn.MSELoss()  # 使用均方误差损失函数计算MSE


In [4]:
import math

import torch
import numpy as np
import  pickle
import os
import json

In [5]:
class DataIterator(object):
    def __init__(self, x_data,x_mask_data,x_edge_data, args):
        self.x_data,self.x_mask_data,self.x_edge_data,=x_data,x_mask_data,x_edge_data,
        #date跟fearture的分开
        # 虽然x_date是一个二维数组，但是二维数组中的每个元素都是一个列表，每个列表的内容是一个日期id和三十五个F特征还有要预测的两个目标值
        # x_data[:,:,0]取出来的是日期
        # x_data[:,:,1:-2]取出来的是三十五个特征
        # x_data[:,:,-2:]取出来的是两个预测值也就是
        self.x_date,self.x_feature,self.x_tags=self.x_data[:,:,0],self.x_data[:,:,1:-2],x_data[:,:,-2:]
        # print(self.x_date.shape,self.x_feature.shape,self.x_tags.shape)
        self.args = args
        #通过数据总数除掉每个批次的数据数目args.batch_size来算出一共多少个批次
        self.batch_count = math.ceil(len(x_data)/args.batch_size)

        #get_batch函数是用来获取某个训练批次的数据的，index代表批次号
    def get_batch(self, index):
        x_date = []
        x_feature = []
        x_mask_data=[]
        x_edge_data = []
        x_tags = []


        for i in range(index * self.args.batch_size,
                       min((index + 1) * self.args.batch_size, len(self.x_data))):

            x_date.append(self.x_date[i])
            x_feature.append(self.x_feature[i].float() )

            # print(self.x_mask_data[i].shape)
            x_mask_data.append(self.x_mask_data[i])
            # print(self.x_edge_data[i].shape)
            x_edge_data.append(self.x_edge_data[i])
            x_tags.append(self.x_tags[i].float() )

        x_date = torch.stack(x_date).to(self.args.device)
        # x_feature=torch.DoubleTensor(torch.stack(x_feature)).to(self.args.device)
        x_feature = torch.FloatTensor(torch.stack(x_feature)).to(self.args.device)
        x_mask_data = torch.stack(x_mask_data).to(self.args.device)
        x_edge_data = torch.stack(x_edge_data).to(self.args.device)
        x_tags = torch.stack(x_tags).to(self.args.device)


        return  x_date,x_feature,x_mask_data,x_edge_data,x_tags

In [6]:
class GraphConvolution(nn.Module):
    def __init__(self, input_dim, output_dim, dropout, bias=False):
        super(GraphConvolution, self).__init__()
        self.dropout = nn.Dropout(dropout)
        self.weight = nn.Parameter(torch.Tensor(input_dim, output_dim))
        nn.init.xavier_uniform_(self.weight)  # xavier初始化，就是论文里的glorot初始化
        if bias:
            self.bias = nn.Parameter(torch.Tensor(output_dim))
            nn.init.zeros_(self.bias)
        else:
            self.register_parameter('bias', None)

    def forward(self, inputs, adj):
        # inputs: (N, n_channels), adj: sparse_matrix (N, N)
        support = torch.mm(self.dropout(inputs), self.weight)
        output = torch.spmm(adj, support)
        if self.bias is not None:
            return output + self.bias
        else:
            return output

In [7]:
class GCN(nn.Module):
    def __init__(self, n_features, hidden_dim, dropout, n_classes):
        super(GCN, self).__init__()
        self.gc1 = GraphConvolution(n_features, hidden_dim, dropout)
        self.gc2 = GraphConvolution(hidden_dim, n_classes, dropout)
        self.relu = nn.ReLU()

    def forward(self, inputs, adj):
        x = inputs
        x = self.relu(self.gc1(x, adj))
        x = self.gc2(x, adj)
        return x

In [8]:
import torch
import torch.nn as nn
import torch.nn.functional as F


In [9]:
class GraphAttentionLayer(nn.Module):
    def __init__(self, in_features, out_features, dropout, alpha, concat):
        super(GraphAttentionLayer, self).__init__()
        self.dropout = dropout
        self.in_features = in_features
        self.out_features = out_features
        self.alpha = alpha
        self.concat = concat

        self.W = nn.Parameter(torch.zeros(in_features, out_features))
        self.a = nn.Parameter(torch.zeros(2 * out_features, 1))
        nn.init.xavier_uniform_(self.W.data, gain=1.414)
        nn.init.xavier_uniform_(self.a.data, gain=1.414)

        self.leakyrelu = nn.LeakyReLU(self.alpha)

    def forward(self, h, adj):
        '''
        h: (N, in_features)
        adj: sparse matrix with shape (N, N)
        p
        '''
        adj=torch.squeeze(adj,-1)
        # print(h.dtype)
        # print(h.shape)
        h = h.type_as(self.W)
        Wh = torch.matmul(h, self.W)  # (N, out_features)
        #print(h)
        #print(self.W)

        Wh1 = torch.matmul(Wh, self.a[:self.out_features, :])  # (N, 1)
        Wh2 = torch.matmul(Wh, self.a[self.out_features:, :])  # (N, 1)
        # print(Wh1.shape)
        # print(Wh2.shape)

        # Wh1 + Wh2.T 是N*N矩阵，第i行第j列是Wh1[i]+Wh2[j]
        # 那么Wh1 + Wh2.T的第i行第j列刚好就是文中的a^T*[Whi||Whj]
        # 代表着节点i对节点j的attention
        # print(torch.transpose(Wh2,2,1).shape)
        e = self.leakyrelu(Wh1 +torch.transpose(Wh2,2,1))  # (N, N)
        padding = (-2 ** 31) * torch.ones_like(e)  # (N, N)
        # print(adj.shape)
        # print(padding.shape)
        attention = torch.where(adj > 0, e, padding)  # (N, N)
        attention = F.softmax(attention, dim=1)  # (N, N)
        # attention矩阵第i行第j列代表node_i对node_j的注意力
        # 对注意力权重也做dropout（如果经过mask之后，attention矩阵也许是高度稀疏的，这样做还有必要吗？）
        attention = F.dropout(attention, self.dropout, training=self.training)

        h_prime = torch.matmul(attention, Wh)  # (N, out_features)
        if self.concat:
            return F.elu(h_prime)
        else:
            return h_prime
        

In [10]:
class GAT(nn.Module):
    def __init__(self,date_emb, nfeat, nhid, dropout, alpha, nheads):
        super(GAT, self).__init__()
        date_index_number,date_dim = date_emb[0], date_emb[1]
        self.dropout = dropout
        self.MH = nn.ModuleList([
            GraphAttentionLayer(nfeat, nhid, dropout, alpha, concat=True)
            for _ in range(nheads)
        ])
        self.out_att = GraphAttentionLayer(nhid * nheads, nhid, dropout, alpha, concat=False)
        self.date_embdding = nn.Embedding(date_index_number,date_dim)
        self.active_index = nn.Linear(nhid,1)
        self.consume_index = nn.Linear(nhid,1)
    def forward(self,x_date,x_feature,x_mask_data):


        x = x_feature
        # x = F.dropout(x_feature, self.dropout, training=self.training)  # (N, nfeat)
        x = torch.cat([head(x, x_mask_data) for head in self.MH], dim=-1)  # (N, nheads*nhid)
        x = F.dropout(x, self.dropout, training=self.training)  # (N, nfeat)


        # x = F.dropout(x, self.dropout, training=self.training)  # (N, nheads*nhid)
        x = self.out_att(x, x_mask_data)
        # print(x.shape,x.dtype)
        act_pre= self.active_index(x)
        con_pre = self.consume_index(x)
        return  act_pre,con_pre


In [11]:
class BILSTM(nn.Module):
    def __init__(self,date_emb, nfeat, nhid, dropout, alpha, nheads):
        super(BILSTM, self).__init__()
        date_index_number,date_dim = date_emb[0], date_emb[1]
        self.dropout = dropout
        self.lstm = nn.LSTM(nfeat,
                nhid,
                num_layers=2,
                bias=True,
                batch_first=False,
                dropout=0,
                bidirectional=True)

        self.active_index = nn.Linear(2*nhid, 1)
        self.consume_index = nn.Linear(2*nhid,1)
        self.my_linear = nn.Linear(2*nhid,128)


    def forward(self,x_date,x_feature,x_mask_data):
        x_feature = x_feature.float()
        # print(x_feature.shape)
        lstm_out, (hidden, cell) = self.lstm(x_feature)
        x = lstm_out
        # print(x.shape)


        x = F.dropout(x, self.dropout, training=self.training)  # (N, nheads*nhid)
        act_pre= self.active_index(x)
        con_pre = self.consume_index(x)
        # print(act_pre.shape,con_pre.shape)
        # return  act_pre,con_pre
        return self.my_linear(x)

In [12]:
class IntegratedModel(nn.Module):
    def __init__(self, date_emb, nfeat, gat_hidden_dim, lstm_hidden_dim, dropout, alpha, nheads):
        super(IntegratedModel, self).__init__()
      
        self.bilstm = BILSTM(date_emb, nfeat, lstm_hidden_dim, dropout, alpha, nheads)
        
        self.gat = GAT(date_emb, 128, gat_hidden_dim, dropout, alpha, nheads)
      
        self.dropout = dropout

    def forward(self, x_date,x_feature,x_mask_data):
    
        x_feature = x_feature.float()    
    
        #BILSTM处理
        lstm_ouput = self.bilstm(x_date,x_feature,x_mask_data)
        
        # GAT 处 理
        act_pre, con_pre = self.gat(x_date,lstm_ouput,x_mask_data)

        return act_pre, con_pre

In [14]:
import torch


In [13]:
def get_train_data(file_path,edge_pth):
    df = pd.read_csv(file_path, encoding='utf-8')
    #读取图文件，并且把它存储为一个名字为df的对象，并且指定文件字符编码为UFT-8编码
    edge_df = pd.read_csv(edge_pth, encoding='utf-8')
    df.head()

    # %%
    # 先定义两个空字典变量，分别用来存储地点和日期和某个序号的映射
    geohasd_df_dict = {}
    date_df_dict = {}
    #最开始字典为空，先声明两个初始值为0的变量
    number_hash = 0
    number_date = 0
    
    # 使用循环
    for i in df["geohash_id"]:

        if i not in geohasd_df_dict.keys():
            geohasd_df_dict[i] = number_hash
            number_hash += 1 #字典已经存入了一个地点，那么number_hash就应该加1
            
    for i in df["date_id"]:
        if i not in date_df_dict.keys():
            date_df_dict[i] = number_date
            number_date += 1

    # 这里创建了一个列表，行数就是日期的数目，列数是地点的数目
    # 子列表数目就是
    new_data = np.zeros((len(date_df_dict),len(geohasd_df_dict),38))
    # [len(geohasd_df_dict) * [0]] * len(date_df_dict)
    
    
    
    for index, row in df.iterrows():
    # iterrows()方法会返回一个元组，其中包含当前行的索引和数据
    # index变量将保存当前行的索引，row变量将保存当前行的数据
        # print(index)
        hash_index, date_index = geohasd_df_dict[row["geohash_id"]], date_df_dict[row["date_id"]]
        #将时间index加到里面
        """
        这里new_data[date_index][hash_index]将被赋值为一个列表。
        这个列表的第一个元素是date_index，后面是row.iloc[2:]的值。
        row.iloc[2:]表示从row中的第三个元素开始到最后一个元素的切片。
        包含一行中从第三列开始的所有列的值。
        """
        new_data[date_index][hash_index] = [date_index]+list(row.iloc[2:])
    new_data = np.array(new_data) 
    # 这里new_data转换为numpy数组，这个函数会创建一个具有相同维度和元素的新数组
    
    
    
    
    # x_train,y_train = new_data[:, :-2], new_data[:, -2:]
    # print(len(geohasd_df_dict))
    # exit()
    # print(x_train.shape)
    # print(y_train.shape)
    #这里构建邻接矩阵其中mask表示1为有边，0无边， value_mask表示有值
    #并且这里我考虑mask是一个无向图，如果有向删除x_mask[date_index][point2_index][point1_index],value_mask同理
    
    #下面两个是元素值均为0的数组
    x_mask =  np.zeros((len(date_df_dict),len(geohasd_df_dict),len(geohasd_df_dict),1), dtype = float)
    x_edge_df =np.zeros((len(date_df_dict),len(geohasd_df_dict),len(geohasd_df_dict),2), dtype = float)

    for index, row in edge_df.iterrows():
        # print(index)
        # 地点编号在字典中找不到，就说明这个数据是错误的，出现了错误的地点，那就进入下一层循环
        if row["geohash6_point1"] not in geohasd_df_dict.keys() or row["geohash6_point2"] not in geohasd_df_dict.keys():
            continue
        point1_index,point2_index,F_1,F_2,date_index= geohasd_df_dict[row["geohash6_point1"]],geohasd_df_dict[row["geohash6_point2"]]\
            ,row["F_1"],row["F_2"],date_df_dict[row["date_id"]]
        x_mask[date_index][point1_index][point2_index] = 1
        x_mask[date_index][point2_index][point1_index] = 1
        # 这里把mask数组对应位置赋值为1，说明两个地点之间有边
        x_edge_df[date_index][point1_index][point2_index] = [F_1,F_2]
        x_edge_df[date_index][point2_index][point1_index] = [F_1, F_2]
        # 把边上面的两个特征存入数组x_edge_df中
    # print(data)

    return geohasd_df_dict, date_df_dict, new_data,x_mask, x_edge_df
#get_train_data函数运行完之后，把地点、时间字典等各种数据做一个返回
#newdata存的是某个日期某个地点的具体特征
#x_mask 存的是某个日期两个地点之间是否有边
#x_edge_df存的是边上的两个特征

In [14]:
def get_test_data(file_path,edge_pth):
    df = pd.read_csv(file_path, encoding='utf-8')
    #读取图文件，并且把它存储为一个名字为df的对象，并且指定文件字符编码为UFT-8编码
    edge_df = pd.read_csv(edge_pth, encoding='utf-8')
    df.head()

    # %%
    # 先定义两个空字典变量，分别用来存储地点和日期和某个序号的映射
    geohasd_df_dict = {}
    date_df_dict = {}
    #最开始字典为空，先声明两个初始值为0的变量
    number_hash = 0
    number_date = 0
    
    # 使用循环
    for i in df["geohash_id"]:

        if i not in geohasd_df_dict.keys():
            geohasd_df_dict[i] = number_hash
            number_hash += 1 #字典已经存入了一个地点，那么number_hash就应该加1
            
    for i in df["date_id"]:
        if i not in date_df_dict.keys():
            date_df_dict[i] = number_date
            number_date += 1

    # 这里创建了一个列表，行数就是日期的数目，列数是地点的数目
    # 子列表数目就是
    new_data = np.zeros((len(date_df_dict),len(geohasd_df_dict),36))
    # [len(geohasd_df_dict) * [0]] * len(date_df_dict)
    
    
    
    for index, row in df.iterrows():
    # iterrows()方法会返回一个元组，其中包含当前行的索引和数据
    # index变量将保存当前行的索引，row变量将保存当前行的数据
        # print(index)
        hash_index, date_index = geohasd_df_dict[row["geohash_id"]], date_df_dict[row["date_id"]]
        #将时间index加到里面
        """
        这里new_data[date_index][hash_index]将被赋值为一个列表。
        这个列表的第一个元素是date_index，后面是row.iloc[2:]的值。
        row.iloc[2:]表示从row中的第三个元素开始到最后一个元素的切片。
        包含一行中从第三列开始的所有列的值。
        """
        new_data[date_index][hash_index] = [date_index]+list(row.iloc[2:])
    new_data = np.array(new_data) 
    # 这里new_data转换为numpy数组，这个函数会创建一个具有相同维度和元素的新数组
    
    
    
    
    # x_train,y_train = new_data[:, :-2], new_data[:, -2:]
    # print(len(geohasd_df_dict))
    # exit()
    # print(x_train.shape)
    # print(y_train.shape)
    #这里构建邻接矩阵其中mask表示1为有边，0无边， value_mask表示有值
    #并且这里我考虑mask是一个无向图，如果有向删除x_mask[date_index][point2_index][point1_index],value_mask同理
    
    #下面两个是元素值均为0的数组
    x_mask =  np.zeros((len(date_df_dict),len(geohasd_df_dict),len(geohasd_df_dict),1), dtype = float)
    x_edge_df =np.zeros((len(date_df_dict),len(geohasd_df_dict),len(geohasd_df_dict),2), dtype = float)

    for index, row in edge_df.iterrows():
        # print(index)
        # 地点编号在字典中找不到，就说明这个数据是错误的，出现了错误的地点，那就进入下一层循环
        if row["geohash6_point1"] not in geohasd_df_dict.keys() or row["geohash6_point2"] not in geohasd_df_dict.keys():
            continue
        point1_index,point2_index,F_1,F_2,date_index= geohasd_df_dict[row["geohash6_point1"]],geohasd_df_dict[row["geohash6_point2"]]\
            ,row["F_1"],row["F_2"],date_df_dict[row["date_id"]]
        x_mask[date_index][point1_index][point2_index] = 1
        x_mask[date_index][point2_index][point1_index] = 1
        # 这里把mask数组对应位置赋值为1，说明两个地点之间有边
        x_edge_df[date_index][point1_index][point2_index] =  [F_1,F_2]
        x_edge_df[date_index][point2_index][point1_index] = [F_1, F_2]
        # 把边上面的两个特征存入数组x_edge_df中
    # print(data)

    return     geohasd_df_dict, date_df_dict, new_data,x_mask, x_edge_df
#get_train_data函数运行完之后，把地点、时间字典等各种数据做一个返回
#newdata存的是某个日期某个地点的具体特征
#x_mask 存的是某个日期两个地点之间是否有边
#x_edge_df存的是边上的两个特征

In [15]:
# 这是一个评估函数，评估模型在给定数据集上的性能
# model是要评估的模型
# dataset是要用于评估模型的数据的数据集对象
# args是包含其他辅助参数的对象
def eval(model, dataset, args,indx):
    global min_loss
    model.eval()
    with torch.no_grad():

        dev_loss = 0.0
        for j in trange(dataset.batch_count):
            x_date, x_feature, x_mask_data, x_edge_data, x_tags = dataset.get_batch(j)
            act_pre, con_pre = model(x_date, x_feature, x_mask_data)
            predict = torch.cat((act_pre, con_pre), dim=-1)
            loss = criterion(predict, x_tags)
            dev_loss+= loss
        print("epoch {0} dev loss is {1}".format(indx,dev_loss))
        if  dev_loss < min_loss:
            min_loss = dev_loss
            # best_model_params = model.state_dict()
            # torch.save(model, 'best_model_{}.pth'.format(dev_loss))
        if(indx==args.epochs-1):
            torch.save(model, 'best_model_{}.pth'.format(dev_loss))
            torch.save(model, 'best_model_{}.pth'.format(min_loss))
            print(dev_loss)
            print(min_loss)
        # print(min_loss)
        # torch.save(model, 'best_model_{}.pth'.format(min_loss))
        model.train()

In [16]:
def train(args):

    geohasd_df_dict, date_df_dict, x_train, x_mask, x_edge_df = get_train_data('./train_90.csv',
                                                                                        "./edge_90.csv")
   
    x_train,x_dev = torch.tensor(x_train[:int(len(x_train)*args.rat)]),torch.tensor(x_train[int(len(x_train)*args.rat):])
  
   
    x_mask_train,x_mask_dev = torch.tensor(x_mask[:int(len(x_mask)*args.rat)]),torch.tensor(x_mask[int(len(x_mask)*args.rat):])
   
    x_edge_train, x_edge_dev = torch.tensor(x_edge_df[:int(len(x_edge_df) * args.rat)]),torch.tensor( x_edge_df[int(len(x_edge_df) * args.rat):])



    date_emb = 5  
    # model = BILSTM(date_emb =[len(date_df_dict),date_emb], nfeat=35, nhid=64, dropout=0.3, alpha=0.3, nheads=8).to(args.device)
    
    model = IntegratedModel(date_emb =[len(date_df_dict),date_emb], nfeat=35, gat_hidden_dim=64, lstm_hidden_dim=64,dropout=0.3, alpha=0.3, nheads=8)
  
    optimizer = torch.optim.Adam(params=model.parameters(),lr=args.lr)

    model.train()
    trainset = DataIterator(x_train,x_mask_train,x_edge_train, args)
    valset =DataIterator(x_dev,x_mask_dev,x_edge_dev, args)

 
    for indx in range(args.epochs):
        train_all_loss = 0.0
        for j in trange(trainset.batch_count):
            x_date,x_feature,x_mask_data,x_edge_data,x_tags= trainset.get_batch(j)
            act_pre, con_pre = model(x_date,x_feature,x_mask_data)
            # act_pre,con_pre = model()
            predict = torch.cat((act_pre, con_pre), dim=-1)
            loss = criterion(predict, x_tags)
            train_all_loss += loss
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
        print( 'epoch {0} train loss :{1}'.format(indx,train_all_loss))
     
        eval(model,valset, args,indx)

In [18]:
# min_loss = float('inf')
# 定义一个类似 argparse 的命名元组
from collections import namedtuple
Args = namedtuple('Args', ['epochs', 'batch_size', 'device', 'lr', 'rat', 'decline'])

# 创建一个 Args 对象并设置各个参数的值
args = Args(100, 4, 'cpu', 0.0005, 0.9, 30)

train(args)

100%|██████████| 21/21 [00:24<00:00,  1.16s/it]


epoch 0 train loss :98630.78125


100%|██████████| 3/3 [00:01<00:00,  1.86it/s]


epoch 0 dev loss is 13061.85546875


100%|██████████| 21/21 [00:23<00:00,  1.10s/it]


epoch 1 train loss :71186.0625


100%|██████████| 3/3 [00:01<00:00,  1.82it/s]


epoch 1 dev loss is 7869.4345703125


100%|██████████| 21/21 [00:23<00:00,  1.12s/it]


epoch 2 train loss :26636.927734375


100%|██████████| 3/3 [00:01<00:00,  1.96it/s]


epoch 2 dev loss is 1969.5528564453125


100%|██████████| 21/21 [00:23<00:00,  1.11s/it]


epoch 3 train loss :9117.24609375


100%|██████████| 3/3 [00:01<00:00,  2.00it/s]


epoch 3 dev loss is 2142.88623046875


100%|██████████| 21/21 [00:22<00:00,  1.09s/it]


epoch 4 train loss :6974.5029296875


100%|██████████| 3/3 [00:01<00:00,  2.03it/s]


epoch 4 dev loss is 2119.488037109375


100%|██████████| 21/21 [00:23<00:00,  1.10s/it]


epoch 5 train loss :6320.85107421875


100%|██████████| 3/3 [00:01<00:00,  1.99it/s]


epoch 5 dev loss is 1875.7401123046875


100%|██████████| 21/21 [00:22<00:00,  1.08s/it]


epoch 6 train loss :6033.83154296875


100%|██████████| 3/3 [00:01<00:00,  2.08it/s]


epoch 6 dev loss is 1676.067626953125


100%|██████████| 21/21 [00:21<00:00,  1.00s/it]


epoch 7 train loss :5886.09912109375


100%|██████████| 3/3 [00:01<00:00,  2.14it/s]


epoch 7 dev loss is 1525.694580078125


100%|██████████| 21/21 [00:20<00:00,  1.01it/s]


epoch 8 train loss :5803.3076171875


100%|██████████| 3/3 [00:01<00:00,  2.13it/s]


epoch 8 dev loss is 1390.904541015625


100%|██████████| 21/21 [00:20<00:00,  1.04it/s]


epoch 9 train loss :5636.591796875


100%|██████████| 3/3 [00:01<00:00,  1.70it/s]


epoch 9 dev loss is 1249.6260986328125


100%|██████████| 21/21 [00:20<00:00,  1.01it/s]


epoch 10 train loss :5543.2939453125


100%|██████████| 3/3 [00:01<00:00,  2.15it/s]


epoch 10 dev loss is 1142.9893798828125


100%|██████████| 21/21 [00:19<00:00,  1.05it/s]


epoch 11 train loss :5424.2373046875


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 11 dev loss is 1058.5987548828125


100%|██████████| 21/21 [00:20<00:00,  1.03it/s]


epoch 12 train loss :5370.3154296875


100%|██████████| 3/3 [00:01<00:00,  2.13it/s]


epoch 12 dev loss is 947.7100830078125


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 13 train loss :5205.5859375


100%|██████████| 3/3 [00:01<00:00,  2.03it/s]


epoch 13 dev loss is 865.2900390625


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 14 train loss :5108.17578125


100%|██████████| 3/3 [00:01<00:00,  2.02it/s]


epoch 14 dev loss is 771.2147827148438


100%|██████████| 21/21 [00:21<00:00,  1.00s/it]


epoch 15 train loss :4994.40283203125


100%|██████████| 3/3 [00:01<00:00,  2.14it/s]


epoch 15 dev loss is 723.84033203125


100%|██████████| 21/21 [00:20<00:00,  1.03it/s]


epoch 16 train loss :4951.06103515625


100%|██████████| 3/3 [00:01<00:00,  2.14it/s]


epoch 16 dev loss is 631.0858764648438


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 17 train loss :4807.28955078125


100%|██████████| 3/3 [00:01<00:00,  2.11it/s]


epoch 17 dev loss is 577.87841796875


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 18 train loss :4766.8720703125


100%|██████████| 3/3 [00:01<00:00,  2.05it/s]


epoch 18 dev loss is 540.3970336914062


100%|██████████| 21/21 [00:20<00:00,  1.02it/s]


epoch 19 train loss :4727.62939453125


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 19 dev loss is 472.1910095214844


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 20 train loss :4643.11572265625


100%|██████████| 3/3 [00:01<00:00,  2.15it/s]


epoch 20 dev loss is 445.928955078125


100%|██████████| 21/21 [00:20<00:00,  1.03it/s]


epoch 21 train loss :4561.0498046875


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 21 dev loss is 411.87542724609375


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 22 train loss :4504.01708984375


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 22 dev loss is 381.9231262207031


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 23 train loss :4504.42626953125


100%|██████████| 3/3 [00:01<00:00,  2.09it/s]


epoch 23 dev loss is 397.2491455078125


100%|██████████| 21/21 [00:20<00:00,  1.03it/s]


epoch 24 train loss :4510.44384765625


100%|██████████| 3/3 [00:01<00:00,  2.13it/s]


epoch 24 dev loss is 340.526611328125


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 25 train loss :4479.86669921875


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 25 dev loss is 332.94818115234375


100%|██████████| 21/21 [00:21<00:00,  1.04s/it]


epoch 26 train loss :4465.35546875


100%|██████████| 3/3 [00:01<00:00,  2.16it/s]


epoch 26 dev loss is 322.54437255859375


100%|██████████| 21/21 [00:20<00:00,  1.03it/s]


epoch 27 train loss :4458.33544921875


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 27 dev loss is 317.3633117675781


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 28 train loss :4507.0751953125


100%|██████████| 3/3 [00:01<00:00,  2.09it/s]


epoch 28 dev loss is 312.20501708984375


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 29 train loss :4443.9404296875


100%|██████████| 3/3 [00:01<00:00,  2.14it/s]


epoch 29 dev loss is 299.44122314453125


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 30 train loss :4468.267578125


100%|██████████| 3/3 [00:01<00:00,  2.15it/s]


epoch 30 dev loss is 306.82794189453125


100%|██████████| 21/21 [00:20<00:00,  1.04it/s]


epoch 31 train loss :4428.47412109375


100%|██████████| 3/3 [00:01<00:00,  1.78it/s]


epoch 31 dev loss is 291.21142578125


100%|██████████| 21/21 [00:21<00:00,  1.00s/it]


epoch 32 train loss :4399.0322265625


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 32 dev loss is 286.2771301269531


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 33 train loss :4423.66015625


100%|██████████| 3/3 [00:01<00:00,  2.15it/s]


epoch 33 dev loss is 281.21588134765625


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 34 train loss :4455.06005859375


100%|██████████| 3/3 [00:01<00:00,  2.11it/s]


epoch 34 dev loss is 286.84307861328125


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 35 train loss :4432.6806640625


100%|██████████| 3/3 [00:01<00:00,  2.21it/s]


epoch 35 dev loss is 304.21490478515625


100%|██████████| 21/21 [00:20<00:00,  1.04it/s]


epoch 36 train loss :4448.74462890625


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 36 dev loss is 294.83929443359375


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 37 train loss :4467.13671875


100%|██████████| 3/3 [00:01<00:00,  2.14it/s]


epoch 37 dev loss is 310.07586669921875


100%|██████████| 21/21 [00:21<00:00,  1.00s/it]


epoch 38 train loss :4404.3623046875


100%|██████████| 3/3 [00:01<00:00,  2.00it/s]


epoch 38 dev loss is 303.80474853515625


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 39 train loss :4418.3828125


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 39 dev loss is 284.721435546875


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 40 train loss :4434.1416015625


100%|██████████| 3/3 [00:01<00:00,  1.88it/s]


epoch 40 dev loss is 285.3477783203125


100%|██████████| 21/21 [00:20<00:00,  1.04it/s]


epoch 41 train loss :4427.18701171875


100%|██████████| 3/3 [00:01<00:00,  2.14it/s]


epoch 41 dev loss is 279.58941650390625


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 42 train loss :4412.93505859375


100%|██████████| 3/3 [00:01<00:00,  2.07it/s]


epoch 42 dev loss is 274.4615173339844


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 43 train loss :4403.2021484375


100%|██████████| 3/3 [00:01<00:00,  2.11it/s]


epoch 43 dev loss is 278.3970031738281


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 44 train loss :4419.56005859375


100%|██████████| 3/3 [00:01<00:00,  2.05it/s]


epoch 44 dev loss is 267.42279052734375


100%|██████████| 21/21 [00:20<00:00,  1.01it/s]


epoch 45 train loss :4393.857421875


100%|██████████| 3/3 [00:01<00:00,  1.74it/s]


epoch 45 dev loss is 262.07989501953125


100%|██████████| 21/21 [00:20<00:00,  1.01it/s]


epoch 46 train loss :4386.50390625


100%|██████████| 3/3 [00:01<00:00,  2.13it/s]


epoch 46 dev loss is 259.5010070800781


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 47 train loss :4378.876953125


100%|██████████| 3/3 [00:01<00:00,  2.11it/s]


epoch 47 dev loss is 260.18865966796875


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 48 train loss :4398.412109375


100%|██████████| 3/3 [00:01<00:00,  2.16it/s]


epoch 48 dev loss is 266.5071716308594


100%|██████████| 21/21 [00:20<00:00,  1.03it/s]


epoch 49 train loss :4338.56787109375


100%|██████████| 3/3 [00:01<00:00,  1.72it/s]


epoch 49 dev loss is 263.79718017578125


100%|██████████| 21/21 [00:20<00:00,  1.02it/s]


epoch 50 train loss :4378.17626953125


100%|██████████| 3/3 [00:01<00:00,  2.06it/s]


epoch 50 dev loss is 268.49493408203125


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 51 train loss :4382.6416015625


100%|██████████| 3/3 [00:01<00:00,  2.16it/s]


epoch 51 dev loss is 251.30093383789062


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 52 train loss :4334.42431640625


100%|██████████| 3/3 [00:01<00:00,  2.13it/s]


epoch 52 dev loss is 257.448974609375


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 53 train loss :4371.60546875


100%|██████████| 3/3 [00:01<00:00,  2.11it/s]


epoch 53 dev loss is 253.8616180419922


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 54 train loss :4389.78662109375


100%|██████████| 3/3 [00:01<00:00,  2.10it/s]


epoch 54 dev loss is 239.40692138671875


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 55 train loss :4376.14453125


100%|██████████| 3/3 [00:01<00:00,  2.11it/s]


epoch 55 dev loss is 238.28826904296875


100%|██████████| 21/21 [00:22<00:00,  1.05s/it]


epoch 56 train loss :4381.9970703125


100%|██████████| 3/3 [00:01<00:00,  2.13it/s]


epoch 56 dev loss is 239.53555297851562


100%|██████████| 21/21 [00:21<00:00,  1.00s/it]


epoch 57 train loss :4358.5537109375


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 57 dev loss is 235.21038818359375


100%|██████████| 21/21 [00:22<00:00,  1.07s/it]


epoch 58 train loss :4358.0810546875


100%|██████████| 3/3 [00:01<00:00,  2.11it/s]


epoch 58 dev loss is 236.2041473388672


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 59 train loss :4360.11962890625


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 59 dev loss is 225.4746551513672


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 60 train loss :4352.36767578125


100%|██████████| 3/3 [00:01<00:00,  2.08it/s]


epoch 60 dev loss is 238.93556213378906


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 61 train loss :4361.279296875


100%|██████████| 3/3 [00:01<00:00,  2.04it/s]


epoch 61 dev loss is 223.338623046875


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 62 train loss :4400.91748046875


100%|██████████| 3/3 [00:01<00:00,  2.13it/s]


epoch 62 dev loss is 219.483154296875


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 63 train loss :4414.5673828125


100%|██████████| 3/3 [00:01<00:00,  2.11it/s]


epoch 63 dev loss is 214.02963256835938


100%|██████████| 21/21 [00:20<00:00,  1.03it/s]


epoch 64 train loss :4431.771484375


100%|██████████| 3/3 [00:01<00:00,  1.91it/s]


epoch 64 dev loss is 220.7349853515625


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 65 train loss :4368.3828125


100%|██████████| 3/3 [00:01<00:00,  1.99it/s]


epoch 65 dev loss is 219.8294677734375


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 66 train loss :4424.37060546875


100%|██████████| 3/3 [00:01<00:00,  2.13it/s]


epoch 66 dev loss is 224.74044799804688


100%|██████████| 21/21 [00:21<00:00,  1.00s/it]


epoch 67 train loss :4440.4912109375


100%|██████████| 3/3 [00:01<00:00,  2.17it/s]


epoch 67 dev loss is 228.933837890625


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 68 train loss :4429.66015625


100%|██████████| 3/3 [00:01<00:00,  2.11it/s]


epoch 68 dev loss is 233.568603515625


100%|██████████| 21/21 [00:21<00:00,  1.03s/it]


epoch 69 train loss :4443.455078125


100%|██████████| 3/3 [00:01<00:00,  2.03it/s]


epoch 69 dev loss is 238.57186889648438


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 70 train loss :4467.13671875


100%|██████████| 3/3 [00:01<00:00,  2.13it/s]


epoch 70 dev loss is 263.85906982421875


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 71 train loss :4419.228515625


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 71 dev loss is 255.8719482421875


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 72 train loss :4373.287109375


100%|██████████| 3/3 [00:01<00:00,  2.15it/s]


epoch 72 dev loss is 295.72955322265625


100%|██████████| 21/21 [00:20<00:00,  1.02it/s]


epoch 73 train loss :4391.337890625


100%|██████████| 3/3 [00:01<00:00,  1.72it/s]


epoch 73 dev loss is 293.6459655761719


100%|██████████| 21/21 [00:20<00:00,  1.02it/s]


epoch 74 train loss :4376.40625


100%|██████████| 3/3 [00:01<00:00,  1.96it/s]


epoch 74 dev loss is 297.5203857421875


100%|██████████| 21/21 [00:20<00:00,  1.01it/s]


epoch 75 train loss :4374.275390625


100%|██████████| 3/3 [00:01<00:00,  2.13it/s]


epoch 75 dev loss is 319.6112365722656


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 76 train loss :4391.97998046875


100%|██████████| 3/3 [00:01<00:00,  2.13it/s]


epoch 76 dev loss is 335.7760314941406


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 77 train loss :4380.779296875


100%|██████████| 3/3 [00:01<00:00,  2.08it/s]


epoch 77 dev loss is 360.80810546875


100%|██████████| 21/21 [00:21<00:00,  1.02s/it]


epoch 78 train loss :4408.9404296875


100%|██████████| 3/3 [00:01<00:00,  2.13it/s]


epoch 78 dev loss is 378.67742919921875


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 79 train loss :4463.236328125


100%|██████████| 3/3 [00:01<00:00,  2.16it/s]


epoch 79 dev loss is 383.43988037109375


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 80 train loss :4475.27197265625


100%|██████████| 3/3 [00:01<00:00,  2.14it/s]


epoch 80 dev loss is 390.669677734375


100%|██████████| 21/21 [00:21<00:00,  1.00s/it]


epoch 81 train loss :4579.50146484375


100%|██████████| 3/3 [00:01<00:00,  2.11it/s]


epoch 81 dev loss is 372.72650146484375


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 82 train loss :4571.82373046875


100%|██████████| 3/3 [00:01<00:00,  2.12it/s]


epoch 82 dev loss is 348.9423522949219


100%|██████████| 21/21 [00:21<00:00,  1.01s/it]


epoch 83 train loss :4628.142578125


100%|██████████| 3/3 [00:01<00:00,  1.78it/s]


epoch 83 dev loss is 335.8363037109375


100%|██████████| 21/21 [00:20<00:00,  1.03it/s]


epoch 84 train loss :4646.62744140625


100%|██████████| 3/3 [00:01<00:00,  1.90it/s]


epoch 84 dev loss is 310.9417724609375


100%|██████████| 21/21 [00:22<00:00,  1.05s/it]


epoch 85 train loss :4652.2890625


100%|██████████| 3/3 [00:01<00:00,  2.07it/s]


epoch 85 dev loss is 279.9144287109375


100%|██████████| 21/21 [00:20<00:00,  1.01it/s]


epoch 86 train loss :4650.75537109375


100%|██████████| 3/3 [00:01<00:00,  2.20it/s]


epoch 86 dev loss is 254.26437377929688


100%|██████████| 21/21 [00:20<00:00,  1.02it/s]


epoch 87 train loss :4685.34765625


100%|██████████| 3/3 [00:01<00:00,  1.83it/s]


epoch 87 dev loss is 231.09727478027344


100%|██████████| 21/21 [00:20<00:00,  1.02it/s]


epoch 88 train loss :4620.1484375


100%|██████████| 3/3 [00:01<00:00,  2.20it/s]


epoch 88 dev loss is 199.76898193359375


100%|██████████| 21/21 [00:20<00:00,  1.01it/s]


epoch 89 train loss :4560.5263671875


100%|██████████| 3/3 [00:01<00:00,  2.21it/s]


epoch 89 dev loss is 179.72848510742188


100%|██████████| 21/21 [00:20<00:00,  1.01it/s]


epoch 90 train loss :4501.23388671875


100%|██████████| 3/3 [00:01<00:00,  2.21it/s]


epoch 90 dev loss is 173.8543701171875


100%|██████████| 21/21 [00:20<00:00,  1.01it/s]


epoch 91 train loss :4393.927734375


100%|██████████| 3/3 [00:01<00:00,  2.16it/s]


epoch 91 dev loss is 170.29835510253906


100%|██████████| 21/21 [00:20<00:00,  1.01it/s]


epoch 92 train loss :4350.49169921875


100%|██████████| 3/3 [00:01<00:00,  2.22it/s]


epoch 92 dev loss is 175.8406982421875


100%|██████████| 21/21 [00:20<00:00,  1.02it/s]


epoch 93 train loss :4345.8154296875


100%|██████████| 3/3 [00:01<00:00,  2.19it/s]


epoch 93 dev loss is 174.35694885253906


100%|██████████| 21/21 [00:20<00:00,  1.02it/s]


epoch 94 train loss :4315.1611328125


100%|██████████| 3/3 [00:01<00:00,  2.08it/s]


epoch 94 dev loss is 176.87396240234375


100%|██████████| 21/21 [00:20<00:00,  1.04it/s]


epoch 95 train loss :4336.02587890625


100%|██████████| 3/3 [00:01<00:00,  1.77it/s]


epoch 95 dev loss is 180.6674346923828


100%|██████████| 21/21 [00:20<00:00,  1.03it/s]


epoch 96 train loss :4314.3701171875


100%|██████████| 3/3 [00:01<00:00,  1.78it/s]


epoch 96 dev loss is 176.04844665527344


100%|██████████| 21/21 [00:19<00:00,  1.06it/s]


epoch 97 train loss :4322.93408203125


100%|██████████| 3/3 [00:01<00:00,  1.86it/s]


epoch 97 dev loss is 169.23878479003906


100%|██████████| 21/21 [00:20<00:00,  1.03it/s]


epoch 98 train loss :4301.08984375


100%|██████████| 3/3 [00:01<00:00,  2.05it/s]


epoch 98 dev loss is 173.30386352539062


100%|██████████| 21/21 [00:20<00:00,  1.01it/s]


epoch 99 train loss :4311.77001953125


100%|██████████| 3/3 [00:01<00:00,  2.20it/s]


epoch 99 dev loss is 174.20700073242188
tensor(174.2070)
tensor(169.2388)


In [None]:
# min_loss = float('inf')
# 定义一个类似 argparse 的命名元组
from collections import namedtuple
Args = namedtuple('Args', ['epochs', 'batch_size', 'device', 'lr', 'rat', 'decline'])

# 创建一个 Args 对象并设置各个参数的值
args = Args(150, 4, 'cpu', 0.0008, 0.9, 30)

train(args)

100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.41s/it]


epoch 0 train loss :93025.328125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.45it/s]


epoch 0 dev loss is 10342.955078125


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.42s/it]


epoch 1 train loss :33592.33984375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.49it/s]


epoch 1 dev loss is 2758.74609375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.40s/it]


epoch 2 train loss :9714.2421875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.47it/s]


epoch 2 dev loss is 1643.50341796875


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:30<00:00,  1.43s/it]


epoch 3 train loss :6350.6318359375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.31it/s]


epoch 3 dev loss is 1451.5308837890625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.42s/it]


epoch 4 train loss :5917.353515625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.47it/s]


epoch 4 dev loss is 1306.47705078125


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:30<00:00,  1.43s/it]


epoch 5 train loss :5709.787109375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.50it/s]


epoch 5 dev loss is 1170.2265625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:30<00:00,  1.45s/it]


epoch 6 train loss :5683.3134765625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.49it/s]


epoch 6 dev loss is 1029.603271484375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:30<00:00,  1.44s/it]


epoch 7 train loss :5690.61572265625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.50it/s]


epoch 7 dev loss is 905.9927978515625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.39s/it]


epoch 8 train loss :5676.4208984375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.50it/s]


epoch 8 dev loss is 763.6241455078125


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.42s/it]


epoch 9 train loss :5637.87890625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.50it/s]


epoch 9 dev loss is 606.151123046875


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.41s/it]


epoch 10 train loss :5529.3564453125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.53it/s]


epoch 10 dev loss is 510.7513732910156


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.42s/it]


epoch 11 train loss :5464.6474609375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.45it/s]


epoch 11 dev loss is 441.71600341796875


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:30<00:00,  1.43s/it]


epoch 12 train loss :5345.30126953125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.52it/s]


epoch 12 dev loss is 391.0310974121094


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:30<00:00,  1.43s/it]


epoch 13 train loss :5245.09326171875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.50it/s]


epoch 13 dev loss is 357.2344970703125


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.39s/it]


epoch 14 train loss :5056.86181640625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.49it/s]


epoch 14 dev loss is 373.9066162109375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.41s/it]


epoch 15 train loss :4928.912109375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.52it/s]


epoch 15 dev loss is 352.9367980957031


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:30<00:00,  1.44s/it]


epoch 16 train loss :4814.38525390625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.37it/s]


epoch 16 dev loss is 349.38360595703125


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.40s/it]


epoch 17 train loss :4760.822265625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.44it/s]


epoch 17 dev loss is 329.14068603515625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.39s/it]


epoch 18 train loss :4775.94140625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.54it/s]


epoch 18 dev loss is 292.48577880859375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.41s/it]


epoch 19 train loss :4640.8818359375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.49it/s]


epoch 19 dev loss is 261.03192138671875


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.40s/it]


epoch 20 train loss :4602.720703125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.51it/s]


epoch 20 dev loss is 258.58642578125


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.38s/it]


epoch 21 train loss :4584.8125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.51it/s]


epoch 21 dev loss is 241.78330993652344


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.38s/it]


epoch 22 train loss :4536.98291015625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.54it/s]


epoch 22 dev loss is 251.41229248046875


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.41s/it]


epoch 23 train loss :4493.05517578125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.50it/s]


epoch 23 dev loss is 233.33653259277344


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.40s/it]


epoch 24 train loss :4463.8818359375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.54it/s]


epoch 24 dev loss is 241.04681396484375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.40s/it]


epoch 25 train loss :4479.39697265625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.53it/s]


epoch 25 dev loss is 221.27719116210938


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.38s/it]


epoch 26 train loss :4472.17626953125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.47it/s]


epoch 26 dev loss is 224.039306640625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.38s/it]


epoch 27 train loss :4473.173828125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.54it/s]


epoch 27 dev loss is 215.22592163085938


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.37s/it]


epoch 28 train loss :4432.54736328125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.49it/s]


epoch 28 dev loss is 212.255615234375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.38s/it]


epoch 29 train loss :4442.66455078125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.49it/s]


epoch 29 dev loss is 211.31153869628906


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.39s/it]


epoch 30 train loss :4406.70703125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.50it/s]


epoch 30 dev loss is 214.0355224609375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.40s/it]


epoch 31 train loss :4438.25927734375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.46it/s]


epoch 31 dev loss is 212.60691833496094


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:31<00:00,  1.48s/it]


epoch 32 train loss :4415.66845703125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.53it/s]


epoch 32 dev loss is 210.52035522460938


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.38s/it]


epoch 33 train loss :4421.9833984375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.54it/s]


epoch 33 dev loss is 202.50064086914062


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.37s/it]


epoch 34 train loss :4422.4375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.47it/s]


epoch 34 dev loss is 207.05470275878906


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.36s/it]


epoch 35 train loss :4398.16455078125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.43it/s]


epoch 35 dev loss is 214.32662963867188


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.37s/it]


epoch 36 train loss :4357.48583984375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.52it/s]


epoch 36 dev loss is 195.61996459960938


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.38s/it]


epoch 37 train loss :4412.83544921875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.57it/s]


epoch 37 dev loss is 204.58963012695312


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.36s/it]


epoch 38 train loss :4433.9609375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.55it/s]


epoch 38 dev loss is 203.7309112548828


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.37s/it]


epoch 39 train loss :4391.548828125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.49it/s]


epoch 39 dev loss is 195.88719177246094


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.41s/it]


epoch 40 train loss :4403.6142578125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.52it/s]


epoch 40 dev loss is 208.4998321533203


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.37s/it]


epoch 41 train loss :4404.3916015625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.52it/s]


epoch 41 dev loss is 200.98797607421875


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.43s/it]


epoch 42 train loss :4381.2060546875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.46it/s]


epoch 42 dev loss is 199.74069213867188


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.38s/it]


epoch 43 train loss :4369.93408203125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.52it/s]


epoch 43 dev loss is 196.36825561523438


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.36s/it]


epoch 44 train loss :4389.87646484375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.51it/s]


epoch 44 dev loss is 195.08445739746094


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.38s/it]


epoch 45 train loss :4385.16796875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.50it/s]


epoch 45 dev loss is 198.35787963867188


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.37s/it]


epoch 46 train loss :4409.60595703125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.50it/s]


epoch 46 dev loss is 195.51266479492188


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.37s/it]


epoch 47 train loss :4364.36767578125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.55it/s]


epoch 47 dev loss is 212.79412841796875


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.37s/it]


epoch 48 train loss :4379.91552734375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.53it/s]


epoch 48 dev loss is 212.8263702392578


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.37s/it]


epoch 49 train loss :4388.2587890625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.52it/s]


epoch 49 dev loss is 197.61712646484375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.38s/it]


epoch 50 train loss :4355.13232421875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.45it/s]


epoch 50 dev loss is 194.38369750976562


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.37s/it]


epoch 51 train loss :4415.51513671875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.51it/s]


epoch 51 dev loss is 191.83157348632812


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.36s/it]


epoch 52 train loss :4386.63525390625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.52it/s]


epoch 52 dev loss is 193.89012145996094


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.36s/it]


epoch 53 train loss :4384.04931640625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.52it/s]


epoch 53 dev loss is 207.99810791015625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.36s/it]


epoch 54 train loss :4368.9365234375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.55it/s]


epoch 54 dev loss is 196.36463928222656


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.36s/it]


epoch 55 train loss :4346.140625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.53it/s]


epoch 55 dev loss is 185.54623413085938


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.36s/it]


epoch 56 train loss :4349.1484375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.58it/s]


epoch 56 dev loss is 186.72711181640625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.35s/it]


epoch 57 train loss :4324.1044921875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.57it/s]


epoch 57 dev loss is 187.62979125976562


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.36s/it]


epoch 58 train loss :4373.72900390625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.55it/s]


epoch 58 dev loss is 193.7554931640625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.35s/it]


epoch 59 train loss :4331.91015625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.51it/s]


epoch 59 dev loss is 196.0816650390625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.35s/it]


epoch 60 train loss :4287.4619140625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.54it/s]


epoch 60 dev loss is 183.13168334960938


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.39s/it]


epoch 61 train loss :4310.486328125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.56it/s]


epoch 61 dev loss is 197.4497833251953


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.37s/it]


epoch 62 train loss :4345.849609375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.52it/s]


epoch 62 dev loss is 207.6226806640625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.36s/it]


epoch 63 train loss :4336.826171875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.51it/s]


epoch 63 dev loss is 192.74745178222656


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.34s/it]


epoch 64 train loss :4357.9765625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.57it/s]


epoch 64 dev loss is 202.76112365722656


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.32s/it]


epoch 65 train loss :4353.1689453125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.57it/s]


epoch 65 dev loss is 207.0684051513672


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.33s/it]


epoch 66 train loss :4316.6572265625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.61it/s]


epoch 66 dev loss is 189.773681640625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.33s/it]


epoch 67 train loss :4305.03173828125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.62it/s]


epoch 67 dev loss is 187.1734619140625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.32s/it]


epoch 68 train loss :4251.52099609375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.56it/s]


epoch 68 dev loss is 188.30160522460938


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.34s/it]


epoch 69 train loss :4309.0654296875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.57it/s]


epoch 69 dev loss is 200.57183837890625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.35s/it]


epoch 70 train loss :4317.4091796875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.61it/s]


epoch 70 dev loss is 193.94886779785156


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.33s/it]


epoch 71 train loss :4292.36962890625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.55it/s]


epoch 71 dev loss is 203.32424926757812


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.36s/it]


epoch 72 train loss :4319.84033203125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.62it/s]


epoch 72 dev loss is 202.9232177734375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.34s/it]


epoch 73 train loss :4277.525390625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.49it/s]


epoch 73 dev loss is 199.61578369140625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.33s/it]


epoch 74 train loss :4287.03515625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.55it/s]


epoch 74 dev loss is 204.94200134277344


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.33s/it]


epoch 75 train loss :4319.15185546875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.61it/s]


epoch 75 dev loss is 210.37562561035156


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.34s/it]


epoch 76 train loss :4331.2216796875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.60it/s]


epoch 76 dev loss is 219.5982208251953


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.35s/it]


epoch 77 train loss :4286.27294921875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.60it/s]


epoch 77 dev loss is 191.14395141601562


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.34s/it]


epoch 78 train loss :4266.4169921875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.58it/s]


epoch 78 dev loss is 201.89016723632812


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.32s/it]


epoch 79 train loss :4278.208984375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.64it/s]


epoch 79 dev loss is 198.2772674560547


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.34s/it]


epoch 80 train loss :4276.3193359375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.60it/s]


epoch 80 dev loss is 208.97857666015625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.34s/it]


epoch 81 train loss :4243.1953125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.56it/s]


epoch 81 dev loss is 215.74696350097656


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.34s/it]


epoch 82 train loss :4315.09521484375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.56it/s]


epoch 82 dev loss is 204.962890625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.33s/it]


epoch 83 train loss :4232.537109375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.62it/s]


epoch 83 dev loss is 204.47024536132812


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.33s/it]


epoch 84 train loss :4248.80859375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.47it/s]


epoch 84 dev loss is 202.09097290039062


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.33s/it]


epoch 85 train loss :4301.61083984375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.55it/s]


epoch 85 dev loss is 211.36404418945312


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.33s/it]


epoch 86 train loss :4256.7890625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.53it/s]


epoch 86 dev loss is 214.940673828125


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.35s/it]


epoch 87 train loss :4240.40283203125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.59it/s]


epoch 87 dev loss is 209.62554931640625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.33s/it]


epoch 88 train loss :4269.85302734375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.51it/s]


epoch 88 dev loss is 207.21868896484375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.32s/it]


epoch 89 train loss :4228.69091796875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.57it/s]


epoch 89 dev loss is 218.64511108398438


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.34s/it]


epoch 90 train loss :4188.01806640625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.58it/s]


epoch 90 dev loss is 216.9764862060547


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:29<00:00,  1.39s/it]


epoch 91 train loss :4210.2578125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.60it/s]


epoch 91 dev loss is 203.55917358398438


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.34s/it]


epoch 92 train loss :4241.82763671875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.55it/s]


epoch 92 dev loss is 211.53524780273438


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.33s/it]


epoch 93 train loss :4229.67431640625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.52it/s]


epoch 93 dev loss is 230.11648559570312


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.34s/it]


epoch 94 train loss :4218.83154296875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.54it/s]


epoch 94 dev loss is 213.8583526611328


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:27<00:00,  1.33s/it]


epoch 95 train loss :4184.36962890625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.51it/s]


epoch 95 dev loss is 239.84796142578125


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [11:46<00:00, 33.64s/it]


epoch 96 train loss :4245.13037109375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.48it/s]


epoch 96 dev loss is 232.64190673828125


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:28<00:00,  1.38s/it]


epoch 97 train loss :4214.26806640625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:02<00:00,  1.50it/s]


epoch 97 dev loss is 241.4985809326172


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.25s/it]


epoch 98 train loss :4228.0224609375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.73it/s]


epoch 98 dev loss is 226.12986755371094


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.28s/it]


epoch 99 train loss :4221.8916015625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.69it/s]


epoch 99 dev loss is 231.50991821289062


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.25s/it]


epoch 100 train loss :4238.69775390625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.67it/s]


epoch 100 dev loss is 242.37356567382812


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.27s/it]


epoch 101 train loss :4173.6845703125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.67it/s]


epoch 101 dev loss is 220.22430419921875


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.28s/it]


epoch 102 train loss :4172.94580078125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.73it/s]


epoch 102 dev loss is 226.5795440673828


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.25s/it]


epoch 103 train loss :4185.8994140625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.71it/s]


epoch 103 dev loss is 234.95843505859375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:25<00:00,  1.23s/it]


epoch 104 train loss :4223.0625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.74it/s]


epoch 104 dev loss is 248.99575805664062


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.24s/it]


epoch 105 train loss :4254.376953125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.76it/s]


epoch 105 dev loss is 262.71722412109375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.24s/it]


epoch 106 train loss :4227.42724609375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.72it/s]


epoch 106 dev loss is 253.22885131835938


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.24s/it]


epoch 107 train loss :4170.2109375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.68it/s]


epoch 107 dev loss is 245.58230590820312


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:25<00:00,  1.24s/it]


epoch 108 train loss :4185.5546875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.73it/s]


epoch 108 dev loss is 264.73345947265625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.25s/it]


epoch 109 train loss :4234.513671875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.72it/s]


epoch 109 dev loss is 266.62445068359375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:25<00:00,  1.23s/it]


epoch 110 train loss :4202.8759765625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.70it/s]


epoch 110 dev loss is 235.73663330078125


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.24s/it]


epoch 111 train loss :4192.11865234375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.78it/s]


epoch 111 dev loss is 240.3502197265625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.24s/it]


epoch 112 train loss :4200.412109375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.76it/s]


epoch 112 dev loss is 219.47598266601562


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:25<00:00,  1.23s/it]


epoch 113 train loss :4182.85986328125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.75it/s]


epoch 113 dev loss is 197.9501953125


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.25s/it]


epoch 114 train loss :4192.3544921875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.73it/s]


epoch 114 dev loss is 209.61500549316406


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:25<00:00,  1.23s/it]


epoch 115 train loss :4161.07861328125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.70it/s]


epoch 115 dev loss is 203.77139282226562


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.25s/it]


epoch 116 train loss :4186.4951171875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.66it/s]


epoch 116 dev loss is 210.85853576660156


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.25s/it]


epoch 117 train loss :4148.73388671875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.69it/s]


epoch 117 dev loss is 210.13694763183594


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:25<00:00,  1.24s/it]


epoch 118 train loss :4168.27587890625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.71it/s]


epoch 118 dev loss is 208.58963012695312


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.24s/it]


epoch 119 train loss :4182.2265625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.71it/s]


epoch 119 dev loss is 216.52061462402344


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.24s/it]


epoch 120 train loss :4221.708984375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.71it/s]


epoch 120 dev loss is 222.86688232421875


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.24s/it]


epoch 121 train loss :4209.765625


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.76it/s]


epoch 121 dev loss is 256.07647705078125


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.25s/it]


epoch 122 train loss :4195.68310546875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.56it/s]


epoch 122 dev loss is 241.44769287109375


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.28s/it]


epoch 123 train loss :4155.3037109375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.75it/s]


epoch 123 dev loss is 246.02072143554688


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.24s/it]


epoch 124 train loss :4149.38671875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.81it/s]


epoch 124 dev loss is 287.7952575683594


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.27s/it]


epoch 125 train loss :4215.89013671875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.60it/s]


epoch 125 dev loss is 300.5441589355469


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.24s/it]


epoch 126 train loss :4253.87451171875


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.75it/s]


epoch 126 dev loss is 284.4019775390625


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.24s/it]


epoch 127 train loss :4259.70361328125


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.60it/s]


epoch 127 dev loss is 252.47427368164062


100%|██████████████████████████████████████████████████████████████████████████████████| 21/21 [00:26<00:00,  1.24s/it]


epoch 128 train loss :4199.3349609375


100%|████████████████████████████████████████████████████████████████████████████████████| 3/3 [00:01<00:00,  1.78it/s]


epoch 128 dev loss is 208.77081298828125



  0%|                                                                                           | 0/21 [00:00<?, ?it/s]

In [23]:
# min_loss = float('inf')
# 变换维度128（还没跑）
# 定义一个类似 argparse 的命名元组
from collections import namedtuple
Args = namedtuple('Args', ['epochs', 'batch_size', 'device', 'lr', 'rat', 'decline'])

# 创建一个 Args 对象并设置各个参数的值
args = Args(50, 8, 'cpu', 0.0009, 0.9, 30)

train(args)

100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:31<00:00,  2.91s/it]


epoch 0 train loss :51200.58984375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.01it/s]


epoch 0 dev loss is 8342.8408203125


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.65s/it]


epoch 1 train loss :30233.701171875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.02it/s]


epoch 1 dev loss is 3913.7529296875


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.65s/it]


epoch 2 train loss :15779.572265625


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.08it/s]


epoch 2 dev loss is 3083.7119140625


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:30<00:00,  2.74s/it]


epoch 3 train loss :6844.9716796875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.11s/it]


epoch 3 dev loss is 1645.0296630859375


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.63s/it]


epoch 4 train loss :4519.84375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.05it/s]


epoch 4 dev loss is 1526.1015625


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.61s/it]


epoch 5 train loss :3757.89501953125


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.02it/s]


epoch 5 dev loss is 1174.3697509765625


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.62s/it]


epoch 6 train loss :3478.02880859375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.00s/it]


epoch 6 dev loss is 1026.6263427734375


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.59s/it]


epoch 7 train loss :3220.51708984375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.05it/s]


epoch 7 dev loss is 842.3401489257812


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.62s/it]


epoch 8 train loss :3047.82421875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.10it/s]


epoch 8 dev loss is 710.2628784179688


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.68s/it]


epoch 9 train loss :2910.162353515625


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.00it/s]


epoch 9 dev loss is 600.7764892578125


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.68s/it]


epoch 10 train loss :2801.491943359375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.03s/it]


epoch 10 dev loss is 495.2930908203125


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.62s/it]


epoch 11 train loss :2699.01904296875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.01it/s]


epoch 11 dev loss is 421.91522216796875


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.65s/it]


epoch 12 train loss :2593.8447265625


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.04it/s]


epoch 12 dev loss is 358.2142333984375


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.59s/it]


epoch 13 train loss :2556.71826171875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.03it/s]


epoch 13 dev loss is 298.927490234375


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.67s/it]


epoch 14 train loss :2499.06396484375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.00it/s]


epoch 14 dev loss is 271.17449951171875


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.62s/it]


epoch 15 train loss :2439.202392578125


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.05it/s]


epoch 15 dev loss is 255.61915588378906


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:30<00:00,  2.73s/it]


epoch 16 train loss :2441.3974609375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.07s/it]


epoch 16 dev loss is 224.39320373535156


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.64s/it]


epoch 17 train loss :2411.786376953125


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.03it/s]


epoch 17 dev loss is 217.70339965820312


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.64s/it]


epoch 18 train loss :2432.7451171875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.06it/s]


epoch 18 dev loss is 216.86099243164062


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.66s/it]


epoch 19 train loss :2376.375732421875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.06s/it]


epoch 19 dev loss is 199.43310546875


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:30<00:00,  2.79s/it]


epoch 20 train loss :2406.65771484375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.01s/it]


epoch 20 dev loss is 195.74407958984375


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:30<00:00,  2.73s/it]


epoch 21 train loss :2425.86181640625


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.04it/s]


epoch 21 dev loss is 187.78741455078125


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.63s/it]


epoch 22 train loss :2381.728515625


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.04it/s]


epoch 22 dev loss is 189.27252197265625


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.59s/it]


epoch 23 train loss :2384.591796875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.04it/s]


epoch 23 dev loss is 179.68504333496094


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.68s/it]


epoch 24 train loss :2375.816650390625


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.05it/s]


epoch 24 dev loss is 178.31109619140625


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.64s/it]


epoch 25 train loss :2353.483642578125


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.02it/s]


epoch 25 dev loss is 176.35861206054688


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.69s/it]


epoch 26 train loss :2357.689453125


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.03it/s]


epoch 26 dev loss is 172.55923461914062


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.66s/it]


epoch 27 train loss :2378.373779296875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.02s/it]


epoch 27 dev loss is 190.6872100830078


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.62s/it]


epoch 28 train loss :2345.880126953125


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.06it/s]


epoch 28 dev loss is 182.63363647460938


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.61s/it]


epoch 29 train loss :2337.550048828125


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.03s/it]


epoch 29 dev loss is 170.32899475097656


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.62s/it]


epoch 30 train loss :2371.5458984375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.09it/s]


epoch 30 dev loss is 174.6501922607422


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.61s/it]


epoch 31 train loss :2334.944091796875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.03it/s]


epoch 31 dev loss is 162.4842529296875


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.68s/it]


epoch 32 train loss :2346.2470703125


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.08it/s]


epoch 32 dev loss is 179.41978454589844


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.66s/it]


epoch 33 train loss :2335.30810546875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.05it/s]


epoch 33 dev loss is 175.9412841796875


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.63s/it]


epoch 34 train loss :2305.216796875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.09it/s]


epoch 34 dev loss is 171.78948974609375


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.65s/it]


epoch 35 train loss :2337.96875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.07it/s]


epoch 35 dev loss is 187.71914672851562


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.73s/it]


epoch 36 train loss :2349.81982421875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.03it/s]


epoch 36 dev loss is 161.77545166015625


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.67s/it]


epoch 37 train loss :2356.286865234375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.02s/it]


epoch 37 dev loss is 169.21551513671875


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.70s/it]


epoch 38 train loss :2346.794189453125


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.04s/it]


epoch 38 dev loss is 169.03924560546875


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:28<00:00,  2.63s/it]


epoch 39 train loss :2349.233154296875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.06it/s]


epoch 39 dev loss is 147.95799255371094


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.65s/it]


epoch 40 train loss :2348.742919921875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.00s/it]


epoch 40 dev loss is 175.5084228515625


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.64s/it]


epoch 41 train loss :2327.6474609375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.02it/s]


epoch 41 dev loss is 169.34317016601562


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.65s/it]


epoch 42 train loss :2370.54833984375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.03s/it]


epoch 42 dev loss is 166.0258026123047


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:31<00:00,  2.85s/it]


epoch 43 train loss :2359.3486328125


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.00s/it]


epoch 43 dev loss is 164.39883422851562


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:30<00:00,  2.76s/it]


epoch 44 train loss :2330.233642578125


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:02<00:00,  1.03s/it]


epoch 44 dev loss is 159.70404052734375


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.65s/it]


epoch 45 train loss :2380.771484375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.02it/s]


epoch 45 dev loss is 155.7506103515625


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.72s/it]


epoch 46 train loss :2369.236083984375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.02it/s]


epoch 46 dev loss is 158.068603515625


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:30<00:00,  2.81s/it]


epoch 47 train loss :2322.66796875


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.05it/s]


epoch 47 dev loss is 160.850341796875


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:31<00:00,  2.84s/it]


epoch 48 train loss :2322.744384765625


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.01it/s]


epoch 48 dev loss is 156.01931762695312


100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:29<00:00,  2.72s/it]


epoch 49 train loss :2316.36083984375


100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:01<00:00,  1.01it/s]


epoch 49 dev loss is 158.46142578125
tensor(158.4614)
tensor(147.9580)


In [20]:
class DataIterator2(object):
    def __init__(self, x_data,x_mask_data,x_edge_data, args):
        self.x_data,self.x_mask_data,self.x_edge_data,=x_data,x_mask_data,x_edge_data,
        #date跟fearture的分开
        self.x_date,self.x_feature=self.x_data[:,:,0],self.x_data[:,:,1:]
        # print(self.x_date.shape,self.x_feature.shape,self.x_tags.shape)
        self.args = args
        self.batch_count = math.ceil(len(x_data)/args.batch_size)

    def get_batch(self, index):
        x_date = []
        x_feature = []
        x_mask_data=[]
        x_edge_data = []

        for i in range(index * self.args.batch_size,
                       min((index + 1) * self.args.batch_size, len(self.x_data))):

            x_date.append(self.x_date[i])
            x_feature.append(self.x_feature[i].float() )

            # print(self.x_mask_data[i].shape)
            x_mask_data.append(self.x_mask_data[i])
            # print(self.x_edge_data[i].shape)
            x_edge_data.append(self.x_edge_data[i])

        x_date = torch.stack(x_date).to(self.args.device)
        x_feature = torch.DoubledTensor(torch.stack(x_feature)).to(self.args.device)
        x_mask_data = torch.stack(x_mask_data).to(self.args.device)
        x_edge_data = torch.stack(x_edge_data).to(self.args.device)


        return  x_date,x_feature,x_mask_data,x_edge_data


In [21]:
node_csv = pd.read_csv('A/node_test_4_A.csv')
edge_csv = pd.read_csv('A/edge_test_4_A.csv')
geohash_id = node_csv['geohash_id']
date_id = node_csv['date_id']
geohasd_df_dict2, date_df_dict2, x_data2, x_mask2, x_edge_df2 = get_test_data('A/node_test_4_A.csv','A/edge_test_4_A.csv')#得到测试集数据
x_data2 = torch.tensor(x_data2[:])
x_mask2 = torch.tensor(x_mask2[:])
x_edge_df2 = torch.tensor(x_edge_df2[:])
outset=DataIterator2 (x_data2,x_mask2,x_edge_df2, args)
predict = torch.Tensor()
model1 = torch.load('best_model_169.23878479003906.pth')
with torch.no_grad():
    act_pre, con_pre = model1(outset.x_date,outset.x_feature,outset.x_mask_data)
    print(act_pre.shape)
    print(con_pre.shape)
    act_pre=act_pre.reshape(1,4560)
    con_pre=con_pre.reshape(1,4560)
    predict = torch.cat((act_pre, con_pre), dim= 0)
        

consumption_level = predict[1,:].to('cpu')
activity_level = predict[0, :].to('cpu')
print(consumption_level.shape)
print(activity_level.shape)

output = {
    'geohash_id': geohash_id.tolist(),
    'consumption_level': consumption_level.tolist(),
    'activity_level': activity_level.tolist(),
    'date_id': date_id.tolist()
}
df = pd.DataFrame.from_dict(output)
df.to_csv('submit_11.21(先lstm再gat).csv', sep='\t', index=False)

torch.Size([4, 1140, 1])
torch.Size([4, 1140, 1])
torch.Size([4560])
torch.Size([4560])


In [None]:
# import torch
# model1 = torch.load('best_model.pth')

In [None]:
# model = GAT(date_emb =[124,6], nfeat=35, nhid=64, dropout=0.3, alpha=0.3, nheads=8).to('cpu')


In [None]:
# torch.save(model.state_dict(),'my_model.pth')

In [None]:
# m = torch.load('my_model.pth')

In [None]:
# kk = model.load_state_dict(m)

In [None]:
# kk

In [None]:
# """
# # 定义一个类似 argparse 的命名元组
# from collections import namedtuple
#
#
# Args = namedtuple('Args', ['epochs', 'batch_size', 'device', 'lr', 'rat', 'decline'])
#
# # 创建一个 Args 对象并设置各个参数的值
# args = Args(300, 4, 'cuda', 1e-3, 0.9, 30)
# """
# geohasd_df_dict, date_df_dict, x_train, x_mask, x_edge_df = get_train_data('./train_90.csv',"./edge_90.csv")
# #分割各种训练集测试集
# x_train,x_dev = torch.tensor(x_train[:int(len(x_train)*args.rat)]),torch.tensor(x_train[int(len(x_train)*args.rat):])
# x_mask_train,x_mask_dev = torch.tensor(x_mask[:int(len(x_mask)*args.rat)]),torch.tensor(x_mask[int(len(x_mask)*args.rat):])
# x_edge_train, x_edge_dev = torch.tensor(x_edge_df[:int(len(x_edge_df) * args.rat)]),torch.tensor( x_edge_df[int(len(x_edge_df) * args.rat):])
#
# date_emb = 5
#
#
#     # 这里的x包含了date_id+F35个特征+2个y值的
# # train_activate = torch.tensor(y_train[:, -2])
# # train_consume = torch.tensor(y_train[:, -1])
#
# model = GAT(date_emb =[len(date_df_dict),date_emb], nfeat=35, nhid=64, dropout=0.3, alpha=0.3, nheads=8)
# def train(args,model):
#
#     model = model.to(args.device)
#     # rmse_loss = torch.sqrt(mse_loss)
#
#     # model = my_model.BILSTM(date_emb =[len(date_df_dict),date_emb], nfeat=35, nhid=64, dropout=0.3, alpha=0.3, nheads=8).to(args.device)
#     optimizer = torch.optim.Adam(params=model.parameters(),lr=args.lr)
#     # scheduler = torch.optim.lr_scheduler.StepLR(optimizer, args.decline, gamma=0.5, last_epoch=-1)
#     model.train()
#     trainset = DataIterator(x_train,x_mask_train,x_edge_train, args)
#     valset =DataIterator(x_dev,x_mask_dev,x_edge_dev, args)
#     for indx in range(args.epochs):
#         train_all_loss = 0.0
#         for j in trange(trainset.batch_count):
#             x_date,x_feature,x_mask_data,x_edge_data,x_tags= trainset.get_batch(j)
#             act_pre, con_pre = model(x_date,x_feature,x_mask_data)#!!!!!
#             predict = torch.cat((act_pre, con_pre), dim=-1)
#
#             loss = criterion(predict, x_tags)
#             train_all_loss += loss
#             optimizer.zero_grad()
#             loss.backward()
#             optimizer.step()
#         print('this epoch train loss :{0}'.format(train_all_loss/trainset.batch_count))
#         # scheduler.step()
#         eval(model,valset, args)
