In [3]:
import os
import time
import random
import numpy as np
import pickle as pk
import pandas as pd
from tqdm import tqdm
from operator import itemgetter
from collections import defaultdict
import torch
import jieba


# 准备好模型的参数
parameter = {
    'epoch':100,
    'batch_size':300,
    'embedding_dim':300,
    'hidden_size':128,
    'num_layers':2, 
    'dropout':0.1,
    #'cuda':torch.device('cuda'),#我电脑不支持
    'cuda':torch.device('cpu'),
    'lr':0.001,
    'max_len':50,
}

def build_dataSet(parameter):
    data_src = pd.read_csv('../../dataSet/data_src.csv')
    data_src = data_src[data_src['关系'] == 'question2answer']
    q,a = list(data_src.实体1),list(data_src.实体2)
    word2id = defaultdict(int)
    word2id['<PAD>'] = 0
    word2id['<UNK>'] = 0
    qa_list = {}
    for ind in range(len(q)):
        q_cut = list(q[ind])
        a_cut = list(a[ind])
        if q[ind] not in qa_list:
            qa_list[q[ind]] = [q_cut,a_cut]
        else:
            qa_list[q[ind]] += [a_cut]
        for i in q_cut:
            word2id[i] += 1
        for i in a_cut:
            word2id[i] += 1
    qa_list = list(qa_list.values())
    parameter['qa_list'] = qa_list
    parameter['word2id'] = dict(zip(word2id.keys(),range(len(word2id))))
    parameter['id2word'] = dict(zip(range(len(word2id)),word2id.keys()))
    parameter['word_size'] = len(word2id)
    
def sample(n,parameter,neg_sample_num):
    neg_sample = []
    q_size = len(parameter['qa_list'])
    while 1:
        sample_id = random.randint(0,q_size-1)
        if sample_id == n:
            continue
        neg_sample_answer = parameter['qa_list'][sample_id]
        a_id = random.randint(1,len(neg_sample_answer)-1)
        neg_sample.append(neg_sample_answer[a_id])
        if len(neg_sample) >= neg_sample_num:
            return neg_sample
        
def list2torch(a):
    return torch.from_numpy(np.array(a)).long().to(parameter['cuda'])
    
def batch_yield(parameter,shuffle = True):
    for train_epoch in range(parameter['epoch']):
        qa_list = parameter['qa_list']
        data = []
        for ind,i in enumerate(qa_list):
            q = i[0]
            p_a = i[1:]
            n_a = sample(ind,parameter,len(p_a))
            q = [q] * len(p_a)
            data += list(zip(q,p_a,n_a))
        if shuffle:
            random.shuffle(data)
        batch_q,batch_a,batch_n = [],[],[]
        seq_len_q,seq_len_a,seq_len_n = 0,0,0
        for (q,a,n) in tqdm(data):
            q = itemgetter(*q)(parameter['word2id'])
            a = itemgetter(*a)(parameter['word2id'])
            n = itemgetter(*n)(parameter['word2id'])
            q = list(q) if type(q) == type(()) else [q,0]
            a = list(a) if type(a) == type(()) else [a,0]
            n = list(n) if type(n) == type(()) else [n,0]
            q = q[:parameter['max_len']]
            a = a[:parameter['max_len']]
            n = n[:parameter['max_len']]
            if len(q) > seq_len_q:
                seq_len_q = len(q)
            if len(a) > seq_len_a:
                seq_len_a = len(a)
            if len(n) > seq_len_n:
                seq_len_n = len(n)
            batch_q.append(q)
            batch_a.append(a)
            batch_n.append(n)
            if len(batch_q) >= parameter['batch_size']:
                batch_q = [i+[0]*(seq_len_q-len(i)) for i in batch_q]
                batch_a = [i+[0]*(seq_len_a-len(i)) for i in batch_a]
                batch_n = [i+[0]*(seq_len_n-len(i)) for i in batch_n]
                yield list2torch(batch_q),list2torch(batch_a),list2torch(batch_n),None,False
                batch_q,batch_a,batch_n = [],[],[]
                seq_len_q,seq_len_a,seq_len_n = 0,0,0
        batch_q = [i+[0]*(seq_len_q-len(i)) for i in batch_q]
        batch_a = [i+[0]*(seq_len_a-len(i)) for i in batch_a]
        batch_n = [i+[0]*(seq_len_n-len(i)) for i in batch_n]
        yield list2torch(batch_q),list2torch(batch_a),list2torch(batch_n),train_epoch,False
        batch_q,batch_a,batch_n = [],[],[]
        seq_len_q,seq_len_a,seq_len_n = 0,0,0
    yield None,None,None,None,True
            
build_dataSet(parameter)
pk.dump(parameter,open('parameter.pkl','wb'))

In [4]:
train_yield = batch_yield(parameter)
test_q,test_a,test_n,_,_ = next(train_yield)
test_q,test_a,test_n

  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s]

(tensor([[ 438,  129,  197,  ...,    0,    0,    0],
         [ 282, 1054,  152,  ...,    0,    0,    0],
         [  15,   16,  200,  ...,    0,    0,    0],
         ...,
         [  60,   61,    0,  ...,    0,    0,    0],
         [ 907,  594,    7,  ...,    0,    0,    0],
         [  70,  292,  146,  ...,    0,    0,    0]]),
 tensor([[438, 343,  64,  ...,   0,   0,   0],
         [167, 580, 365,  ...,   0,   0,   0],
         [214,  79,  44,  ...,   0,   0,   0],
         ...,
         [ 60,  61, 288,  ..., 395, 361, 362],
         [539,  47, 266,  ...,   0,   0,   0],
         [868, 418, 341,  ...,   0,   0,   0]]),
 tensor([[121, 169, 385,  ..., 419,  29, 242],
         [209, 210, 211,  ...,  41,  43,  90],
         [319, 171, 387,  ...,   0,   0,   0],
         ...,
         [548, 159, 311,  ...,   0,   0,   0],
         [288, 104, 558,  ..., 141,  48, 553],
         [ 26,  13,  14,  ...,   0,   0,   0]]))

In [5]:
import torch.nn.functional as F # pytorch 激活函数的类
from torch import nn,optim # 构建模型和优化器

# 构建分类模型
class TextRNN(nn.Module):
    def __init__(self, parameter):
        super(TextRNN, self).__init__()
        embedding_dim = parameter['embedding_dim']
        hidden_size = parameter['hidden_size']
        num_layers = parameter['num_layers']
        dropout = parameter['dropout']
        word_size = parameter['word_size']
        self.embedding = nn.Embedding(word_size, embedding_dim, padding_idx=0)
        
        self.lstm_q = nn.LSTM(embedding_dim, hidden_size, num_layers, bidirectional=True, batch_first=True, dropout=dropout)

        self.lstm_a = nn.LSTM(embedding_dim, hidden_size, num_layers, bidirectional=True, batch_first=True, dropout=dropout)


        
    def forward(self, q, a1,a2 = None):
        q_emd = self.embedding(q)
        q_emd,(h, c)= self.lstm_q(q_emd)
        q_emd = torch.max(q_emd,1)[0]

        a1_emd = self.embedding(a1)
        a1_emd,(h, c)= self.lstm_a(a1_emd)
        a1_emd = torch.max(a1_emd,1)[0]
        if a2 is not None:
            a2_emd = self.embedding(a2)
            a2_emd,(h, c)= self.lstm_a(a2_emd)
            a2_emd = torch.max(a2_emd,1)[0]
            return q_emd,a1_emd,a2_emd
        return F.cosine_similarity(q_emd,a1_emd,1,1e-8)

In [7]:
#test_model = TextRNN(parameter).cuda()#我电脑不支持
test_model = TextRNN(parameter)
test_model(test_q,test_a)

tensor([0.5519, 0.6497, 0.4228, 0.7707, 0.6180, 0.7856, 0.7394, 0.7570, 0.7016,
        0.7094, 0.5542, 0.7083, 0.6563, 0.6838, 0.5852, 0.5750, 0.6565, 0.6351,
        0.5930, 0.5578, 0.6730, 0.7508, 0.6937, 0.4789, 0.6029, 0.7968, 0.7886,
        0.5430, 0.6589, 0.6894, 0.5239, 0.7751, 0.5660, 0.5832, 0.6075, 0.4763,
        0.7108, 0.7125, 0.5238, 0.6683, 0.5538, 0.6191, 0.7145, 0.6611, 0.6788,
        0.7459, 0.7418, 0.6455, 0.6492, 0.6884, 0.7952, 0.7218, 0.7336, 0.6687,
        0.5981, 0.8177, 0.7637, 0.6822, 0.7940, 0.5627, 0.5844, 0.7129, 0.7136,
        0.5808, 0.6028, 0.6168, 0.7395, 0.8016, 0.7871, 0.4897, 0.6963, 0.7608,
        0.7063, 0.5874, 0.5158, 0.5249, 0.7707, 0.7789, 0.7543, 0.7334, 0.8036,
        0.7004, 0.6161, 0.7557, 0.5182, 0.7523, 0.7054, 0.6836, 0.5873, 0.6930,
        0.6415, 0.5843, 0.7300, 0.7037, 0.6505, 0.5907, 0.7230, 0.7401, 0.5917,
        0.7624, 0.5524, 0.6554, 0.6651, 0.5895, 0.6063, 0.5793, 0.4865, 0.7877,
        0.7443, 0.6010, 0.7536, 0.6875, 

In [8]:
import os
import shutil
import pickle as pk
from torch.utils.tensorboard import SummaryWriter

# 构建模型
model = TextRNN(parameter).to(parameter['cuda'])

# 确定训练模式
model.train()

# 确定优化器和损失
optimizer = torch.optim.SGD(model.parameters(),lr=0.1, momentum=0.95, nesterov=True)
scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=30, gamma=0.9)

# 准备迭代器
train_yield = batch_yield(parameter)

# 开始训练
loss_cal = []
min_loss = float('inf')
while 1:
        q,a,n,epoch,keys = next(train_yield)
        if keys:
            break
        q_emd,a_emd,n_emd = model(q,a,n)
        loss = nn.functional.triplet_margin_loss(q_emd, a_emd, n_emd,reduction='mean')
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        loss_cal.append(loss.item())
        if epoch is not None:
            if (epoch+1)%1 == 0:
                loss_cal = sum(loss_cal)/len(loss_cal)
                if loss_cal < min_loss:
                    min_loss = loss_cal
                    torch.save(model.state_dict(), 'grade.h5')
                print('epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, \
                                                       parameter['epoch'],loss_cal))
                optimizer.step()
            loss_cal = [loss.item()]



  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:09<00:33, 32.18it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:22<00:30, 26.00it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:32<00:17, 28.10it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:44<00:17, 28.10it/s][A
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:44<00:00, 30.94it/s][A


epoch [1/100], Loss: 0.9616



  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:17<01:02, 17.44it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:29<00:37, 21.01it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:42<00:37, 21.01it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:42<00:22, 21.89it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [01:02<00:22, 21.89it/s][A
100%|██████████████████████████████████

epoch [2/100], Loss: 0.9158



  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:14<00:51, 20.98it/s][A
 27%|███████████████████████████████▋                                                                                    | 379/1390 [00:14<00:35, 28.56it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:27<00:37, 20.83it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:39<00:37, 20.83it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:41<00:23, 20.91it/s][A
100%|██████████████████████████████████

epoch [3/100], Loss: 0.8842



  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:12<00:44, 24.26it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:25<00:44, 24.26it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:39<00:55, 14.19it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:52<00:28, 17.13it/s][A
 66%|████████████████████████████████████████████████████████████████████████████▊                                       | 920/1390 [00:52<00:26, 17.81it/s][A
100%|██████████████████████████████████

epoch [4/100], Loss: 0.8545



  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:10<00:39, 27.86it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:19<00:24, 31.78it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:29<00:16, 30.21it/s][A
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:39<00:00, 35.06it/s][A


epoch [5/100], Loss: 0.8613



  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:09<00:36, 30.28it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:20<00:27, 28.44it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:29<00:15, 30.90it/s][A
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:39<00:00, 35.52it/s][A


epoch [6/100], Loss: 0.8374



  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:08<00:32, 33.36it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:19<00:32, 33.36it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:23<00:31, 25.04it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:35<00:20, 24.23it/s][A
 86%|███████████████████████████████████████████████████████████████████████████████████████████████████▎               | 1200/1390 [00:48<00:07, 24.50it/s][A
100%|██████████████████████████████████

epoch [7/100], Loss: 0.7953



  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:11<00:42, 25.38it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:22<00:29, 27.17it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:33<00:29, 27.17it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:38<00:21, 22.43it/s][A
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:51<00:00, 27.22it/s][A


epoch [8/100], Loss: 0.7926



  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:14<00:52, 20.58it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:30<00:39, 19.76it/s][A
 45%|████████████████████████████████████████████████████▌                                                               | 630/1390 [00:30<00:35, 21.30it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:40<00:20, 23.34it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:51<00:20, 23.34it/s][A
100%|██████████████████████████████████

epoch [9/100], Loss: 0.8192



  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:15<00:57, 18.93it/s][A
 34%|███████████████████████████████████████▌                                                                            | 474/1390 [00:15<00:26, 34.30it/s][A
 34%|███████████████████████████████████████▌                                                                            | 474/1390 [00:29<00:26, 34.30it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:29<00:43, 18.18it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:41<00:22, 21.85it/s][A
100%|██████████████████████████████████

epoch [10/100], Loss: 0.7905



  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s][A
 22%|█████████████████████████                                                                                           | 300/1390 [00:11<00:41, 26.21it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:22<00:28, 27.47it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:33<00:18, 26.92it/s][A
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:42<00:00, 32.33it/s][A


epoch [11/100], Loss: 0.7599



  0%|                                                                                                                              | 0/1390 [00:00<?, ?it/s][A
 22%|████████████████████████▉                                                                                           | 299/1390 [12:18<44:54,  2.47s/it][A

 38%|████████████████████████████████████████████▏                                                                       | 529/1390 [00:09<00:13, 61.94it/s][A
 43%|██████████████████████████████████████████████████                                                                  | 600/1390 [00:20<00:33, 23.73it/s][A
 65%|███████████████████████████████████████████████████████████████████████████                                         | 900/1390 [00:29<00:17, 28.07it/s][A
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:39<00:00, 35.12it/s][A


epoch [12/100], Loss: 0.7305


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:46<00:00, 29.89it/s]


epoch [13/100], Loss: 0.7035


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:48<00:00, 28.45it/s]


epoch [14/100], Loss: 0.6759


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:42<00:00, 32.39it/s]


epoch [15/100], Loss: 0.6679


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:37<00:00, 36.89it/s]


epoch [16/100], Loss: 0.6510


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:35<00:00, 38.72it/s]


epoch [17/100], Loss: 0.6129


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:34<00:00, 40.22it/s]


epoch [18/100], Loss: 0.5807


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 42.07it/s]


epoch [19/100], Loss: 0.5760


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:34<00:00, 40.33it/s]


epoch [20/100], Loss: 0.5704


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:31<00:00, 44.22it/s]


epoch [21/100], Loss: 0.5388


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 43.12it/s]


epoch [22/100], Loss: 0.5098


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 43.38it/s]


epoch [23/100], Loss: 0.4920


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:31<00:00, 43.97it/s]


epoch [24/100], Loss: 0.4648


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:31<00:00, 44.19it/s]


epoch [25/100], Loss: 0.4267


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 43.32it/s]


epoch [26/100], Loss: 0.4236


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.24it/s]


epoch [27/100], Loss: 0.4159


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.72it/s]


epoch [28/100], Loss: 0.4003


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.41it/s]


epoch [29/100], Loss: 0.3680


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.45it/s]


epoch [30/100], Loss: 0.3402


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.77it/s]


epoch [31/100], Loss: 0.3184


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.87it/s]


epoch [32/100], Loss: 0.2955


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.55it/s]


epoch [33/100], Loss: 0.2783


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.20it/s]


epoch [34/100], Loss: 0.2716


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:34<00:00, 39.89it/s]


epoch [35/100], Loss: 0.2551


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:34<00:00, 39.78it/s]


epoch [36/100], Loss: 0.2506


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.83it/s]


epoch [37/100], Loss: 0.2355


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 42.05it/s]


epoch [38/100], Loss: 0.1998


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:34<00:00, 40.60it/s]


epoch [39/100], Loss: 0.1926


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.69it/s]


epoch [40/100], Loss: 0.1873


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.76it/s]


epoch [41/100], Loss: 0.1652


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.26it/s]


epoch [42/100], Loss: 0.1583


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.84it/s]


epoch [43/100], Loss: 0.1714


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 42.05it/s]


epoch [44/100], Loss: 0.1580


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 42.05it/s]


epoch [45/100], Loss: 0.1417


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.79it/s]


epoch [46/100], Loss: 0.1398


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.61it/s]


epoch [47/100], Loss: 0.1340


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.55it/s]


epoch [48/100], Loss: 0.1145


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.76it/s]


epoch [49/100], Loss: 0.1122


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.95it/s]


epoch [50/100], Loss: 0.1130


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:31<00:00, 43.53it/s]


epoch [51/100], Loss: 0.1103


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.86it/s]


epoch [52/100], Loss: 0.1038


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:35<00:00, 39.20it/s]


epoch [53/100], Loss: 0.1005


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.19it/s]


epoch [54/100], Loss: 0.0958


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.89it/s]


epoch [55/100], Loss: 0.0822


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 42.12it/s]


epoch [56/100], Loss: 0.0912


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.36it/s]


epoch [57/100], Loss: 0.0798


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.05it/s]


epoch [58/100], Loss: 0.0733


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.88it/s]


epoch [59/100], Loss: 0.0682


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.48it/s]


epoch [60/100], Loss: 0.0682


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:31<00:00, 43.45it/s]


epoch [61/100], Loss: 0.0697


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.91it/s]


epoch [62/100], Loss: 0.0722


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 43.07it/s]


epoch [63/100], Loss: 0.0659


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 43.41it/s]


epoch [64/100], Loss: 0.0621


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:31<00:00, 43.96it/s]


epoch [65/100], Loss: 0.0563


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:31<00:00, 43.89it/s]


epoch [66/100], Loss: 0.0544


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.92it/s]


epoch [67/100], Loss: 0.0614


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.57it/s]


epoch [68/100], Loss: 0.0566


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.78it/s]


epoch [69/100], Loss: 0.0517


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.95it/s]


epoch [70/100], Loss: 0.0574


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.94it/s]


epoch [71/100], Loss: 0.0490


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:35<00:00, 39.45it/s]


epoch [72/100], Loss: 0.0573


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.00it/s]


epoch [73/100], Loss: 0.0518


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:34<00:00, 40.00it/s]


epoch [74/100], Loss: 0.0551


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.57it/s]


epoch [75/100], Loss: 0.0538


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:31<00:00, 44.22it/s]


epoch [76/100], Loss: 0.0498


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.60it/s]


epoch [77/100], Loss: 0.0519


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 43.23it/s]


epoch [78/100], Loss: 0.0460


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.78it/s]


epoch [79/100], Loss: 0.0414


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.96it/s]


epoch [80/100], Loss: 0.0467


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:35<00:00, 39.48it/s]


epoch [81/100], Loss: 0.0475


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:34<00:00, 40.85it/s]


epoch [82/100], Loss: 0.0377


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.59it/s]


epoch [83/100], Loss: 0.0388


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.69it/s]


epoch [84/100], Loss: 0.0344


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 43.03it/s]


epoch [85/100], Loss: 0.0365


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.74it/s]


epoch [86/100], Loss: 0.0369


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.30it/s]


epoch [87/100], Loss: 0.0333


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.73it/s]


epoch [88/100], Loss: 0.0315


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.58it/s]


epoch [89/100], Loss: 0.0326


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.47it/s]


epoch [90/100], Loss: 0.0312


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.95it/s]


epoch [91/100], Loss: 0.0324


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.61it/s]


epoch [92/100], Loss: 0.0367


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.37it/s]


epoch [93/100], Loss: 0.0266


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 42.08it/s]


epoch [94/100], Loss: 0.0266


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 42.02it/s]


epoch [95/100], Loss: 0.0300


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.74it/s]


epoch [96/100], Loss: 0.0278


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:33<00:00, 41.95it/s]


epoch [97/100], Loss: 0.0278


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 43.06it/s]


epoch [98/100], Loss: 0.0289


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.59it/s]


epoch [99/100], Loss: 0.0271


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1390/1390 [00:32<00:00, 42.58it/s]


epoch [100/100], Loss: 0.0332
