In [1]:
from collections import defaultdict
from operator import itemgetter
from tqdm import tqdm
import numpy as np
import random
import torch 
import jieba
import json
import os

import pickle as pk

if torch.cuda.is_available():
    device = torch.device('cuda:0')
    torch.cuda.set_device(0)
else:
    device = torch.device('cpu')
# 确定模型训练方式，GPU训练或CPU训练
parameter_copy = {
    # 此处embedding维度为768
    'd_model':768, 
    # rnn的隐层维度为300
    'hid_dim':300,
    # 训练的批次为100轮
    'epoch':100,
    # 单次训练的batch_size为100条数据
    'batch_size':100,
    # 设置序列的最大长度为100
    'n_layers':2,
    # 设置dropout，为防止过拟合
    'dropout':0.1,
    # 配置cpu、gpu
    'device':device,
    # 设置训练学习率
    'lr':0.001,
    # 优化器的参数，动量主要用于随机梯度下降
    'momentum':0.99,
}

def build_dataSet(parameter):
    data_name = ['train','dev']
    data_set = {}
    key_table = defaultdict(int)
    vocab_table = defaultdict(int)
    vocab_table['<PAD>'] = 0
    vocab_table['<UNK>'] = 0
    for i in data_name:
        data_set[i] = []
        data_src = open('data/'+i+'.json','r',encoding = 'utf-8').readlines()
        for data in data_src:
            data = json.loads(data)
            text = list(data['text'])
            label = data['label']
            label_new = ['O']*len(text)
            key_table['O']
            for keys in label:
                inds = label[keys].values()
                for id_list in inds:
                    for ind in id_list:
                        if ind[1] - ind[0] == 0:
                            keys_list = ['S-'+keys]
                            label_new[ind[0]] = keys_list[0]
                        if ind[1] - ind[0] == 1:
                            keys_list = ['B-'+keys,'E-'+keys]
                            label_new[ind[0]] = keys_list[0]
                            label_new[ind[1]] = keys_list[1]
                        if ind[1] - ind[0] > 1:
                            keys_list = ['B-'+keys,'I-'+keys,'E-'+keys]
                            label_new[ind[0]] = keys_list[0]
                            label_new[ind[0]+1:ind[1]] = [keys_list[1]]*(ind[1]-1-ind[0])
                            label_new[ind[1]] = keys_list[2]
                        for key in keys_list:
                            key_table[key] += 1
            for j in text:
                vocab_table[j] += 1
            data_set[i].append([text,label_new])
    key2ind = dict(zip(key_table.keys(),range(len(key_table))))
    ind2key = dict(zip(range(len(key_table)),key_table.keys()))
    word2ind = dict(zip(vocab_table.keys(),range(len(vocab_table))))
    ind2word = dict(zip(range(len(vocab_table)),vocab_table.keys()))
    parameter['key2ind'] = key2ind
    parameter['ind2key'] = ind2key
    parameter['word2ind'] = word2ind
    parameter['ind2word'] = ind2word
    parameter['data_set'] = data_set
    parameter['output_size'] = len(key2ind)
    parameter['word_size'] = len(word2ind)
    return parameter


def batch_yield(parameter,shuffle = True,isTrain = True):
    data_set = parameter['data_set']['train'] if isTrain else parameter['data_set']['dev']
    Epoch = parameter['epoch'] if isTrain else 1
    for epoch in range(Epoch):
        # 每轮对原始数据进行随机化
        if shuffle:
            random.shuffle(data_set)
        inputs,targets = [],[]
        max_len = 0
        for items in tqdm(data_set):
            input = itemgetter(*items[0])(parameter['word2ind'])
            target = itemgetter(*items[1])(parameter['key2ind'])
            input = input if type(input) == type(()) else (input,0)
            target = target if type(target) == type(()) else (target,0)
            if len(input) > max_len:
                max_len = len(input)
            inputs.append(list(input))
            targets.append(list(target))
            if len(inputs) >= parameter['batch_size']:
                inputs = [i+[0]*(max_len-len(i)) for i in inputs]
                targets = [i+[0]*(max_len-len(i)) for i in targets]
                yield list2torch(inputs),list2torch(targets),None,False
                inputs,targets = [],[]
                max_len = 0
        inputs = [i+[0]*(max_len-len(i)) for i in inputs]
        targets = [i+[0]*(max_len-len(i)) for i in targets]
        yield list2torch(inputs),list2torch(targets),epoch,False
        inputs,targets = [],[]
        max_len = 0
    yield None,None,None,True
            

def list2torch(ins):
    return torch.from_numpy(np.array(ins))

# 因此这边提前配置好用于训练的相关参数
# 不要每次重新生成
if not os.path.exists('parameter.pkl'):
    parameter = parameter_copy
    # 构建相关字典和对应的数据集
    parameter = build_dataSet(parameter)
    pk.dump(parameter,open('parameter.pkl','wb'))
else:
    # 读取已经处理好的parameter，但是考虑到模型训练的参数会发生变化，
    # 因此此处对于parameter中模型训练参数进行替换
    parameter = pk.load(open('parameter.pkl','rb'))
    for i in parameter_copy.keys():
        if i not in parameter:
            parameter[i] = parameter_copy[i]
            continue
        if parameter_copy[i] != parameter[i]:
            parameter[i] = parameter_copy[i]
    for i in parameter_copy.keys():
        print(i,':',parameter[i])
    pk.dump(parameter,open('parameter.pkl','wb'))
    del parameter_copy,i

d_model : 768
hid_dim : 300
epoch : 100
batch_size : 100
n_layers : 2
dropout : 0.1
device : cuda:0
lr : 0.001
momentum : 0.99


In [3]:
test_input,test_target,_,_ = next(batch_yield(parameter))

  1%|▋                                                                           | 99/10748 [00:00<00:00, 49627.84it/s]


In [2]:
import torch.nn.functional as F # pytorch 激活函数的类
from torch import nn,optim # 构建模型和优化器
from torchcrf import CRF


# 构建基于bilstm实现ner
class bilstm_crf(nn.Module):
    def __init__(self, parameter):
        super(bilstm_crf, self).__init__()
        word_size = parameter['word_size']
        embedding_dim = parameter['d_model']
        self.embedding = nn.Embedding(word_size, embedding_dim, padding_idx=0)

        hidden_size = parameter['hid_dim']
        num_layers = parameter['n_layers']
        dropout = parameter['dropout']
        self.lstm = nn.LSTM(embedding_dim, hidden_size, num_layers, bidirectional=True, batch_first=True, dropout=dropout)

        output_size = parameter['output_size']
        self.fc = nn.Linear(hidden_size*2, output_size)
        
        self.crf = CRF(output_size,batch_first=True)
        
    def forward(self, x):
        out = self.embedding(x)
        out,(h, c)= self.lstm(out)
        out = self.fc(out)
        return out

In [3]:
import os
import shutil
import pickle as pk
from torch.utils.tensorboard import SummaryWriter


# 构建模型
model = bilstm_crf(parameter).to(parameter['device'])

# 确定训练模式
model.train()

# 确定优化器和损失
optimizer = torch.optim.SGD(model.parameters(),lr=0.00005, momentum=0.95, nesterov=True)
# optimizer = torch.optim.Adam(model.parameters(),lr = parameter['lr'], \
#                              weight_decay = 0.01)

# 准备学习率策略
scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=10, gamma=0.9)

# 准备迭代器
train_yield = batch_yield(parameter)

# 开始训练
loss_cal = []
min_loss = float('inf')
while 1:
        inputs,targets,epoch,keys = next(train_yield)
        if keys:
            break
        out = model(inputs.long().to(parameter['device']))
        loss = -model.crf(out,targets.long().to(parameter['device']))
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        loss_cal.append(loss.item())
        if epoch is not None:
            if (epoch+1)%1 == 0:
                loss_cal = sum(loss_cal)/len(loss_cal)
                if loss_cal < min_loss:
                    min_loss = loss_cal
                    torch.save(model.state_dict(), 'bilstm_crf.h5')
                print('epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, \
                                                       parameter['epoch'],loss_cal))
            loss_cal = [loss.item()]
            scheduler.step()


  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])
100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 551.31it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 612.17it/s]

epoch [1/100], Loss: 3299.8201


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 547.14it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 592.59it/s]

epoch [2/100], Loss: 948.1050


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 546.51it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [3/100], Loss: 568.2584


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 542.07it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [4/100], Loss: 417.6999


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 552.22it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [5/100], Loss: 325.8806


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 547.66it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 602.10it/s]

epoch [6/100], Loss: 260.2512


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 551.43it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [7/100], Loss: 209.4002


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 551.32it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [8/100], Loss: 170.4296


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 548.25it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [9/100], Loss: 133.6373


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 548.52it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 614.30it/s]

epoch [10/100], Loss: 112.1475


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 548.78it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 591.94it/s]

epoch [11/100], Loss: 88.7352


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 543.23it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 611.20it/s]

epoch [12/100], Loss: 73.5775


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 561.40it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [13/100], Loss: 66.0690


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 552.20it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [14/100], Loss: 56.2731


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:20<00:00, 536.14it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 609.65it/s]

epoch [15/100], Loss: 46.7960


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 548.89it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [16/100], Loss: 40.5282


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 553.67it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [17/100], Loss: 34.9295


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 557.65it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [18/100], Loss: 29.2800


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 553.34it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 599.68it/s]

epoch [19/100], Loss: 26.0472


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 550.64it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [20/100], Loss: 25.7648


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 556.27it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [21/100], Loss: 27.7144


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 549.91it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [22/100], Loss: 25.1233


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 547.21it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:19, 549.92it/s]

epoch [23/100], Loss: 23.1359


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 539.03it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 605.15it/s]

epoch [24/100], Loss: 22.4049


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 542.13it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [25/100], Loss: 16.5954


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 546.98it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 609.95it/s]

epoch [26/100], Loss: 16.7088


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 556.80it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 595.31it/s]

epoch [27/100], Loss: 13.9117


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 546.28it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [28/100], Loss: 12.7498


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 568.52it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:18, 590.09it/s]

epoch [29/100], Loss: 11.7189


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 569.34it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [30/100], Loss: 9.9992


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 539.49it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [31/100], Loss: 10.1662


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 579.42it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 615.09it/s]

epoch [32/100], Loss: 9.0721


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 581.71it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:18, 584.78it/s]

epoch [33/100], Loss: 9.2351


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 588.92it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 600.36it/s]

epoch [34/100], Loss: 8.3976


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 587.87it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [35/100], Loss: 8.4705


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 589.59it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [36/100], Loss: 8.0025


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 588.41it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 607.57it/s]

epoch [37/100], Loss: 7.4351


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 583.75it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [38/100], Loss: 6.0042


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 575.13it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 623.18it/s]

epoch [39/100], Loss: 5.9626


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 574.79it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [40/100], Loss: 5.5341


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 569.04it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [41/100], Loss: 6.1855


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 568.45it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:18, 580.47it/s]

epoch [42/100], Loss: 5.5650


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 577.20it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 612.01it/s]

epoch [43/100], Loss: 5.4468


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 571.70it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [44/100], Loss: 5.3984


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 579.76it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 607.05it/s]

epoch [45/100], Loss: 5.0428


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 583.72it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 617.35it/s]

epoch [46/100], Loss: 4.6566


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 581.34it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 600.37it/s]

epoch [47/100], Loss: 4.6174


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 577.71it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [48/100], Loss: 6.0792


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 581.54it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [49/100], Loss: 4.5538


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 577.21it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [50/100], Loss: 4.1256


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 574.88it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:18, 566.44it/s]

epoch [51/100], Loss: 3.7529


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 567.68it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 611.38it/s]

epoch [52/100], Loss: 3.4405


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 573.51it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 611.39it/s]

epoch [53/100], Loss: 3.5691


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 568.25it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 611.39it/s]

epoch [54/100], Loss: 3.1819


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:19<00:00, 564.86it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [55/100], Loss: 3.1101


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 571.00it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:18, 582.60it/s]

epoch [56/100], Loss: 3.5015


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 570.91it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 596.83it/s]

epoch [57/100], Loss: 3.3905


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 589.23it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 622.78it/s]

epoch [58/100], Loss: 3.2736


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 583.58it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:18, 563.30it/s]

epoch [59/100], Loss: 2.8204


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 573.80it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 611.39it/s]

epoch [60/100], Loss: 2.8430


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 577.24it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:18, 586.36it/s]

epoch [61/100], Loss: 2.3904


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 578.30it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 607.69it/s]

epoch [62/100], Loss: 2.6036


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 586.17it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 618.94it/s]

epoch [63/100], Loss: 2.4394


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 582.42it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 600.41it/s]

epoch [64/100], Loss: 2.6005


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 586.08it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 604.88it/s]

epoch [65/100], Loss: 2.2897


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 574.97it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 618.92it/s]

epoch [66/100], Loss: 5.4824


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 573.06it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [67/100], Loss: 8.5818


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 574.76it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 604.02it/s]

epoch [68/100], Loss: 12.5998


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 579.97it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [69/100], Loss: 10.7377


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 581.04it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 600.40it/s]

epoch [70/100], Loss: 13.7819


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 576.71it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [71/100], Loss: 10.4820


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 581.11it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [72/100], Loss: 8.0285


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 577.48it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 607.69it/s]

epoch [73/100], Loss: 5.5359


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 582.49it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 618.94it/s]

epoch [74/100], Loss: 4.2350


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 582.72it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [75/100], Loss: 3.5255


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 581.58it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [76/100], Loss: 2.7079


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 583.72it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [77/100], Loss: 2.3140


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 579.01it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 593.30it/s]

epoch [78/100], Loss: 2.7708


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 584.59it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 593.30it/s]

epoch [79/100], Loss: 2.1382


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 569.19it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [80/100], Loss: 2.0191


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 571.38it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 611.29it/s]

epoch [81/100], Loss: 1.9372


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 581.28it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:18, 582.95it/s]

epoch [82/100], Loss: 1.7725


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 585.84it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [83/100], Loss: 1.6713


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 577.14it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 604.02it/s]

epoch [84/100], Loss: 1.5964


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 577.32it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 607.68it/s]

epoch [85/100], Loss: 1.4431


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 572.95it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 622.78it/s]

epoch [86/100], Loss: 1.6138


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 579.34it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 604.03it/s]

epoch [87/100], Loss: 1.5633


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 580.23it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:18, 586.36it/s]

epoch [88/100], Loss: 1.4798


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 580.20it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 600.40it/s]

epoch [89/100], Loss: 1.4202


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 579.03it/s]
  0%|                                                                                        | 0/10748 [00:00<?, ?it/s]

epoch [90/100], Loss: 1.3668


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 568.81it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 615.03it/s]

epoch [91/100], Loss: 1.3693


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 580.41it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 607.69it/s]

epoch [92/100], Loss: 1.4253


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 582.77it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 611.39it/s]

epoch [93/100], Loss: 1.2334


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 570.23it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 596.89it/s]

epoch [94/100], Loss: 1.1875


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 575.48it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 600.40it/s]

epoch [95/100], Loss: 1.0849


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 579.95it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:18, 579.58it/s]

epoch [96/100], Loss: 1.1509


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 577.68it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 611.39it/s]

epoch [97/100], Loss: 1.1443


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 567.95it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 615.14it/s]

epoch [98/100], Loss: 1.1057


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 574.92it/s]
  1%|▋                                                                            | 100/10748 [00:00<00:17, 600.87it/s]

epoch [99/100], Loss: 1.0020


100%|███████████████████████████████████████████████████████████████████████████| 10748/10748 [00:18<00:00, 573.44it/s]


epoch [100/100], Loss: 1.0190
