In [1]:
#4-使用robert-base-chinese，无数据增强
import random
import torch
from torch import nn
import os
import pickle

from sklearn.model_selection import train_test_split
from torch.utils.data import Dataset,DataLoader
from transformers import BertModel,BertTokenizer
from tqdm import tqdm
from seqeval.metrics import f1_score
import ahocorasick
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

cache_model = '4_robert_base_no_aug.pt'

def get_data(path,max_len=None):
    all_text,all_tag = [],[]
    with open(path,'r',encoding='utf8') as f:
        all_data = f.read().split('\n')

    sen,tag = [],[]
    for data in all_data:
        data = data.split(' ')
        if(len(data)!=2):
            if len(sen)>2:
                all_text.append(sen)
                all_tag.append(tag)
            sen, tag = [], []
            continue
        te,ta = data
        sen.append(te)
        tag.append(ta)
    if max_len is not None:
        return all_text[:max_len], all_tag[:max_len]
    return all_text,all_tag

class rule_find:
    def __init__(self):
        self.idx2type = idx2type = ["食物", "药品商", "治疗方法", "药品","检查项目","疾病","疾病症状","科目"]
        self.type2idx = type2idx = {"食物": 0, "药品商": 1, "治疗方法": 2, "药品": 3,"检查项目":4,"疾病":5,"疾病症状":6,"科目":7}
        self.ahos = [ahocorasick.Automaton() for i in range(len(self.type2idx))]

        for type in idx2type:
            with open(os.path.join('data','ent_aug',f'{type}.txt'),encoding='utf-8') as f:
                all_en = f.read().split('\n')
            for en in all_en:
                en = en.split(' ')[0]
                if len(en)>=2:
                    self.ahos[type2idx[type]].add_word(en,en)
        for i in range(len(self.ahos)):
            self.ahos[i].make_automaton()

    def find(self,sen):
        rule_result = []
        mp = {}
        all_res = []
        all_ty = []
        for i in range(len(self.ahos)):
            now = list(self.ahos[i].iter(sen))
            all_res.extend(now)
            for j in range(len(now)):
                all_ty.append(self.idx2type[i])
        if len(all_res) != 0:
            all_res = sorted(all_res, key=lambda x: len(x[1]), reverse=True)
            for i,res in enumerate(all_res):
                be = res[0] - len(res[1]) + 1
                ed = res[0]
                if be in mp or ed in mp:
                    continue
                rule_result.append((be, ed, all_ty[i], res[1]))
                for t in range(be, ed + 1):
                    mp[t] = 1
        return rule_result


#找出tag(label)中的所有实体及其下表，为实体动态替换/随机掩码策略/实体动态拼接做准备
def find_entities(tag):
    result = []#[(2,3,'药品'),(7,10,'药品商')]
    label_len = len(tag)
    i = 0
    while(i<label_len):
        if(tag[i][0]=='B'):
            type = tag[i].strip('B-')
            j=i+1
            while(j<label_len and tag[j][0]=='I'):
                j += 1
            result.append((i,j-1,type))
            i=j
        else:
            i = i + 1
    return result


class tfidf_alignment():
    def __init__(self):
        eneities_path = os.path.join('data', 'ent_aug')
        files = os.listdir(eneities_path)
        files = [docu for docu in files if '.py' not in docu]

        self.tag_2_embs = {}
        self.tag_2_tfidf_model = {}
        self.tag_2_entity = {}
        for ty in files:
            with open(os.path.join(eneities_path, ty), 'r', encoding='utf-8') as f:
                entities = f.read().split('\n')
                entities = [ent for ent in entities if len(ent.split(' ')[0]) <= 15 and len(ent.split(' ')[0]) >= 1]
                en_name = [ent.split(' ')[0] for ent in entities]
                ty = ty.strip('.txt')
                self.tag_2_entity[ty] = en_name
                tfidf_model = TfidfVectorizer(analyzer="char")
                embs = tfidf_model.fit_transform(en_name).toarray()
                self.tag_2_embs[ty] = embs
                self.tag_2_tfidf_model[ty] = tfidf_model
    def align(self,ent_list):
        new_result = {}
        for s,e,cls,ent in ent_list:
            ent_emb = self.tag_2_tfidf_model[cls].transform([ent])
            sim_score = cosine_similarity(ent_emb, self.tag_2_embs[cls])
            max_idx = sim_score[0].argmax()
            max_score = sim_score[0][max_idx]

            if max_score >= 0.5:
                new_result[cls]= self.tag_2_entity[cls][max_idx]
        return new_result


class Entity_Extend:
    def __init__(self):
        eneities_path = os.path.join('data','ent')
        files = os.listdir(eneities_path)
        files = [docu for docu in files if '.py' not in docu]

        self.type2entity = {}
        self.type2weight = {}
        for type in files:
            with open(os.path.join(eneities_path,type),'r',encoding='utf-8') as f:
                entities = f.read().split('\n')
                en_name = [ent for ent in entities if len(ent.split(' ')[0])<=15 and len(ent.split(' ')[0])>=1]
                en_weight = [1]*len(en_name)
                type = type.strip('.txt')
                self.type2entity[type] = en_name
                self.type2weight[type] = en_weight
    def no_work(self,te,tag,type):
        return te,tag

    # 1. 实体替换
    def entity_replace(self,te,ta,type):
        choice_ent = random.choices(self.type2entity[type],weights=self.type2weight[type],k=1)[0]
        ta = ["B-"+type] + ["I-"+type]*(len(choice_ent)-1)
        return list(choice_ent),ta

    # 2. 实体掩盖
    def entity_mask(self,te,ta,type):
        if(len(te)<=3):
            return te,ta
        elif(len(te)<=5):
            te.pop(random.randint(0,len(te)-1))
        else:
            te.pop(random.randint(0, len(te) - 1))
            te.pop(random.randint(0, len(te) - 1))
        ta = ["B-" + type] + ["I-" + type] * (len(te) - 1)
        return te,ta

    # 3. 实体拼接
    def entity_union(self,te,ta,type):
        words = ['和','与','以及']
        wor = random.choice(words)
        choice_ent = random.choices(self.type2entity[type],weights=self.type2weight[type],k=1)[0]
        te = te+list(wor)+list(choice_ent)
        ta = ta+['O']*len(wor)+["B-"+type] + ["I-"+type]*(len(choice_ent)-1)
        return te,ta
    def entities_extend(self,text,tag,ents):
        cho = [self.no_work,self.entity_union,self.entity_mask,self.entity_replace,self.no_work]
        new_text = text.copy()
        new_tag = tag.copy()
        sign = 0
        for ent in ents:
            p = random.choice(cho)
            te,ta = p(text[ent[0]:ent[1]+1],tag[ent[0]:ent[1]+1],ent[2])
            new_text[ent[0] + sign:ent[1] + 1 + sign], new_tag[ent[0] + sign:ent[1] + 1 + sign] = te,ta
            sign += len(te)-(ent[1]-ent[0]+1)

        return new_text, new_tag




class Nerdataset(Dataset):
    def __init__(self,all_text,all_label,tokenizer,max_len,tag2idx,is_dev=False,enhance_data=False):
        self.all_text = all_text
        self.all_label = all_label
        self.tokenizer = tokenizer
        self.max_len= max_len
        self.tag2idx = tag2idx
        self.is_dev = is_dev
        self.entity_extend = Entity_Extend()
        self.enhance_data = enhance_data
    def __getitem__(self, x):
        text, label = self.all_text[x], self.all_label[x]
        if self.is_dev:
            max_len = min(len(self.all_text[x])+2,500)
        else:
            # 几种策略
            if self.enhance_data and e>=7 and e%2==1:
                ents = find_entities(label)
                text,label = self.entity_extend.entities_extend(text,label,ents)
            max_len = self.max_len
        text, label =text[:max_len - 2], label[:max_len - 2]

        x_len = len(text)
        assert len(text)==len(label)
        text_idx = self.tokenizer.encode(text,add_special_token=True)
        label_idx = [self.tag2idx['<PAD>']] + [self.tag2idx[i] for i in label] + [self.tag2idx['<PAD>']]

        text_idx +=[0]*(max_len-len(text_idx))
        label_idx +=[self.tag2idx['<PAD>']]*(max_len-len(label_idx))
        return torch.tensor(text_idx),torch.tensor(label_idx),x_len
    def __len__(self):
        return len(self.all_text)




def build_tag2idx(all_tag):
    tag2idx = {'<PAD>':0}
    for sen in all_tag:
        for tag in sen:
            tag2idx[tag] = tag2idx.get(tag,len(tag2idx))
    return tag2idx




class Bert_Model(nn.Module):
    def __init__(self,model_name,hidden_size,tag_num,bi):
        super().__init__()
        self.bert = BertModel.from_pretrained(model_name)
        self.gru = nn.RNN(input_size=768,hidden_size=hidden_size,num_layers=2,batch_first=True,bidirectional=bi)
        if bi:
            self.classifier = nn.Linear(hidden_size*2,tag_num)
        else:
            self.classifier = nn.Linear(hidden_size, tag_num)
        self.loss_fn = nn.CrossEntropyLoss(ignore_index=0)
    def forward(self,x,label=None):
        bert_0,_ = self.bert(x,attention_mask=(x>0),return_dict=False)
        gru_0,_ = self.gru(bert_0)
        pre = self.classifier(gru_0)
        if label is not None:
            loss = self.loss_fn(pre.reshape(-1,pre.shape[-1]),label.reshape(-1))
            return loss
        else:
            return torch.argmax(pre,dim=-1).squeeze(0)

def merge(model_result_word,rule_result):
    result = model_result_word+rule_result
    result = sorted(result,key=lambda x:len(x[-1]),reverse=True)
    check_result = []
    mp = {}
    for res in result:
        if res[0] in mp or res[1] in mp:
            continue
        check_result.append(res)
        for i in range(res[0],res[1]+1):
            mp[i] = 1
    return check_result

def get_ner_result(model,tokenizer,sen,rule,tfidf_r,device,idx2tag):
    sen_to = tokenizer.encode(sen, add_special_tokens=True, return_tensors='pt').to(device)

    pre = model(sen_to).tolist()

    pre_tag = [idx2tag[i] for i in pre[1:-1]]
    model_result = find_entities(pre_tag)
    model_result_word = []
    for res in model_result:
        word = sen[res[0]:res[1] + 1]
        model_result_word.append((res[0], res[1], res[2], word))
    rule_result = rule.find(sen)

    merge_result = merge(model_result_word, rule_result)
    # print('模型结果',model_result_word)
    # print('规则结果',rule_result)
    tfidf_result = tfidf_r.align(merge_result)
    #print('整合结果', merge_result)
    #print('tfidf对齐结果', tfidf_result)
    return tfidf_result

if __name__ == "__main__":
    all_text,all_label = get_data(os.path.join('data','ner_data_aug.txt'))
    train_text, dev_text, train_label, dev_label = train_test_split(all_text, all_label, test_size = 0.02, random_state = 42)

    #加载太慢了，预处理一下
    if os.path.exists('tmp_data/tag2idx.npy'):
        with open('tmp_data/tag2idx.npy','rb') as f:
            tag2idx = pickle.load(f)
    else:
        tag2idx = build_tag2idx(all_label)
        with open('tmp_data/tag2idx.npy','wb') as f:
            pickle.dump(tag2idx,f)


    idx2tag = list(tag2idx)

    max_len = 50
    epoch = 50
    batch_size = 60
    hidden_size = 128
    bi = True
    model_name='model/chinese-roberta-wwm-ext'#chinese-roberta-wwm-ext
    tokenizer = BertTokenizer.from_pretrained(model_name)
    lr =1e-5
    is_train=True

    device = torch.device('cuda:0') if torch.cuda.is_available()   else torch.device('cpu')

    train_dataset = Nerdataset(train_text,train_label,tokenizer,max_len,tag2idx,enhance_data=False)
    train_dataloader = DataLoader(train_dataset,batch_size=batch_size,shuffle=True)

    dev_dataset = Nerdataset(dev_text, dev_label, tokenizer, max_len, tag2idx,is_dev=True)
    dev_dataloader = DataLoader(dev_dataset, batch_size=1, shuffle=False)

    model = Bert_Model(model_name,hidden_size,len(tag2idx),bi)
    # if os.path.exists(f'model/best_roberta_gru_model_ent_aug.pt'):
    #     model.load_state_dict(torch.load('model/best_roberta_gru_model_ent_aug.pt'))
    model = model.to(device)
    opt = torch.optim.Adam(model.parameters(),lr = lr)
    bestf1 = -1
    if is_train:
        for e in range(epoch):
            loss_sum = 0
            ba = 0
            for x,y,batch_len in tqdm(train_dataloader):
                x = x.to(device)
                y = y.to(device)
                opt.zero_grad()
                loss = model(x,y)
                loss.backward()

                opt.step()
                loss_sum+=loss
                ba += 1
            all_pre = []
            all_label = []
            for x,y,batch_len in tqdm(dev_dataloader):
                assert len(x)==len(y)
                x = x.to(device)
                pre = model(x)
                pre = [idx2tag[i] for i in pre[1:batch_len+1]]
                all_pre.append(pre)

                label = [idx2tag[i] for i in y[0][1:batch_len+1]]
                all_label.append(label)
            f1 = f1_score(all_pre, all_label)
            if f1>bestf1:
                bestf1 = f1
                print(f'e={e},loss={loss_sum / ba:.5f} f1={f1:.5f} ---------------------->best')
                torch.save(model.state_dict(),f'model/{cache_model}.pt')
            else:
                print(f'e={e},loss={loss_sum/ba:.5f} f1={f1:.5f}')

    rule = rule_find()
    tfidf_r = tfidf_alignment()

    # while(True):
    #     sen = input('请输入:')
    #     print(get_ner_result(model, tokenizer, sen, rule, tfidf_r,device,idx2tag))

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:35<00:00, 13.76it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:39<00:00, 91.09it/s]


e=0,loss=0.19714 f1=0.87656 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:30<00:00, 14.10it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.08it/s]


e=1,loss=0.05835 f1=0.91779 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:22<00:00, 14.63it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.70it/s]


e=2,loss=0.03029 f1=0.92931 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:34<00:00, 13.84it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.05it/s]


e=3,loss=0.01754 f1=0.94065 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:31<00:00, 13.99it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 88.64it/s]


e=4,loss=0.01119 f1=0.94399 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:40<00:00, 13.42it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.28it/s]


e=5,loss=0.00820 f1=0.94792 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:37<00:00, 13.65it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 87.98it/s]


e=6,loss=0.00639 f1=0.95214 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:38<00:00, 13.56it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.53it/s]


e=7,loss=0.00506 f1=0.95117


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:27<00:00, 14.27it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.00it/s]


e=8,loss=0.00409 f1=0.95038


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:31<00:00, 14.02it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.87it/s]


e=9,loss=0.00373 f1=0.95297 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:26<00:00, 14.39it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.21it/s]


e=10,loss=0.00334 f1=0.95448 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:22<00:00, 14.66it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.74it/s]


e=11,loss=0.00278 f1=0.94935


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:26<00:00, 14.36it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.64it/s]


e=12,loss=0.00274 f1=0.95630 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:33<00:00, 13.89it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 88.84it/s]


e=13,loss=0.00236 f1=0.95958 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:36<00:00, 13.69it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.76it/s]


e=14,loss=0.00207 f1=0.95646


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:37<00:00, 13.66it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.98it/s]


e=15,loss=0.00216 f1=0.96031 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:32<00:00, 13.96it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 88.98it/s]


e=16,loss=0.00196 f1=0.95655


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:21<00:00, 14.72it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:39<00:00, 90.86it/s]


e=17,loss=0.00180 f1=0.96066 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:16<00:00, 15.07it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.84it/s]


e=18,loss=0.00169 f1=0.95892


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:26<00:00, 14.33it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.06it/s]


e=19,loss=0.00159 f1=0.96197 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:25<00:00, 14.41it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.96it/s]


e=20,loss=0.00160 f1=0.96013


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:20<00:00, 14.77it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.17it/s]


e=21,loss=0.00137 f1=0.96112


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:22<00:00, 14.66it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.42it/s]


e=22,loss=0.00158 f1=0.96158


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:28<00:00, 14.21it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.68it/s]


e=23,loss=0.00136 f1=0.96050


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:24<00:00, 14.52it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:39<00:00, 90.79it/s]


e=24,loss=0.00144 f1=0.96108


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:19<00:00, 14.86it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 88.75it/s]


e=25,loss=0.00129 f1=0.96101


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:29<00:00, 14.17it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.13it/s]


e=26,loss=0.00137 f1=0.96206 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:20<00:00, 14.76it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.89it/s]


e=27,loss=0.00106 f1=0.96632 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:19<00:00, 14.88it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.23it/s]


e=28,loss=0.00127 f1=0.96511


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:24<00:00, 14.50it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.56it/s]


e=29,loss=0.00114 f1=0.96558


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:26<00:00, 14.37it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:39<00:00, 90.85it/s]


e=30,loss=0.00109 f1=0.96186


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:18<00:00, 14.94it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.39it/s]


e=31,loss=0.00110 f1=0.96578


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:35<00:00, 13.79it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 87.78it/s]


e=32,loss=0.00101 f1=0.96599


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:24<00:00, 14.51it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:39<00:00, 91.20it/s]


e=33,loss=0.00100 f1=0.96419


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:20<00:00, 14.76it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.30it/s]


e=34,loss=0.00106 f1=0.96768 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:20<00:00, 14.76it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.45it/s]


e=35,loss=0.00102 f1=0.96747


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:37<00:00, 13.63it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.77it/s]


e=36,loss=0.00095 f1=0.96401


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:19<00:00, 14.85it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.43it/s]


e=37,loss=0.00095 f1=0.96636


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:26<00:00, 14.39it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.19it/s]


e=38,loss=0.00089 f1=0.96760


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 87.40it/s]


e=39,loss=0.00086 f1=0.96726


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [04:07<00:00, 12.00it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 87.14it/s]


e=40,loss=0.00094 f1=0.96625


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:40<00:00, 13.43it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.80it/s]


e=41,loss=0.00085 f1=0.96768 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:20<00:00, 14.82it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 88.05it/s]


e=42,loss=0.00091 f1=0.96535


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:20<00:00, 14.75it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.01it/s]


e=43,loss=0.00088 f1=0.96501


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:32<00:00, 13.94it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.62it/s]


e=44,loss=0.00082 f1=0.96695


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:29<00:00, 14.13it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.26it/s]


e=45,loss=0.00073 f1=0.96728


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:22<00:00, 14.61it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.32it/s]


e=46,loss=0.00089 f1=0.96491


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:29<00:00, 14.17it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:39<00:00, 91.27it/s]


e=47,loss=0.00071 f1=0.96708


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:15<00:00, 15.14it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:39<00:00, 91.07it/s]


e=48,loss=0.00090 f1=0.96404


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.12it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.01it/s]


e=49,loss=0.00072 f1=0.96522
