In [1]:
#2-使用bert-base-chinese，有数据增强
import random
import torch
from torch import nn
import os
import pickle

from sklearn.model_selection import train_test_split
from torch.utils.data import Dataset,DataLoader
from transformers import BertModel,BertTokenizer
from tqdm import tqdm
from seqeval.metrics import f1_score
import ahocorasick
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

cache_model = '2_bert_base_aug.pt'

def get_data(path,max_len=None):
    all_text,all_tag = [],[]
    with open(path,'r',encoding='utf8') as f:
        all_data = f.read().split('\n')

    sen,tag = [],[]
    for data in all_data:
        data = data.split(' ')
        if(len(data)!=2):
            if len(sen)>2:
                all_text.append(sen)
                all_tag.append(tag)
            sen, tag = [], []
            continue
        te,ta = data
        sen.append(te)
        tag.append(ta)
    if max_len is not None:
        return all_text[:max_len], all_tag[:max_len]
    return all_text,all_tag

class rule_find:
    def __init__(self):
        self.idx2type = idx2type = ["食物", "药品商", "治疗方法", "药品","检查项目","疾病","疾病症状","科目"]
        self.type2idx = type2idx = {"食物": 0, "药品商": 1, "治疗方法": 2, "药品": 3,"检查项目":4,"疾病":5,"疾病症状":6,"科目":7}
        self.ahos = [ahocorasick.Automaton() for i in range(len(self.type2idx))]

        for type in idx2type:
            with open(os.path.join('data','ent_aug',f'{type}.txt'),encoding='utf-8') as f:
                all_en = f.read().split('\n')
            for en in all_en:
                en = en.split(' ')[0]
                if len(en)>=2:
                    self.ahos[type2idx[type]].add_word(en,en)
        for i in range(len(self.ahos)):
            self.ahos[i].make_automaton()

    def find(self,sen):
        rule_result = []
        mp = {}
        all_res = []
        all_ty = []
        for i in range(len(self.ahos)):
            now = list(self.ahos[i].iter(sen))
            all_res.extend(now)
            for j in range(len(now)):
                all_ty.append(self.idx2type[i])
        if len(all_res) != 0:
            all_res = sorted(all_res, key=lambda x: len(x[1]), reverse=True)
            for i,res in enumerate(all_res):
                be = res[0] - len(res[1]) + 1
                ed = res[0]
                if be in mp or ed in mp:
                    continue
                rule_result.append((be, ed, all_ty[i], res[1]))
                for t in range(be, ed + 1):
                    mp[t] = 1
        return rule_result


#找出tag(label)中的所有实体及其下表，为实体动态替换/随机掩码策略/实体动态拼接做准备
def find_entities(tag):
    result = []#[(2,3,'药品'),(7,10,'药品商')]
    label_len = len(tag)
    i = 0
    while(i<label_len):
        if(tag[i][0]=='B'):
            type = tag[i].strip('B-')
            j=i+1
            while(j<label_len and tag[j][0]=='I'):
                j += 1
            result.append((i,j-1,type))
            i=j
        else:
            i = i + 1
    return result


class tfidf_alignment():
    def __init__(self):
        eneities_path = os.path.join('data', 'ent_aug')
        files = os.listdir(eneities_path)
        files = [docu for docu in files if '.py' not in docu]

        self.tag_2_embs = {}
        self.tag_2_tfidf_model = {}
        self.tag_2_entity = {}
        for ty in files:
            with open(os.path.join(eneities_path, ty), 'r', encoding='utf-8') as f:
                entities = f.read().split('\n')
                entities = [ent for ent in entities if len(ent.split(' ')[0]) <= 15 and len(ent.split(' ')[0]) >= 1]
                en_name = [ent.split(' ')[0] for ent in entities]
                ty = ty.strip('.txt')
                self.tag_2_entity[ty] = en_name
                tfidf_model = TfidfVectorizer(analyzer="char")
                embs = tfidf_model.fit_transform(en_name).toarray()
                self.tag_2_embs[ty] = embs
                self.tag_2_tfidf_model[ty] = tfidf_model
    def align(self,ent_list):
        new_result = {}
        for s,e,cls,ent in ent_list:
            ent_emb = self.tag_2_tfidf_model[cls].transform([ent])
            sim_score = cosine_similarity(ent_emb, self.tag_2_embs[cls])
            max_idx = sim_score[0].argmax()
            max_score = sim_score[0][max_idx]

            if max_score >= 0.5:
                new_result[cls]= self.tag_2_entity[cls][max_idx]
        return new_result


class Entity_Extend:
    def __init__(self):
        eneities_path = os.path.join('data','ent')
        files = os.listdir(eneities_path)
        files = [docu for docu in files if '.py' not in docu]

        self.type2entity = {}
        self.type2weight = {}
        for type in files:
            with open(os.path.join(eneities_path,type),'r',encoding='utf-8') as f:
                entities = f.read().split('\n')
                en_name = [ent for ent in entities if len(ent.split(' ')[0])<=15 and len(ent.split(' ')[0])>=1]
                en_weight = [1]*len(en_name)
                type = type.strip('.txt')
                self.type2entity[type] = en_name
                self.type2weight[type] = en_weight
    def no_work(self,te,tag,type):
        return te,tag

    # 1. 实体替换
    def entity_replace(self,te,ta,type):
        choice_ent = random.choices(self.type2entity[type],weights=self.type2weight[type],k=1)[0]
        ta = ["B-"+type] + ["I-"+type]*(len(choice_ent)-1)
        return list(choice_ent),ta

    # 2. 实体掩盖
    def entity_mask(self,te,ta,type):
        if(len(te)<=3):
            return te,ta
        elif(len(te)<=5):
            te.pop(random.randint(0,len(te)-1))
        else:
            te.pop(random.randint(0, len(te) - 1))
            te.pop(random.randint(0, len(te) - 1))
        ta = ["B-" + type] + ["I-" + type] * (len(te) - 1)
        return te,ta

    # 3. 实体拼接
    def entity_union(self,te,ta,type):
        words = ['和','与','以及']
        wor = random.choice(words)
        choice_ent = random.choices(self.type2entity[type],weights=self.type2weight[type],k=1)[0]
        te = te+list(wor)+list(choice_ent)
        ta = ta+['O']*len(wor)+["B-"+type] + ["I-"+type]*(len(choice_ent)-1)
        return te,ta
    def entities_extend(self,text,tag,ents):
        cho = [self.no_work,self.entity_union,self.entity_mask,self.entity_replace,self.no_work]
        new_text = text.copy()
        new_tag = tag.copy()
        sign = 0
        for ent in ents:
            p = random.choice(cho)
            te,ta = p(text[ent[0]:ent[1]+1],tag[ent[0]:ent[1]+1],ent[2])
            new_text[ent[0] + sign:ent[1] + 1 + sign], new_tag[ent[0] + sign:ent[1] + 1 + sign] = te,ta
            sign += len(te)-(ent[1]-ent[0]+1)

        return new_text, new_tag




class Nerdataset(Dataset):
    def __init__(self,all_text,all_label,tokenizer,max_len,tag2idx,is_dev=False,enhance_data=False):
        self.all_text = all_text
        self.all_label = all_label
        self.tokenizer = tokenizer
        self.max_len= max_len
        self.tag2idx = tag2idx
        self.is_dev = is_dev
        self.entity_extend = Entity_Extend()
        self.enhance_data = enhance_data
    def __getitem__(self, x):
        text, label = self.all_text[x], self.all_label[x]
        if self.is_dev:
            max_len = min(len(self.all_text[x])+2,500)
        else:
            # 几种策略
            if self.enhance_data and e>=7 and e%2==1:
                ents = find_entities(label)
                text,label = self.entity_extend.entities_extend(text,label,ents)
            max_len = self.max_len
        text, label =text[:max_len - 2], label[:max_len - 2]

        x_len = len(text)
        assert len(text)==len(label)
        text_idx = self.tokenizer.encode(text,add_special_token=True)
        label_idx = [self.tag2idx['<PAD>']] + [self.tag2idx[i] for i in label] + [self.tag2idx['<PAD>']]

        text_idx +=[0]*(max_len-len(text_idx))
        label_idx +=[self.tag2idx['<PAD>']]*(max_len-len(label_idx))
        return torch.tensor(text_idx),torch.tensor(label_idx),x_len
    def __len__(self):
        return len(self.all_text)




def build_tag2idx(all_tag):
    tag2idx = {'<PAD>':0}
    for sen in all_tag:
        for tag in sen:
            tag2idx[tag] = tag2idx.get(tag,len(tag2idx))
    return tag2idx




class Bert_Model(nn.Module):
    def __init__(self,model_name,hidden_size,tag_num,bi):
        super().__init__()
        self.bert = BertModel.from_pretrained(model_name)
        self.gru = nn.RNN(input_size=768,hidden_size=hidden_size,num_layers=2,batch_first=True,bidirectional=bi)
        if bi:
            self.classifier = nn.Linear(hidden_size*2,tag_num)
        else:
            self.classifier = nn.Linear(hidden_size, tag_num)
        self.loss_fn = nn.CrossEntropyLoss(ignore_index=0)
    def forward(self,x,label=None):
        bert_0,_ = self.bert(x,attention_mask=(x>0),return_dict=False)
        gru_0,_ = self.gru(bert_0)
        pre = self.classifier(gru_0)
        if label is not None:
            loss = self.loss_fn(pre.reshape(-1,pre.shape[-1]),label.reshape(-1))
            return loss
        else:
            return torch.argmax(pre,dim=-1).squeeze(0)

def merge(model_result_word,rule_result):
    result = model_result_word+rule_result
    result = sorted(result,key=lambda x:len(x[-1]),reverse=True)
    check_result = []
    mp = {}
    for res in result:
        if res[0] in mp or res[1] in mp:
            continue
        check_result.append(res)
        for i in range(res[0],res[1]+1):
            mp[i] = 1
    return check_result

def get_ner_result(model,tokenizer,sen,rule,tfidf_r,device,idx2tag):
    sen_to = tokenizer.encode(sen, add_special_tokens=True, return_tensors='pt').to(device)

    pre = model(sen_to).tolist()

    pre_tag = [idx2tag[i] for i in pre[1:-1]]
    model_result = find_entities(pre_tag)
    model_result_word = []
    for res in model_result:
        word = sen[res[0]:res[1] + 1]
        model_result_word.append((res[0], res[1], res[2], word))
    rule_result = rule.find(sen)

    merge_result = merge(model_result_word, rule_result)
    # print('模型结果',model_result_word)
    # print('规则结果',rule_result)
    tfidf_result = tfidf_r.align(merge_result)
    #print('整合结果', merge_result)
    #print('tfidf对齐结果', tfidf_result)
    return tfidf_result

if __name__ == "__main__":
    all_text,all_label = get_data(os.path.join('data','ner_data_aug.txt'))
    train_text, dev_text, train_label, dev_label = train_test_split(all_text, all_label, test_size = 0.02, random_state = 42)

    #加载太慢了，预处理一下
    if os.path.exists('tmp_data/tag2idx.npy'):
        with open('tmp_data/tag2idx.npy','rb') as f:
            tag2idx = pickle.load(f)
    else:
        tag2idx = build_tag2idx(all_label)
        with open('tmp_data/tag2idx.npy','wb') as f:
            pickle.dump(tag2idx,f)


    idx2tag = list(tag2idx)

    max_len = 50
    epoch = 50
    batch_size = 60
    hidden_size = 128
    bi = True
    model_name='model/bert-base-chinese'#chinese-roberta-wwm-ext
    tokenizer = BertTokenizer.from_pretrained(model_name)
    lr =1e-5
    is_train=True

    device = torch.device('cuda:3') if torch.cuda.is_available()   else torch.device('cpu')

    train_dataset = Nerdataset(train_text,train_label,tokenizer,max_len,tag2idx,enhance_data=True)
    train_dataloader = DataLoader(train_dataset,batch_size=batch_size,shuffle=True)

    dev_dataset = Nerdataset(dev_text, dev_label, tokenizer, max_len, tag2idx,is_dev=True)
    dev_dataloader = DataLoader(dev_dataset, batch_size=1, shuffle=False)

    model = Bert_Model(model_name,hidden_size,len(tag2idx),bi)
    # if os.path.exists(f'model/best_roberta_gru_model_ent_aug.pt'):
    #     model.load_state_dict(torch.load('model/best_roberta_gru_model_ent_aug.pt'))
    model = model.to(device)
    opt = torch.optim.Adam(model.parameters(),lr = lr)
    bestf1 = -1
    if is_train:
        for e in range(epoch):
            loss_sum = 0
            ba = 0
            for x,y,batch_len in tqdm(train_dataloader):
                x = x.to(device)
                y = y.to(device)
                opt.zero_grad()
                loss = model(x,y)
                loss.backward()

                opt.step()
                loss_sum+=loss
                ba += 1
            all_pre = []
            all_label = []
            for x,y,batch_len in tqdm(dev_dataloader):
                assert len(x)==len(y)
                x = x.to(device)
                pre = model(x)
                pre = [idx2tag[i] for i in pre[1:batch_len+1]]
                all_pre.append(pre)

                label = [idx2tag[i] for i in y[0][1:batch_len+1]]
                all_label.append(label)
            f1 = f1_score(all_pre, all_label)
            if f1>bestf1:
                bestf1 = f1
                print(f'e={e},loss={loss_sum / ba:.5f} f1={f1:.5f} ---------------------->best')
                torch.save(model.state_dict(),f'model/{cache_model}.pt')
            else:
                print(f'e={e},loss={loss_sum/ba:.5f} f1={f1:.5f}')

    rule = rule_find()
    tfidf_r = tfidf_alignment()

    # while(True):
    #     sen = input('请输入:')
    #     print(get_ner_result(model, tokenizer, sen, rule, tfidf_r,device,idx2tag))

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:54<00:00, 16.99it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.56it/s]


e=0,loss=0.18729 f1=0.88555 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:54<00:00, 17.02it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 87.58it/s]


e=1,loss=0.05321 f1=0.92168 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.05it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.39it/s]


e=2,loss=0.02728 f1=0.93479 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.09it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.03it/s]


e=3,loss=0.01607 f1=0.94611 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.07it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.55it/s]


e=4,loss=0.01097 f1=0.95024 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.04it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.19it/s]


e=5,loss=0.00827 f1=0.95255 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.10it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.52it/s]


e=6,loss=0.00655 f1=0.95154


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.09it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 88.60it/s]


e=7,loss=0.08413 f1=0.93218


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [05:51<00:00,  8.43it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.70it/s]


e=8,loss=0.00522 f1=0.95904 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.12it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.34it/s]


e=9,loss=0.05032 f1=0.94553


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.09it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 88.07it/s]


e=10,loss=0.00370 f1=0.96258 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.08it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 88.47it/s]


e=11,loss=0.03883 f1=0.94837


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.10it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 87.32it/s]


e=12,loss=0.00297 f1=0.96180


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.09it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.86it/s]


e=13,loss=0.03166 f1=0.95105


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.08it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 88.94it/s]


e=14,loss=0.00257 f1=0.96433 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.12it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 87.64it/s]


e=15,loss=0.02685 f1=0.95288


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [03:09<00:00, 15.69it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:43<00:00, 82.75it/s]


e=16,loss=0.00208 f1=0.96473 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.10it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.08it/s]


e=17,loss=0.02409 f1=0.95242


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.12it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.15it/s]


e=18,loss=0.00184 f1=0.96458


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.13it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 88.98it/s]


e=19,loss=0.02190 f1=0.94820


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.13it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.13it/s]


e=20,loss=0.00156 f1=0.96932 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.13it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.42it/s]


e=21,loss=0.02017 f1=0.95412


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.11it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.34it/s]


e=22,loss=0.00147 f1=0.97103 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.11it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.34it/s]


e=23,loss=0.01836 f1=0.95464


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:52<00:00, 17.15it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.35it/s]


e=24,loss=0.00147 f1=0.97012


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.09it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.82it/s]


e=25,loss=0.01727 f1=0.95643


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.14it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.65it/s]


e=26,loss=0.00127 f1=0.96936


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.12it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.30it/s]


e=27,loss=0.01638 f1=0.95757


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.11it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.98it/s]


e=28,loss=0.00112 f1=0.97063


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.12it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.14it/s]


e=29,loss=0.01564 f1=0.96217


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.13it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 88.88it/s]


e=30,loss=0.00108 f1=0.96972


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.13it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:39<00:00, 91.16it/s]


e=31,loss=0.01467 f1=0.95265


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:52<00:00, 17.15it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.38it/s]


e=32,loss=0.00093 f1=0.97178 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.11it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.11it/s]


e=33,loss=0.01380 f1=0.95766


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.11it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.01it/s]


e=34,loss=0.00086 f1=0.97425 ---------------------->best


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:52<00:00, 17.15it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.61it/s]


e=35,loss=0.01337 f1=0.96132


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:52<00:00, 17.15it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.51it/s]


e=36,loss=0.00082 f1=0.97160


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.13it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:39<00:00, 90.82it/s]


e=37,loss=0.01325 f1=0.95558


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:52<00:00, 17.14it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.09it/s]


e=38,loss=0.00096 f1=0.97073


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:52<00:00, 17.14it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.42it/s]


e=39,loss=0.01233 f1=0.96293


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.12it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 88.05it/s]


e=40,loss=0.00076 f1=0.97205


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.12it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.45it/s]


e=41,loss=0.01213 f1=0.96049


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.10it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 88.55it/s]


e=42,loss=0.00075 f1=0.97193


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.06it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 88.55it/s]


e=43,loss=0.01163 f1=0.95746


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.11it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.95it/s]


e=44,loss=0.00078 f1=0.96944


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.11it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 89.76it/s]


e=45,loss=0.01151 f1=0.95894


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.10it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:41<00:00, 88.51it/s]


e=46,loss=0.00067 f1=0.97142


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.12it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.54it/s]


e=47,loss=0.01091 f1=0.96432


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:52<00:00, 17.15it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:40<00:00, 90.63it/s]


e=48,loss=0.00065 f1=0.97250


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2965/2965 [02:53<00:00, 17.14it/s]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3631/3631 [00:39<00:00, 90.86it/s]


e=49,loss=0.01079 f1=0.95780
