In [1]:
import json
import torch.nn as nn
import torch
from transformers import BertTokenizer, BertModel, GPT2LMHeadModel, GPT2Tokenizer, GPT2Model
import torch.utils.data as Data
from tqdm import tqdm
import torch.nn as nn

def ranked_sents_to_pairs(pth, tokenizer, special='[SEP]', MAX_LENGTH=256, diffusion=0.24, p1=0.3, p2=0.1, p3=0.2):
    data=[]
    with open(pth, encoding='utf-8') as f:
        samples=[json.loads(sample) for sample in f.readlines()]
    embeds_a=[]
    embeds_b=[]
    embeds_c=[]
    embeds_d=[]
    for sample in samples[:-20]:
        d=[sample['content']+' '+special+' '+sent for sent in sample['results']]
        window_size=len(d)//2
        for i in range(len(d)-window_size):
            if random.random()<diffusion:
                sent=call_function_with_probability(d[i], p1=p1, p2=p2, p3=p3)
            else:
                sent=d[i]
            embeds_a.append(tokenizer.encode(sent, return_tensors='pt', padding='max_length', \
                                    truncation=True, add_special_tokens=True, max_length=MAX_LENGTH))
            if random.random()<diffusion:
                sent=call_function_with_probability(d[i+window_size], p1=p1, p2=p2, p3=p3)
            else:
                sent=d[i+window_size]
            embeds_b.append(tokenizer.encode(d[i+window_size], return_tensors='pt', padding='max_length', \
                                    truncation=True, add_special_tokens=True, max_length=MAX_LENGTH))
    for sample in samples[-100:]:
        d=[sample['content']+' '+special+' '+sent for sent in sample['results']]
        window_size=len(d)//2
        for i in range(len(d)-window_size):
            if random.random()<diffusion:
                sent=call_function_with_probability(d[i], p1=p1, p2=p2, p3=p3)
            else:
                sent=d[i]
            embeds_c.append(tokenizer.encode(d[i], return_tensors='pt', padding='max_length', \
                                    truncation=True, add_special_tokens=True, max_length=MAX_LENGTH))
            if random.random()<diffusion:
                sent=call_function_with_probability(d[i+window_size], p1=p1, p2=p2, p3=p3)
            else:
                sent=d[i+window_size]
            embeds_d.append(tokenizer.encode(d[i+window_size], return_tensors='pt', padding='max_length', \
                                    truncation=True, add_special_tokens=True, max_length=MAX_LENGTH))        
    return torch.cat(embeds_a, 0), torch.cat(embeds_b ,0), torch.cat(embeds_c, 0), torch.cat(embeds_d ,0)

def reward_mdel_loss(a, b):
    return sum(-torch.log(torch.sigmoid(a-b)))/a.size(-1)

class MLP(nn.Module):
    def __init__(self, vocab_size, p=0.1, relu=0.05):
        super(MLP, self).__init__()
        self.bert=GPT2Model.from_pretrained('gpt2')
        self.bert.resize_token_embeddings(vocab_size)
        self.fc1 = nn.Linear(768, 256)
        self.fc2 = nn.Linear(256, 128)
        self.fc3 = nn.Linear(128, 1)
        self.dropout = nn.Dropout(p=p)
        self.leaky_relu = nn.LeakyReLU(relu)
    def forward(self, x):
        x=self.bert(x)[0][:,-1:]
        x = self.fc1(x)
        x = self.leaky_relu(x)
        x = self.dropout(x)
        x = self.fc2(x)
        x = self.leaky_relu(x)
        x = self.dropout(x)
        x = self.fc3(x)
        return x
    
def model_eval(test_data_iter, model, device):
    model.eval()
    total=0
    acc=0
    for a, b in test_data_iter:
        opt_a=model(a.to(device))
        opt_b=model(b.to(device))
        opt=opt_a.view(-1)-opt_b.view(-1)
        for i in opt.view(-1):
            if float(i)>0:
                acc+=1
            total+=1
    print('Acc: ', round(acc/total*100, 3), '%')
    return

def train_reward_model(data_iter, test_data_iter, mlp, lr=0.0001, epoch_num=50, loss_print_step=10, eval_step=200, clip=50):
    device=torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    mlp.train()
    '''
    pre_lm=pre_lm.to(device)
    pre_lm.train()
    '''
    #pre_lm.eval()
    optimizer = torch.optim.Adam(mlp.parameters(), lr=lr)
    iter_count=0
    print_losses=[]
    for epoch in range(epoch_num):
        print('--------- Epoch: ', epoch, ' ---------')
        for data_a, data_b in tqdm(data_iter):
            data_a=data_a.to(device)
            data_b=data_b.to(device)
            optimizer.zero_grad()
            iter_count+=1
            #data_a=pre_lm(data_a)[1]
            #data_b=pre_lm(data_b)[1]
            data_a=mlp(data_a)
            data_b=mlp(data_b)
            loss=reward_mdel_loss(data_a.view(-1), data_b.view(-1))
            print_losses.append(loss.item())
            loss.backward()
            _ = nn.utils.clip_grad_norm_(mlp.parameters(), clip)
            optimizer.step()
            if iter_count%loss_print_step==0:
                print('Training Loss:',round(float(sum(print_losses) / loss_print_step), 3))
                print_losses=[]
            
            if iter_count%eval_step==0:
                model_eval(test_data_iter, mlp, device=device)
                mlp.train()
            
        torch.save(mlp.state_dict(), './results/mlp'+str(iter_count)+'.pth')

In [2]:
# 可被py文件取代
from nltk.tokenize import sent_tokenize, word_tokenize
import random
from transformers import BertTokenizer
tokenizer=BertTokenizer.from_pretrained('bert-base-uncased')

def remove_negations(sentence):
    # 定义否定词列表
    negations = ['not', 'no', 'never', 'none', 'neither', 'nor', 'nobody', 'nothing', 'nowhere']
    # 分词
    words = word_tokenize(sentence)
    # 遍历单词列表
    new_words = []
    i = 0
    while i < len(words):
        # 如果当前单词为否定词
        if words[i].lower() in negations:
            # 删除当前单词和下一个单词（如果有）
            del words[i:i+2]
        else:
            # 将当前单词添加到新列表中
            new_words.append(words[i])
            i += 1
    # 重新组合单词，生成新的句子
    new_sentence = ' '.join(new_words)
    return new_sentence

def add_negations(sentence):
    # 定义可用于添加否定的单词列表
    negatable_words = ['like', 'enjoy', 'love', 'appreciate', 'want', 'need', 'desire', 'crave', 'hope']
    # 分词
    words = word_tokenize(sentence)
    # 遍历单词列表
    new_words = []
    i = 0
    while i < len(words):
        # 如果当前单词可以被否定
        if words[i].lower() in negatable_words:
            # 如果下一个单词不是否定词，则添加否定词"not"
            if i < len(words) - 1 and words[i+1].lower() not in ['not', 'no', 'never']:
                new_words.extend(['not', words[i]])
                i += 1
            # 否则，不添加否定词
            else:
                new_words.append(words[i])
        else:
            new_words.append(words[i])
        i += 1
    # 重新组合单词，生成新的句子
    new_sentence = ' '.join(new_words)
    return new_sentence

def modify_sentence(sentence, new_word):
    words = sentence.split()
    index = random.randint(0, len(words)-1) # 随机选择一个单词的下标
    operation = random.randint(0, 2) # 随机选择一种操作

    if operation == 0: # 删除随机单词
        del words[index]
    elif operation == 1: # 在随机位置插入新单词
        words.insert(index, new_word)
    else: # 将一个随机单词替换成新单词
        words[index] = new_word
    new_sentence = ' '.join(words)
    return new_sentence

def shuffle_sentences(article):
    sentences = article.split('.')
    sentences = [s.strip() for s in sentences if s.strip()] # 去除空句子
    random.shuffle(sentences)
    shuffled_article = '. '.join(sentences) + '.'
    return shuffled_article

def sentence_shuffle(sentence):
    words = sentence.split()
    if random.random() < 0.5:
        # swap two random words
        i, j = random.sample(range(len(words)), 2)
        words[i], words[j] = words[j], words[i]
    else:
        # move one random word to another random position
        i, j = random.sample(range(len(words)), 2)
        words.insert(j, words.pop(i))
    return ' '.join(words)

def negation_operations(sentence, p1=0.5):
    p = random.random()
    if p < p1:
        return remove_negations(sentence)
    else:
        return add_negations(sentence)   
    
def call_function_with_probability(sentence, p1=0.3, p2=0.1, p3=0.2):   
    #这个是加噪，p1, p2, p3 分别是编辑操作，添加否定词，打乱句子顺序和打乱单词顺序
    p = random.random()
    if p < p1:
        new_word=tokenizer.decode([random.randint(999, tokenizer.vocab_size)])
        return modify_sentence(sentence, new_word=new_word)
    elif p < p1 + p2:
        return negation_operations(sentence)
    elif p < p1 + p2 + p3:
        return shuffle_sentences(sentence)    
    else:
        return sentence_shuffle(sentence)

In [4]:
MAX_LENGTH=256
BATCH_SIZE=16
device=torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print('Data loading...')
tokenizer=GPT2Tokenizer.from_pretrained('gpt2')
tokenizer.add_special_tokens({'pad_token': '[PAD]'})
tokenizer.add_special_tokens({'sep_token': '__eou__'})
tokenizer.add_special_tokens({'sep_token': '[SEP]'})
#dataset/CornellMovie-Dialog/generated_text_results.json
data_a, data_b, data_c, data_d=ranked_sents_to_pairs('C:/Users/DELL/reward_model_ys/dataset/CornellMovie-Dialog/generated_text_results.json',tokenizer, diffusion=0.24, MAX_LENGTH=MAX_LENGTH)
dataset=Data.TensorDataset(data_a, data_b)
data_iter=torch.utils.data.DataLoader(dataset, batch_size=BATCH_SIZE, shuffle=True)
test_dataset=Data.TensorDataset(data_c, data_d)
test_data_iter=torch.utils.data.DataLoader(test_dataset, batch_size=1, shuffle=False)

Data loading...


In [5]:
mlp=MLP(len(tokenizer)).to(device)

In [None]:
print('Training...')
train_reward_model(data_iter, test_data_iter, mlp, lr=0.00003, epoch_num=50, loss_print_step=10, eval_step=50)

Training...
--------- Epoch:  0  ---------


  3%|██                                                                               | 10/388 [00:09<04:47,  1.31it/s]

Training Loss: 0.772


  5%|████▏                                                                            | 20/388 [00:17<04:30,  1.36it/s]

Training Loss: 0.802


  8%|██████▎                                                                          | 30/388 [00:24<04:23,  1.36it/s]

Training Loss: 0.776


 10%|████████▎                                                                        | 40/388 [00:31<04:19,  1.34it/s]

Training Loss: 0.74


 13%|██████████▏                                                                      | 49/388 [00:38<04:12,  1.34it/s]

Training Loss: 0.729


 13%|██████████▍                                                                      | 50/388 [00:58<36:50,  6.54s/it]

Acc:  58.659 %


 15%|████████████▌                                                                    | 60/388 [01:06<05:02,  1.08it/s]

Training Loss: 0.668


 18%|██████████████▌                                                                  | 70/388 [01:13<04:04,  1.30it/s]

Training Loss: 0.603


 21%|████████████████▋                                                                | 80/388 [01:21<03:57,  1.30it/s]

Training Loss: 0.635


 23%|██████████████████▊                                                              | 90/388 [01:29<03:48,  1.30it/s]

Training Loss: 0.562


 26%|████████████████████▋                                                            | 99/388 [01:36<03:42,  1.30it/s]

Training Loss: 0.534


 26%|████████████████████▌                                                           | 100/388 [01:55<31:14,  6.51s/it]

Acc:  79.33 %


 28%|██████████████████████▋                                                         | 110/388 [02:03<04:18,  1.07it/s]

Training Loss: 0.495


 31%|████████████████████████▋                                                       | 120/388 [02:11<03:27,  1.29it/s]

Training Loss: 0.492


 34%|██████████████████████████▊                                                     | 130/388 [02:19<03:18,  1.30it/s]

Training Loss: 0.422


 36%|████████████████████████████▊                                                   | 140/388 [02:26<03:11,  1.30it/s]

Training Loss: 0.454


 38%|██████████████████████████████▋                                                 | 149/388 [02:33<03:04,  1.30it/s]

Training Loss: 0.383


 39%|██████████████████████████████▉                                                 | 150/388 [02:55<27:56,  7.04s/it]

Acc:  81.378 %


 41%|████████████████████████████████▉                                               | 160/388 [03:03<03:35,  1.06it/s]

Training Loss: 0.467


 44%|███████████████████████████████████                                             | 170/388 [03:10<02:49,  1.29it/s]

Training Loss: 0.393


 46%|█████████████████████████████████████                                           | 180/388 [03:18<02:41,  1.29it/s]

Training Loss: 0.351


 49%|███████████████████████████████████████▏                                        | 190/388 [03:26<02:32,  1.30it/s]

Training Loss: 0.41


 51%|█████████████████████████████████████████                                       | 199/388 [03:33<02:26,  1.29it/s]

Training Loss: 0.335


 52%|█████████████████████████████████████████▏                                      | 200/388 [03:53<20:12,  6.45s/it]

Acc:  83.985 %


 54%|███████████████████████████████████████████▎                                    | 210/388 [04:00<02:47,  1.06it/s]

Training Loss: 0.339


 57%|█████████████████████████████████████████████▎                                  | 220/388 [04:08<02:11,  1.28it/s]

Training Loss: 0.346


 59%|███████████████████████████████████████████████▍                                | 230/388 [04:16<02:03,  1.28it/s]

Training Loss: 0.345


 62%|█████████████████████████████████████████████████▍                              | 240/388 [04:24<01:55,  1.28it/s]

Training Loss: 0.326


 64%|███████████████████████████████████████████████████▎                            | 249/388 [04:31<01:51,  1.25it/s]

Training Loss: 0.308


 64%|███████████████████████████████████████████████████▌                            | 250/388 [04:53<16:33,  7.20s/it]

Acc:  85.475 %


 67%|█████████████████████████████████████████████████████▌                          | 260/388 [05:01<02:02,  1.04it/s]

Training Loss: 0.351


 70%|███████████████████████████████████████████████████████▋                        | 270/388 [05:09<01:32,  1.28it/s]

Training Loss: 0.31


 72%|█████████████████████████████████████████████████████████▋                      | 280/388 [05:16<01:24,  1.28it/s]

Training Loss: 0.343


 75%|███████████████████████████████████████████████████████████▊                    | 290/388 [05:24<01:16,  1.29it/s]

Training Loss: 0.473


 77%|█████████████████████████████████████████████████████████████▋                  | 299/388 [05:31<01:09,  1.28it/s]

Training Loss: 0.329


 77%|█████████████████████████████████████████████████████████████▊                  | 300/388 [05:51<09:36,  6.56s/it]

Acc:  88.454 %


 80%|███████████████████████████████████████████████████████████████▉                | 310/388 [05:59<01:13,  1.06it/s]

Training Loss: 0.334


 82%|█████████████████████████████████████████████████████████████████▉              | 320/388 [06:07<00:53,  1.27it/s]

Training Loss: 0.349


 85%|████████████████████████████████████████████████████████████████████            | 330/388 [06:15<00:45,  1.28it/s]

Training Loss: 0.358


 88%|██████████████████████████████████████████████████████████████████████          | 340/388 [06:22<00:37,  1.28it/s]

Training Loss: 0.265


 90%|███████████████████████████████████████████████████████████████████████▉        | 349/388 [06:29<00:30,  1.28it/s]

Training Loss: 0.325


 90%|████████████████████████████████████████████████████████████████████████▏       | 350/388 [06:50<04:10,  6.59s/it]

Acc:  86.22 %


 93%|██████████████████████████████████████████████████████████████████████████▏     | 360/388 [06:57<00:26,  1.06it/s]

Training Loss: 0.348


 95%|████████████████████████████████████████████████████████████████████████████▎   | 370/388 [07:05<00:14,  1.27it/s]

Training Loss: 0.273


 98%|██████████████████████████████████████████████████████████████████████████████▎ | 380/388 [07:13<00:06,  1.29it/s]

Training Loss: 0.278


100%|████████████████████████████████████████████████████████████████████████████████| 388/388 [07:19<00:00,  1.13s/it]


--------- Epoch:  1  ---------


  1%|▍                                                                                 | 2/388 [00:01<04:57,  1.30it/s]

Training Loss: 0.295


  3%|██▎                                                                              | 11/388 [00:08<04:54,  1.28it/s]

Training Loss: 0.23


  3%|██▌                                                                              | 12/388 [00:29<43:32,  6.95s/it]

Acc:  89.758 %


  6%|████▌                                                                            | 22/388 [00:37<05:49,  1.05it/s]

Training Loss: 0.27


  8%|██████▋                                                                          | 32/388 [00:45<04:40,  1.27it/s]

Training Loss: 0.15


 11%|████████▊                                                                        | 42/388 [00:53<04:30,  1.28it/s]

Training Loss: 0.207


 13%|██████████▊                                                                      | 52/388 [01:00<04:22,  1.28it/s]

Training Loss: 0.278


 16%|████████████▋                                                                    | 61/388 [01:07<04:16,  1.28it/s]

Training Loss: 0.228


 16%|████████████▉                                                                    | 62/388 [01:28<36:24,  6.70s/it]

Acc:  89.758 %


 19%|███████████████                                                                  | 72/388 [01:36<04:59,  1.05it/s]

Training Loss: 0.277


 21%|█████████████████                                                                | 82/388 [01:44<04:00,  1.27it/s]

Training Loss: 0.283


 24%|███████████████████▏                                                             | 92/388 [01:51<03:51,  1.28it/s]

Training Loss: 0.32


 26%|█████████████████████                                                           | 102/388 [01:59<03:42,  1.29it/s]

Training Loss: 0.289


 29%|██████████████████████▉                                                         | 111/388 [02:06<03:36,  1.28it/s]

Training Loss: 0.306


 29%|███████████████████████                                                         | 112/388 [02:26<30:30,  6.63s/it]

Acc:  89.013 %


 31%|█████████████████████████▏                                                      | 122/388 [02:34<04:11,  1.06it/s]

Training Loss: 0.188


 34%|███████████████████████████▏                                                    | 132/388 [02:42<03:19,  1.28it/s]

Training Loss: 0.194


 37%|█████████████████████████████▎                                                  | 142/388 [02:50<03:11,  1.29it/s]

Training Loss: 0.386


 39%|███████████████████████████████▎                                                | 152/388 [02:58<03:03,  1.29it/s]

Training Loss: 0.284


 41%|█████████████████████████████████▏                                              | 161/388 [03:05<02:56,  1.28it/s]

Training Loss: 0.23


 42%|█████████████████████████████████▍                                              | 162/388 [03:25<24:43,  6.57s/it]

Acc:  90.503 %


 44%|███████████████████████████████████▍                                            | 172/388 [03:32<03:23,  1.06it/s]

Training Loss: 0.175


 47%|█████████████████████████████████████▌                                          | 182/388 [03:40<02:41,  1.27it/s]

Training Loss: 0.153


 49%|███████████████████████████████████████▌                                        | 192/388 [03:48<02:38,  1.23it/s]

Training Loss: 0.243


 52%|█████████████████████████████████████████▋                                      | 202/388 [03:56<02:30,  1.24it/s]

Training Loss: 0.201


 54%|███████████████████████████████████████████▌                                    | 211/388 [04:03<02:20,  1.26it/s]

Training Loss: 0.272


 55%|███████████████████████████████████████████▋                                    | 212/388 [04:26<21:12,  7.23s/it]

Acc:  91.061 %


 57%|█████████████████████████████████████████████▊                                  | 222/388 [04:34<02:43,  1.02it/s]

Training Loss: 0.278


 60%|███████████████████████████████████████████████▊                                | 232/388 [04:41<02:02,  1.27it/s]

Training Loss: 0.26


 62%|█████████████████████████████████████████████████▉                              | 242/388 [04:49<01:53,  1.28it/s]

Training Loss: 0.228


 65%|███████████████████████████████████████████████████▉                            | 252/388 [04:57<01:45,  1.29it/s]

Training Loss: 0.185


 67%|█████████████████████████████████████████████████████▊                          | 261/388 [05:04<01:39,  1.28it/s]

Training Loss: 0.232


 68%|██████████████████████████████████████████████████████                          | 262/388 [05:25<14:07,  6.72s/it]

Acc:  91.434 %


 70%|████████████████████████████████████████████████████████                        | 272/388 [05:32<01:49,  1.06it/s]

Training Loss: 0.171


 73%|██████████████████████████████████████████████████████████▏                     | 282/388 [05:40<01:23,  1.27it/s]

Training Loss: 0.35


 75%|████████████████████████████████████████████████████████████▏                   | 292/388 [05:48<01:14,  1.29it/s]

Training Loss: 0.219


 78%|██████████████████████████████████████████████████████████████▎                 | 302/388 [05:56<01:07,  1.28it/s]

Training Loss: 0.183


 80%|████████████████████████████████████████████████████████████████                | 311/388 [06:03<01:00,  1.28it/s]

Training Loss: 0.213


 80%|████████████████████████████████████████████████████████████████▎               | 312/388 [06:23<08:15,  6.52s/it]

Acc:  92.551 %


 83%|██████████████████████████████████████████████████████████████████▍             | 322/388 [06:30<01:02,  1.06it/s]

Training Loss: 0.232


 86%|████████████████████████████████████████████████████████████████████▍           | 332/388 [06:38<00:44,  1.27it/s]

Training Loss: 0.235


 88%|██████████████████████████████████████████████████████████████████████▌         | 342/388 [06:46<00:35,  1.28it/s]

Training Loss: 0.167


 91%|████████████████████████████████████████████████████████████████████████▌       | 352/388 [06:54<00:28,  1.28it/s]

Training Loss: 0.318


 93%|██████████████████████████████████████████████████████████████████████████▍     | 361/388 [07:01<00:20,  1.29it/s]

Training Loss: 0.141


 93%|██████████████████████████████████████████████████████████████████████████▋     | 362/388 [07:22<02:54,  6.72s/it]

Acc:  91.806 %


 96%|████████████████████████████████████████████████████████████████████████████▋   | 372/388 [07:29<00:15,  1.06it/s]

Training Loss: 0.191


 98%|██████████████████████████████████████████████████████████████████████████████▊ | 382/388 [07:37<00:04,  1.27it/s]

Training Loss: 0.31


100%|████████████████████████████████████████████████████████████████████████████████| 388/388 [07:42<00:00,  1.19s/it]


--------- Epoch:  2  ---------


  1%|▊                                                                                 | 4/388 [00:03<05:05,  1.26it/s]

Training Loss: 0.165


  4%|██▉                                                                              | 14/388 [00:11<04:54,  1.27it/s]

Training Loss: 0.249


  6%|████▊                                                                            | 23/388 [00:18<04:48,  1.26it/s]

Training Loss: 0.264


  6%|█████                                                                            | 24/388 [00:38<40:42,  6.71s/it]

Acc:  92.737 %


  9%|███████                                                                          | 34/388 [00:46<05:34,  1.06it/s]

Training Loss: 0.189


 11%|█████████▏                                                                       | 44/388 [00:54<04:29,  1.28it/s]

Training Loss: 0.144


 14%|███████████▎                                                                     | 54/388 [01:02<04:19,  1.29it/s]

Training Loss: 0.163


 16%|█████████████▎                                                                   | 64/388 [01:09<04:12,  1.28it/s]

Training Loss: 0.217


 19%|███████████████▏                                                                 | 73/388 [01:16<04:04,  1.29it/s]

Training Loss: 0.208


 19%|███████████████▍                                                                 | 74/388 [01:36<33:26,  6.39s/it]

Acc:  91.993 %


 22%|█████████████████▌                                                               | 84/388 [01:44<04:44,  1.07it/s]

Training Loss: 0.21


 24%|███████████████████▌                                                             | 94/388 [01:51<03:50,  1.28it/s]

Training Loss: 0.144


 27%|█████████████████████▍                                                          | 104/388 [01:59<03:40,  1.29it/s]

Training Loss: 0.171


 29%|███████████████████████▌                                                        | 114/388 [02:07<03:33,  1.28it/s]

Training Loss: 0.19


 32%|█████████████████████████▎                                                      | 123/388 [02:14<03:27,  1.28it/s]

Training Loss: 0.195


 32%|█████████████████████████▌                                                      | 124/388 [02:36<30:56,  7.03s/it]

Acc:  93.11 %


 35%|███████████████████████████▋                                                    | 134/388 [02:43<04:02,  1.05it/s]

Training Loss: 0.157


 37%|█████████████████████████████▋                                                  | 144/388 [02:51<03:11,  1.28it/s]

Training Loss: 0.149


 40%|███████████████████████████████▊                                                | 154/388 [02:59<03:02,  1.28it/s]

Training Loss: 0.144


 42%|█████████████████████████████████▊                                              | 164/388 [03:07<02:54,  1.28it/s]

Training Loss: 0.169


 45%|███████████████████████████████████▋                                            | 173/388 [03:14<02:47,  1.29it/s]

Training Loss: 0.166


 45%|███████████████████████████████████▉                                            | 174/388 [03:35<24:34,  6.89s/it]

Acc:  92.737 %


 47%|█████████████████████████████████████▉                                          | 184/388 [03:43<03:18,  1.03it/s]

Training Loss: 0.168


 50%|████████████████████████████████████████                                        | 194/388 [03:51<02:31,  1.28it/s]

Training Loss: 0.147


 53%|██████████████████████████████████████████                                      | 204/388 [03:58<02:22,  1.29it/s]

Training Loss: 0.173


 55%|████████████████████████████████████████████                                    | 214/388 [04:06<02:15,  1.28it/s]

Training Loss: 0.153


 57%|█████████████████████████████████████████████▉                                  | 223/388 [04:13<02:08,  1.28it/s]

Training Loss: 0.127


 58%|██████████████████████████████████████████████▏                                 | 224/388 [04:34<18:15,  6.68s/it]

Acc:  93.855 %


 60%|████████████████████████████████████████████████▏                               | 234/388 [04:42<02:25,  1.06it/s]

Training Loss: 0.128


 63%|██████████████████████████████████████████████████▎                             | 244/388 [04:49<01:52,  1.28it/s]

Training Loss: 0.224


 65%|████████████████████████████████████████████████████▎                           | 254/388 [04:57<01:43,  1.29it/s]

Training Loss: 0.154


 68%|██████████████████████████████████████████████████████▍                         | 264/388 [05:05<01:36,  1.28it/s]

Training Loss: 0.124


 70%|████████████████████████████████████████████████████████▎                       | 273/388 [05:12<01:29,  1.29it/s]

Training Loss: 0.188


 71%|████████████████████████████████████████████████████████▍                       | 274/388 [05:35<14:18,  7.53s/it]

Acc:  93.855 %


 73%|██████████████████████████████████████████████████████████▌                     | 284/388 [05:43<01:40,  1.04it/s]

Training Loss: 0.152


 76%|████████████████████████████████████████████████████████████▌                   | 294/388 [05:51<01:13,  1.28it/s]

Training Loss: 0.171


 78%|██████████████████████████████████████████████████████████████▋                 | 304/388 [05:58<01:05,  1.29it/s]

Training Loss: 0.182


 81%|████████████████████████████████████████████████████████████████▋               | 314/388 [06:06<00:57,  1.29it/s]

Training Loss: 0.14


 83%|██████████████████████████████████████████████████████████████████▌             | 323/388 [06:13<00:50,  1.28it/s]

Training Loss: 0.198


 84%|██████████████████████████████████████████████████████████████████▊             | 324/388 [06:33<07:01,  6.59s/it]

Acc:  95.345 %


 86%|████████████████████████████████████████████████████████████████████▊           | 334/388 [06:41<00:50,  1.06it/s]

Training Loss: 0.231


 89%|██████████████████████████████████████████████████████████████████████▉         | 344/388 [06:49<00:34,  1.27it/s]

Training Loss: 0.162


 91%|████████████████████████████████████████████████████████████████████████▉       | 354/388 [06:57<00:27,  1.24it/s]

Training Loss: 0.206


 94%|███████████████████████████████████████████████████████████████████████████     | 364/388 [07:05<00:18,  1.27it/s]

Training Loss: 0.153


 96%|████████████████████████████████████████████████████████████████████████████▉   | 373/388 [07:12<00:11,  1.27it/s]

Training Loss: 0.133


 96%|█████████████████████████████████████████████████████████████████████████████   | 374/388 [07:32<01:33,  6.68s/it]

Acc:  95.717 %


 99%|███████████████████████████████████████████████████████████████████████████████▏| 384/388 [07:40<00:03,  1.06it/s]

Training Loss: 0.201


100%|████████████████████████████████████████████████████████████████████████████████| 388/388 [07:43<00:00,  1.19s/it]


--------- Epoch:  3  ---------


  2%|█▎                                                                                | 6/388 [00:04<04:56,  1.29it/s]

Training Loss: 0.18


  4%|███▎                                                                             | 16/388 [00:12<04:50,  1.28it/s]

Training Loss: 0.103


  7%|█████▍                                                                           | 26/388 [00:20<04:40,  1.29it/s]

Training Loss: 0.105


  9%|███████▎                                                                         | 35/388 [00:27<04:34,  1.29it/s]