In [1]:
%load_ext nb_black

<IPython.core.display.Javascript object>

In [2]:
%env HF_DATASETS_CACHE="/data/users/sgarg6/hf_cache"

env: HF_DATASETS_CACHE="/data/users/sgarg6/hf_cache"


<IPython.core.display.Javascript object>

In [3]:
import torch
from transformers import AutoTokenizer, GPT2ForSequenceClassification

tokenizer = AutoTokenizer.from_pretrained("microsoft/DialogRPT-updown")
model = GPT2ForSequenceClassification.from_pretrained("microsoft/DialogRPT-updown")



<IPython.core.display.Javascript object>

In [4]:
inputs = tokenizer("Hello, my dog is cute", return_tensors="pt")

with torch.no_grad():
    logits = model(**inputs).logits

predicted_class_id = logits.argmax().item()

print(logits)

tensor([[-1.2981]])


<IPython.core.display.Javascript object>

In [5]:
from torch.utils.data import Dataset
from datasets import load_dataset


class AnthropicDataset(Dataset):
    def __init__(self, split="test"):
        assert split in ("train", "test")
        major_split = split if "train" == split else "test"
        dataset = load_dataset("Anthropic/hh-rlhf")[major_split]
        self.data = []
        for data in dataset:
            self.data.append((data["chosen"], 1))
            self.data.append((data["rejected"], 0))

    def __len__(self):
        return len(self.data)

    def __getitem__(self, index):
        sample, label = self.data[index]

        return sample, label

<IPython.core.display.Javascript object>

In [6]:
train_data = AnthropicDataset("train")
test_data = AnthropicDataset("test")

Using custom data configuration Anthropic--hh-rlhf-c8cd8dc58ab67414
Found cached dataset json (/soe/sgarg6/course_work/244_nlp/LLMbias/"/data/users/sgarg6/hf_cache"/Anthropic___json/Anthropic--hh-rlhf-c8cd8dc58ab67414/0.0.0/0f7e3662623656454fcd2b650f34e886a7db4b9104504885bd462096cc7a9f51)


  0%|          | 0/2 [00:00<?, ?it/s]

Using custom data configuration Anthropic--hh-rlhf-c8cd8dc58ab67414
Found cached dataset json (/soe/sgarg6/course_work/244_nlp/LLMbias/"/data/users/sgarg6/hf_cache"/Anthropic___json/Anthropic--hh-rlhf-c8cd8dc58ab67414/0.0.0/0f7e3662623656454fcd2b650f34e886a7db4b9104504885bd462096cc7a9f51)


  0%|          | 0/2 [00:00<?, ?it/s]

<IPython.core.display.Javascript object>

In [7]:
device = "cuda" if torch.cuda.is_available() else "cpu"

<IPython.core.display.Javascript object>

In [8]:
def collate_data(data):
    text_samples = [sample[0] for sample in data]
    labels = torch.tensor([sample[1] for sample in data], dtype=torch.float).to(device)
    tokens = tokenizer(
        text_samples,
        return_tensors="pt",
        truncation=True,
        padding=True,
        max_length=512,
    ).to(device)
    return tokens, labels

<IPython.core.display.Javascript object>

In [9]:
from torch.utils.data import DataLoader

# train_dataloader = DataLoader(train_data, collate_fn=collate_data, batch_size=2)

<IPython.core.display.Javascript object>

In [10]:
best_val_loss = 99999
BATCH_SIZE = 16
EPOCHS = 1
learning_rate = 0.0001

<IPython.core.display.Javascript object>

In [11]:
import wandb

wandb.init(
    entity="sugam110795",
    project="nlp244",
    group="LLMbias",
    config={
        "epochs": EPOCHS,
        "batch_size": BATCH_SIZE,
        "lr": learning_rate,
    },
)

[34m[1mwandb[0m: Currently logged in as: [33msugam110795[0m. Use [1m`wandb login --relogin`[0m to force relogin


<IPython.core.display.Javascript object>

In [12]:
def free_memory():
    import gc

    torch.cuda.empty_cache()
    gc.collect()

<IPython.core.display.Javascript object>

In [13]:
from tqdm import tqdm
import time
from sklearn.metrics import accuracy_score
from sklearn.metrics import f1_score


def evaluate(model, data_loader, criterion):
    model.eval()
    total_loss = 0.0
    start_time = time.time()
    out = []
    label = []
    for batch, (X, y) in enumerate(tqdm(data_loader)):
        model.zero_grad()
        output = model(**X).logits
        loss = criterion(output.reshape(-1), y)
        total_loss += loss.item()
        pred = torch.sigmoid(output) > 0.5
        out.extend(pred.long().detach().tolist())
        label.extend(y.long().detach().tolist())
        del X, y, output, loss
        free_memory()
    acc = accuracy_score(label, out)
    f1 = f1_score(label, out)
    return total_loss / batch, acc, f1

<IPython.core.display.Javascript object>

In [14]:
from tqdm import tqdm
import time


def train_step(
    data_loader, model, epoch, criterion, optimizer, eval_step, eval_data_loader
):
    model.train()
    total_loss = 0.0
    start_time = time.time()
    for batch, (X, y) in tqdm(enumerate(data_loader)):
        model.zero_grad()
        output = model(**X).logits
        loss = criterion(output.reshape(-1), y)
        loss.backward()
        torch.nn.utils.clip_grad_norm_(model.parameters(), 0.5)
        optimizer.step()
        total_loss += loss.item()
        metrics = {"train/train_loss": loss.item(), "train/step": (batch + 1)}
        wandb.log(metrics)
        if batch % eval_step == 0 and batch > 0:
            cur_loss = loss.item()
            elapsed = time.time() - start_time
            print("| epoch {:3d} |" " loss {:5.2f}".format(epoch, cur_loss))
            val_loss, acc, f1 = evaluate(model, eval_data_loader, criterion)
            metrics = {
                "train/train_loss": total_loss / (batch),
                "train/step": batch,
                "eval/eval_loss": val_loss,
                "eval/acc": acc,
                "eval/f1": f1,
            }
            wandb.log(metrics)
        del loss, X, y, output
        free_memory()
    return total_loss / batch

<IPython.core.display.Javascript object>

In [16]:
config = wandb.config

<IPython.core.display.Javascript object>

In [None]:
from torch.optim import Adam
import torch.nn as nn


model = model.to(device)
optimizer = Adam(model.parameters(), lr=config.lr)
criterion = nn.BCEWithLogitsLoss()

for epoch in range(config.epochs):
    epoch_start_time = time.time()
    train_dataloader = DataLoader(
        train_data, batch_size=config.batch_size, shuffle=True, collate_fn=collate_data
    )
    valid_dataloader = DataLoader(
        test_data, batch_size=config.batch_size, shuffle=True, collate_fn=collate_data
    )
    train_loss = train_step(
        train_dataloader, model, epoch, criterion, optimizer, 50, valid_dataloader
    )

    # End of training
    val_loss, acc, f1 = evaluate(model, valid_dataloader, criterion)
    print("-" * 89)
    print(
        "| end of epoch {:3d} | time: {:5.2f}s | valid loss {:5.2f} | "
        " acc {:5.2f}".format(epoch, (time.time() - epoch_start_time), val_loss, acc)
    )
    print(f"F1-score is {f1}")
    print("-" * 89)
    # Save the model if the validation loss is the best we've seen so far.
    if val_loss < best_val_loss:
        with open("/data/users/sgarg6/trained_models/gpt-reward/model.pt", "wb") as f:
            torch.save(model, f)
        best_val_loss = val_loss

50it [01:12,  1.41s/it]

| epoch   0 | loss  0.68



  0%|                                                                                                                                | 0/1069 [00:00<?, ?it/s][A
  0%|                                                                                                                        | 1/1069 [00:00<10:11,  1.75it/s][A
  0%|▏                                                                                                                       | 2/1069 [00:01<10:35,  1.68it/s][A
  0%|▎                                                                                                                       | 3/1069 [00:01<10:31,  1.69it/s][A
  0%|▍                                                                                                                       | 4/1069 [00:02<09:42,  1.83it/s][A
  0%|▌                                                                                                                       | 5/1069 [00:02<09:53,  1.79it/s][A
  1%|▋                     

  5%|█████▌                                                                                                                 | 50/1069 [00:37<12:43,  1.33it/s][A
  5%|█████▋                                                                                                                 | 51/1069 [00:38<13:22,  1.27it/s][A
  5%|█████▊                                                                                                                 | 52/1069 [00:38<12:11,  1.39it/s][A
  5%|█████▉                                                                                                                 | 53/1069 [00:39<11:58,  1.41it/s][A
  5%|██████                                                                                                                 | 54/1069 [00:39<11:50,  1.43it/s][A
  5%|██████                                                                                                                 | 55/1069 [00:40<11:55,  1.42it/s][A
  5%|██████▏                

  9%|███████████                                                                                                           | 100/1069 [01:15<11:58,  1.35it/s][A
  9%|███████████▏                                                                                                          | 101/1069 [01:15<11:03,  1.46it/s][A
 10%|███████████▎                                                                                                          | 102/1069 [01:16<11:01,  1.46it/s][A
 10%|███████████▎                                                                                                          | 103/1069 [01:17<10:45,  1.50it/s][A
 10%|███████████▍                                                                                                          | 104/1069 [01:18<11:34,  1.39it/s][A
 10%|███████████▌                                                                                                          | 105/1069 [01:18<11:18,  1.42it/s][A
 10%|███████████▋           

 14%|████████████████▌                                                                                                     | 150/1069 [01:53<11:33,  1.32it/s][A
 14%|████████████████▋                                                                                                     | 151/1069 [01:54<12:22,  1.24it/s][A
 14%|████████████████▊                                                                                                     | 152/1069 [01:54<12:12,  1.25it/s][A
 14%|████████████████▉                                                                                                     | 153/1069 [01:55<11:59,  1.27it/s][A
 14%|████████████████▉                                                                                                     | 154/1069 [01:56<11:54,  1.28it/s][A
 14%|█████████████████                                                                                                     | 155/1069 [01:57<11:30,  1.32it/s][A
 15%|█████████████████▏     

 19%|██████████████████████                                                                                                | 200/1069 [02:32<11:49,  1.23it/s][A
 19%|██████████████████████▏                                                                                               | 201/1069 [02:33<11:44,  1.23it/s][A
 19%|██████████████████████▎                                                                                               | 202/1069 [02:34<11:25,  1.26it/s][A
 19%|██████████████████████▍                                                                                               | 203/1069 [02:35<11:18,  1.28it/s][A
 19%|██████████████████████▌                                                                                               | 204/1069 [02:35<11:56,  1.21it/s][A
 19%|██████████████████████▋                                                                                               | 205/1069 [02:36<11:53,  1.21it/s][A
 19%|██████████████████████▋

 23%|███████████████████████████▌                                                                                          | 250/1069 [03:11<10:48,  1.26it/s][A
 23%|███████████████████████████▋                                                                                          | 251/1069 [03:12<10:36,  1.29it/s][A
 24%|███████████████████████████▊                                                                                          | 252/1069 [03:13<11:21,  1.20it/s][A
 24%|███████████████████████████▉                                                                                          | 253/1069 [03:13<09:53,  1.37it/s][A
 24%|████████████████████████████                                                                                          | 254/1069 [03:14<10:27,  1.30it/s][A
 24%|████████████████████████████▏                                                                                         | 255/1069 [03:15<12:44,  1.06it/s][A
 24%|███████████████████████

 28%|█████████████████████████████████                                                                                     | 300/1069 [03:49<09:58,  1.29it/s][A
 28%|█████████████████████████████████▏                                                                                    | 301/1069 [03:50<09:28,  1.35it/s][A
 28%|█████████████████████████████████▎                                                                                    | 302/1069 [03:51<09:58,  1.28it/s][A
 28%|█████████████████████████████████▍                                                                                    | 303/1069 [03:52<12:49,  1.00s/it][A
 28%|█████████████████████████████████▌                                                                                    | 304/1069 [03:53<11:12,  1.14it/s][A
 29%|█████████████████████████████████▋                                                                                    | 305/1069 [03:53<10:01,  1.27it/s][A
 29%|███████████████████████

 33%|██████████████████████████████████████▋                                                                               | 350/1069 [04:28<09:06,  1.32it/s][A
 33%|██████████████████████████████████████▋                                                                               | 351/1069 [04:29<08:28,  1.41it/s][A
 33%|██████████████████████████████████████▊                                                                               | 352/1069 [04:29<08:11,  1.46it/s][A
 33%|██████████████████████████████████████▉                                                                               | 353/1069 [04:30<08:35,  1.39it/s][A
 33%|███████████████████████████████████████                                                                               | 354/1069 [04:31<08:43,  1.37it/s][A
 33%|███████████████████████████████████████▏                                                                              | 355/1069 [04:32<09:25,  1.26it/s][A
 33%|███████████████████████

 37%|████████████████████████████████████████████▏                                                                         | 400/1069 [05:08<09:00,  1.24it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 401/1069 [05:08<07:50,  1.42it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 402/1069 [05:09<08:07,  1.37it/s][A
 38%|████████████████████████████████████████████▍                                                                         | 403/1069 [05:10<08:56,  1.24it/s][A
 38%|████████████████████████████████████████████▌                                                                         | 404/1069 [05:10<08:08,  1.36it/s][A
 38%|████████████████████████████████████████████▋                                                                         | 405/1069 [05:11<08:23,  1.32it/s][A
 38%|███████████████████████

 42%|█████████████████████████████████████████████████▋                                                                    | 450/1069 [05:46<07:52,  1.31it/s][A
 42%|█████████████████████████████████████████████████▊                                                                    | 451/1069 [05:46<07:59,  1.29it/s][A
 42%|█████████████████████████████████████████████████▉                                                                    | 452/1069 [05:47<07:32,  1.36it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 453/1069 [05:48<07:49,  1.31it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 454/1069 [05:49<08:50,  1.16it/s][A
 43%|██████████████████████████████████████████████████▏                                                                   | 455/1069 [05:50<08:37,  1.19it/s][A
 43%|███████████████████████

 47%|███████████████████████████████████████████████████████▏                                                              | 500/1069 [06:25<07:38,  1.24it/s][A
 47%|███████████████████████████████████████████████████████▎                                                              | 501/1069 [06:26<07:25,  1.28it/s][A
 47%|███████████████████████████████████████████████████████▍                                                              | 502/1069 [06:27<07:27,  1.27it/s][A
 47%|███████████████████████████████████████████████████████▌                                                              | 503/1069 [06:27<07:21,  1.28it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 504/1069 [06:28<07:23,  1.27it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 505/1069 [06:29<07:47,  1.21it/s][A
 47%|███████████████████████

 51%|████████████████████████████████████████████████████████████▋                                                         | 550/1069 [07:04<06:50,  1.26it/s][A
 52%|████████████████████████████████████████████████████████████▊                                                         | 551/1069 [07:05<06:51,  1.26it/s][A
 52%|████████████████████████████████████████████████████████████▉                                                         | 552/1069 [07:05<06:36,  1.30it/s][A
 52%|█████████████████████████████████████████████████████████████                                                         | 553/1069 [07:06<06:49,  1.26it/s][A
 52%|█████████████████████████████████████████████████████████████▏                                                        | 554/1069 [07:07<07:06,  1.21it/s][A
 52%|█████████████████████████████████████████████████████████████▎                                                        | 555/1069 [07:08<06:43,  1.27it/s][A
 52%|███████████████████████

 56%|██████████████████████████████████████████████████████████████████▏                                                   | 600/1069 [07:42<05:22,  1.45it/s][A
 56%|██████████████████████████████████████████████████████████████████▎                                                   | 601/1069 [07:42<05:33,  1.40it/s][A
 56%|██████████████████████████████████████████████████████████████████▍                                                   | 602/1069 [07:43<05:26,  1.43it/s][A
 56%|██████████████████████████████████████████████████████████████████▌                                                   | 603/1069 [07:44<05:17,  1.47it/s][A
 57%|██████████████████████████████████████████████████████████████████▋                                                   | 604/1069 [07:44<05:43,  1.35it/s][A
 57%|██████████████████████████████████████████████████████████████████▊                                                   | 605/1069 [07:45<05:30,  1.41it/s][A
 57%|███████████████████████

 61%|███████████████████████████████████████████████████████████████████████▋                                              | 650/1069 [08:20<06:01,  1.16it/s][A
 61%|███████████████████████████████████████████████████████████████████████▊                                              | 651/1069 [08:21<05:26,  1.28it/s][A
 61%|███████████████████████████████████████████████████████████████████████▉                                              | 652/1069 [08:21<05:01,  1.38it/s][A
 61%|████████████████████████████████████████████████████████████████████████                                              | 653/1069 [08:22<04:49,  1.44it/s][A
 61%|████████████████████████████████████████████████████████████████████████▏                                             | 654/1069 [08:22<04:19,  1.60it/s][A
 61%|████████████████████████████████████████████████████████████████████████▎                                             | 655/1069 [08:23<04:55,  1.40it/s][A
 61%|███████████████████████

 65%|█████████████████████████████████████████████████████████████████████████████▎                                        | 700/1069 [08:58<05:07,  1.20it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 701/1069 [08:59<05:05,  1.21it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 702/1069 [09:00<05:03,  1.21it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▌                                        | 703/1069 [09:01<05:01,  1.22it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▋                                        | 704/1069 [09:02<05:05,  1.19it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▊                                        | 705/1069 [09:02<05:01,  1.21it/s][A
 66%|███████████████████████

 70%|██████████████████████████████████████████████████████████████████████████████████▊                                   | 750/1069 [09:36<04:05,  1.30it/s][A
 70%|██████████████████████████████████████████████████████████████████████████████████▉                                   | 751/1069 [09:36<04:03,  1.31it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 752/1069 [09:37<03:59,  1.32it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 753/1069 [09:38<03:56,  1.34it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▏                                  | 754/1069 [09:38<03:32,  1.49it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▎                                  | 755/1069 [09:39<04:05,  1.28it/s][A
 71%|███████████████████████

 75%|████████████████████████████████████████████████████████████████████████████████████████▎                             | 800/1069 [10:15<03:32,  1.26it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▍                             | 801/1069 [10:15<03:14,  1.38it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▌                             | 802/1069 [10:16<03:10,  1.40it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 803/1069 [10:17<03:21,  1.32it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 804/1069 [10:17<03:22,  1.31it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▊                             | 805/1069 [10:18<03:25,  1.28it/s][A
 75%|███████████████████████

 80%|█████████████████████████████████████████████████████████████████████████████████████████████▊                        | 850/1069 [10:53<02:42,  1.35it/s][A
 80%|█████████████████████████████████████████████████████████████████████████████████████████████▉                        | 851/1069 [10:53<02:41,  1.35it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████                        | 852/1069 [10:54<02:35,  1.40it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▏                       | 853/1069 [10:55<02:41,  1.34it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▎                       | 854/1069 [10:56<02:44,  1.31it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▍                       | 855/1069 [10:57<02:43,  1.31it/s][A
 80%|███████████████████████

 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 900/1069 [11:31<02:14,  1.26it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▍                  | 901/1069 [11:32<02:22,  1.18it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                  | 902/1069 [11:33<02:23,  1.17it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                  | 903/1069 [11:33<02:17,  1.21it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▊                  | 904/1069 [11:34<02:09,  1.27it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▉                  | 905/1069 [11:35<02:08,  1.27it/s][A
 85%|███████████████████████

 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 950/1069 [12:09<01:26,  1.38it/s][A
 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▉             | 951/1069 [12:10<01:17,  1.52it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████             | 952/1069 [12:11<01:28,  1.32it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 953/1069 [12:12<01:29,  1.29it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 954/1069 [12:12<01:25,  1.35it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▍            | 955/1069 [12:13<01:28,  1.29it/s][A
 89%|███████████████████████

 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍       | 1000/1069 [12:48<00:55,  1.24it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▌       | 1001/1069 [12:49<00:53,  1.26it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▋       | 1002/1069 [12:49<00:53,  1.26it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▊       | 1003/1069 [12:50<00:52,  1.26it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1004/1069 [12:51<00:51,  1.26it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1005/1069 [12:52<00:51,  1.24it/s][A
 94%|███████████████████████

 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉  | 1050/1069 [13:26<00:14,  1.31it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████  | 1051/1069 [13:27<00:14,  1.28it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1052/1069 [13:28<00:13,  1.28it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1053/1069 [13:29<00:12,  1.26it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎ | 1054/1069 [13:30<00:12,  1.17it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍ | 1055/1069 [13:30<00:11,  1.20it/s][A
 99%|███████████████████████

| epoch   0 | loss  0.68



  0%|                                                                                                                                | 0/1069 [00:00<?, ?it/s][A
  0%|                                                                                                                        | 1/1069 [00:00<12:51,  1.38it/s][A
  0%|▏                                                                                                                       | 2/1069 [00:01<12:21,  1.44it/s][A
  0%|▎                                                                                                                       | 3/1069 [00:02<11:38,  1.53it/s][A
  0%|▍                                                                                                                       | 4/1069 [00:02<11:24,  1.56it/s][A
  0%|▌                                                                                                                       | 5/1069 [00:03<11:15,  1.58it/s][A
  1%|▋                     

  5%|█████▌                                                                                                                 | 50/1069 [00:37<13:34,  1.25it/s][A
  5%|█████▋                                                                                                                 | 51/1069 [00:38<12:14,  1.39it/s][A
  5%|█████▊                                                                                                                 | 52/1069 [00:38<13:04,  1.30it/s][A
  5%|█████▉                                                                                                                 | 53/1069 [00:39<13:42,  1.23it/s][A
  5%|██████                                                                                                                 | 54/1069 [00:40<13:47,  1.23it/s][A
  5%|██████                                                                                                                 | 55/1069 [00:41<13:33,  1.25it/s][A
  5%|██████▏                

  9%|███████████                                                                                                           | 100/1069 [01:15<11:56,  1.35it/s][A
  9%|███████████▏                                                                                                          | 101/1069 [01:16<12:27,  1.29it/s][A
 10%|███████████▎                                                                                                          | 102/1069 [01:17<11:38,  1.39it/s][A
 10%|███████████▎                                                                                                          | 103/1069 [01:18<12:27,  1.29it/s][A
 10%|███████████▍                                                                                                          | 104/1069 [01:19<13:06,  1.23it/s][A
 10%|███████████▌                                                                                                          | 105/1069 [01:19<12:31,  1.28it/s][A
 10%|███████████▋           

 14%|████████████████▌                                                                                                     | 150/1069 [01:54<11:53,  1.29it/s][A
 14%|████████████████▋                                                                                                     | 151/1069 [01:55<12:21,  1.24it/s][A
 14%|████████████████▊                                                                                                     | 152/1069 [01:55<11:53,  1.29it/s][A
 14%|████████████████▉                                                                                                     | 153/1069 [01:56<11:59,  1.27it/s][A
 14%|████████████████▉                                                                                                     | 154/1069 [01:57<12:30,  1.22it/s][A
 14%|█████████████████                                                                                                     | 155/1069 [01:58<12:01,  1.27it/s][A
 15%|█████████████████▏     

 19%|██████████████████████                                                                                                | 200/1069 [02:34<12:17,  1.18it/s][A
 19%|██████████████████████▏                                                                                               | 201/1069 [02:34<11:40,  1.24it/s][A
 19%|██████████████████████▎                                                                                               | 202/1069 [02:35<11:14,  1.29it/s][A
 19%|██████████████████████▍                                                                                               | 203/1069 [02:36<10:46,  1.34it/s][A
 19%|██████████████████████▌                                                                                               | 204/1069 [02:36<09:55,  1.45it/s][A
 19%|██████████████████████▋                                                                                               | 205/1069 [02:37<09:39,  1.49it/s][A
 19%|██████████████████████▋

 23%|███████████████████████████▌                                                                                          | 250/1069 [03:12<10:30,  1.30it/s][A
 23%|███████████████████████████▋                                                                                          | 251/1069 [03:13<10:47,  1.26it/s][A
 24%|███████████████████████████▊                                                                                          | 252/1069 [03:13<10:43,  1.27it/s][A
 24%|███████████████████████████▉                                                                                          | 253/1069 [03:14<11:29,  1.18it/s][A
 24%|████████████████████████████                                                                                          | 254/1069 [03:15<10:23,  1.31it/s][A
 24%|████████████████████████████▏                                                                                         | 255/1069 [03:16<10:18,  1.32it/s][A
 24%|███████████████████████

 28%|█████████████████████████████████                                                                                     | 300/1069 [03:50<08:50,  1.45it/s][A
 28%|█████████████████████████████████▏                                                                                    | 301/1069 [03:51<09:39,  1.33it/s][A
 28%|█████████████████████████████████▎                                                                                    | 302/1069 [03:51<09:26,  1.35it/s][A
 28%|█████████████████████████████████▍                                                                                    | 303/1069 [03:52<09:44,  1.31it/s][A
 28%|█████████████████████████████████▌                                                                                    | 304/1069 [03:53<10:10,  1.25it/s][A
 29%|█████████████████████████████████▋                                                                                    | 305/1069 [03:54<10:05,  1.26it/s][A
 29%|███████████████████████

 33%|██████████████████████████████████████▋                                                                               | 350/1069 [04:29<08:21,  1.43it/s][A
 33%|██████████████████████████████████████▋                                                                               | 351/1069 [04:30<08:53,  1.35it/s][A
 33%|██████████████████████████████████████▊                                                                               | 352/1069 [04:31<09:03,  1.32it/s][A
 33%|██████████████████████████████████████▉                                                                               | 353/1069 [04:31<08:56,  1.33it/s][A
 33%|███████████████████████████████████████                                                                               | 354/1069 [04:32<08:51,  1.34it/s][A
 33%|███████████████████████████████████████▏                                                                              | 355/1069 [04:33<09:23,  1.27it/s][A
 33%|███████████████████████

 37%|████████████████████████████████████████████▏                                                                         | 400/1069 [05:07<08:03,  1.38it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 401/1069 [05:08<08:53,  1.25it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 402/1069 [05:09<08:58,  1.24it/s][A
 38%|████████████████████████████████████████████▍                                                                         | 403/1069 [05:10<08:54,  1.25it/s][A
 38%|████████████████████████████████████████████▌                                                                         | 404/1069 [05:11<08:48,  1.26it/s][A
 38%|████████████████████████████████████████████▋                                                                         | 405/1069 [05:12<08:35,  1.29it/s][A
 38%|███████████████████████

 42%|█████████████████████████████████████████████████▋                                                                    | 450/1069 [05:46<07:53,  1.31it/s][A
 42%|█████████████████████████████████████████████████▊                                                                    | 451/1069 [05:47<07:59,  1.29it/s][A
 42%|█████████████████████████████████████████████████▉                                                                    | 452/1069 [05:47<07:15,  1.42it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 453/1069 [05:48<07:54,  1.30it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 454/1069 [05:49<08:05,  1.27it/s][A
 43%|██████████████████████████████████████████████████▏                                                                   | 455/1069 [05:50<08:01,  1.28it/s][A
 43%|███████████████████████

 47%|███████████████████████████████████████████████████████▏                                                              | 500/1069 [06:24<07:11,  1.32it/s][A
 47%|███████████████████████████████████████████████████████▎                                                              | 501/1069 [06:25<07:22,  1.28it/s][A
 47%|███████████████████████████████████████████████████████▍                                                              | 502/1069 [06:26<07:36,  1.24it/s][A
 47%|███████████████████████████████████████████████████████▌                                                              | 503/1069 [06:27<07:22,  1.28it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 504/1069 [06:28<07:12,  1.31it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 505/1069 [06:29<07:39,  1.23it/s][A
 47%|███████████████████████

 51%|████████████████████████████████████████████████████████████▋                                                         | 550/1069 [07:03<06:39,  1.30it/s][A
 52%|████████████████████████████████████████████████████████████▊                                                         | 551/1069 [07:04<06:13,  1.39it/s][A
 52%|████████████████████████████████████████████████████████████▉                                                         | 552/1069 [07:05<06:39,  1.29it/s][A
 52%|█████████████████████████████████████████████████████████████                                                         | 553/1069 [07:06<06:54,  1.24it/s][A
 52%|█████████████████████████████████████████████████████████████▏                                                        | 554/1069 [07:06<06:48,  1.26it/s][A
 52%|█████████████████████████████████████████████████████████████▎                                                        | 555/1069 [07:07<06:52,  1.25it/s][A
 52%|███████████████████████

 56%|██████████████████████████████████████████████████████████████████▏                                                   | 600/1069 [07:42<06:19,  1.24it/s][A
 56%|██████████████████████████████████████████████████████████████████▎                                                   | 601/1069 [07:43<06:18,  1.24it/s][A
 56%|██████████████████████████████████████████████████████████████████▍                                                   | 602/1069 [07:44<05:48,  1.34it/s][A
 56%|██████████████████████████████████████████████████████████████████▌                                                   | 603/1069 [07:44<05:41,  1.36it/s][A
 57%|██████████████████████████████████████████████████████████████████▋                                                   | 604/1069 [07:45<05:21,  1.45it/s][A
 57%|██████████████████████████████████████████████████████████████████▊                                                   | 605/1069 [07:45<05:16,  1.47it/s][A
 57%|███████████████████████

 61%|███████████████████████████████████████████████████████████████████████▋                                              | 650/1069 [08:21<04:46,  1.46it/s][A
 61%|███████████████████████████████████████████████████████████████████████▊                                              | 651/1069 [08:21<04:32,  1.53it/s][A
 61%|███████████████████████████████████████████████████████████████████████▉                                              | 652/1069 [08:22<04:47,  1.45it/s][A
 61%|████████████████████████████████████████████████████████████████████████                                              | 653/1069 [08:23<05:03,  1.37it/s][A
 61%|████████████████████████████████████████████████████████████████████████▏                                             | 654/1069 [08:24<05:06,  1.35it/s][A
 61%|████████████████████████████████████████████████████████████████████████▎                                             | 655/1069 [08:24<05:12,  1.33it/s][A
 61%|███████████████████████

 65%|█████████████████████████████████████████████████████████████████████████████▎                                        | 700/1069 [08:58<04:25,  1.39it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 701/1069 [08:59<04:18,  1.42it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 702/1069 [08:59<04:13,  1.45it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▌                                        | 703/1069 [09:00<03:59,  1.53it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▋                                        | 704/1069 [09:01<04:23,  1.39it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▊                                        | 705/1069 [09:01<04:31,  1.34it/s][A
 66%|███████████████████████

 70%|██████████████████████████████████████████████████████████████████████████████████▊                                   | 750/1069 [09:37<04:09,  1.28it/s][A
 70%|██████████████████████████████████████████████████████████████████████████████████▉                                   | 751/1069 [09:38<04:16,  1.24it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 752/1069 [09:38<03:47,  1.39it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 753/1069 [09:39<04:01,  1.31it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▏                                  | 754/1069 [09:41<05:03,  1.04it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▎                                  | 755/1069 [09:41<04:24,  1.19it/s][A
 71%|███████████████████████

 75%|████████████████████████████████████████████████████████████████████████████████████████▎                             | 800/1069 [10:16<04:18,  1.04it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▍                             | 801/1069 [10:16<03:47,  1.18it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▌                             | 802/1069 [10:17<03:24,  1.31it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 803/1069 [10:18<03:07,  1.42it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 804/1069 [10:18<03:10,  1.39it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▊                             | 805/1069 [10:19<03:09,  1.39it/s][A
 75%|███████████████████████

 80%|█████████████████████████████████████████████████████████████████████████████████████████████▊                        | 850/1069 [10:54<02:59,  1.22it/s][A
 80%|█████████████████████████████████████████████████████████████████████████████████████████████▉                        | 851/1069 [10:55<02:54,  1.25it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████                        | 852/1069 [10:55<02:51,  1.26it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▏                       | 853/1069 [10:56<02:43,  1.32it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▎                       | 854/1069 [10:57<02:47,  1.28it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▍                       | 855/1069 [10:58<02:52,  1.24it/s][A
 80%|███████████████████████

 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 900/1069 [11:32<02:07,  1.32it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▍                  | 901/1069 [11:33<02:08,  1.31it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                  | 902/1069 [11:35<02:57,  1.06s/it][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                  | 903/1069 [11:36<02:45,  1.00it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▊                  | 904/1069 [11:36<02:33,  1.08it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▉                  | 905/1069 [11:37<02:21,  1.16it/s][A
 85%|███████████████████████

 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 950/1069 [12:12<01:26,  1.37it/s][A
 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▉             | 951/1069 [12:13<01:33,  1.26it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████             | 952/1069 [12:14<01:32,  1.26it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 953/1069 [12:15<01:40,  1.15it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 954/1069 [12:15<01:33,  1.24it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▍            | 955/1069 [12:16<01:29,  1.28it/s][A
 89%|███████████████████████

 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍       | 1000/1069 [12:50<00:51,  1.33it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▌       | 1001/1069 [12:51<00:52,  1.30it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▋       | 1002/1069 [12:52<00:51,  1.31it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▊       | 1003/1069 [12:52<00:50,  1.31it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1004/1069 [12:53<00:50,  1.29it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1005/1069 [12:54<00:52,  1.23it/s][A
 94%|███████████████████████

 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉  | 1050/1069 [13:29<00:15,  1.26it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████  | 1051/1069 [13:30<00:13,  1.31it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1052/1069 [13:31<00:13,  1.29it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1053/1069 [13:32<00:12,  1.31it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎ | 1054/1069 [13:32<00:11,  1.28it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍ | 1055/1069 [13:33<00:09,  1.41it/s][A
 99%|███████████████████████

| epoch   0 | loss  0.69



  0%|                                                                                                                                | 0/1069 [00:00<?, ?it/s][A
  0%|                                                                                                                        | 1/1069 [00:00<09:56,  1.79it/s][A
  0%|▏                                                                                                                       | 2/1069 [00:01<11:40,  1.52it/s][A
  0%|▎                                                                                                                       | 3/1069 [00:02<12:48,  1.39it/s][A
  0%|▍                                                                                                                       | 4/1069 [00:02<13:47,  1.29it/s][A
  0%|▌                                                                                                                       | 5/1069 [00:03<13:35,  1.31it/s][A
  1%|▋                     

  5%|█████▌                                                                                                                 | 50/1069 [00:36<12:54,  1.32it/s][A
  5%|█████▋                                                                                                                 | 51/1069 [00:37<12:36,  1.35it/s][A
  5%|█████▊                                                                                                                 | 52/1069 [00:38<12:46,  1.33it/s][A
  5%|█████▉                                                                                                                 | 53/1069 [00:39<13:39,  1.24it/s][A
  5%|██████                                                                                                                 | 54/1069 [00:40<14:08,  1.20it/s][A
  5%|██████                                                                                                                 | 55/1069 [00:40<13:47,  1.23it/s][A
  5%|██████▏                

  9%|███████████                                                                                                           | 100/1069 [01:15<11:54,  1.36it/s][A
  9%|███████████▏                                                                                                          | 101/1069 [01:16<12:26,  1.30it/s][A
 10%|███████████▎                                                                                                          | 102/1069 [01:17<12:33,  1.28it/s][A
 10%|███████████▎                                                                                                          | 103/1069 [01:18<12:32,  1.28it/s][A
 10%|███████████▍                                                                                                          | 104/1069 [01:19<13:25,  1.20it/s][A
 10%|███████████▌                                                                                                          | 105/1069 [01:20<13:22,  1.20it/s][A
 10%|███████████▋           

 14%|████████████████▌                                                                                                     | 150/1069 [01:53<12:17,  1.25it/s][A
 14%|████████████████▋                                                                                                     | 151/1069 [01:54<12:34,  1.22it/s][A
 14%|████████████████▊                                                                                                     | 152/1069 [01:55<11:12,  1.36it/s][A
 14%|████████████████▉                                                                                                     | 153/1069 [01:56<12:15,  1.24it/s][A
 14%|████████████████▉                                                                                                     | 154/1069 [01:57<12:15,  1.24it/s][A
 14%|█████████████████                                                                                                     | 155/1069 [01:57<11:54,  1.28it/s][A
 15%|█████████████████▏     

 19%|██████████████████████                                                                                                | 200/1069 [02:32<11:11,  1.29it/s][A
 19%|██████████████████████▏                                                                                               | 201/1069 [02:32<11:34,  1.25it/s][A
 19%|██████████████████████▎                                                                                               | 202/1069 [02:33<11:13,  1.29it/s][A
 19%|██████████████████████▍                                                                                               | 203/1069 [02:34<11:46,  1.23it/s][A
 19%|██████████████████████▌                                                                                               | 204/1069 [02:35<11:20,  1.27it/s][A
 19%|██████████████████████▋                                                                                               | 205/1069 [02:36<11:38,  1.24it/s][A
 19%|██████████████████████▋

 23%|███████████████████████████▌                                                                                          | 250/1069 [03:10<08:29,  1.61it/s][A
 23%|███████████████████████████▋                                                                                          | 251/1069 [03:11<09:11,  1.48it/s][A
 24%|███████████████████████████▊                                                                                          | 252/1069 [03:12<10:27,  1.30it/s][A
 24%|███████████████████████████▉                                                                                          | 253/1069 [03:12<09:21,  1.45it/s][A
 24%|████████████████████████████                                                                                          | 254/1069 [03:13<10:06,  1.34it/s][A
 24%|████████████████████████████▏                                                                                         | 255/1069 [03:14<10:33,  1.28it/s][A
 24%|███████████████████████

 28%|█████████████████████████████████                                                                                     | 300/1069 [03:49<10:11,  1.26it/s][A
 28%|█████████████████████████████████▏                                                                                    | 301/1069 [03:50<10:10,  1.26it/s][A
 28%|█████████████████████████████████▎                                                                                    | 302/1069 [03:51<09:40,  1.32it/s][A
 28%|█████████████████████████████████▍                                                                                    | 303/1069 [03:52<10:02,  1.27it/s][A
 28%|█████████████████████████████████▌                                                                                    | 304/1069 [03:53<10:23,  1.23it/s][A
 29%|█████████████████████████████████▋                                                                                    | 305/1069 [03:53<10:07,  1.26it/s][A
 29%|███████████████████████

 33%|██████████████████████████████████████▋                                                                               | 350/1069 [04:28<09:22,  1.28it/s][A
 33%|██████████████████████████████████████▋                                                                               | 351/1069 [04:29<09:18,  1.29it/s][A
 33%|██████████████████████████████████████▊                                                                               | 352/1069 [04:29<08:48,  1.36it/s][A
 33%|██████████████████████████████████████▉                                                                               | 353/1069 [04:30<09:17,  1.28it/s][A
 33%|███████████████████████████████████████                                                                               | 354/1069 [04:31<09:34,  1.24it/s][A
 33%|███████████████████████████████████████▏                                                                              | 355/1069 [04:32<09:35,  1.24it/s][A
 33%|███████████████████████

 37%|████████████████████████████████████████████▏                                                                         | 400/1069 [05:06<08:51,  1.26it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 401/1069 [05:07<08:36,  1.29it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 402/1069 [05:08<09:19,  1.19it/s][A
 38%|████████████████████████████████████████████▍                                                                         | 403/1069 [05:09<08:46,  1.27it/s][A
 38%|████████████████████████████████████████████▌                                                                         | 404/1069 [05:10<08:31,  1.30it/s][A
 38%|████████████████████████████████████████████▋                                                                         | 405/1069 [05:10<08:47,  1.26it/s][A
 38%|███████████████████████

 42%|█████████████████████████████████████████████████▋                                                                    | 450/1069 [05:44<06:54,  1.49it/s][A
 42%|█████████████████████████████████████████████████▊                                                                    | 451/1069 [05:44<06:34,  1.57it/s][A
 42%|█████████████████████████████████████████████████▉                                                                    | 452/1069 [05:45<06:40,  1.54it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 453/1069 [05:45<06:25,  1.60it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 454/1069 [05:46<07:20,  1.40it/s][A
 43%|██████████████████████████████████████████████████▏                                                                   | 455/1069 [05:47<06:57,  1.47it/s][A
 43%|███████████████████████

 47%|███████████████████████████████████████████████████████▏                                                              | 500/1069 [06:22<05:57,  1.59it/s][A
 47%|███████████████████████████████████████████████████████▎                                                              | 501/1069 [06:23<06:54,  1.37it/s][A
 47%|███████████████████████████████████████████████████████▍                                                              | 502/1069 [06:24<07:36,  1.24it/s][A
 47%|███████████████████████████████████████████████████████▌                                                              | 503/1069 [06:24<06:44,  1.40it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 504/1069 [06:25<06:11,  1.52it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 505/1069 [06:25<06:38,  1.42it/s][A
 47%|███████████████████████

 51%|████████████████████████████████████████████████████████████▋                                                         | 550/1069 [07:00<06:35,  1.31it/s][A
 52%|████████████████████████████████████████████████████████████▊                                                         | 551/1069 [07:01<06:47,  1.27it/s][A
 52%|████████████████████████████████████████████████████████████▉                                                         | 552/1069 [07:02<06:43,  1.28it/s][A
 52%|█████████████████████████████████████████████████████████████                                                         | 553/1069 [07:03<06:09,  1.40it/s][A
 52%|█████████████████████████████████████████████████████████████▏                                                        | 554/1069 [07:03<06:38,  1.29it/s][A
 52%|█████████████████████████████████████████████████████████████▎                                                        | 555/1069 [07:04<06:46,  1.26it/s][A
 52%|███████████████████████

 56%|██████████████████████████████████████████████████████████████████▏                                                   | 600/1069 [07:40<06:34,  1.19it/s][A
 56%|██████████████████████████████████████████████████████████████████▎                                                   | 601/1069 [07:41<06:14,  1.25it/s][A
 56%|██████████████████████████████████████████████████████████████████▍                                                   | 602/1069 [07:41<06:01,  1.29it/s][A
 56%|██████████████████████████████████████████████████████████████████▌                                                   | 603/1069 [07:42<05:45,  1.35it/s][A
 57%|██████████████████████████████████████████████████████████████████▋                                                   | 604/1069 [07:43<06:21,  1.22it/s][A
 57%|██████████████████████████████████████████████████████████████████▊                                                   | 605/1069 [07:44<06:22,  1.21it/s][A
 57%|███████████████████████

 61%|███████████████████████████████████████████████████████████████████████▋                                              | 650/1069 [08:18<05:28,  1.28it/s][A
 61%|███████████████████████████████████████████████████████████████████████▊                                              | 651/1069 [08:19<05:52,  1.19it/s][A
 61%|███████████████████████████████████████████████████████████████████████▉                                              | 652/1069 [08:20<05:39,  1.23it/s][A
 61%|████████████████████████████████████████████████████████████████████████                                              | 653/1069 [08:21<05:32,  1.25it/s][A
 61%|████████████████████████████████████████████████████████████████████████▏                                             | 654/1069 [08:22<05:28,  1.26it/s][A
 61%|████████████████████████████████████████████████████████████████████████▎                                             | 655/1069 [08:23<05:32,  1.25it/s][A
 61%|███████████████████████

 65%|█████████████████████████████████████████████████████████████████████████████▎                                        | 700/1069 [08:58<04:58,  1.23it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 701/1069 [08:58<04:42,  1.30it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 702/1069 [08:59<04:44,  1.29it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▌                                        | 703/1069 [09:00<04:36,  1.32it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▋                                        | 704/1069 [09:01<04:57,  1.23it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▊                                        | 705/1069 [09:02<05:08,  1.18it/s][A
 66%|███████████████████████

 70%|██████████████████████████████████████████████████████████████████████████████████▊                                   | 750/1069 [09:36<04:14,  1.25it/s][A
 70%|██████████████████████████████████████████████████████████████████████████████████▉                                   | 751/1069 [09:37<04:13,  1.26it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 752/1069 [09:38<04:22,  1.21it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 753/1069 [09:38<04:15,  1.24it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▏                                  | 754/1069 [09:39<04:08,  1.27it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▎                                  | 755/1069 [09:40<04:17,  1.22it/s][A
 71%|███████████████████████

 75%|████████████████████████████████████████████████████████████████████████████████████████▎                             | 800/1069 [10:15<03:24,  1.32it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▍                             | 801/1069 [10:16<03:33,  1.26it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▌                             | 802/1069 [10:16<03:20,  1.33it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 803/1069 [10:17<03:26,  1.29it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 804/1069 [10:18<03:34,  1.23it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▊                             | 805/1069 [10:19<03:27,  1.27it/s][A
 75%|███████████████████████

 80%|█████████████████████████████████████████████████████████████████████████████████████████████▊                        | 850/1069 [10:54<02:58,  1.23it/s][A
 80%|█████████████████████████████████████████████████████████████████████████████████████████████▉                        | 851/1069 [10:55<03:03,  1.19it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████                        | 852/1069 [10:56<02:53,  1.25it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▏                       | 853/1069 [10:57<02:49,  1.27it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▎                       | 854/1069 [10:57<02:41,  1.33it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▍                       | 855/1069 [10:58<02:33,  1.39it/s][A
 80%|███████████████████████

 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 900/1069 [11:32<01:46,  1.58it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▍                  | 901/1069 [11:33<01:52,  1.49it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                  | 902/1069 [11:33<01:55,  1.45it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                  | 903/1069 [11:34<01:48,  1.52it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▊                  | 904/1069 [11:35<01:57,  1.41it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▉                  | 905/1069 [11:36<02:05,  1.31it/s][A
 85%|███████████████████████

 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 950/1069 [12:11<01:33,  1.28it/s][A
 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▉             | 951/1069 [12:12<01:35,  1.24it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████             | 952/1069 [12:13<01:37,  1.20it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 953/1069 [12:14<01:33,  1.24it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 954/1069 [12:14<01:30,  1.26it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▍            | 955/1069 [12:15<01:31,  1.24it/s][A
 89%|███████████████████████

 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍       | 1000/1069 [12:51<00:53,  1.30it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▌       | 1001/1069 [12:51<00:47,  1.44it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▋       | 1002/1069 [12:52<00:52,  1.29it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▊       | 1003/1069 [12:53<00:48,  1.36it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1004/1069 [12:54<00:46,  1.39it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1005/1069 [12:55<00:50,  1.26it/s][A
 94%|███████████████████████

 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉  | 1050/1069 [13:30<00:14,  1.31it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████  | 1051/1069 [13:30<00:13,  1.34it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1052/1069 [13:31<00:12,  1.37it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1053/1069 [13:32<00:12,  1.30it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎ | 1054/1069 [13:33<00:11,  1.29it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍ | 1055/1069 [13:33<00:10,  1.29it/s][A
 99%|███████████████████████

| epoch   0 | loss  0.69



  0%|                                                                                                                                | 0/1069 [00:00<?, ?it/s][A
  0%|                                                                                                                        | 1/1069 [00:00<08:04,  2.20it/s][A
  0%|▏                                                                                                                       | 2/1069 [00:01<09:29,  1.87it/s][A
  0%|▎                                                                                                                       | 3/1069 [00:01<09:46,  1.82it/s][A
  0%|▍                                                                                                                       | 4/1069 [00:02<09:54,  1.79it/s][A
  0%|▌                                                                                                                       | 5/1069 [00:02<09:58,  1.78it/s][A
  1%|▋                     

  5%|█████▌                                                                                                                 | 50/1069 [00:36<12:04,  1.41it/s][A
  5%|█████▋                                                                                                                 | 51/1069 [00:37<11:57,  1.42it/s][A
  5%|█████▊                                                                                                                 | 52/1069 [00:38<13:08,  1.29it/s][A
  5%|█████▉                                                                                                                 | 53/1069 [00:39<13:22,  1.27it/s][A
  5%|██████                                                                                                                 | 54/1069 [00:39<13:02,  1.30it/s][A
  5%|██████                                                                                                                 | 55/1069 [00:40<12:46,  1.32it/s][A
  5%|██████▏                

  9%|███████████                                                                                                           | 100/1069 [01:15<13:42,  1.18it/s][A
  9%|███████████▏                                                                                                          | 101/1069 [01:16<13:09,  1.23it/s][A
 10%|███████████▎                                                                                                          | 102/1069 [01:17<12:57,  1.24it/s][A
 10%|███████████▎                                                                                                          | 103/1069 [01:18<12:47,  1.26it/s][A
 10%|███████████▍                                                                                                          | 104/1069 [01:18<11:54,  1.35it/s][A
 10%|███████████▌                                                                                                          | 105/1069 [01:19<12:19,  1.30it/s][A
 10%|███████████▋           

 14%|████████████████▌                                                                                                     | 150/1069 [01:54<12:47,  1.20it/s][A
 14%|████████████████▋                                                                                                     | 151/1069 [01:54<12:34,  1.22it/s][A
 14%|████████████████▊                                                                                                     | 152/1069 [01:55<12:27,  1.23it/s][A
 14%|████████████████▉                                                                                                     | 153/1069 [01:56<12:24,  1.23it/s][A
 14%|████████████████▉                                                                                                     | 154/1069 [01:57<12:22,  1.23it/s][A
 14%|█████████████████                                                                                                     | 155/1069 [01:58<12:29,  1.22it/s][A
 15%|█████████████████▏     

 19%|██████████████████████                                                                                                | 200/1069 [02:32<10:34,  1.37it/s][A
 19%|██████████████████████▏                                                                                               | 201/1069 [02:32<09:23,  1.54it/s][A
 19%|██████████████████████▎                                                                                               | 202/1069 [02:33<10:30,  1.37it/s][A
 19%|██████████████████████▍                                                                                               | 203/1069 [02:34<09:25,  1.53it/s][A
 19%|██████████████████████▌                                                                                               | 204/1069 [02:35<10:32,  1.37it/s][A
 19%|██████████████████████▋                                                                                               | 205/1069 [02:36<13:27,  1.07it/s][A
 19%|██████████████████████▋

 23%|███████████████████████████▌                                                                                          | 250/1069 [03:10<10:33,  1.29it/s][A
 23%|███████████████████████████▋                                                                                          | 251/1069 [03:11<09:49,  1.39it/s][A
 24%|███████████████████████████▊                                                                                          | 252/1069 [03:12<09:10,  1.48it/s][A
 24%|███████████████████████████▉                                                                                          | 253/1069 [03:12<09:55,  1.37it/s][A
 24%|████████████████████████████                                                                                          | 254/1069 [03:13<10:20,  1.31it/s][A
 24%|████████████████████████████▏                                                                                         | 255/1069 [03:14<10:08,  1.34it/s][A
 24%|███████████████████████

 28%|█████████████████████████████████                                                                                     | 300/1069 [03:49<10:04,  1.27it/s][A
 28%|█████████████████████████████████▏                                                                                    | 301/1069 [03:50<10:05,  1.27it/s][A
 28%|█████████████████████████████████▎                                                                                    | 302/1069 [03:51<10:08,  1.26it/s][A
 28%|█████████████████████████████████▍                                                                                    | 303/1069 [03:51<10:01,  1.27it/s][A
 28%|█████████████████████████████████▌                                                                                    | 304/1069 [03:52<09:09,  1.39it/s][A
 29%|█████████████████████████████████▋                                                                                    | 305/1069 [03:53<09:42,  1.31it/s][A
 29%|███████████████████████

 33%|██████████████████████████████████████▋                                                                               | 350/1069 [04:26<09:10,  1.31it/s][A
 33%|██████████████████████████████████████▋                                                                               | 351/1069 [04:27<09:18,  1.29it/s][A
 33%|██████████████████████████████████████▊                                                                               | 352/1069 [04:28<08:25,  1.42it/s][A
 33%|██████████████████████████████████████▉                                                                               | 353/1069 [04:29<08:58,  1.33it/s][A
 33%|███████████████████████████████████████                                                                               | 354/1069 [04:29<09:14,  1.29it/s][A
 33%|███████████████████████████████████████▏                                                                              | 355/1069 [04:30<08:27,  1.41it/s][A
 33%|███████████████████████

 37%|████████████████████████████████████████████▏                                                                         | 400/1069 [05:05<08:48,  1.27it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 401/1069 [05:05<08:37,  1.29it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 402/1069 [05:06<08:40,  1.28it/s][A
 38%|████████████████████████████████████████████▍                                                                         | 403/1069 [05:07<09:20,  1.19it/s][A
 38%|████████████████████████████████████████████▌                                                                         | 404/1069 [05:08<08:48,  1.26it/s][A
 38%|████████████████████████████████████████████▋                                                                         | 405/1069 [05:09<08:56,  1.24it/s][A
 38%|███████████████████████

 42%|█████████████████████████████████████████████████▋                                                                    | 450/1069 [05:43<07:16,  1.42it/s][A
 42%|█████████████████████████████████████████████████▊                                                                    | 451/1069 [05:44<07:59,  1.29it/s][A
 42%|█████████████████████████████████████████████████▉                                                                    | 452/1069 [05:45<08:03,  1.27it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 453/1069 [05:46<07:52,  1.30it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 454/1069 [05:46<07:44,  1.32it/s][A
 43%|██████████████████████████████████████████████████▏                                                                   | 455/1069 [05:47<08:15,  1.24it/s][A
 43%|███████████████████████

 47%|███████████████████████████████████████████████████████▏                                                              | 500/1069 [06:22<07:46,  1.22it/s][A
 47%|███████████████████████████████████████████████████████▎                                                              | 501/1069 [06:23<07:33,  1.25it/s][A
 47%|███████████████████████████████████████████████████████▍                                                              | 502/1069 [06:23<06:52,  1.38it/s][A
 47%|███████████████████████████████████████████████████████▌                                                              | 503/1069 [06:24<06:34,  1.44it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 504/1069 [06:25<07:01,  1.34it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 505/1069 [06:25<06:48,  1.38it/s][A
 47%|███████████████████████

 51%|████████████████████████████████████████████████████████████▋                                                         | 550/1069 [07:00<06:09,  1.40it/s][A
 52%|████████████████████████████████████████████████████████████▊                                                         | 551/1069 [07:01<06:31,  1.32it/s][A
 52%|████████████████████████████████████████████████████████████▉                                                         | 552/1069 [07:02<06:25,  1.34it/s][A
 52%|█████████████████████████████████████████████████████████████                                                         | 553/1069 [07:03<06:42,  1.28it/s][A
 52%|█████████████████████████████████████████████████████████████▏                                                        | 554/1069 [07:03<06:37,  1.30it/s][A
 52%|█████████████████████████████████████████████████████████████▎                                                        | 555/1069 [07:04<06:50,  1.25it/s][A
 52%|███████████████████████

 56%|██████████████████████████████████████████████████████████████████▏                                                   | 600/1069 [07:39<06:34,  1.19it/s][A
 56%|██████████████████████████████████████████████████████████████████▎                                                   | 601/1069 [07:40<06:15,  1.24it/s][A
 56%|██████████████████████████████████████████████████████████████████▍                                                   | 602/1069 [07:41<06:14,  1.25it/s][A
 56%|██████████████████████████████████████████████████████████████████▌                                                   | 603/1069 [07:42<06:17,  1.23it/s][A
 57%|██████████████████████████████████████████████████████████████████▋                                                   | 604/1069 [07:42<06:20,  1.22it/s][A
 57%|██████████████████████████████████████████████████████████████████▊                                                   | 605/1069 [07:43<05:59,  1.29it/s][A
 57%|███████████████████████

 61%|███████████████████████████████████████████████████████████████████████▋                                              | 650/1069 [08:19<05:32,  1.26it/s][A
 61%|███████████████████████████████████████████████████████████████████████▊                                              | 651/1069 [08:19<04:54,  1.42it/s][A
 61%|███████████████████████████████████████████████████████████████████████▉                                              | 652/1069 [08:20<05:22,  1.29it/s][A
 61%|████████████████████████████████████████████████████████████████████████                                              | 653/1069 [08:22<07:09,  1.03s/it][A
 61%|████████████████████████████████████████████████████████████████████████▏                                             | 654/1069 [08:23<06:23,  1.08it/s][A
 61%|████████████████████████████████████████████████████████████████████████▎                                             | 655/1069 [08:23<05:39,  1.22it/s][A
 61%|███████████████████████

 65%|█████████████████████████████████████████████████████████████████████████████▎                                        | 700/1069 [08:58<05:09,  1.19it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 701/1069 [08:59<05:00,  1.23it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 702/1069 [09:00<04:45,  1.28it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▌                                        | 703/1069 [09:01<04:46,  1.28it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▋                                        | 704/1069 [09:01<04:42,  1.29it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▊                                        | 705/1069 [09:02<04:45,  1.28it/s][A
 66%|███████████████████████

 70%|██████████████████████████████████████████████████████████████████████████████████▊                                   | 750/1069 [09:37<03:52,  1.37it/s][A
 70%|██████████████████████████████████████████████████████████████████████████████████▉                                   | 751/1069 [09:38<03:52,  1.37it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 752/1069 [09:38<04:02,  1.30it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 753/1069 [09:39<04:09,  1.27it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▏                                  | 754/1069 [09:40<04:08,  1.27it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▎                                  | 755/1069 [09:41<04:05,  1.28it/s][A
 71%|███████████████████████

 75%|████████████████████████████████████████████████████████████████████████████████████████▎                             | 800/1069 [10:15<03:21,  1.34it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▍                             | 801/1069 [10:16<03:29,  1.28it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▌                             | 802/1069 [10:17<03:28,  1.28it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 803/1069 [10:18<03:25,  1.29it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 804/1069 [10:18<03:25,  1.29it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▊                             | 805/1069 [10:19<03:24,  1.29it/s][A
 75%|███████████████████████

 80%|█████████████████████████████████████████████████████████████████████████████████████████████▊                        | 850/1069 [10:54<03:11,  1.14it/s][A
 80%|█████████████████████████████████████████████████████████████████████████████████████████████▉                        | 851/1069 [10:55<03:02,  1.20it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████                        | 852/1069 [10:56<02:54,  1.24it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▏                       | 853/1069 [10:56<02:50,  1.27it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▎                       | 854/1069 [10:57<02:46,  1.29it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▍                       | 855/1069 [10:58<02:39,  1.34it/s][A
 80%|███████████████████████

 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 900/1069 [11:32<02:08,  1.32it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▍                  | 901/1069 [11:33<02:10,  1.29it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                  | 902/1069 [11:34<01:54,  1.46it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                  | 903/1069 [11:34<01:56,  1.43it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▊                  | 904/1069 [11:35<02:01,  1.36it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▉                  | 905/1069 [11:36<01:58,  1.38it/s][A
 85%|███████████████████████

 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 950/1069 [12:11<01:33,  1.27it/s][A
 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▉             | 951/1069 [12:12<01:30,  1.30it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████             | 952/1069 [12:12<01:30,  1.29it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 953/1069 [12:13<01:28,  1.31it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 954/1069 [12:14<01:28,  1.31it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▍            | 955/1069 [12:15<01:21,  1.40it/s][A
 89%|███████████████████████

 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍       | 1000/1069 [12:49<00:53,  1.30it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▌       | 1001/1069 [12:50<00:52,  1.29it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▋       | 1002/1069 [12:51<00:51,  1.31it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▊       | 1003/1069 [12:51<00:48,  1.37it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1004/1069 [12:52<00:50,  1.29it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1005/1069 [12:53<00:48,  1.32it/s][A
 94%|███████████████████████

 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉  | 1050/1069 [13:28<00:14,  1.32it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████  | 1051/1069 [13:29<00:14,  1.21it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1052/1069 [13:29<00:13,  1.25it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1053/1069 [13:30<00:11,  1.37it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎ | 1054/1069 [13:31<00:11,  1.34it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍ | 1055/1069 [13:32<00:11,  1.23it/s][A
 99%|███████████████████████

| epoch   0 | loss  0.65



  0%|                                                                                                                                | 0/1069 [00:00<?, ?it/s][A
  0%|                                                                                                                        | 1/1069 [00:00<12:01,  1.48it/s][A
  0%|▏                                                                                                                       | 2/1069 [00:01<11:59,  1.48it/s][A
  0%|▎                                                                                                                       | 3/1069 [00:02<11:59,  1.48it/s][A
  0%|▍                                                                                                                       | 4/1069 [00:02<12:03,  1.47it/s][A
  0%|▌                                                                                                                       | 5/1069 [00:03<12:04,  1.47it/s][A
  1%|▋                     

  5%|█████▌                                                                                                                 | 50/1069 [00:38<13:40,  1.24it/s][A
  5%|█████▋                                                                                                                 | 51/1069 [00:38<11:52,  1.43it/s][A
  5%|█████▊                                                                                                                 | 52/1069 [00:39<12:25,  1.36it/s][A
  5%|█████▉                                                                                                                 | 53/1069 [00:40<13:15,  1.28it/s][A
  5%|██████                                                                                                                 | 54/1069 [00:41<13:08,  1.29it/s][A
  5%|██████                                                                                                                 | 55/1069 [00:42<13:07,  1.29it/s][A
  5%|██████▏                

  9%|███████████                                                                                                           | 100/1069 [01:15<12:40,  1.27it/s][A
  9%|███████████▏                                                                                                          | 101/1069 [01:16<13:11,  1.22it/s][A
 10%|███████████▎                                                                                                          | 102/1069 [01:17<12:45,  1.26it/s][A
 10%|███████████▎                                                                                                          | 103/1069 [01:17<12:40,  1.27it/s][A
 10%|███████████▍                                                                                                          | 104/1069 [01:18<12:45,  1.26it/s][A
 10%|███████████▌                                                                                                          | 105/1069 [01:19<12:47,  1.26it/s][A
 10%|███████████▋           

 14%|████████████████▌                                                                                                     | 150/1069 [01:53<12:11,  1.26it/s][A
 14%|████████████████▋                                                                                                     | 151/1069 [01:54<11:17,  1.36it/s][A
 14%|████████████████▊                                                                                                     | 152/1069 [01:55<11:31,  1.33it/s][A
 14%|████████████████▉                                                                                                     | 153/1069 [01:55<10:04,  1.52it/s][A
 14%|████████████████▉                                                                                                     | 154/1069 [01:56<11:25,  1.34it/s][A
 14%|█████████████████                                                                                                     | 155/1069 [01:57<11:35,  1.32it/s][A
 15%|█████████████████▏     

 19%|██████████████████████                                                                                                | 200/1069 [02:32<11:40,  1.24it/s][A
 19%|██████████████████████▏                                                                                               | 201/1069 [02:32<10:54,  1.33it/s][A
 19%|██████████████████████▎                                                                                               | 202/1069 [02:33<11:17,  1.28it/s][A
 19%|██████████████████████▍                                                                                               | 203/1069 [02:34<11:56,  1.21it/s][A
 19%|██████████████████████▌                                                                                               | 204/1069 [02:35<11:24,  1.26it/s][A
 19%|██████████████████████▋                                                                                               | 205/1069 [02:35<11:38,  1.24it/s][A
 19%|██████████████████████▋

 23%|███████████████████████████▌                                                                                          | 250/1069 [03:10<11:02,  1.24it/s][A
 23%|███████████████████████████▋                                                                                          | 251/1069 [03:11<10:05,  1.35it/s][A
 24%|███████████████████████████▊                                                                                          | 252/1069 [03:12<09:57,  1.37it/s][A
 24%|███████████████████████████▉                                                                                          | 253/1069 [03:12<10:11,  1.33it/s][A
 24%|████████████████████████████                                                                                          | 254/1069 [03:13<10:25,  1.30it/s][A
 24%|████████████████████████████▏                                                                                         | 255/1069 [03:15<13:29,  1.01it/s][A
 24%|███████████████████████

 28%|█████████████████████████████████                                                                                     | 300/1069 [03:49<10:07,  1.27it/s][A
 28%|█████████████████████████████████▏                                                                                    | 301/1069 [03:49<10:14,  1.25it/s][A
 28%|█████████████████████████████████▎                                                                                    | 302/1069 [03:50<10:10,  1.26it/s][A
 28%|█████████████████████████████████▍                                                                                    | 303/1069 [03:51<09:11,  1.39it/s][A
 28%|█████████████████████████████████▌                                                                                    | 304/1069 [03:51<09:08,  1.40it/s][A
 29%|█████████████████████████████████▋                                                                                    | 305/1069 [03:52<09:30,  1.34it/s][A
 29%|███████████████████████

 33%|██████████████████████████████████████▋                                                                               | 350/1069 [04:28<10:01,  1.20it/s][A
 33%|██████████████████████████████████████▋                                                                               | 351/1069 [04:28<09:32,  1.25it/s][A
 33%|██████████████████████████████████████▊                                                                               | 352/1069 [04:29<09:07,  1.31it/s][A
 33%|██████████████████████████████████████▉                                                                               | 353/1069 [04:30<09:38,  1.24it/s][A
 33%|███████████████████████████████████████                                                                               | 354/1069 [04:31<09:37,  1.24it/s][A
 33%|███████████████████████████████████████▏                                                                              | 355/1069 [04:31<09:29,  1.25it/s][A
 33%|███████████████████████

 37%|████████████████████████████████████████████▏                                                                         | 400/1069 [05:07<08:55,  1.25it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 401/1069 [05:07<08:41,  1.28it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 402/1069 [05:08<08:39,  1.29it/s][A
 38%|████████████████████████████████████████████▍                                                                         | 403/1069 [05:09<08:14,  1.35it/s][A
 38%|████████████████████████████████████████████▌                                                                         | 404/1069 [05:10<08:49,  1.25it/s][A
 38%|████████████████████████████████████████████▋                                                                         | 405/1069 [05:10<07:48,  1.42it/s][A
 38%|███████████████████████

 42%|█████████████████████████████████████████████████▋                                                                    | 450/1069 [05:46<08:25,  1.23it/s][A
 42%|█████████████████████████████████████████████████▊                                                                    | 451/1069 [05:46<08:06,  1.27it/s][A
 42%|█████████████████████████████████████████████████▉                                                                    | 452/1069 [05:47<08:10,  1.26it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 453/1069 [05:48<08:08,  1.26it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 454/1069 [05:49<07:30,  1.37it/s][A
 43%|██████████████████████████████████████████████████▏                                                                   | 455/1069 [05:49<06:45,  1.51it/s][A
 43%|███████████████████████

 47%|███████████████████████████████████████████████████████▏                                                              | 500/1069 [06:23<06:55,  1.37it/s][A
 47%|███████████████████████████████████████████████████████▎                                                              | 501/1069 [06:24<07:30,  1.26it/s][A
 47%|███████████████████████████████████████████████████████▍                                                              | 502/1069 [06:25<07:45,  1.22it/s][A
 47%|███████████████████████████████████████████████████████▌                                                              | 503/1069 [06:26<07:37,  1.24it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 504/1069 [06:27<07:31,  1.25it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 505/1069 [06:27<07:23,  1.27it/s][A
 47%|███████████████████████

 51%|████████████████████████████████████████████████████████████▋                                                         | 550/1069 [07:03<06:33,  1.32it/s][A
 52%|████████████████████████████████████████████████████████████▊                                                         | 551/1069 [07:04<06:44,  1.28it/s][A
 52%|████████████████████████████████████████████████████████████▉                                                         | 552/1069 [07:05<07:06,  1.21it/s][A
 52%|█████████████████████████████████████████████████████████████                                                         | 553/1069 [07:06<06:50,  1.26it/s][A
 52%|█████████████████████████████████████████████████████████████▏                                                        | 554/1069 [07:06<05:58,  1.43it/s][A
 52%|█████████████████████████████████████████████████████████████▎                                                        | 555/1069 [07:07<05:47,  1.48it/s][A
 52%|███████████████████████

 56%|██████████████████████████████████████████████████████████████████▏                                                   | 600/1069 [07:43<06:15,  1.25it/s][A
 56%|██████████████████████████████████████████████████████████████████▎                                                   | 601/1069 [07:44<06:15,  1.25it/s][A
 56%|██████████████████████████████████████████████████████████████████▍                                                   | 602/1069 [07:44<06:05,  1.28it/s][A
 56%|██████████████████████████████████████████████████████████████████▌                                                   | 603/1069 [07:45<06:14,  1.24it/s][A
 57%|██████████████████████████████████████████████████████████████████▋                                                   | 604/1069 [07:46<06:27,  1.20it/s][A
 57%|██████████████████████████████████████████████████████████████████▊                                                   | 605/1069 [07:47<06:19,  1.22it/s][A
 57%|███████████████████████

 61%|███████████████████████████████████████████████████████████████████████▋                                              | 650/1069 [08:22<05:37,  1.24it/s][A
 61%|███████████████████████████████████████████████████████████████████████▊                                              | 651/1069 [08:23<05:39,  1.23it/s][A
 61%|███████████████████████████████████████████████████████████████████████▉                                              | 652/1069 [08:24<05:12,  1.33it/s][A
 61%|████████████████████████████████████████████████████████████████████████                                              | 653/1069 [08:24<05:29,  1.26it/s][A
 61%|████████████████████████████████████████████████████████████████████████▏                                             | 654/1069 [08:25<05:34,  1.24it/s][A
 61%|████████████████████████████████████████████████████████████████████████▎                                             | 655/1069 [08:26<05:36,  1.23it/s][A
 61%|███████████████████████

 65%|█████████████████████████████████████████████████████████████████████████████▎                                        | 700/1069 [09:00<04:39,  1.32it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 701/1069 [09:01<04:48,  1.28it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 702/1069 [09:02<04:43,  1.30it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▌                                        | 703/1069 [09:03<05:13,  1.17it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▋                                        | 704/1069 [09:04<04:54,  1.24it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▊                                        | 705/1069 [09:05<04:48,  1.26it/s][A
 66%|███████████████████████

 70%|██████████████████████████████████████████████████████████████████████████████████▊                                   | 750/1069 [09:40<03:52,  1.37it/s][A
 70%|██████████████████████████████████████████████████████████████████████████████████▉                                   | 751/1069 [09:40<04:04,  1.30it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 752/1069 [09:41<03:58,  1.33it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 753/1069 [09:42<04:07,  1.27it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▏                                  | 754/1069 [09:43<04:04,  1.29it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▎                                  | 755/1069 [09:44<04:08,  1.26it/s][A
 71%|███████████████████████

 75%|████████████████████████████████████████████████████████████████████████████████████████▎                             | 800/1069 [10:18<03:23,  1.32it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▍                             | 801/1069 [10:19<03:28,  1.28it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▌                             | 802/1069 [10:20<03:25,  1.30it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 803/1069 [10:21<03:29,  1.27it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 804/1069 [10:22<03:41,  1.20it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▊                             | 805/1069 [10:22<03:22,  1.30it/s][A
 75%|███████████████████████

 80%|█████████████████████████████████████████████████████████████████████████████████████████████▊                        | 850/1069 [10:56<02:24,  1.52it/s][A
 80%|█████████████████████████████████████████████████████████████████████████████████████████████▉                        | 851/1069 [10:57<02:41,  1.35it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████                        | 852/1069 [10:58<02:46,  1.31it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▏                       | 853/1069 [10:59<02:49,  1.28it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▎                       | 854/1069 [10:59<02:47,  1.28it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▍                       | 855/1069 [11:00<02:47,  1.28it/s][A
 80%|███████████████████████

 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 900/1069 [11:35<02:35,  1.09it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▍                  | 901/1069 [11:36<02:22,  1.18it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                  | 902/1069 [11:37<02:12,  1.26it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                  | 903/1069 [11:37<02:04,  1.33it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▊                  | 904/1069 [11:38<02:01,  1.36it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▉                  | 905/1069 [11:39<02:04,  1.32it/s][A
 85%|███████████████████████

 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 950/1069 [12:14<01:32,  1.29it/s][A
 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▉             | 951/1069 [12:15<01:35,  1.23it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████             | 952/1069 [12:15<01:22,  1.41it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 953/1069 [12:16<01:20,  1.45it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 954/1069 [12:17<01:20,  1.42it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▍            | 955/1069 [12:18<01:24,  1.34it/s][A
 89%|███████████████████████

 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍       | 1000/1069 [12:53<00:55,  1.24it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▌       | 1001/1069 [12:53<00:49,  1.38it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▋       | 1002/1069 [12:54<00:56,  1.18it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▊       | 1003/1069 [12:55<00:54,  1.21it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1004/1069 [12:56<00:51,  1.27it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1005/1069 [12:56<00:47,  1.35it/s][A
 94%|███████████████████████

 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉  | 1050/1069 [13:30<00:13,  1.39it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████  | 1051/1069 [13:31<00:12,  1.45it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1052/1069 [13:31<00:12,  1.34it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1053/1069 [13:32<00:11,  1.45it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎ | 1054/1069 [13:33<00:11,  1.31it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍ | 1055/1069 [13:34<00:10,  1.37it/s][A
 99%|███████████████████████

| epoch   0 | loss  0.71



  0%|                                                                                                                                | 0/1069 [00:00<?, ?it/s][A
  0%|                                                                                                                        | 1/1069 [00:00<10:00,  1.78it/s][A
  0%|▏                                                                                                                       | 2/1069 [00:01<10:06,  1.76it/s][A
  0%|▎                                                                                                                       | 3/1069 [00:01<10:13,  1.74it/s][A
  0%|▍                                                                                                                       | 4/1069 [00:02<10:27,  1.70it/s][A
  0%|▌                                                                                                                       | 5/1069 [00:02<09:38,  1.84it/s][A
  1%|▋                     

  5%|█████▌                                                                                                                 | 50/1069 [00:38<14:24,  1.18it/s][A
  5%|█████▋                                                                                                                 | 51/1069 [00:39<13:31,  1.25it/s][A
  5%|█████▊                                                                                                                 | 52/1069 [00:39<13:45,  1.23it/s][A
  5%|█████▉                                                                                                                 | 53/1069 [00:40<13:36,  1.24it/s][A
  5%|██████                                                                                                                 | 54/1069 [00:41<12:39,  1.34it/s][A
  5%|██████                                                                                                                 | 55/1069 [00:41<11:56,  1.41it/s][A
  5%|██████▏                

  9%|███████████                                                                                                           | 100/1069 [01:16<12:23,  1.30it/s][A
  9%|███████████▏                                                                                                          | 101/1069 [01:17<12:56,  1.25it/s][A
 10%|███████████▎                                                                                                          | 102/1069 [01:17<12:22,  1.30it/s][A
 10%|███████████▎                                                                                                          | 103/1069 [01:18<12:22,  1.30it/s][A
 10%|███████████▍                                                                                                          | 104/1069 [01:19<12:28,  1.29it/s][A
 10%|███████████▌                                                                                                          | 105/1069 [01:20<12:31,  1.28it/s][A
 10%|███████████▋           

 14%|████████████████▌                                                                                                     | 150/1069 [01:54<11:24,  1.34it/s][A
 14%|████████████████▋                                                                                                     | 151/1069 [01:55<10:58,  1.39it/s][A
 14%|████████████████▊                                                                                                     | 152/1069 [01:56<11:12,  1.36it/s][A
 14%|████████████████▉                                                                                                     | 153/1069 [01:57<12:05,  1.26it/s][A
 14%|████████████████▉                                                                                                     | 154/1069 [01:58<11:42,  1.30it/s][A
 14%|█████████████████                                                                                                     | 155/1069 [01:58<11:44,  1.30it/s][A
 15%|█████████████████▏     

 19%|██████████████████████                                                                                                | 200/1069 [02:33<11:19,  1.28it/s][A
 19%|██████████████████████▏                                                                                               | 201/1069 [02:34<11:29,  1.26it/s][A
 19%|██████████████████████▎                                                                                               | 202/1069 [02:34<11:20,  1.27it/s][A
 19%|██████████████████████▍                                                                                               | 203/1069 [02:35<10:28,  1.38it/s][A
 19%|██████████████████████▌                                                                                               | 204/1069 [02:36<11:38,  1.24it/s][A
 19%|██████████████████████▋                                                                                               | 205/1069 [02:37<11:01,  1.31it/s][A
 19%|██████████████████████▋

 23%|███████████████████████████▌                                                                                          | 250/1069 [03:11<10:26,  1.31it/s][A
 23%|███████████████████████████▋                                                                                          | 251/1069 [03:11<10:58,  1.24it/s][A
 24%|███████████████████████████▊                                                                                          | 252/1069 [03:12<11:21,  1.20it/s][A
 24%|███████████████████████████▉                                                                                          | 253/1069 [03:13<11:08,  1.22it/s][A
 24%|████████████████████████████                                                                                          | 254/1069 [03:14<10:59,  1.24it/s][A
 24%|████████████████████████████▏                                                                                         | 255/1069 [03:15<11:15,  1.21it/s][A
 24%|███████████████████████

 28%|█████████████████████████████████                                                                                     | 300/1069 [03:49<10:00,  1.28it/s][A
 28%|█████████████████████████████████▏                                                                                    | 301/1069 [03:50<10:10,  1.26it/s][A
 28%|█████████████████████████████████▎                                                                                    | 302/1069 [03:51<10:09,  1.26it/s][A
 28%|█████████████████████████████████▍                                                                                    | 303/1069 [03:51<09:59,  1.28it/s][A
 28%|█████████████████████████████████▌                                                                                    | 304/1069 [03:52<09:49,  1.30it/s][A
 29%|█████████████████████████████████▋                                                                                    | 305/1069 [03:53<10:11,  1.25it/s][A
 29%|███████████████████████

 33%|██████████████████████████████████████▋                                                                               | 350/1069 [04:28<08:58,  1.34it/s][A
 33%|██████████████████████████████████████▋                                                                               | 351/1069 [04:29<09:20,  1.28it/s][A
 33%|██████████████████████████████████████▊                                                                               | 352/1069 [04:30<09:08,  1.31it/s][A
 33%|██████████████████████████████████████▉                                                                               | 353/1069 [04:31<09:21,  1.28it/s][A
 33%|███████████████████████████████████████                                                                               | 354/1069 [04:31<09:23,  1.27it/s][A
 33%|███████████████████████████████████████▏                                                                              | 355/1069 [04:32<09:22,  1.27it/s][A
 33%|███████████████████████

 37%|████████████████████████████████████████████▏                                                                         | 400/1069 [05:08<08:46,  1.27it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 401/1069 [05:09<08:54,  1.25it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 402/1069 [05:09<08:55,  1.25it/s][A
 38%|████████████████████████████████████████████▍                                                                         | 403/1069 [05:10<08:55,  1.24it/s][A
 38%|████████████████████████████████████████████▌                                                                         | 404/1069 [05:11<08:57,  1.24it/s][A
 38%|████████████████████████████████████████████▋                                                                         | 405/1069 [05:12<08:58,  1.23it/s][A
 38%|███████████████████████

 42%|█████████████████████████████████████████████████▋                                                                    | 450/1069 [05:45<07:57,  1.30it/s][A
 42%|█████████████████████████████████████████████████▊                                                                    | 451/1069 [05:46<08:00,  1.28it/s][A
 42%|█████████████████████████████████████████████████▉                                                                    | 452/1069 [05:47<08:21,  1.23it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 453/1069 [05:48<08:08,  1.26it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 454/1069 [05:49<08:10,  1.25it/s][A
 43%|██████████████████████████████████████████████████▏                                                                   | 455/1069 [05:49<07:53,  1.30it/s][A
 43%|███████████████████████

 47%|███████████████████████████████████████████████████████▏                                                              | 500/1069 [06:25<07:24,  1.28it/s][A
 47%|███████████████████████████████████████████████████████▎                                                              | 501/1069 [06:25<07:08,  1.33it/s][A
 47%|███████████████████████████████████████████████████████▍                                                              | 502/1069 [06:26<07:26,  1.27it/s][A
 47%|███████████████████████████████████████████████████████▌                                                              | 503/1069 [06:27<07:48,  1.21it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 504/1069 [06:28<07:23,  1.28it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 505/1069 [06:29<07:28,  1.26it/s][A
 47%|███████████████████████

 51%|████████████████████████████████████████████████████████████▋                                                         | 550/1069 [07:04<06:56,  1.25it/s][A
 52%|████████████████████████████████████████████████████████████▊                                                         | 551/1069 [07:05<06:49,  1.27it/s][A
 52%|████████████████████████████████████████████████████████████▉                                                         | 552/1069 [07:05<06:18,  1.37it/s][A
 52%|█████████████████████████████████████████████████████████████                                                         | 553/1069 [07:06<06:40,  1.29it/s][A
 52%|█████████████████████████████████████████████████████████████▏                                                        | 554/1069 [07:07<06:44,  1.27it/s][A
 52%|█████████████████████████████████████████████████████████████▎                                                        | 555/1069 [07:08<06:30,  1.31it/s][A
 52%|███████████████████████

 56%|██████████████████████████████████████████████████████████████████▏                                                   | 600/1069 [07:43<06:01,  1.30it/s][A
 56%|██████████████████████████████████████████████████████████████████▎                                                   | 601/1069 [07:44<06:10,  1.26it/s][A
 56%|██████████████████████████████████████████████████████████████████▍                                                   | 602/1069 [07:45<06:07,  1.27it/s][A
 56%|██████████████████████████████████████████████████████████████████▌                                                   | 603/1069 [07:46<06:09,  1.26it/s][A
 57%|██████████████████████████████████████████████████████████████████▋                                                   | 604/1069 [07:47<06:04,  1.27it/s][A
 57%|██████████████████████████████████████████████████████████████████▊                                                   | 605/1069 [07:47<05:58,  1.30it/s][A
 57%|███████████████████████

 61%|███████████████████████████████████████████████████████████████████████▋                                              | 650/1069 [08:22<05:33,  1.26it/s][A
 61%|███████████████████████████████████████████████████████████████████████▊                                              | 651/1069 [08:23<05:35,  1.25it/s][A
 61%|███████████████████████████████████████████████████████████████████████▉                                              | 652/1069 [08:24<05:40,  1.23it/s][A
 61%|████████████████████████████████████████████████████████████████████████                                              | 653/1069 [08:25<05:21,  1.29it/s][A
 61%|████████████████████████████████████████████████████████████████████████▏                                             | 654/1069 [08:26<05:41,  1.21it/s][A
 61%|████████████████████████████████████████████████████████████████████████▎                                             | 655/1069 [08:27<06:02,  1.14it/s][A
 61%|███████████████████████

 65%|█████████████████████████████████████████████████████████████████████████████▎                                        | 700/1069 [09:01<04:40,  1.32it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 701/1069 [09:02<04:41,  1.31it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 702/1069 [09:02<04:43,  1.29it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▌                                        | 703/1069 [09:03<04:20,  1.41it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▋                                        | 704/1069 [09:04<04:37,  1.32it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▊                                        | 705/1069 [09:05<04:45,  1.28it/s][A
 66%|███████████████████████

 70%|██████████████████████████████████████████████████████████████████████████████████▊                                   | 750/1069 [09:40<04:22,  1.21it/s][A
 70%|██████████████████████████████████████████████████████████████████████████████████▉                                   | 751/1069 [09:41<04:10,  1.27it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 752/1069 [09:41<04:15,  1.24it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 753/1069 [09:42<04:12,  1.25it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▏                                  | 754/1069 [09:43<04:12,  1.25it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▎                                  | 755/1069 [09:44<04:10,  1.26it/s][A
 71%|███████████████████████

 75%|████████████████████████████████████████████████████████████████████████████████████████▎                             | 800/1069 [10:19<03:29,  1.29it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▍                             | 801/1069 [10:20<03:29,  1.28it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▌                             | 802/1069 [10:20<03:27,  1.29it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 803/1069 [10:21<03:24,  1.30it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 804/1069 [10:22<03:16,  1.35it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▊                             | 805/1069 [10:22<03:06,  1.42it/s][A
 75%|███████████████████████

 80%|█████████████████████████████████████████████████████████████████████████████████████████████▊                        | 850/1069 [10:57<02:37,  1.39it/s][A
 80%|█████████████████████████████████████████████████████████████████████████████████████████████▉                        | 851/1069 [10:58<02:43,  1.34it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████                        | 852/1069 [10:59<02:52,  1.26it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▏                       | 853/1069 [11:00<02:48,  1.28it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▎                       | 854/1069 [11:01<02:52,  1.24it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▍                       | 855/1069 [11:01<02:47,  1.28it/s][A
 80%|███████████████████████

 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 900/1069 [11:36<02:02,  1.38it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▍                  | 901/1069 [11:36<02:07,  1.32it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                  | 902/1069 [11:37<02:12,  1.26it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                  | 903/1069 [11:38<02:09,  1.28it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▊                  | 904/1069 [11:39<02:15,  1.21it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▉                  | 905/1069 [11:40<02:05,  1.31it/s][A
 85%|███████████████████████

 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 950/1069 [12:14<01:33,  1.27it/s][A
 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▉             | 951/1069 [12:15<01:33,  1.26it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████             | 952/1069 [12:16<01:32,  1.27it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 953/1069 [12:16<01:26,  1.34it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 954/1069 [12:17<01:31,  1.26it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▍            | 955/1069 [12:18<01:33,  1.22it/s][A
 89%|███████████████████████

 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍       | 1000/1069 [12:53<00:53,  1.29it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▌       | 1001/1069 [12:54<00:51,  1.31it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▋       | 1002/1069 [12:54<00:51,  1.31it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▊       | 1003/1069 [12:55<00:51,  1.29it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1004/1069 [12:56<00:48,  1.33it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1005/1069 [12:57<00:53,  1.19it/s][A
 94%|███████████████████████

 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉  | 1050/1069 [13:31<00:15,  1.26it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████  | 1051/1069 [13:32<00:14,  1.27it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1052/1069 [13:33<00:12,  1.32it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1053/1069 [13:33<00:12,  1.33it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎ | 1054/1069 [13:34<00:11,  1.34it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍ | 1055/1069 [13:35<00:10,  1.34it/s][A
 99%|███████████████████████

| epoch   0 | loss  0.70



  0%|                                                                                                                                | 0/1069 [00:00<?, ?it/s][A
  0%|                                                                                                                        | 1/1069 [00:00<08:24,  2.12it/s][A
  0%|▏                                                                                                                       | 2/1069 [00:01<09:33,  1.86it/s][A
  0%|▎                                                                                                                       | 3/1069 [00:01<09:49,  1.81it/s][A
  0%|▍                                                                                                                       | 4/1069 [00:02<09:59,  1.78it/s][A
  0%|▌                                                                                                                       | 5/1069 [00:02<10:02,  1.76it/s][A
  1%|▋                     

  5%|█████▌                                                                                                                 | 50/1069 [00:36<13:53,  1.22it/s][A
  5%|█████▋                                                                                                                 | 51/1069 [00:37<13:32,  1.25it/s][A
  5%|█████▊                                                                                                                 | 52/1069 [00:37<12:30,  1.36it/s][A
  5%|█████▉                                                                                                                 | 53/1069 [00:38<12:08,  1.39it/s][A
  5%|██████                                                                                                                 | 54/1069 [00:39<12:10,  1.39it/s][A
  5%|██████                                                                                                                 | 55/1069 [00:39<12:32,  1.35it/s][A
  5%|██████▏                

  9%|███████████                                                                                                           | 100/1069 [01:14<12:14,  1.32it/s][A
  9%|███████████▏                                                                                                          | 101/1069 [01:15<12:31,  1.29it/s][A
 10%|███████████▎                                                                                                          | 102/1069 [01:16<12:32,  1.29it/s][A
 10%|███████████▎                                                                                                          | 103/1069 [01:17<12:50,  1.25it/s][A
 10%|███████████▍                                                                                                          | 104/1069 [01:17<12:56,  1.24it/s][A
 10%|███████████▌                                                                                                          | 105/1069 [01:18<13:34,  1.18it/s][A
 10%|███████████▋           

 14%|████████████████▌                                                                                                     | 150/1069 [01:53<11:35,  1.32it/s][A
 14%|████████████████▋                                                                                                     | 151/1069 [01:53<11:09,  1.37it/s][A
 14%|████████████████▊                                                                                                     | 152/1069 [01:54<10:01,  1.52it/s][A
 14%|████████████████▉                                                                                                     | 153/1069 [01:55<10:36,  1.44it/s][A
 14%|████████████████▉                                                                                                     | 154/1069 [01:56<11:15,  1.35it/s][A
 14%|█████████████████                                                                                                     | 155/1069 [01:56<11:22,  1.34it/s][A
 15%|█████████████████▏     

 19%|██████████████████████                                                                                                | 200/1069 [02:32<11:47,  1.23it/s][A
 19%|██████████████████████▏                                                                                               | 201/1069 [02:33<10:51,  1.33it/s][A
 19%|██████████████████████▎                                                                                               | 202/1069 [02:34<10:45,  1.34it/s][A
 19%|██████████████████████▍                                                                                               | 203/1069 [02:35<11:28,  1.26it/s][A
 19%|██████████████████████▌                                                                                               | 204/1069 [02:35<11:03,  1.30it/s][A
 19%|██████████████████████▋                                                                                               | 205/1069 [02:36<11:23,  1.26it/s][A
 19%|██████████████████████▋

 23%|███████████████████████████▌                                                                                          | 250/1069 [03:11<09:28,  1.44it/s][A
 23%|███████████████████████████▋                                                                                          | 251/1069 [03:12<10:21,  1.32it/s][A
 24%|███████████████████████████▊                                                                                          | 252/1069 [03:13<10:13,  1.33it/s][A
 24%|███████████████████████████▉                                                                                          | 253/1069 [03:13<08:59,  1.51it/s][A
 24%|████████████████████████████                                                                                          | 254/1069 [03:14<08:01,  1.69it/s][A
 24%|████████████████████████████▏                                                                                         | 255/1069 [03:15<09:04,  1.49it/s][A
 24%|███████████████████████

 28%|█████████████████████████████████                                                                                     | 300/1069 [03:49<09:44,  1.31it/s][A
 28%|█████████████████████████████████▏                                                                                    | 301/1069 [03:49<08:56,  1.43it/s][A
 28%|█████████████████████████████████▎                                                                                    | 302/1069 [03:50<09:28,  1.35it/s][A
 28%|█████████████████████████████████▍                                                                                    | 303/1069 [03:51<09:05,  1.41it/s][A
 28%|█████████████████████████████████▌                                                                                    | 304/1069 [03:52<09:39,  1.32it/s][A
 29%|█████████████████████████████████▋                                                                                    | 305/1069 [03:52<08:37,  1.48it/s][A
 29%|███████████████████████

 33%|██████████████████████████████████████▋                                                                               | 350/1069 [04:26<08:34,  1.40it/s][A
 33%|██████████████████████████████████████▋                                                                               | 351/1069 [04:27<09:27,  1.26it/s][A
 33%|██████████████████████████████████████▊                                                                               | 352/1069 [04:28<09:31,  1.25it/s][A
 33%|██████████████████████████████████████▉                                                                               | 353/1069 [04:29<09:28,  1.26it/s][A
 33%|███████████████████████████████████████                                                                               | 354/1069 [04:29<08:22,  1.42it/s][A
 33%|███████████████████████████████████████▏                                                                              | 355/1069 [04:30<09:13,  1.29it/s][A
 33%|███████████████████████

 37%|████████████████████████████████████████████▏                                                                         | 400/1069 [05:06<08:22,  1.33it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 401/1069 [05:06<08:50,  1.26it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 402/1069 [05:07<09:07,  1.22it/s][A
 38%|████████████████████████████████████████████▍                                                                         | 403/1069 [05:08<08:56,  1.24it/s][A
 38%|████████████████████████████████████████████▌                                                                         | 404/1069 [05:09<08:05,  1.37it/s][A
 38%|████████████████████████████████████████████▋                                                                         | 405/1069 [05:10<08:25,  1.31it/s][A
 38%|███████████████████████

 42%|█████████████████████████████████████████████████▋                                                                    | 450/1069 [05:43<07:49,  1.32it/s][A
 42%|█████████████████████████████████████████████████▊                                                                    | 451/1069 [05:44<07:44,  1.33it/s][A
 42%|█████████████████████████████████████████████████▉                                                                    | 452/1069 [05:45<07:50,  1.31it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 453/1069 [05:45<07:16,  1.41it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 454/1069 [05:46<07:46,  1.32it/s][A
 43%|██████████████████████████████████████████████████▏                                                                   | 455/1069 [05:47<08:28,  1.21it/s][A
 43%|███████████████████████

 47%|███████████████████████████████████████████████████████▏                                                              | 500/1069 [06:22<07:53,  1.20it/s][A
 47%|███████████████████████████████████████████████████████▎                                                              | 501/1069 [06:23<07:32,  1.25it/s][A
 47%|███████████████████████████████████████████████████████▍                                                              | 502/1069 [06:23<07:22,  1.28it/s][A
 47%|███████████████████████████████████████████████████████▌                                                              | 503/1069 [06:24<07:59,  1.18it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 504/1069 [06:25<07:58,  1.18it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 505/1069 [06:26<07:55,  1.19it/s][A
 47%|███████████████████████

 51%|████████████████████████████████████████████████████████████▋                                                         | 550/1069 [07:00<06:25,  1.34it/s][A
 52%|████████████████████████████████████████████████████████████▊                                                         | 551/1069 [07:01<06:44,  1.28it/s][A
 52%|████████████████████████████████████████████████████████████▉                                                         | 552/1069 [07:02<07:05,  1.22it/s][A
 52%|█████████████████████████████████████████████████████████████                                                         | 553/1069 [07:03<06:47,  1.26it/s][A
 52%|█████████████████████████████████████████████████████████████▏                                                        | 554/1069 [07:03<06:51,  1.25it/s][A
 52%|█████████████████████████████████████████████████████████████▎                                                        | 555/1069 [07:04<06:18,  1.36it/s][A
 52%|███████████████████████

 56%|██████████████████████████████████████████████████████████████████▏                                                   | 600/1069 [07:39<06:08,  1.27it/s][A
 56%|██████████████████████████████████████████████████████████████████▎                                                   | 601/1069 [07:40<05:56,  1.31it/s][A
 56%|██████████████████████████████████████████████████████████████████▍                                                   | 602/1069 [07:40<05:31,  1.41it/s][A
 56%|██████████████████████████████████████████████████████████████████▌                                                   | 603/1069 [07:41<06:16,  1.24it/s][A
 57%|██████████████████████████████████████████████████████████████████▋                                                   | 604/1069 [07:42<06:03,  1.28it/s][A
 57%|██████████████████████████████████████████████████████████████████▊                                                   | 605/1069 [07:43<05:59,  1.29it/s][A
 57%|███████████████████████

 61%|███████████████████████████████████████████████████████████████████████▋                                              | 650/1069 [08:18<05:36,  1.24it/s][A
 61%|███████████████████████████████████████████████████████████████████████▊                                              | 651/1069 [08:19<05:55,  1.17it/s][A
 61%|███████████████████████████████████████████████████████████████████████▉                                              | 652/1069 [08:20<05:47,  1.20it/s][A
 61%|████████████████████████████████████████████████████████████████████████                                              | 653/1069 [08:21<05:45,  1.20it/s][A
 61%|████████████████████████████████████████████████████████████████████████▏                                             | 654/1069 [08:21<05:33,  1.25it/s][A
 61%|████████████████████████████████████████████████████████████████████████▎                                             | 655/1069 [08:22<05:27,  1.26it/s][A
 61%|███████████████████████

 65%|█████████████████████████████████████████████████████████████████████████████▎                                        | 700/1069 [08:57<04:46,  1.29it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 701/1069 [08:58<04:18,  1.42it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▍                                        | 702/1069 [08:59<04:32,  1.35it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▌                                        | 703/1069 [09:00<04:52,  1.25it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▋                                        | 704/1069 [09:00<04:39,  1.30it/s][A
 66%|█████████████████████████████████████████████████████████████████████████████▊                                        | 705/1069 [09:01<04:57,  1.23it/s][A
 66%|███████████████████████

 70%|██████████████████████████████████████████████████████████████████████████████████▊                                   | 750/1069 [09:36<04:25,  1.20it/s][A
 70%|██████████████████████████████████████████████████████████████████████████████████▉                                   | 751/1069 [09:37<04:10,  1.27it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 752/1069 [09:38<04:07,  1.28it/s][A
 70%|███████████████████████████████████████████████████████████████████████████████████                                   | 753/1069 [09:38<03:47,  1.39it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▏                                  | 754/1069 [09:39<03:47,  1.39it/s][A
 71%|███████████████████████████████████████████████████████████████████████████████████▎                                  | 755/1069 [09:40<03:45,  1.39it/s][A
 71%|███████████████████████

 75%|████████████████████████████████████████████████████████████████████████████████████████▎                             | 800/1069 [10:13<02:51,  1.57it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▍                             | 801/1069 [10:13<02:39,  1.68it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▌                             | 802/1069 [10:14<02:42,  1.65it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 803/1069 [10:15<02:42,  1.64it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▋                             | 804/1069 [10:15<02:31,  1.75it/s][A
 75%|████████████████████████████████████████████████████████████████████████████████████████▊                             | 805/1069 [10:16<02:50,  1.55it/s][A
 75%|███████████████████████

 80%|█████████████████████████████████████████████████████████████████████████████████████████████▊                        | 850/1069 [10:51<02:43,  1.34it/s][A
 80%|█████████████████████████████████████████████████████████████████████████████████████████████▉                        | 851/1069 [10:52<02:49,  1.29it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████                        | 852/1069 [10:52<02:37,  1.38it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▏                       | 853/1069 [10:53<02:40,  1.34it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▎                       | 854/1069 [10:55<03:29,  1.02it/s][A
 80%|██████████████████████████████████████████████████████████████████████████████████████████████▍                       | 855/1069 [10:55<03:04,  1.16it/s][A
 80%|███████████████████████

 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 900/1069 [11:31<02:14,  1.25it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▍                  | 901/1069 [11:32<02:15,  1.24it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                  | 902/1069 [11:33<02:16,  1.22it/s][A
 84%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                  | 903/1069 [11:33<02:14,  1.23it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▊                  | 904/1069 [11:34<01:58,  1.39it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████▉                  | 905/1069 [11:35<02:09,  1.27it/s][A
 85%|███████████████████████

 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 950/1069 [12:10<01:36,  1.23it/s][A
 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████▉             | 951/1069 [12:11<01:32,  1.28it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████             | 952/1069 [12:11<01:25,  1.37it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 953/1069 [12:12<01:27,  1.33it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 954/1069 [12:13<01:23,  1.38it/s][A
 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▍            | 955/1069 [12:14<01:28,  1.29it/s][A
 89%|███████████████████████

 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍       | 1000/1069 [12:49<00:55,  1.23it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▌       | 1001/1069 [12:50<00:49,  1.37it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▋       | 1002/1069 [12:50<00:47,  1.40it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▊       | 1003/1069 [12:51<00:50,  1.32it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1004/1069 [12:52<00:49,  1.32it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 1005/1069 [12:53<00:49,  1.30it/s][A
 94%|███████████████████████

 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉  | 1050/1069 [13:28<00:15,  1.22it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████  | 1051/1069 [13:28<00:14,  1.25it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1052/1069 [13:29<00:12,  1.38it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1053/1069 [13:30<00:11,  1.42it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎ | 1054/1069 [13:30<00:10,  1.37it/s][A
 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍ | 1055/1069 [13:31<00:10,  1.38it/s][A
 99%|███████████████████████

| epoch   0 | loss  0.70



  0%|                                                                                                                                | 0/1069 [00:00<?, ?it/s][A
  0%|                                                                                                                        | 1/1069 [00:00<06:53,  2.58it/s][A
  0%|▏                                                                                                                       | 2/1069 [00:00<09:01,  1.97it/s][A
  0%|▎                                                                                                                       | 3/1069 [00:01<09:35,  1.85it/s][A
  0%|▍                                                                                                                       | 4/1069 [00:02<09:54,  1.79it/s][A
  0%|▌                                                                                                                       | 5/1069 [00:02<10:01,  1.77it/s][A
  1%|▋                     

  5%|█████▌                                                                                                                 | 50/1069 [00:36<13:48,  1.23it/s][A
  5%|█████▋                                                                                                                 | 51/1069 [00:37<12:37,  1.34it/s][A
  5%|█████▊                                                                                                                 | 52/1069 [00:37<13:08,  1.29it/s][A
  5%|█████▉                                                                                                                 | 53/1069 [00:38<12:47,  1.32it/s][A
  5%|██████                                                                                                                 | 54/1069 [00:39<12:54,  1.31it/s][A
  5%|██████                                                                                                                 | 55/1069 [00:40<13:42,  1.23it/s][A
  5%|██████▏                

  9%|███████████                                                                                                           | 100/1069 [01:14<12:24,  1.30it/s][A
  9%|███████████▏                                                                                                          | 101/1069 [01:15<14:13,  1.13it/s][A
 10%|███████████▎                                                                                                          | 102/1069 [01:16<12:44,  1.26it/s][A
 10%|███████████▎                                                                                                          | 103/1069 [01:16<12:31,  1.29it/s][A
 10%|███████████▍                                                                                                          | 104/1069 [01:17<12:04,  1.33it/s][A
 10%|███████████▌                                                                                                          | 105/1069 [01:18<13:13,  1.22it/s][A
 10%|███████████▋           

 14%|████████████████▌                                                                                                     | 150/1069 [01:52<10:49,  1.41it/s][A
 14%|████████████████▋                                                                                                     | 151/1069 [01:53<10:52,  1.41it/s][A
 14%|████████████████▊                                                                                                     | 152/1069 [01:53<10:18,  1.48it/s][A
 14%|████████████████▉                                                                                                     | 153/1069 [01:54<11:24,  1.34it/s][A
 14%|████████████████▉                                                                                                     | 154/1069 [01:55<11:53,  1.28it/s][A
 14%|█████████████████                                                                                                     | 155/1069 [01:56<11:48,  1.29it/s][A
 15%|█████████████████▏     

 19%|██████████████████████                                                                                                | 200/1069 [02:32<11:47,  1.23it/s][A
 19%|██████████████████████▏                                                                                               | 201/1069 [02:33<11:51,  1.22it/s][A
 19%|██████████████████████▎                                                                                               | 202/1069 [02:33<11:42,  1.23it/s][A
 19%|██████████████████████▍                                                                                               | 203/1069 [02:34<11:38,  1.24it/s][A
 19%|██████████████████████▌                                                                                               | 204/1069 [02:35<11:20,  1.27it/s][A
 19%|██████████████████████▋                                                                                               | 205/1069 [02:36<11:40,  1.23it/s][A
 19%|██████████████████████▋

 23%|███████████████████████████▌                                                                                          | 250/1069 [03:11<09:53,  1.38it/s][A
 23%|███████████████████████████▋                                                                                          | 251/1069 [03:12<09:31,  1.43it/s][A
 24%|███████████████████████████▊                                                                                          | 252/1069 [03:12<09:34,  1.42it/s][A
 24%|███████████████████████████▉                                                                                          | 253/1069 [03:13<09:49,  1.38it/s][A
 24%|████████████████████████████                                                                                          | 254/1069 [03:14<10:15,  1.32it/s][A
 24%|████████████████████████████▏                                                                                         | 255/1069 [03:15<10:12,  1.33it/s][A
 24%|███████████████████████

 28%|█████████████████████████████████                                                                                     | 300/1069 [03:48<09:24,  1.36it/s][A
 28%|█████████████████████████████████▏                                                                                    | 301/1069 [03:49<09:10,  1.40it/s][A
 28%|█████████████████████████████████▎                                                                                    | 302/1069 [03:50<09:30,  1.35it/s][A
 28%|█████████████████████████████████▍                                                                                    | 303/1069 [03:51<08:47,  1.45it/s][A
 28%|█████████████████████████████████▌                                                                                    | 304/1069 [03:51<09:33,  1.33it/s][A
 29%|█████████████████████████████████▋                                                                                    | 305/1069 [03:52<09:45,  1.31it/s][A
 29%|███████████████████████

 33%|██████████████████████████████████████▋                                                                               | 350/1069 [04:27<09:36,  1.25it/s][A
 33%|██████████████████████████████████████▋                                                                               | 351/1069 [04:28<09:33,  1.25it/s][A
 33%|██████████████████████████████████████▊                                                                               | 352/1069 [04:28<08:41,  1.37it/s][A
 33%|██████████████████████████████████████▉                                                                               | 353/1069 [04:29<09:19,  1.28it/s][A
 33%|███████████████████████████████████████                                                                               | 354/1069 [04:30<09:34,  1.24it/s][A
 33%|███████████████████████████████████████▏                                                                              | 355/1069 [04:31<09:29,  1.25it/s][A
 33%|███████████████████████

 37%|████████████████████████████████████████████▏                                                                         | 400/1069 [05:06<08:45,  1.27it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 401/1069 [05:07<07:50,  1.42it/s][A
 38%|████████████████████████████████████████████▎                                                                         | 402/1069 [05:07<07:45,  1.43it/s][A
 38%|████████████████████████████████████████████▍                                                                         | 403/1069 [05:08<08:32,  1.30it/s][A
 38%|████████████████████████████████████████████▌                                                                         | 404/1069 [05:09<08:40,  1.28it/s][A
 38%|████████████████████████████████████████████▋                                                                         | 405/1069 [05:10<08:39,  1.28it/s][A
 38%|███████████████████████

 42%|█████████████████████████████████████████████████▋                                                                    | 450/1069 [05:45<08:10,  1.26it/s][A
 42%|█████████████████████████████████████████████████▊                                                                    | 451/1069 [05:46<08:35,  1.20it/s][A
 42%|█████████████████████████████████████████████████▉                                                                    | 452/1069 [05:47<08:11,  1.25it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 453/1069 [05:48<08:11,  1.25it/s][A
 42%|██████████████████████████████████████████████████                                                                    | 454/1069 [05:48<08:13,  1.25it/s][A
 43%|██████████████████████████████████████████████████▏                                                                   | 455/1069 [05:49<08:04,  1.27it/s][A
 43%|███████████████████████

 47%|███████████████████████████████████████████████████████▏                                                              | 500/1069 [06:25<07:44,  1.23it/s][A
 47%|███████████████████████████████████████████████████████▎                                                              | 501/1069 [06:25<06:39,  1.42it/s][A
 47%|███████████████████████████████████████████████████████▍                                                              | 502/1069 [06:26<07:21,  1.28it/s][A
 47%|███████████████████████████████████████████████████████▌                                                              | 503/1069 [06:27<07:31,  1.25it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 504/1069 [06:28<07:25,  1.27it/s][A
 47%|███████████████████████████████████████████████████████▋                                                              | 505/1069 [06:28<07:38,  1.23it/s][A
 47%|███████████████████████

 51%|████████████████████████████████████████████████████████████▋                                                         | 550/1069 [07:04<06:44,  1.28it/s][A
 52%|████████████████████████████████████████████████████████████▊                                                         | 551/1069 [07:05<06:54,  1.25it/s][A
 52%|████████████████████████████████████████████████████████████▉                                                         | 552/1069 [07:05<06:01,  1.43it/s][A
 52%|█████████████████████████████████████████████████████████████                                                         | 553/1069 [07:06<06:29,  1.32it/s][A
 52%|█████████████████████████████████████████████████████████████▏                                                        | 554/1069 [07:07<06:40,  1.28it/s][A
 52%|█████████████████████████████████████████████████████████████▎                                                        | 555/1069 [07:08<06:24,  1.34it/s][A
 52%|███████████████████████

In [None]:
val_loss, acc, f1 = evaluate(model, valid_dataloader, criterion)

In [None]:
wandb.summary['val_loss'] = val_loss
wandb.summary['val_acc'] = acc
wandb.summary['val_f1'] = f1

In [None]:
print(val_loss, acc, f1)

In [None]:
inputs = tokenizer("Hello, my dog is cute", return_tensors="pt").to(device)

with torch.no_grad():
    logits = model(**inputs).logits

print(torch.sigmoiod(logits))
predicted_class_id = logits.argmax().item()
print(predicted_class_id)

In [None]:
model.push_to_hub("sugam11/gpt2-rlhf-reward")

In [None]:
wandb.finish()