In [1]:
import sys
sys.path.append("/work/multi_doc_analyzer")
sys.path.append("/work/relation_extraction/Bert_model/baseline/data/")

import torch as T
import numpy as np
import torch.nn as nn
import torch.optim as optim
import torch.cuda
from allennlp.nn import util as nn_util
from multi_doc_analyzer.structure.structure import *
from multi_doc_analyzer.tokenization.tokenizer import MDATokenizer
from tqdm import tqdm

from allennlp.data.dataset_readers import DatasetReader
from allennlp.data.tokenizers import Token
from allennlp.data.token_indexers import TokenIndexer

from allennlp.data.instance import Instance
from allennlp.data.fields import TextField, LabelField, ArrayField

from ace05_set_reader import ACE05Reader

from allennlp.data.vocabulary import Vocabulary
from allennlp.data.iterators import BucketIterator, DataIterator, BasicIterator
from allennlp.nn.util import get_text_field_mask
from allennlp.models import Model
from allennlp.modules.text_field_embedders import TextFieldEmbedder
import random

from allennlp.data.token_indexers import PretrainedBertIndexer
from allennlp.modules.text_field_embedders import BasicTextFieldEmbedder
from allennlp.modules.token_embedders.bert_token_embedder import PretrainedBertEmbedder

from sklearn.metrics import precision_recall_fscore_support as prs
from sklearn.metrics import confusion_matrix
import matplotlib.pyplot as plt
import csv



In [2]:
train_path = "/work/LDC2006T06/dataset/train/"
test_path = "/work/LDC2006T06/dataset/test/"
model_folder = "/work/model_checkpoint/bert_model_checkpoint/bert_modify_seq/"
output_path = "/work/relation_extraction/Bert_model/bert_modify_seq/analysis/"

In [3]:
class Config(dict):
    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        for k, v in kwargs.items():
            setattr(self, k, v)
    
    def set(self, key, val):
        self[key] = val
        setattr(self, key, val)
        
config = Config(
    seed=1,
    batch_size=64,
    lr=3e-4,                # learning rate
    epochs=50,
    mlp_hidden_sz=300,
    lstm_hidden_sz=768,
    arg_sz=10,              # position embedding size
    max_seq_len=100
)

In [4]:
USE_GPU = T.cuda.is_available()
USE_GPU

True

In [5]:
# set seed for both CPU and CUDA
T.manual_seed(config.seed)

<torch._C.Generator at 0x7f595ecd47b0>

In [6]:
e_type2idx = {'X':0, 'O': 1, 'PER': 2, 'ORG': 3, 'LOC': 4, 'GPE': 5, 'FAC': 6, 'VEH': 7, 'WEA': 8}

r_label2idx = {'PHYS-lr': 1, 'PART-WHOLE-lr': 2, 'PER-SOC-lr': 3, 'ORG-AFF-lr': 4, 'ART-lr': 5, 'GEN-AFF-lr': 6,
               'PHYS-rl': 7, 'PART-WHOLE-rl': 8, 'PER-SOC-rl': 9, 'ORG-AFF-rl': 10, 'ART-rl': 11, 'GEN-AFF-rl': 12,
               'NONE': 0}

# r_label2idx = {'PHYS': 1, 'PART-WHOLE': 2, 'PER-SOC': 3, 'ORG-AFF': 4, 'ART': 5, 'GEN-AFF': 6, 'NONE': 0}

r_idx2label = {v: k for k, v in r_label2idx.items()}

class RelationDatasetReader(DatasetReader):
    """
    Reads Structure object formatted datasets files, and creates AllenNLP instances.
    """
    def __init__(self, token_indexers: Dict[str, TokenIndexer]=None, 
                 MAX_WORDPIECES: int=config.max_seq_len, 
                 is_training = False, ace05_reader: ACE05Reader=None):
        # make sure results may be reproduced when sampling...
        super().__init__(lazy=False)
        random.seed(0)
        self.is_training = is_training
        self.ace05_reader = ace05_reader
        
        # NOTE AllenNLP automatically adds [CLS] and [SEP] word peices in the begining and end of the context,
        # therefore we need to subtract 2
        self.MAX_WORDPIECES = MAX_WORDPIECES - 2
        
        # BERT specific init
        self._token_indexers = token_indexers

    def text_to_instance(self, sentence: Sentence) -> Instance:

        e_tuple_check_dicts = {} # {(train_arg_l.id, train_arg_r.id):true_label, ...}
        if self.is_training: 
            for r in sentence.relation_mentions:
                train_arg_l, train_arg_r, true_label = r.get_left_right_args()
                e_tuple_check_dicts[(train_arg_l.id, train_arg_r.id)] = true_label

        # construct pair entities
        for arg1_idx in range(len(sentence.entity_mentions)-1):
            for arg2_idx in range(arg1_idx+1, len(sentence.entity_mentions)):
                field = {}
                sentence_tokens = []
    
                arg1 = sentence.entity_mentions[arg1_idx]
                arg2 = sentence.entity_mentions[arg2_idx]
                
                # dicide which is on the left and redefine
                if arg1.char_b >= arg2.char_b:
                    entity_l = arg2
                    entity_r = arg1
                else:
                    entity_l = arg1
                    entity_r = arg2                    
                
                # in order to save our two entities which may be splited
                ent = [[] for i in range(2)]             # index 0 : 0 for ent_l, 1 for ent_r
                
                # create our manual form of seq
                for i,t in enumerate(sentence.tokens):
                    if i >= entity_l.token_b and i < entity_l.token_e:
                        ent[0].append(t.text)
                        sentence_tokens.append(Token(text="[unused" + str(e_type2idx[entity_l.type]) + "]"))
                    elif i >= entity_r.token_b and i < entity_r.token_e:
                        ent[1].append(t.text)
                        sentence_tokens.append(Token(text="[unused" + str(e_type2idx[entity_r.type]) + "]"))
                    else:
                        sentence_tokens.append(Token(text=t.text))
                sentence_tokens.append(Token(text="[SEP]"))
                for i in range(len(ent[0])):
                    sentence_tokens.append(Token(text=ent[0][i]))
                sentence_tokens.append(Token(text="[SEP]"))
                for i in range(len(ent[1])):
                    sentence_tokens.append(Token(text=ent[1][i]))
                
                sentence_field = TextField(sentence_tokens, self._token_indexers)
                fields = {"tokens": sentence_field}

                arg_vec = T.tensor([[0, 0] for i in range(len(sentence.tokens) + 2)], dtype=T.long)   # long type to feed into embedding layer
                
                # +1 because the first token is [CLS]
                pos = lambda t, b, e: 0 if t >= b and t < e else ( (b-t) if t < b else (t-e+1) ) 
                for i in range(len(sentence.tokens) + 2):
                    arg_vec[i][0] = pos(i-1, entity_l.token_b, entity_l.token_e)    # arg_l position, i-1 for [CLS]
                    arg_vec[i][1] = pos(i-1, entity_r.token_b, entity_r.token_e)    # arg_r position, i-1 for [CLS]
                fields["arg_idx"] = ArrayField(arg_vec)
    
                # relation
                if self.is_training:
                    if (entity_l.id, entity_r.id) in e_tuple_check_dicts.keys():
                        fields["label"] = LabelField(r_label2idx[e_tuple_check_dicts[(entity_l.id, entity_r.id)]], skip_indexing=True)
                    else:
                        fields["label"] = LabelField(r_label2idx['NONE'], skip_indexing=True)
                yield Instance(fields)
    
    def _read(self, file_path: str)->Iterator: 
        doc_dicts = self.ace05_reader.read(file_path)
        tokenizer = MDATokenizer('bert-en')
        for doc in doc_dicts.values():
            tokenizer.annotate_document(doc)
            for s in doc.sentences: 
                if len(s.tokens) <= config.max_seq_len - 2:
                    for instance in self.text_to_instance(s):
                        yield instance

In [7]:
# ace05_reader = ACE05Reader(lang='en')

# token_indexer = PretrainedBertIndexer(
#     pretrained_model="bert-base-uncased",
# #         max_pieces=config.max_seq_len,
# #         do_lowercase=False               # for cased condition
# )

# # AllenNLP DatasetReader
# reader = RelationDatasetReader(
#     is_training=True, 
#     ace05_reader=ace05_reader, 
#     tokenizer=lambda s: token_indexer.wordpiece_tokenizer(s),
#     token_indexers={"tokens": token_indexer}
# )

# train_ds = reader.read(train_path)

In [8]:
class BERT(Model):
    def __init__(self, word_embeddings: TextFieldEmbedder,
                out_sz: int=len(r_label2idx)):
        super().__init__(vocab)
        self.word_embeddings = word_embeddings
        self._position_embeddings = T.nn.Embedding(num_embeddings=(config.max_seq_len), embedding_dim=config.arg_sz, padding_idx=99)
        
        # bert output is of dimension 768
        self.lstm = T.nn.LSTM(input_size=768 + 2*config.arg_sz, hidden_size=768, batch_first=True, bidirectional=True)
        self.projection1 = nn.Linear(config.lstm_hidden_sz * 2, config.mlp_hidden_sz)
        self.projection2 = nn.Linear(config.mlp_hidden_sz, out_sz)
        self.loss = nn.CrossEntropyLoss()
        
    def forward(self, tokens: Dict[str, T.tensor], arg_idx: T.tensor, label: T.tensor = None) -> Dict[str, T.tensor]:
        mask = get_text_field_mask(tokens)
#         print(tokens)
        print(arg_idx[0])
        embeddings = self.word_embeddings(tokens)
#         print(embeddings.shape)
        arg_idx = arg_idx.type(T.long)
        
#         cut_len = 0
#         for i in range(len(arg_idx)):
#             for j in range(len(arg_idx[i])-1, -1, -1):
#                 if arg_idx[i][j][0] != config.max_seq_len-1 or arg_idx[i][j][1] != config.max_seq_len-1:
#                     pad_len = j+1
# #                     print(pad_len, arg_idx[i][j][0], arg_idx[i][j][1])
#                     break
#             if pad_len > cut_len:
#                 cut_len = pad_len

#         print(cut_len)
        cut_len = max(len(arg_idx[i]) for i in range(len(arg_idx)))    # for epoch = 1
        
        embeddings = embeddings[:,:cut_len,:]
#         arg_idx = arg_idx[:,:cut_len,:]
#         print(arg_idx)
#         print(embeddings.shape)
        arg_emb = self._position_embeddings(arg_idx)
        arg_cat = T.cat((arg_emb[:,:,0,:], arg_emb[:,:,1,:]), -1)
#         print(arg_emb)
#         print(arg_cat)
        concat = T.cat((embeddings, arg_cat), -1)
#         print(concat)
        ot, hs = self.lstm(concat)
        
        mlp_hs = self.projection1(ot[:, -1, :])
#         print(mlp_hs)
        class_logits = self.projection2(mlp_hs)
#         print(label)
        output = {"class_logits": class_logits}
        output["loss"] = self.loss(class_logits, label)

        return output

In [9]:
from scipy.special import expit # the sigmoid function
def tonp(tsr): return tsr.detach().cpu().numpy()

In [10]:
# Predict
class Predictor:
    def __init__(self, model: Model, iterator: DataIterator,
                 cuda_device: int=-1) -> None:
        self.model = model
        self.iterator = iterator
        self.cuda_device = cuda_device
        
    def _extract_data(self, batch) -> np.ndarray:
        out_dict = self.model(**batch)
        return expit(tonp(out_dict["class_logits"]))
    
    def predict(self, ds: Iterable[Instance]) -> np.ndarray:
        pred_generator = self.iterator(ds, num_epochs=1, shuffle=False)
        self.model.eval()
        pred_generator_tqdm = tqdm(pred_generator, total=self.iterator.get_num_batches(ds))
        preds = []
        with T.no_grad():
            for batch in pred_generator_tqdm:
                batch = nn_util.move_to_device(batch, self.cuda_device)
                preds.append(self._extract_data(batch))
        return np.concatenate(preds, axis=0)

In [11]:
def plot_comfusion_matrix(label_classes, predict_classes, out_folder, file_name):
    label_types = list(r_idx2label.values())

    cm = confusion_matrix(label_classes, predict_classes, label_types)
    print(cm)
    fig = plt.figure()
    ax = fig.add_subplot(111)
    cax = ax.matshow(cm)
    for (i, j), z in np.ndenumerate(cm):
        ax.text(j, i, '{:0.0f}'.format(z), ha='center', va='center', color='white')
    fig.colorbar(cax)
    ax.set_xticklabels([''] + label_types)
    ax.set_yticklabels([''] + label_types)
    plt.xlabel('Predicted')
    plt.ylabel('True')

    plt.savefig(out_folder + 'confusion_matrix_' + file_name + '.png')
    plt.show()
    
    # remove the data which is none or predict none
    
    pre, recall, f1, sup = prs(label_classes, predict_classes, average='macro')
    
    print("Accuracy:", sum(cm[i][i] for i in range(len(cm))) / len(label_classes))
    print("Precision:", pre)
    print("Recall:", recall)
    print("F1 score:", f1)

In [12]:
def err_analyze(ds, true, pred, opt):
    
    # classify different kinds of error
    detail = [[[] for j in range(len(r_label2idx))] for i in range(len(r_label2idx))]
    for i in range(len(ds)):
         if true[i] != pred[i]:
            detail[r_label2idx[true[i]]][r_label2idx[pred[i]]].append(i)
    
    # print into a csv file
    with open(output_path + "error_detail_" + opt + ".csv", "w", newline='') as f:
        writer = csv.writer(f)
        writer.writerow(["Sentence", "Two_Entity", "Predict", "Label", "idx"])
        for j in range(len(detail)):
            for k in range(len(detail)):
                with_element = 0
                if k == j:
                    continue
                for i in detail[j][k]:
                    with_element = 1
                    ent1 = []
                    ent2 = []
                    for g in range(len(vars(ds[i].fields['arg_idx'])['array'])):
                        if int(vars(ds[i].fields['arg_idx'])['array'][g][0]) == config.max_seq_len or int(vars(ds[i].fields['arg_idx'])['array'][g][1]) == config.max_seq_len:
                            if int(vars(ds[i].fields['arg_idx'])['array'][g][0]) == config.max_seq_len:
                                ent1.append(vars(ds[i].fields['tokens'])['tokens'][g-1])
                            else:
                                ent2.append(vars(ds[i].fields['tokens'])['tokens'][g-1])
    
                    tostr = lambda a: [str(a[i]) for i in range(len(a))] 
                    writer.writerow([" ".join(tostr(vars(ds[i].fields['tokens'])['tokens'])), [ent1, ent2], pred[i], true[i], i])
                if with_element == 1:
                    writer.writerow("")

In [13]:

if __name__ == '__main__':

    ace05_reader = ACE05Reader(lang='en')
    
    token_indexer = PretrainedBertIndexer(
        pretrained_model="bert-base-uncased",
#         do_lowercase=False               # for cased condition
    )
 
	# AllenNLP DatasetReader
    reader = RelationDatasetReader(
        is_training=True, 
        ace05_reader=ace05_reader, 
        token_indexers={"tokens": token_indexer}
    )

    train_ds = reader.read(train_path)
    print(len(train_ds))
#     for e in range(20):
#         print(len(vars(train_ds[e].fields['tokens'])['tokens']))
#         print(vars(train_ds[e].fields['tokens']))
#         print(len(vars(train_ds[0].fields['arg_idx'])['array']))
#         print(vars(train_ds[e].fields['arg_idx']))
#         print(vars(train_ds[e].fields['label']))
    
    # user-defined new label
#     new_token = {"bert-pretrained": ["[" + i +"]" for i in e_type2idx.keys()]}
#     print(type(new_token["tokens"]))
#     vocab = Vocabulary(tokens_to_add=new_token)
    vocab = Vocabulary()
#     print(vocab.get_index_to_token_vocabulary(namespace="token"))
#     print(type(vocab))
    iterator = BucketIterator(batch_size=config.batch_size, sorting_keys=[("tokens", "num_tokens")])
    iterator.index_with(vocab)

    bert_embedder = PretrainedBertEmbedder(
        pretrained_model="bert-base-uncased",
        top_layer_only=True, # conserve memory   
    )
    
#     bert_embedder.vocab={"[per]":500000 , "[org]": 60000000}
    
    word_embeddings: TextFieldEmbedder = BasicTextFieldEmbedder({"tokens": bert_embedder},
                                                                # we'll be ignoring masks so we'll need to set this to True
                                                               allow_unmatched_keys = True)
#     print(vocab.by_name("default"))
#     print(token_indexer.tokens_to_indices([Token(text="[unused100]")], vocab, "test"))
#     print(vocab.get_index_to_token_vocabulary(namespace="bert"))
    model = BERT(word_embeddings)
    if USE_GPU:
        model.cuda()

    optimizer = optim.Adam(model.parameters(), lr=config.lr)

0it [00:00, ?it/s]
  0%|          | 0/351 [00:00<?, ?it/s][A
  3%|▎         | 12/351 [00:00<00:03, 111.15it/s][A
  8%|▊         | 27/351 [00:00<00:02, 119.59it/s][A
 11%|█         | 39/351 [00:00<00:02, 118.15it/s][A
 15%|█▌        | 53/351 [00:00<00:02, 121.59it/s][A
 19%|█▊        | 65/351 [00:00<00:02, 117.80it/s][A
 23%|██▎       | 81/351 [00:00<00:02, 122.38it/s][A
 28%|██▊       | 97/351 [00:00<00:01, 127.11it/s][A
 31%|███▏      | 110/351 [00:00<00:01, 125.62it/s][A
 35%|███▌      | 123/351 [00:00<00:01, 126.73it/s][A
 39%|███▊      | 136/351 [00:01<00:01, 114.31it/s][A
 44%|████▍     | 155/351 [00:01<00:01, 129.01it/s][A
 48%|████▊     | 169/351 [00:01<00:01, 119.96it/s][A
 52%|█████▏    | 182/351 [00:01<00:01, 119.85it/s][A
 57%|█████▋    | 199/351 [00:01<00:01, 131.38it/s][A
 61%|██████    | 213/351 [00:02<00:02, 57.56it/s] [A
 64%|██████▍   | 224/351 [00:02<00:02, 62.90it/s][A
 67%|██████▋   | 234/351 [00:02<00:01, 62.57it/s][A
 71%|███████   | 248/351 [00:

ORG-AFF
FBI
FBI
error! relation argument positions error!
ORG-AFF
Department
Department
error! relation argument positions error!
ORG-AFF
CIA
CIA
error! relation argument positions error!


65310it [01:48, 599.83it/s] 


65310


In [14]:
    # training
    from allennlp.training.trainer import Trainer

    trainer = Trainer(
        model=model,
        optimizer=optimizer,
        iterator=iterator,
        train_dataset=train_ds,
        cuda_device=0 if USE_GPU else -1,
        num_epochs=config.epochs,
    )

In [15]:
    # train the model 
    metrics = trainer.train()

loss: 2.6634 ||:   0%|          | 1/1021 [00:24<6:56:20, 24.49s/it]

tensor([[ 6., 28.],
        [ 5., 27.],
        [ 4., 26.],
        [ 3., 25.],
        [ 2., 24.],
        [ 1., 23.],
        [ 0., 22.],
        [ 1., 21.],
        [ 2., 20.],
        [ 3., 19.],
        [ 4., 18.],
        [ 5., 17.],
        [ 6., 16.],
        [ 7., 15.],
        [ 8., 14.],
        [ 9., 13.],
        [10., 12.],
        [11., 11.],
        [12., 10.],
        [13.,  9.],
        [14.,  8.],
        [15.,  7.],
        [16.,  6.],
        [17.,  5.],
        [18.,  4.],
        [19.,  3.],
        [20.,  2.],
        [21.,  1.],
        [22.,  0.],
        [23.,  1.],
        [24.,  2.],
        [25.,  3.],
        [26.,  4.],
        [27.,  5.],
        [28.,  6.],
        [29.,  7.],
        [30.,  8.],
        [31.,  9.],
        [32., 10.],
        [33., 11.],
        [34., 12.],
        [35., 13.],
        [36., 14.],
        [37., 15.],
        [38., 16.],
        [39., 17.],
        [40., 18.],
        [41., 19.],
        [42., 20.],
        [ 0.,  0.],


loss: 2.3488 ||:   0%|          | 3/1021 [00:24<3:24:40, 12.06s/it]

tensor([[26., 40.],
        [25., 39.],
        [24., 38.],
        [23., 37.],
        [22., 36.],
        [21., 35.],
        [20., 34.],
        [19., 33.],
        [18., 32.],
        [17., 31.],
        [16., 30.],
        [15., 29.],
        [14., 28.],
        [13., 27.],
        [12., 26.],
        [11., 25.],
        [10., 24.],
        [ 9., 23.],
        [ 8., 22.],
        [ 7., 21.],
        [ 6., 20.],
        [ 5., 19.],
        [ 4., 18.],
        [ 3., 17.],
        [ 2., 16.],
        [ 1., 15.],
        [ 0., 14.],
        [ 1., 13.],
        [ 2., 12.],
        [ 3., 11.],
        [ 4., 10.],
        [ 5.,  9.],
        [ 6.,  8.],
        [ 7.,  7.],
        [ 8.,  6.],
        [ 9.,  5.],
        [10.,  4.],
        [11.,  3.],
        [12.,  2.],
        [13.,  1.],
        [14.,  0.],
        [15.,  1.],
        [16.,  2.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]],

loss: 1.9280 ||:   0%|          | 5/1021 [00:24<1:41:09,  5.97s/it]

tensor([[13., 16.],
        [12., 15.],
        [11., 14.],
        [10., 13.],
        [ 9., 12.],
        [ 8., 11.],
        [ 7., 10.],
        [ 6.,  9.],
        [ 5.,  8.],
        [ 4.,  7.],
        [ 3.,  6.],
        [ 2.,  5.],
        [ 1.,  4.],
        [ 0.,  3.],
        [ 1.,  2.],
        [ 2.,  1.],
        [ 3.,  0.],
        [ 4.,  1.],
        [ 5.,  2.],
        [ 6.,  3.],
        [ 7.,  4.],
        [ 8.,  5.],
        [ 9.,  6.],
        [10.,  7.],
        [11.,  8.],
        [12.,  9.],
        [13., 10.],
        [14., 11.],
        [15., 12.],
        [16., 13.],
        [17., 14.],
        [18., 15.],
        [19., 16.],
        [20., 17.],
        [21., 18.],
        [22., 19.],
        [23., 20.],
        [24., 21.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[23., 32.],
        [22., 31.],
        [21., 30.],
        [20., 29.],
        [19., 28.],
        [18., 27.],
  

loss: 1.3692 ||:   1%|          | 8/1021 [00:25<50:21,  2.98s/it]  

tensor([[ 3., 12.],
        [ 2., 11.],
        [ 1., 10.],
        [ 0.,  9.],
        [ 1.,  8.],
        [ 2.,  7.],
        [ 3.,  6.],
        [ 4.,  5.],
        [ 5.,  4.],
        [ 6.,  3.],
        [ 7.,  2.],
        [ 8.,  1.],
        [ 9.,  0.],
        [10.,  1.],
        [11.,  2.],
        [12.,  3.],
        [13.,  4.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[11., 30.],
        [10., 29.],
        [ 9., 28.],
        [ 8., 27.],
        [ 7., 26.],
        [ 6., 25.],
        [ 5., 24.],
        [ 4., 23.],
        [ 3., 22.],
        [ 2., 21.],
        [ 1., 20.],
        [ 0., 19.],
        [ 1., 18.],
        [ 2., 17.],
        [ 3., 16.],
        [ 4., 15.],
        [ 5., 14.],
        [ 6., 13.],
        [ 7., 12.],
        [ 8., 11.],
        [ 9., 10.],
        [10.,  9.],
        [11.,  8.],
        [12.,  7.],
        [13.,  6.],
        [14.,  5.],
        [15.,  4.],
        [16.,  3.],
        [17.,  2.],
        [18.,  1.],
  

loss: 1.2439 ||:   1%|          | 9/1021 [00:25<36:33,  2.17s/it]

tensor([[ 2.,  3.],
        [ 1.,  2.],
        [ 0.,  1.],
        [ 1.,  0.],
        [ 2.,  1.],
        [ 3.,  2.],
        [ 4.,  3.],
        [ 5.,  4.],
        [ 6.,  5.],
        [ 7.,  6.],
        [ 8.,  7.],
        [ 9.,  8.],
        [10.,  9.],
        [11., 10.],
        [12., 11.],
        [13., 12.],
        [14., 13.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[50., 55.],
        [49., 54.],
        [48., 53.],
        [47., 52.],
        [46., 51.],
        [45., 50.],
        [44., 49.],
        [43., 48.],
        [42., 47.],
        [41., 46.],
        [40., 45.],
        [39., 44.],
        [38., 43.],
        [37., 42.],
        [36., 41.],
        [35., 40.],
        [34., 39.],
        [33., 38.],
        [32., 37.],
        [31., 36.],
        [30., 35.],
        [29., 34.],
        [28., 33.],
        [27., 32.],
        [26., 31.],
        [25., 30.],
        [24., 29.],
        [23., 28.],
        [22., 27.],
        [21., 26.],
  

loss: 1.1651 ||:   1%|          | 12/1021 [00:25<18:50,  1.12s/it]

tensor([[ 1., 14.],
        [ 0., 13.],
        [ 1., 12.],
        [ 2., 11.],
        [ 3., 10.],
        [ 4.,  9.],
        [ 5.,  8.],
        [ 6.,  7.],
        [ 7.,  6.],
        [ 8.,  5.],
        [ 9.,  4.],
        [10.,  3.],
        [11.,  2.],
        [12.,  1.],
        [13.,  0.],
        [14.,  1.],
        [15.,  2.],
        [16.,  3.],
        [17.,  4.],
        [18.,  5.],
        [19.,  6.],
        [20.,  7.],
        [21.,  8.],
        [22.,  9.],
        [23., 10.],
        [24., 11.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[31., 42.],
        [30., 41.],
        [29., 40.],
        [28., 39.],
        [27., 38.],
        [26., 37.],
        [25., 36.],
        [24., 35.],
        [23., 34.],
        [22., 33.],
        [21., 32.],
        [20., 31.],
        [19., 30.],
        [18., 29.],
        [17., 28.],
        [16., 27.],
        [15., 26.],
        [14., 25.],
        [13., 24.],
  

loss: 1.0472 ||:   1%|▏         | 14/1021 [00:26<10:41,  1.57it/s]

tensor([[43., 55.],
        [42., 54.],
        [41., 53.],
        [40., 52.],
        [39., 51.],
        [38., 50.],
        [37., 49.],
        [36., 48.],
        [35., 47.],
        [34., 46.],
        [33., 45.],
        [32., 44.],
        [31., 43.],
        [30., 42.],
        [29., 41.],
        [28., 40.],
        [27., 39.],
        [26., 38.],
        [25., 37.],
        [24., 36.],
        [23., 35.],
        [22., 34.],
        [21., 33.],
        [20., 32.],
        [19., 31.],
        [18., 30.],
        [17., 29.],
        [16., 28.],
        [15., 27.],
        [14., 26.],
        [13., 25.],
        [12., 24.],
        [11., 23.],
        [10., 22.],
        [ 9., 21.],
        [ 8., 20.],
        [ 7., 19.],
        [ 6., 18.],
        [ 5., 17.],
        [ 4., 16.],
        [ 3., 15.],
        [ 2., 14.],
        [ 1., 13.],
        [ 0., 12.],
        [ 1., 11.],
        [ 2., 10.],
        [ 3.,  9.],
        [ 4.,  8.],
        [ 5.,  7.],
        [ 6.,  6.],


loss: 1.0690 ||:   2%|▏         | 16/1021 [00:26<08:03,  2.08it/s]

tensor([[ 7., 34.],
        [ 6., 33.],
        [ 5., 32.],
        [ 4., 31.],
        [ 3., 30.],
        [ 2., 29.],
        [ 1., 28.],
        [ 0., 27.],
        [ 1., 26.],
        [ 2., 25.],
        [ 3., 24.],
        [ 4., 23.],
        [ 5., 22.],
        [ 6., 21.],
        [ 7., 20.],
        [ 8., 19.],
        [ 9., 18.],
        [10., 17.],
        [11., 16.],
        [12., 15.],
        [13., 14.],
        [14., 13.],
        [15., 12.],
        [16., 11.],
        [17., 10.],
        [18.,  9.],
        [19.,  8.],
        [20.,  7.],
        [21.,  6.],
        [22.,  5.],
        [23.,  4.],
        [24.,  3.],
        [25.,  2.],
        [26.,  1.],
        [27.,  0.],
        [28.,  1.],
        [29.,  2.],
        [30.,  3.],
        [31.,  4.],
        [32.,  5.],
        [33.,  6.],
        [34.,  7.],
        [35.,  8.],
        [36.,  9.],
        [37., 10.],
        [38., 11.],
        [39., 12.],
        [40., 13.],
        [ 0.,  0.],
        [ 0.,  0.],


loss: 1.0192 ||:   2%|▏         | 17/1021 [00:26<06:27,  2.59it/s]

tensor([[55., 64.],
        [54., 63.],
        [53., 62.],
        [52., 61.],
        [51., 60.],
        [50., 59.],
        [49., 58.],
        [48., 57.],
        [47., 56.],
        [46., 55.],
        [45., 54.],
        [44., 53.],
        [43., 52.],
        [42., 51.],
        [41., 50.],
        [40., 49.],
        [39., 48.],
        [38., 47.],
        [37., 46.],
        [36., 45.],
        [35., 44.],
        [34., 43.],
        [33., 42.],
        [32., 41.],
        [31., 40.],
        [30., 39.],
        [29., 38.],
        [28., 37.],
        [27., 36.],
        [26., 35.],
        [25., 34.],
        [24., 33.],
        [23., 32.],
        [22., 31.],
        [21., 30.],
        [20., 29.],
        [19., 28.],
        [18., 27.],
        [17., 26.],
        [16., 25.],
        [15., 24.],
        [14., 23.],
        [13., 22.],
        [12., 21.],
        [11., 20.],
        [10., 19.],
        [ 9., 18.],
        [ 8., 17.],
        [ 7., 16.],
        [ 6., 15.],


loss: 0.9338 ||:   2%|▏         | 19/1021 [00:27<05:14,  3.18it/s]

tensor([[37., 52.],
        [36., 51.],
        [35., 50.],
        [34., 49.],
        [33., 48.],
        [32., 47.],
        [31., 46.],
        [30., 45.],
        [29., 44.],
        [28., 43.],
        [27., 42.],
        [26., 41.],
        [25., 40.],
        [24., 39.],
        [23., 38.],
        [22., 37.],
        [21., 36.],
        [20., 35.],
        [19., 34.],
        [18., 33.],
        [17., 32.],
        [16., 31.],
        [15., 30.],
        [14., 29.],
        [13., 28.],
        [12., 27.],
        [11., 26.],
        [10., 25.],
        [ 9., 24.],
        [ 8., 23.],
        [ 7., 22.],
        [ 6., 21.],
        [ 5., 20.],
        [ 4., 19.],
        [ 3., 18.],
        [ 2., 17.],
        [ 1., 16.],
        [ 0., 15.],
        [ 1., 14.],
        [ 2., 13.],
        [ 3., 12.],
        [ 4., 11.],
        [ 5., 10.],
        [ 6.,  9.],
        [ 7.,  8.],
        [ 8.,  7.],
        [ 9.,  6.],
        [10.,  5.],
        [11.,  4.],
        [12.,  3.],


loss: 0.9105 ||:   2%|▏         | 20/1021 [00:27<04:10,  3.99it/s]

tensor([[ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],
        [ 2.,  2.],
        [ 3.,  1.],
        [ 4.,  0.],
        [ 5.,  1.],
        [ 6.,  2.],
        [ 7.,  3.],
        [ 8.,  4.],
        [ 9.,  5.],
        [10.,  6.],
        [11.,  7.],
        [12.,  8.],
        [13.,  9.],
        [14., 10.],
        [15., 11.],
        [16., 12.],
        [17., 13.],
        [18., 14.],
        [19., 15.],
        [20., 16.],
        [21., 17.],
        [22., 18.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[11., 12.],
        [10., 11.],
        [ 9., 10.],
        [ 8.,  9.],
        [ 7.,  8.],
        [ 6.,  7.],
        [ 5.,  6.],
        [ 4.,  5.],
        [ 3.,  4.],
        [ 2.,  3.],
        [ 1.,  2.],
        [ 0.,  1.],
        [ 1.,  0.],
        [ 2.,  1.],
        [ 3.,  2.],
        [ 4.,  3.],
        [ 5.,  4.],
        [ 6.,  5.],
        [ 7.,  6.],
        [ 8.,  7.],
  

loss: 0.8748 ||:   2%|▏         | 22/1021 [00:27<03:05,  5.38it/s]

tensor([[ 7., 32.],
        [ 6., 31.],
        [ 5., 30.],
        [ 4., 29.],
        [ 3., 28.],
        [ 2., 27.],
        [ 1., 26.],
        [ 0., 25.],
        [ 1., 24.],
        [ 2., 23.],
        [ 3., 22.],
        [ 4., 21.],
        [ 5., 20.],
        [ 6., 19.],
        [ 7., 18.],
        [ 8., 17.],
        [ 9., 16.],
        [10., 15.],
        [11., 14.],
        [12., 13.],
        [13., 12.],
        [14., 11.],
        [15., 10.],
        [16.,  9.],
        [17.,  8.],
        [18.,  7.],
        [19.,  6.],
        [20.,  5.],
        [21.,  4.],
        [22.,  3.],
        [23.,  2.],
        [24.,  1.],
        [25.,  0.],
        [26.,  1.],
        [27.,  2.]], device='cuda:0')
tensor([[13., 23.],
        [12., 22.],
        [11., 21.],
        [10., 20.],
        [ 9., 19.],
        [ 8., 18.],
        [ 7., 17.],
        [ 6., 16.],
        [ 5., 15.],
        [ 4., 14.],
        [ 3., 13.],
        [ 2., 12.],
        [ 1., 11.],
        [ 0., 10.],
  

loss: 0.8324 ||:   2%|▏         | 24/1021 [00:27<02:36,  6.36it/s]

tensor([[ 3., 18.],
        [ 2., 17.],
        [ 1., 16.],
        [ 0., 15.],
        [ 1., 14.],
        [ 2., 13.],
        [ 3., 12.],
        [ 4., 11.],
        [ 5., 10.],
        [ 6.,  9.],
        [ 7.,  8.],
        [ 8.,  7.],
        [ 9.,  6.],
        [10.,  5.],
        [11.,  4.],
        [12.,  3.],
        [13.,  2.],
        [14.,  1.],
        [15.,  0.],
        [16.,  1.],
        [17.,  2.],
        [18.,  3.],
        [19.,  4.],
        [20.,  5.],
        [21.,  6.],
        [22.,  7.],
        [23.,  8.],
        [24.,  9.],
        [25., 10.],
        [26., 11.],
        [27., 12.],
        [28., 13.],
        [29., 14.],
        [30., 15.],
        [31., 16.],
        [32., 17.],
        [33., 18.],
        [34., 19.],
        [35., 20.],
        [36., 21.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[31., 41.],
        [30., 40.],
        [29., 39.],
        [28., 38.],
        [27., 37.],
  

loss: 0.7897 ||:   3%|▎         | 26/1021 [00:28<02:33,  6.48it/s]

tensor([[ 1.,  3.],
        [ 0.,  2.],
        [ 1.,  1.],
        [ 2.,  0.],
        [ 3.,  1.],
        [ 4.,  2.],
        [ 5.,  3.],
        [ 6.,  4.],
        [ 7.,  5.],
        [ 8.,  6.],
        [ 9.,  7.],
        [10.,  8.],
        [11.,  9.],
        [12., 10.],
        [13., 11.],
        [14., 12.],
        [15., 13.],
        [16., 14.],
        [17., 15.],
        [18., 16.],
        [19., 17.],
        [20., 18.],
        [21., 19.],
        [22., 20.],
        [23., 21.],
        [24., 22.],
        [25., 23.],
        [26., 24.],
        [27., 25.],
        [28., 26.],
        [29., 27.],
        [30., 28.],
        [31., 29.],
        [32., 30.],
        [33., 31.],
        [34., 32.],
        [35., 33.],
        [36., 34.],
        [ 0.,  0.]], device='cuda:0')
tensor([[41., 45.],
        [40., 44.],
        [39., 43.],
        [38., 42.],
        [37., 41.],
        [36., 40.],
        [35., 39.],
        [34., 38.],
        [33., 37.],
        [32., 36.],
  

loss: 0.7605 ||:   3%|▎         | 28/1021 [00:28<02:31,  6.56it/s]

tensor([[10., 21.],
        [ 9., 20.],
        [ 8., 19.],
        [ 7., 18.],
        [ 6., 17.],
        [ 5., 16.],
        [ 4., 15.],
        [ 3., 14.],
        [ 2., 13.],
        [ 1., 12.],
        [ 0., 11.],
        [ 1., 10.],
        [ 2.,  9.],
        [ 3.,  8.],
        [ 4.,  7.],
        [ 5.,  6.],
        [ 6.,  5.],
        [ 7.,  4.],
        [ 8.,  3.],
        [ 9.,  2.],
        [10.,  1.],
        [11.,  0.],
        [12.,  1.],
        [13.,  2.],
        [14.,  3.],
        [15.,  4.],
        [16.,  5.],
        [17.,  6.],
        [18.,  7.],
        [19.,  8.],
        [20.,  9.],
        [21., 10.],
        [22., 11.],
        [23., 12.],
        [24., 13.],
        [25., 14.]], device='cuda:0')
tensor([[12., 26.],
        [11., 25.],
        [10., 24.],
        [ 9., 23.],
        [ 8., 22.],
        [ 7., 21.],
        [ 6., 20.],
        [ 5., 19.],
        [ 4., 18.],
        [ 3., 17.],
        [ 2., 16.],
        [ 1., 15.],
        [ 0., 14.],
  

loss: 0.7408 ||:   3%|▎         | 30/1021 [00:28<02:49,  5.85it/s]

tensor([[20., 53.],
        [19., 52.],
        [18., 51.],
        [17., 50.],
        [16., 49.],
        [15., 48.],
        [14., 47.],
        [13., 46.],
        [12., 45.],
        [11., 44.],
        [10., 43.],
        [ 9., 42.],
        [ 8., 41.],
        [ 7., 40.],
        [ 6., 39.],
        [ 5., 38.],
        [ 4., 37.],
        [ 3., 36.],
        [ 2., 35.],
        [ 1., 34.],
        [ 0., 33.],
        [ 1., 32.],
        [ 2., 31.],
        [ 3., 30.],
        [ 4., 29.],
        [ 5., 28.],
        [ 6., 27.],
        [ 7., 26.],
        [ 8., 25.],
        [ 9., 24.],
        [10., 23.],
        [11., 22.],
        [12., 21.],
        [13., 20.],
        [14., 19.],
        [15., 18.],
        [16., 17.],
        [17., 16.],
        [18., 15.],
        [19., 14.],
        [20., 13.],
        [21., 12.],
        [22., 11.],
        [23., 10.],
        [24.,  9.],
        [25.,  8.],
        [26.,  7.],
        [27.,  6.],
        [28.,  5.],
        [29.,  4.],


loss: 0.7447 ||:   3%|▎         | 32/1021 [00:28<02:23,  6.90it/s]

tensor([[ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],
        [ 2.,  2.],
        [ 3.,  1.],
        [ 4.,  0.],
        [ 5.,  1.],
        [ 6.,  2.],
        [ 7.,  3.],
        [ 8.,  4.],
        [ 9.,  5.],
        [10.,  6.],
        [11.,  7.],
        [12.,  8.]], device='cuda:0')
tensor([[ 2.,  9.],
        [ 1.,  8.],
        [ 0.,  7.],
        [ 1.,  6.],
        [ 2.,  5.],
        [ 3.,  4.],
        [ 4.,  3.],
        [ 5.,  2.],
        [ 6.,  1.],
        [ 7.,  0.],
        [ 8.,  1.],
        [ 9.,  2.],
        [10.,  3.],
        [11.,  4.],
        [12.,  5.],
        [13.,  6.],
        [14.,  7.],
        [15.,  8.],
        [16.,  9.],
        [17., 10.],
        [18., 11.],
        [19., 12.],
        [20., 13.],
        [21., 14.],
        [22., 15.],
        [23., 16.],
        [24., 17.],
        [25., 18.]], device='cuda:0')
tensor([[ 7., 28.],
    

loss: 0.7242 ||:   3%|▎         | 34/1021 [00:29<02:41,  6.13it/s]

tensor([[49., 52.],
        [48., 51.],
        [47., 50.],
        [46., 49.],
        [45., 48.],
        [44., 47.],
        [43., 46.],
        [42., 45.],
        [41., 44.],
        [40., 43.],
        [39., 42.],
        [38., 41.],
        [37., 40.],
        [36., 39.],
        [35., 38.],
        [34., 37.],
        [33., 36.],
        [32., 35.],
        [31., 34.],
        [30., 33.],
        [29., 32.],
        [28., 31.],
        [27., 30.],
        [26., 29.],
        [25., 28.],
        [24., 27.],
        [23., 26.],
        [22., 25.],
        [21., 24.],
        [20., 23.],
        [19., 22.],
        [18., 21.],
        [17., 20.],
        [16., 19.],
        [15., 18.],
        [14., 17.],
        [13., 16.],
        [12., 15.],
        [11., 14.],
        [10., 13.],
        [ 9., 12.],
        [ 8., 11.],
        [ 7., 10.],
        [ 6.,  9.],
        [ 5.,  8.],
        [ 4.,  7.],
        [ 3.,  6.],
        [ 2.,  5.],
        [ 1.,  4.],
        [ 0.,  3.],


loss: 0.7134 ||:   3%|▎         | 35/1021 [00:29<02:33,  6.41it/s]

tensor([[11., 33.],
        [10., 32.],
        [ 9., 31.],
        [ 8., 30.],
        [ 7., 29.],
        [ 6., 28.],
        [ 5., 27.],
        [ 4., 26.],
        [ 3., 25.],
        [ 2., 24.],
        [ 1., 23.],
        [ 0., 22.],
        [ 1., 21.],
        [ 2., 20.],
        [ 3., 19.],
        [ 4., 18.],
        [ 5., 17.],
        [ 6., 16.],
        [ 7., 15.],
        [ 8., 14.],
        [ 9., 13.],
        [10., 12.],
        [11., 11.],
        [12., 10.],
        [13.,  9.],
        [14.,  8.],
        [15.,  7.],
        [16.,  6.],
        [17.,  5.],
        [18.,  4.],
        [19.,  3.],
        [20.,  2.],
        [21.,  1.],
        [22.,  0.],
        [23.,  1.],
        [24.,  2.],
        [25.,  3.],
        [26.,  4.],
        [27.,  5.],
        [28.,  6.],
        [29.,  7.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[12., 20.],
        [11., 19.],
        [10., 18.],
  

loss: 0.7057 ||:   4%|▎         | 37/1021 [00:29<02:12,  7.45it/s]

tensor([[ 1., 29.],
        [ 0., 28.],
        [ 0., 27.],
        [ 0., 26.],
        [ 1., 25.],
        [ 2., 24.],
        [ 3., 23.],
        [ 4., 22.],
        [ 5., 21.],
        [ 6., 20.],
        [ 7., 19.],
        [ 8., 18.],
        [ 9., 17.],
        [10., 16.],
        [11., 15.],
        [12., 14.],
        [13., 13.],
        [14., 12.],
        [15., 11.],
        [16., 10.],
        [17.,  9.],
        [18.,  8.],
        [19.,  7.],
        [20.,  6.],
        [21.,  5.],
        [22.,  4.],
        [23.,  3.],
        [24.,  2.],
        [25.,  1.],
        [26.,  0.],
        [27.,  0.],
        [28.,  1.],
        [29.,  2.],
        [30.,  3.],
        [31.,  4.],
        [32.,  5.],
        [33.,  6.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 7.,  8.],
        [ 6.,  7.],
        [ 5.,  6.],
        [ 4.,  5.],
        [ 3.,  4.],
        [ 2.,  3.],
        [ 1.,  2.],
        [ 0.,  1.],
        [ 1.,  0.],
  

loss: 0.7163 ||:   4%|▍         | 39/1021 [00:29<01:59,  8.24it/s]

tensor([[ 4.,  9.],
        [ 3.,  8.],
        [ 2.,  7.],
        [ 1.,  6.],
        [ 0.,  5.],
        [ 0.,  4.],
        [ 0.,  3.],
        [ 1.,  2.],
        [ 2.,  1.],
        [ 3.,  0.],
        [ 4.,  1.],
        [ 5.,  2.],
        [ 6.,  3.],
        [ 7.,  4.],
        [ 8.,  5.],
        [ 9.,  6.],
        [10.,  7.],
        [11.,  8.],
        [12.,  9.],
        [13., 10.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 2., 19.],
        [ 1., 18.],
        [ 0., 17.],
        [ 0., 16.],
        [ 0., 15.],
        [ 0., 14.],
        [ 0., 13.],
        [ 1., 12.],
        [ 2., 11.],
        [ 3., 10.],
        [ 4.,  9.],
        [ 5.,  8.],
        [ 6.,  7.],
        [ 7.,  6.],
        [ 8.,  5.],
        [ 9.,  4.],
        [10.,  3.],
        [11.,  2.],
        [12.,  1.],
        [13.,  0.],
        [14.,  1.],
        [15.,  2.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
  

loss: 0.7052 ||:   4%|▍         | 41/1021 [00:30<02:09,  7.54it/s]

tensor([[35., 60.],
        [34., 59.],
        [33., 58.],
        [32., 57.],
        [31., 56.],
        [30., 55.],
        [29., 54.],
        [28., 53.],
        [27., 52.],
        [26., 51.],
        [25., 50.],
        [24., 49.],
        [23., 48.],
        [22., 47.],
        [21., 46.],
        [20., 45.],
        [19., 44.],
        [18., 43.],
        [17., 42.],
        [16., 41.],
        [15., 40.],
        [14., 39.],
        [13., 38.],
        [12., 37.],
        [11., 36.],
        [10., 35.],
        [ 9., 34.],
        [ 8., 33.],
        [ 7., 32.],
        [ 6., 31.],
        [ 5., 30.],
        [ 4., 29.],
        [ 3., 28.],
        [ 2., 27.],
        [ 1., 26.],
        [ 0., 25.],
        [ 1., 24.],
        [ 2., 23.],
        [ 3., 22.],
        [ 4., 21.],
        [ 5., 20.],
        [ 6., 19.],
        [ 7., 18.],
        [ 8., 17.],
        [ 9., 16.],
        [10., 15.],
        [11., 14.],
        [12., 13.],
        [13., 12.],
        [14., 11.],


loss: 0.6909 ||:   4%|▍         | 43/1021 [00:30<01:58,  8.22it/s]

tensor([[ 4., 10.],
        [ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 0.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],
        [ 2.,  2.],
        [ 3.,  1.],
        [ 4.,  0.],
        [ 5.,  1.],
        [ 6.,  2.],
        [ 7.,  3.],
        [ 8.,  4.],
        [ 9.,  5.],
        [10.,  6.],
        [11.,  7.],
        [12.,  8.],
        [13.,  9.],
        [14., 10.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 6., 16.],
        [ 5., 15.],
        [ 4., 14.],
        [ 3., 13.],
        [ 2., 12.],
        [ 1., 11.],
        [ 0., 10.],
        [ 1.,  9.],
        [ 2.,  8.],
        [ 3.,  7.],
        [ 4.,  6.],
        [ 5.,  5.],
        [ 6.,  4.],
        [ 7.,  3.],
        [ 8.,  2.],
        [ 9.,  1.],
        [10.,  0.],
        [11.,  1.],
        [12.,  2.],
        [13.,  3.],
        [14.,  4.],
  

loss: 0.6823 ||:   4%|▍         | 45/1021 [00:30<02:15,  7.23it/s]

tensor([[37., 53.],
        [36., 52.],
        [35., 51.],
        [34., 50.],
        [33., 49.],
        [32., 48.],
        [31., 47.],
        [30., 46.],
        [29., 45.],
        [28., 44.],
        [27., 43.],
        [26., 42.],
        [25., 41.],
        [24., 40.],
        [23., 39.],
        [22., 38.],
        [21., 37.],
        [20., 36.],
        [19., 35.],
        [18., 34.],
        [17., 33.],
        [16., 32.],
        [15., 31.],
        [14., 30.],
        [13., 29.],
        [12., 28.],
        [11., 27.],
        [10., 26.],
        [ 9., 25.],
        [ 8., 24.],
        [ 7., 23.],
        [ 6., 22.],
        [ 5., 21.],
        [ 4., 20.],
        [ 3., 19.],
        [ 2., 18.],
        [ 1., 17.],
        [ 0., 16.],
        [ 1., 15.],
        [ 2., 14.],
        [ 3., 13.],
        [ 4., 12.],
        [ 5., 11.],
        [ 6., 10.],
        [ 7.,  9.],
        [ 8.,  8.],
        [ 9.,  7.],
        [10.,  6.],
        [11.,  5.],
        [12.,  4.],


loss: 0.6767 ||:   5%|▍         | 46/1021 [00:30<02:22,  6.83it/s]

tensor([[ 4., 11.],
        [ 3., 10.],
        [ 2.,  9.],
        [ 1.,  8.],
        [ 0.,  7.],
        [ 0.,  6.],
        [ 1.,  5.],
        [ 2.,  4.],
        [ 3.,  3.],
        [ 4.,  2.],
        [ 5.,  1.],
        [ 6.,  0.],
        [ 7.,  0.],
        [ 8.,  0.],
        [ 9.,  1.],
        [10.,  2.],
        [11.,  3.],
        [12.,  4.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[28., 31.],
        [27., 30.],
        [26., 29.],
        [25., 28.],
        [24., 27.],
        [23., 26.],
        [22., 25.],
        [21., 24.],
        [20., 23.],
        [19., 22.],
        [18., 21.],
        [17., 20.],
        [16., 19.],
        [15., 18.],
        [14., 17.],
        [13., 16.],
        [12., 15.],
        [11., 14.],
        [10., 13.],
        [ 9., 12.],
        [ 8., 11.],
        [ 7., 10.],
        [ 6.,  9.],
        [ 5.,  8.],
  

loss: 0.6668 ||:   5%|▍         | 50/1021 [00:31<02:03,  7.85it/s]

tensor([[ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 1.,  7.],
        [ 2.,  6.],
        [ 3.,  5.],
        [ 4.,  4.],
        [ 5.,  3.],
        [ 6.,  2.],
        [ 7.,  1.],
        [ 8.,  0.],
        [ 9.,  0.],
        [10.,  1.],
        [11.,  2.],
        [12.,  3.],
        [13.,  4.],
        [14.,  5.],
        [15.,  6.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 6., 14.],
        [ 5., 13.],
        [ 4., 12.],
        [ 3., 11.],
        [ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 0.,  7.],
        [ 1.,  6.],
        [ 2.,  5.],
        [ 3.,  4.],
        [ 4.,  3.],
        [ 5.,  2.],
        [ 6.,  1.],
        [ 7.,  0.],
        [ 8.,  0.],
        [ 9.,  0.],
        [10.,  0.],
        [11.,  1.],
        [12.,  2.],
        [13.,  3.],
        [14.,  4.],
        [15.,  5.],
        [16.,  6.],
        [17.,  7.],
        [18.,  8.],
        [19.,  9.],
  

loss: 0.6494 ||:   5%|▌         | 53/1021 [00:31<02:12,  7.29it/s]

tensor([[ 6., 39.],
        [ 5., 38.],
        [ 4., 37.],
        [ 3., 36.],
        [ 2., 35.],
        [ 1., 34.],
        [ 0., 33.],
        [ 1., 32.],
        [ 2., 31.],
        [ 3., 30.],
        [ 4., 29.],
        [ 5., 28.],
        [ 6., 27.],
        [ 7., 26.],
        [ 8., 25.],
        [ 9., 24.],
        [10., 23.],
        [11., 22.],
        [12., 21.],
        [13., 20.],
        [14., 19.],
        [15., 18.],
        [16., 17.],
        [17., 16.],
        [18., 15.],
        [19., 14.],
        [20., 13.],
        [21., 12.],
        [22., 11.],
        [23., 10.],
        [24.,  9.],
        [25.,  8.],
        [26.,  7.],
        [27.,  6.],
        [28.,  5.],
        [29.,  4.],
        [30.,  3.],
        [31.,  2.],
        [32.,  1.],
        [33.,  0.],
        [34.,  1.],
        [35.,  2.],
        [36.,  3.],
        [37.,  4.],
        [38.,  5.],
        [39.,  6.],
        [40.,  7.],
        [41.,  8.],
        [42.,  9.],
        [43., 10.],


loss: 0.6379 ||:   5%|▌         | 55/1021 [00:31<02:14,  7.20it/s]

tensor([[ 2., 37.],
        [ 1., 36.],
        [ 0., 35.],
        [ 1., 34.],
        [ 2., 33.],
        [ 3., 32.],
        [ 4., 31.],
        [ 5., 30.],
        [ 6., 29.],
        [ 7., 28.],
        [ 8., 27.],
        [ 9., 26.],
        [10., 25.],
        [11., 24.],
        [12., 23.],
        [13., 22.],
        [14., 21.],
        [15., 20.],
        [16., 19.],
        [17., 18.],
        [18., 17.],
        [19., 16.],
        [20., 15.],
        [21., 14.],
        [22., 13.],
        [23., 12.],
        [24., 11.],
        [25., 10.],
        [26.,  9.],
        [27.,  8.],
        [28.,  7.],
        [29.,  6.],
        [30.,  5.],
        [31.,  4.],
        [32.,  3.],
        [33.,  2.],
        [34.,  1.],
        [35.,  0.],
        [36.,  1.],
        [37.,  2.],
        [38.,  3.],
        [39.,  4.],
        [40.,  5.],
        [41.,  6.],
        [42.,  7.],
        [43.,  8.],
        [44.,  9.],
        [45., 10.],
        [46., 11.],
        [ 0.,  0.],


loss: 0.6341 ||:   5%|▌         | 56/1021 [00:32<02:08,  7.51it/s]

tensor([[48., 52.],
        [47., 51.],
        [46., 50.],
        [45., 49.],
        [44., 48.],
        [43., 47.],
        [42., 46.],
        [41., 45.],
        [40., 44.],
        [39., 43.],
        [38., 42.],
        [37., 41.],
        [36., 40.],
        [35., 39.],
        [34., 38.],
        [33., 37.],
        [32., 36.],
        [31., 35.],
        [30., 34.],
        [29., 33.],
        [28., 32.],
        [27., 31.],
        [26., 30.],
        [25., 29.],
        [24., 28.],
        [23., 27.],
        [22., 26.],
        [21., 25.],
        [20., 24.],
        [19., 23.],
        [18., 22.],
        [17., 21.],
        [16., 20.],
        [15., 19.],
        [14., 18.],
        [13., 17.],
        [12., 16.],
        [11., 15.],
        [10., 14.],
        [ 9., 13.],
        [ 8., 12.],
        [ 7., 11.],
        [ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 0.,  3.],


loss: 0.6203 ||:   6%|▌         | 58/1021 [00:32<03:04,  5.21it/s]

tensor([[48., 52.],
        [47., 51.],
        [46., 50.],
        [45., 49.],
        [44., 48.],
        [43., 47.],
        [42., 46.],
        [41., 45.],
        [40., 44.],
        [39., 43.],
        [38., 42.],
        [37., 41.],
        [36., 40.],
        [35., 39.],
        [34., 38.],
        [33., 37.],
        [32., 36.],
        [31., 35.],
        [30., 34.],
        [29., 33.],
        [28., 32.],
        [27., 31.],
        [26., 30.],
        [25., 29.],
        [24., 28.],
        [23., 27.],
        [22., 26.],
        [21., 25.],
        [20., 24.],
        [19., 23.],
        [18., 22.],
        [17., 21.],
        [16., 20.],
        [15., 19.],
        [14., 18.],
        [13., 17.],
        [12., 16.],
        [11., 15.],
        [10., 14.],
        [ 9., 13.],
        [ 8., 12.],
        [ 7., 11.],
        [ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],


loss: 0.6120 ||:   6%|▌         | 59/1021 [00:32<03:21,  4.78it/s]

tensor([[46., 70.],
        [45., 69.],
        [44., 68.],
        [43., 67.],
        [42., 66.],
        [41., 65.],
        [40., 64.],
        [39., 63.],
        [38., 62.],
        [37., 61.],
        [36., 60.],
        [35., 59.],
        [34., 58.],
        [33., 57.],
        [32., 56.],
        [31., 55.],
        [30., 54.],
        [29., 53.],
        [28., 52.],
        [27., 51.],
        [26., 50.],
        [25., 49.],
        [24., 48.],
        [23., 47.],
        [22., 46.],
        [21., 45.],
        [20., 44.],
        [19., 43.],
        [18., 42.],
        [17., 41.],
        [16., 40.],
        [15., 39.],
        [14., 38.],
        [13., 37.],
        [12., 36.],
        [11., 35.],
        [10., 34.],
        [ 9., 33.],
        [ 8., 32.],
        [ 7., 31.],
        [ 6., 30.],
        [ 5., 29.],
        [ 4., 28.],
        [ 3., 27.],
        [ 2., 26.],
        [ 1., 25.],
        [ 0., 24.],
        [ 1., 23.],
        [ 2., 22.],
        [ 3., 21.],


loss: 0.6038 ||:   6%|▌         | 60/1021 [00:32<03:08,  5.10it/s]

tensor([[37., 44.],
        [36., 43.],
        [35., 42.],
        [34., 41.],
        [33., 40.],
        [32., 39.],
        [31., 38.],
        [30., 37.],
        [29., 36.],
        [28., 35.],
        [27., 34.],
        [26., 33.],
        [25., 32.],
        [24., 31.],
        [23., 30.],
        [22., 29.],
        [21., 28.],
        [20., 27.],
        [19., 26.],
        [18., 25.],
        [17., 24.],
        [16., 23.],
        [15., 22.],
        [14., 21.],
        [13., 20.],
        [12., 19.],
        [11., 18.],
        [10., 17.],
        [ 9., 16.],
        [ 8., 15.],
        [ 7., 14.],
        [ 6., 13.],
        [ 5., 12.],
        [ 4., 11.],
        [ 3., 10.],
        [ 2.,  9.],
        [ 1.,  8.],
        [ 0.,  7.],
        [ 1.,  6.],
        [ 2.,  5.],
        [ 3.,  4.],
        [ 4.,  3.],
        [ 5.,  2.],
        [ 6.,  1.],
        [ 7.,  0.],
        [ 8.,  1.],
        [ 9.,  2.],
        [10.,  3.],
        [11.,  4.],
        [12.,  5.],


loss: 0.6014 ||:   6%|▌         | 61/1021 [00:33<03:13,  4.95it/s]

tensor([[ 1.,  6.],
        [ 0.,  5.],
        [ 0.,  4.],
        [ 0.,  3.],
        [ 1.,  2.],
        [ 2.,  1.],
        [ 3.,  0.],
        [ 4.,  1.],
        [ 5.,  2.],
        [ 6.,  3.],
        [ 7.,  4.],
        [ 8.,  5.],
        [ 9.,  6.],
        [10.,  7.],
        [11.,  8.],
        [12.,  9.],
        [13., 10.],
        [14., 11.],
        [15., 12.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[19., 80.],
        [18., 79.],
        [17., 78.],
        [16., 77.],
        [15., 76.],
        [14., 75.],
        [13., 74.],
        [12., 73.],
        [11., 72.],
        [10., 71.],
        [ 9., 70.],
        [ 8., 69.],
        [ 7., 68.],
        [ 6., 67.],
        [ 5., 66.],
        [ 4., 65.],
        [ 3., 64.],
        [ 2., 63.],
        [ 1., 62.],
        [ 0., 61.],
        [ 0., 60.],
        [ 0., 59.],
        [ 0., 58.],
        [ 1., 57.],
        [ 2., 56.],
        [ 3., 55.],
        [ 4., 54.],
  

loss: 0.5855 ||:   6%|▋         | 64/1021 [00:33<02:45,  5.77it/s]

tensor([[ 6., 32.],
        [ 5., 31.],
        [ 4., 30.],
        [ 3., 29.],
        [ 2., 28.],
        [ 1., 27.],
        [ 0., 26.],
        [ 1., 25.],
        [ 2., 24.],
        [ 3., 23.],
        [ 4., 22.],
        [ 5., 21.],
        [ 6., 20.],
        [ 7., 19.],
        [ 8., 18.],
        [ 9., 17.],
        [10., 16.],
        [11., 15.],
        [12., 14.],
        [13., 13.],
        [14., 12.],
        [15., 11.],
        [16., 10.],
        [17.,  9.],
        [18.,  8.],
        [19.,  7.],
        [20.,  6.],
        [21.,  5.],
        [22.,  4.],
        [23.,  3.],
        [24.,  2.],
        [25.,  1.],
        [26.,  0.],
        [27.,  1.],
        [28.,  2.],
        [29.,  3.],
        [30.,  4.],
        [31.,  5.],
        [32.,  6.],
        [33.,  7.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 8., 12.],
  

loss: 0.5886 ||:   6%|▋         | 66/1021 [00:33<02:26,  6.51it/s]

tensor([[ 7., 24.],
        [ 6., 23.],
        [ 5., 22.],
        [ 4., 21.],
        [ 3., 20.],
        [ 2., 19.],
        [ 1., 18.],
        [ 0., 17.],
        [ 1., 16.],
        [ 2., 15.],
        [ 3., 14.],
        [ 4., 13.],
        [ 5., 12.],
        [ 6., 11.],
        [ 7., 10.],
        [ 8.,  9.],
        [ 9.,  8.],
        [10.,  7.],
        [11.,  6.],
        [12.,  5.],
        [13.,  4.],
        [14.,  3.],
        [15.,  2.],
        [16.,  1.],
        [17.,  0.],
        [18.,  1.],
        [19.,  2.],
        [20.,  3.],
        [21.,  4.],
        [22.,  5.],
        [23.,  6.],
        [24.,  7.],
        [25.,  8.],
        [26.,  9.],
        [27., 10.],
        [28., 11.],
        [29., 12.],
        [30., 13.],
        [31., 14.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[20., 21.],
        [19., 20.],
        [18., 19.],
        [17., 18.],
  

loss: 0.5853 ||:   7%|▋         | 68/1021 [00:34<02:17,  6.94it/s]

tensor([[26., 34.],
        [25., 33.],
        [24., 32.],
        [23., 31.],
        [22., 30.],
        [21., 29.],
        [20., 28.],
        [19., 27.],
        [18., 26.],
        [17., 25.],
        [16., 24.],
        [15., 23.],
        [14., 22.],
        [13., 21.],
        [12., 20.],
        [11., 19.],
        [10., 18.],
        [ 9., 17.],
        [ 8., 16.],
        [ 7., 15.],
        [ 6., 14.],
        [ 5., 13.],
        [ 4., 12.],
        [ 3., 11.],
        [ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 1.,  7.],
        [ 2.,  6.],
        [ 3.,  5.],
        [ 4.,  4.],
        [ 5.,  3.],
        [ 6.,  2.],
        [ 7.,  1.],
        [ 8.,  0.],
        [ 9.,  1.],
        [10.,  2.],
        [11.,  3.],
        [12.,  4.],
        [13.,  5.],
        [14.,  6.],
        [15.,  7.],
        [16.,  8.],
        [17.,  9.],
        [18., 10.],
        [19., 11.],
        [20., 12.],
        [21., 13.],
        [22., 14.],
        [ 0.,  0.],


loss: 0.5725 ||:   7%|▋         | 70/1021 [00:34<02:25,  6.52it/s]

tensor([[32., 56.],
        [31., 55.],
        [30., 54.],
        [29., 53.],
        [28., 52.],
        [27., 51.],
        [26., 50.],
        [25., 49.],
        [24., 48.],
        [23., 47.],
        [22., 46.],
        [21., 45.],
        [20., 44.],
        [19., 43.],
        [18., 42.],
        [17., 41.],
        [16., 40.],
        [15., 39.],
        [14., 38.],
        [13., 37.],
        [12., 36.],
        [11., 35.],
        [10., 34.],
        [ 9., 33.],
        [ 8., 32.],
        [ 7., 31.],
        [ 6., 30.],
        [ 5., 29.],
        [ 4., 28.],
        [ 3., 27.],
        [ 2., 26.],
        [ 1., 25.],
        [ 0., 24.],
        [ 1., 23.],
        [ 2., 22.],
        [ 3., 21.],
        [ 4., 20.],
        [ 5., 19.],
        [ 6., 18.],
        [ 7., 17.],
        [ 8., 16.],
        [ 9., 15.],
        [10., 14.],
        [11., 13.],
        [12., 12.],
        [13., 11.],
        [14., 10.],
        [15.,  9.],
        [16.,  8.],
        [17.,  7.],


loss: 0.5724 ||:   7%|▋         | 72/1021 [00:34<02:15,  7.00it/s]

tensor([[14., 27.],
        [13., 26.],
        [12., 25.],
        [11., 24.],
        [10., 23.],
        [ 9., 22.],
        [ 8., 21.],
        [ 7., 20.],
        [ 6., 19.],
        [ 5., 18.],
        [ 4., 17.],
        [ 3., 16.],
        [ 2., 15.],
        [ 1., 14.],
        [ 0., 13.],
        [ 1., 12.],
        [ 2., 11.],
        [ 3., 10.],
        [ 4.,  9.],
        [ 5.,  8.],
        [ 6.,  7.],
        [ 7.,  6.],
        [ 8.,  5.],
        [ 9.,  4.],
        [10.,  3.],
        [11.,  2.],
        [12.,  1.],
        [13.,  0.],
        [14.,  1.],
        [15.,  2.],
        [16.,  3.],
        [17.,  4.],
        [18.,  5.],
        [19.,  6.],
        [20.,  7.],
        [21.,  8.],
        [22.,  9.],
        [23., 10.],
        [24., 11.],
        [25., 12.],
        [26., 13.],
        [27., 14.],
        [28., 15.],
        [29., 16.],
        [30., 17.],
        [31., 18.],
        [32., 19.],
        [33., 20.],
        [34., 21.],
        [35., 22.],


loss: 0.5679 ||:   7%|▋         | 73/1021 [00:34<02:47,  5.66it/s]

tensor([[ 5., 13.],
        [ 4., 12.],
        [ 3., 11.],
        [ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 1.,  7.],
        [ 2.,  6.],
        [ 3.,  5.],
        [ 4.,  4.],
        [ 5.,  3.],
        [ 6.,  2.],
        [ 7.,  1.],
        [ 8.,  0.],
        [ 9.,  1.],
        [10.,  2.],
        [11.,  3.],
        [12.,  4.],
        [13.,  5.],
        [14.,  6.],
        [15.,  7.],
        [16.,  8.],
        [17.,  9.],
        [18., 10.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[15., 40.],
        [14., 39.],
        [13., 38.],
        [12., 37.],
        [11., 36.],
        [10., 35.],
        [ 9., 34.],
        [ 8., 33.],
        [ 7., 32.],
        [ 6., 31.],
        [ 5., 30.],
        [ 4., 29.],
        [ 3., 28.],
        [ 2., 27.],
        [ 1., 26.],
        [ 0., 25.],
        [ 1., 24.],
        [ 2., 23.],
        [ 3., 22.],
        [ 4., 21.],
  

loss: 0.5617 ||:   7%|▋         | 76/1021 [00:35<02:19,  6.77it/s]

tensor([[ 6., 25.],
        [ 5., 24.],
        [ 4., 23.],
        [ 3., 22.],
        [ 2., 21.],
        [ 1., 20.],
        [ 0., 19.],
        [ 1., 18.],
        [ 2., 17.],
        [ 3., 16.],
        [ 4., 15.],
        [ 5., 14.],
        [ 6., 13.],
        [ 7., 12.],
        [ 8., 11.],
        [ 9., 10.],
        [10.,  9.],
        [11.,  8.],
        [12.,  7.],
        [13.,  6.],
        [14.,  5.],
        [15.,  4.],
        [16.,  3.],
        [17.,  2.],
        [18.,  1.],
        [19.,  0.],
        [20.,  1.],
        [21.,  2.],
        [22.,  3.],
        [23.,  4.],
        [24.,  5.],
        [25.,  6.],
        [26.,  7.],
        [27.,  8.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 4., 11.],
        [ 3., 10.],
        [ 2.,  9.],
        [ 1.,  8.],
        [ 0.,  7.],
        [ 1.,  6.],
        [ 2.,  5.],
  

loss: 0.5610 ||:   8%|▊         | 78/1021 [00:35<02:16,  6.89it/s]

tensor([[ 1., 38.],
        [ 0., 37.],
        [ 1., 36.],
        [ 2., 35.],
        [ 3., 34.],
        [ 4., 33.],
        [ 5., 32.],
        [ 6., 31.],
        [ 7., 30.],
        [ 8., 29.],
        [ 9., 28.],
        [10., 27.],
        [11., 26.],
        [12., 25.],
        [13., 24.],
        [14., 23.],
        [15., 22.],
        [16., 21.],
        [17., 20.],
        [18., 19.],
        [19., 18.],
        [20., 17.],
        [21., 16.],
        [22., 15.],
        [23., 14.],
        [24., 13.],
        [25., 12.],
        [26., 11.],
        [27., 10.],
        [28.,  9.],
        [29.,  8.],
        [30.,  7.],
        [31.,  6.],
        [32.,  5.],
        [33.,  4.],
        [34.,  3.],
        [35.,  2.],
        [36.,  1.],
        [37.,  0.],
        [38.,  1.],
        [39.,  2.],
        [40.,  3.],
        [41.,  4.],
        [42.,  5.],
        [43.,  6.],
        [44.,  7.],
        [45.,  8.],
        [46.,  9.],
        [47., 10.],
        [48., 11.],


loss: 0.5565 ||:   8%|▊         | 80/1021 [00:35<02:08,  7.32it/s]

tensor([[ 1., 34.],
        [ 0., 33.],
        [ 1., 32.],
        [ 2., 31.],
        [ 3., 30.],
        [ 4., 29.],
        [ 5., 28.],
        [ 6., 27.],
        [ 7., 26.],
        [ 8., 25.],
        [ 9., 24.],
        [10., 23.],
        [11., 22.],
        [12., 21.],
        [13., 20.],
        [14., 19.],
        [15., 18.],
        [16., 17.],
        [17., 16.],
        [18., 15.],
        [19., 14.],
        [20., 13.],
        [21., 12.],
        [22., 11.],
        [23., 10.],
        [24.,  9.],
        [25.,  8.],
        [26.,  7.],
        [27.,  6.],
        [28.,  5.],
        [29.,  4.],
        [30.,  3.],
        [31.,  2.],
        [32.,  1.],
        [33.,  0.],
        [34.,  1.],
        [35.,  2.],
        [36.,  3.],
        [37.,  4.],
        [38.,  5.],
        [39.,  6.],
        [40.,  7.],
        [41.,  8.],
        [42.,  9.],
        [ 0.,  0.]], device='cuda:0')
tensor([[17., 18.],
        [16., 17.],
        [15., 16.],
        [14., 15.],
  

loss: 0.5524 ||:   8%|▊         | 83/1021 [00:36<01:57,  8.02it/s]

tensor([[ 2., 20.],
        [ 1., 19.],
        [ 0., 18.],
        [ 1., 17.],
        [ 2., 16.],
        [ 3., 15.],
        [ 4., 14.],
        [ 5., 13.],
        [ 6., 12.],
        [ 7., 11.],
        [ 8., 10.],
        [ 9.,  9.],
        [10.,  8.],
        [11.,  7.],
        [12.,  6.],
        [13.,  5.],
        [14.,  4.],
        [15.,  3.],
        [16.,  2.],
        [17.,  1.],
        [18.,  0.],
        [19.,  1.],
        [20.,  2.],
        [21.,  3.],
        [22.,  4.],
        [23.,  5.],
        [24.,  6.],
        [25.,  7.],
        [26.,  8.],
        [27.,  9.],
        [28., 10.],
        [29., 11.],
        [30., 12.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[12., 29.],
        [11., 28.],
        [10., 27.],
        [ 9., 26.],
        [ 8., 25.],
        [ 7., 24.],
        [ 6., 23.],
        [ 5., 22.],
        [ 4., 21.],
        [ 3., 20.],
        [ 2., 19.],
        [ 1., 18.],
  

loss: 0.5439 ||:   8%|▊         | 85/1021 [00:36<02:55,  5.33it/s]

tensor([[58., 64.],
        [57., 63.],
        [56., 62.],
        [55., 61.],
        [54., 60.],
        [53., 59.],
        [52., 58.],
        [51., 57.],
        [50., 56.],
        [49., 55.],
        [48., 54.],
        [47., 53.],
        [46., 52.],
        [45., 51.],
        [44., 50.],
        [43., 49.],
        [42., 48.],
        [41., 47.],
        [40., 46.],
        [39., 45.],
        [38., 44.],
        [37., 43.],
        [36., 42.],
        [35., 41.],
        [34., 40.],
        [33., 39.],
        [32., 38.],
        [31., 37.],
        [30., 36.],
        [29., 35.],
        [28., 34.],
        [27., 33.],
        [26., 32.],
        [25., 31.],
        [24., 30.],
        [23., 29.],
        [22., 28.],
        [21., 27.],
        [20., 26.],
        [19., 25.],
        [18., 24.],
        [17., 23.],
        [16., 22.],
        [15., 21.],
        [14., 20.],
        [13., 19.],
        [12., 18.],
        [11., 17.],
        [10., 16.],
        [ 9., 15.],


loss: 0.5400 ||:   8%|▊         | 86/1021 [00:36<02:50,  5.48it/s]

tensor([[35., 40.],
        [34., 39.],
        [33., 38.],
        [32., 37.],
        [31., 36.],
        [30., 35.],
        [29., 34.],
        [28., 33.],
        [27., 32.],
        [26., 31.],
        [25., 30.],
        [24., 29.],
        [23., 28.],
        [22., 27.],
        [21., 26.],
        [20., 25.],
        [19., 24.],
        [18., 23.],
        [17., 22.],
        [16., 21.],
        [15., 20.],
        [14., 19.],
        [13., 18.],
        [12., 17.],
        [11., 16.],
        [10., 15.],
        [ 9., 14.],
        [ 8., 13.],
        [ 7., 12.],
        [ 6., 11.],
        [ 5., 10.],
        [ 4.,  9.],
        [ 3.,  8.],
        [ 2.,  7.],
        [ 1.,  6.],
        [ 0.,  5.],
        [ 1.,  4.],
        [ 2.,  3.],
        [ 3.,  2.],
        [ 4.,  1.],
        [ 5.,  0.],
        [ 6.,  1.],
        [ 7.,  2.],
        [ 8.,  3.],
        [ 9.,  4.],
        [10.,  5.],
        [11.,  6.],
        [12.,  7.],
        [13.,  8.],
        [14.,  9.],


loss: 0.5344 ||:   9%|▊         | 88/1021 [00:37<02:22,  6.57it/s]

tensor([[24., 32.],
        [23., 31.],
        [22., 30.],
        [21., 29.],
        [20., 28.],
        [19., 27.],
        [18., 26.],
        [17., 25.],
        [16., 24.],
        [15., 23.],
        [14., 22.],
        [13., 21.],
        [12., 20.],
        [11., 19.],
        [10., 18.],
        [ 9., 17.],
        [ 8., 16.],
        [ 7., 15.],
        [ 6., 14.],
        [ 5., 13.],
        [ 4., 12.],
        [ 3., 11.],
        [ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 1.,  7.],
        [ 2.,  6.],
        [ 3.,  5.],
        [ 4.,  4.],
        [ 5.,  3.],
        [ 6.,  2.],
        [ 7.,  1.],
        [ 8.,  0.],
        [ 9.,  1.],
        [10.,  2.],
        [11.,  3.],
        [12.,  4.],
        [13.,  5.],
        [14.,  6.],
        [15.,  7.],
        [16.,  8.],
        [17.,  9.],
        [18., 10.],
        [19., 11.],
        [20., 12.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
te

loss: 0.5359 ||:   9%|▉         | 90/1021 [00:37<02:10,  7.12it/s]

tensor([[21., 34.],
        [20., 33.],
        [19., 32.],
        [18., 31.],
        [17., 30.],
        [16., 29.],
        [15., 28.],
        [14., 27.],
        [13., 26.],
        [12., 25.],
        [11., 24.],
        [10., 23.],
        [ 9., 22.],
        [ 8., 21.],
        [ 7., 20.],
        [ 6., 19.],
        [ 5., 18.],
        [ 4., 17.],
        [ 3., 16.],
        [ 2., 15.],
        [ 1., 14.],
        [ 0., 13.],
        [ 0., 12.],
        [ 0., 11.],
        [ 1., 10.],
        [ 2.,  9.],
        [ 3.,  8.],
        [ 4.,  7.],
        [ 5.,  6.],
        [ 6.,  5.],
        [ 7.,  4.],
        [ 8.,  3.],
        [ 9.,  2.],
        [10.,  1.],
        [11.,  0.],
        [12.,  1.],
        [13.,  2.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[17., 33.],
  

loss: 0.5295 ||:   9%|▉         | 92/1021 [00:37<02:05,  7.41it/s]

tensor([[ 6., 24.],
        [ 5., 23.],
        [ 4., 22.],
        [ 3., 21.],
        [ 2., 20.],
        [ 1., 19.],
        [ 0., 18.],
        [ 0., 17.],
        [ 1., 16.],
        [ 2., 15.],
        [ 3., 14.],
        [ 4., 13.],
        [ 5., 12.],
        [ 6., 11.],
        [ 7., 10.],
        [ 8.,  9.],
        [ 9.,  8.],
        [10.,  7.],
        [11.,  6.],
        [12.,  5.],
        [13.,  4.],
        [14.,  3.],
        [15.,  2.],
        [16.,  1.],
        [17.,  0.],
        [18.,  1.],
        [19.,  2.],
        [20.,  3.],
        [21.,  4.],
        [22.,  5.],
        [23.,  6.],
        [24.,  7.],
        [25.,  8.],
        [26.,  9.],
        [27., 10.],
        [28., 11.],
        [29., 12.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[31., 60.],
        [30., 59.],
        [29., 58.],
        [28., 57.],
  

loss: 0.5228 ||:   9%|▉         | 94/1021 [00:37<02:26,  6.34it/s]

tensor([[ 2., 25.],
        [ 1., 24.],
        [ 0., 23.],
        [ 1., 22.],
        [ 2., 21.],
        [ 3., 20.],
        [ 4., 19.],
        [ 5., 18.],
        [ 6., 17.],
        [ 7., 16.],
        [ 8., 15.],
        [ 9., 14.],
        [10., 13.],
        [11., 12.],
        [12., 11.],
        [13., 10.],
        [14.,  9.],
        [15.,  8.],
        [16.,  7.],
        [17.,  6.],
        [18.,  5.],
        [19.,  4.],
        [20.,  3.],
        [21.,  2.],
        [22.,  1.],
        [23.,  0.],
        [24.,  1.],
        [25.,  2.],
        [26.,  3.],
        [27.,  4.],
        [28.,  5.],
        [29.,  6.],
        [30.,  7.],
        [31.,  8.],
        [32.,  9.],
        [33., 10.],
        [34., 11.],
        [35., 12.],
        [36., 13.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[24., 31.],
        [23., 30.],
        [22., 29.],
        [21., 28.],
        [20., 27.],
        [19., 26.],
        [18., 25.],
  

loss: 0.5189 ||:   9%|▉         | 96/1021 [00:38<02:38,  5.84it/s]

tensor([[16., 61.],
        [15., 60.],
        [14., 59.],
        [13., 58.],
        [12., 57.],
        [11., 56.],
        [10., 55.],
        [ 9., 54.],
        [ 8., 53.],
        [ 7., 52.],
        [ 6., 51.],
        [ 5., 50.],
        [ 4., 49.],
        [ 3., 48.],
        [ 2., 47.],
        [ 1., 46.],
        [ 0., 45.],
        [ 1., 44.],
        [ 2., 43.],
        [ 3., 42.],
        [ 4., 41.],
        [ 5., 40.],
        [ 6., 39.],
        [ 7., 38.],
        [ 8., 37.],
        [ 9., 36.],
        [10., 35.],
        [11., 34.],
        [12., 33.],
        [13., 32.],
        [14., 31.],
        [15., 30.],
        [16., 29.],
        [17., 28.],
        [18., 27.],
        [19., 26.],
        [20., 25.],
        [21., 24.],
        [22., 23.],
        [23., 22.],
        [24., 21.],
        [25., 20.],
        [26., 19.],
        [27., 18.],
        [28., 17.],
        [29., 16.],
        [30., 15.],
        [31., 14.],
        [32., 13.],
        [33., 12.],


loss: 0.5171 ||:  10%|▉         | 98/1021 [00:38<02:19,  6.62it/s]

tensor([[23., 31.],
        [22., 30.],
        [21., 29.],
        [20., 28.],
        [19., 27.],
        [18., 26.],
        [17., 25.],
        [16., 24.],
        [15., 23.],
        [14., 22.],
        [13., 21.],
        [12., 20.],
        [11., 19.],
        [10., 18.],
        [ 9., 17.],
        [ 8., 16.],
        [ 7., 15.],
        [ 6., 14.],
        [ 5., 13.],
        [ 4., 12.],
        [ 3., 11.],
        [ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 1.,  7.],
        [ 2.,  6.],
        [ 3.,  5.],
        [ 4.,  4.],
        [ 5.,  3.],
        [ 6.,  2.],
        [ 7.,  1.],
        [ 8.,  0.],
        [ 9.,  0.],
        [10.,  0.],
        [11.,  1.],
        [12.,  2.],
        [13.,  3.],
        [14.,  4.],
        [15.,  5.],
        [16.,  6.],
        [17.,  7.],
        [18.,  8.],
        [19.,  9.],
        [20., 10.],
        [21., 11.],
        [22., 12.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]],

loss: 0.5149 ||:  10%|▉         | 100/1021 [00:38<02:41,  5.70it/s]

tensor([[ 9., 24.],
        [ 8., 23.],
        [ 7., 22.],
        [ 6., 21.],
        [ 5., 20.],
        [ 4., 19.],
        [ 3., 18.],
        [ 2., 17.],
        [ 1., 16.],
        [ 0., 15.],
        [ 1., 14.],
        [ 2., 13.],
        [ 3., 12.],
        [ 4., 11.],
        [ 5., 10.],
        [ 6.,  9.],
        [ 7.,  8.],
        [ 8.,  7.],
        [ 9.,  6.],
        [10.,  5.],
        [11.,  4.],
        [12.,  3.],
        [13.,  2.],
        [14.,  1.],
        [15.,  0.],
        [16.,  1.],
        [17.,  2.],
        [18.,  3.],
        [19.,  4.],
        [20.,  5.],
        [21.,  6.],
        [22.,  7.],
        [23.,  8.],
        [24.,  9.],
        [25., 10.],
        [26., 11.],
        [27., 12.],
        [28., 13.],
        [29., 14.],
        [30., 15.],
        [31., 16.],
        [32., 17.]], device='cuda:0')
tensor([[11., 32.],
        [10., 31.],
        [ 9., 30.],
        [ 8., 29.],
        [ 7., 28.],
        [ 6., 27.],
        [ 5., 26.],
  

loss: 0.5143 ||:  10%|▉         | 102/1021 [00:39<02:22,  6.44it/s]

tensor([[ 6., 12.],
        [ 5., 11.],
        [ 4., 10.],
        [ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 0.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],
        [ 2.,  2.],
        [ 3.,  1.],
        [ 4.,  0.],
        [ 5.,  0.],
        [ 6.,  0.],
        [ 7.,  0.],
        [ 8.,  1.],
        [ 9.,  2.],
        [10.,  3.],
        [11.,  4.],
        [12.,  5.],
        [13.,  6.],
        [14.,  7.],
        [15.,  8.],
        [16.,  9.],
        [17., 10.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[22., 36.],
        [21., 35.],
        [20., 34.],
        [19., 33.],
        [18., 32.],
        [17., 31.],
        [16., 30.],
        [15., 29.],
        [14., 28.],
        [13., 27.],
        [12., 26.],
  

loss: 0.5109 ||:  10%|█         | 104/1021 [00:39<02:22,  6.44it/s]

tensor([[ 6., 48.],
        [ 5., 47.],
        [ 4., 46.],
        [ 3., 45.],
        [ 2., 44.],
        [ 1., 43.],
        [ 0., 42.],
        [ 1., 41.],
        [ 2., 40.],
        [ 3., 39.],
        [ 4., 38.],
        [ 5., 37.],
        [ 6., 36.],
        [ 7., 35.],
        [ 8., 34.],
        [ 9., 33.],
        [10., 32.],
        [11., 31.],
        [12., 30.],
        [13., 29.],
        [14., 28.],
        [15., 27.],
        [16., 26.],
        [17., 25.],
        [18., 24.],
        [19., 23.],
        [20., 22.],
        [21., 21.],
        [22., 20.],
        [23., 19.],
        [24., 18.],
        [25., 17.],
        [26., 16.],
        [27., 15.],
        [28., 14.],
        [29., 13.],
        [30., 12.],
        [31., 11.],
        [32., 10.],
        [33.,  9.],
        [34.,  8.],
        [35.,  7.],
        [36.,  6.],
        [37.,  5.],
        [38.,  4.],
        [39.,  3.],
        [40.,  2.],
        [41.,  1.],
        [42.,  0.],
        [43.,  1.],


loss: 0.5083 ||:  10%|█         | 106/1021 [00:39<02:13,  6.83it/s]

tensor([[ 4., 26.],
        [ 3., 25.],
        [ 2., 24.],
        [ 1., 23.],
        [ 0., 22.],
        [ 1., 21.],
        [ 2., 20.],
        [ 3., 19.],
        [ 4., 18.],
        [ 5., 17.],
        [ 6., 16.],
        [ 7., 15.],
        [ 8., 14.],
        [ 9., 13.],
        [10., 12.],
        [11., 11.],
        [12., 10.],
        [13.,  9.],
        [14.,  8.],
        [15.,  7.],
        [16.,  6.],
        [17.,  5.],
        [18.,  4.],
        [19.,  3.],
        [20.,  2.],
        [21.,  1.],
        [22.,  0.],
        [23.,  1.],
        [24.,  2.],
        [25.,  3.],
        [26.,  4.],
        [27.,  5.],
        [28.,  6.],
        [29.,  7.],
        [30.,  8.],
        [31.,  9.],
        [32., 10.],
        [33., 11.],
        [34., 12.],
        [35., 13.],
        [36., 14.],
        [37., 15.],
        [38., 16.],
        [39., 17.],
        [40., 18.],
        [41., 19.],
        [42., 20.],
        [43., 21.],
        [44., 22.],
        [45., 23.],


loss: 0.5073 ||:  11%|█         | 108/1021 [00:40<02:02,  7.48it/s]

tensor([[ 2., 24.],
        [ 1., 23.],
        [ 0., 22.],
        [ 1., 21.],
        [ 2., 20.],
        [ 3., 19.],
        [ 4., 18.],
        [ 5., 17.],
        [ 6., 16.],
        [ 7., 15.],
        [ 8., 14.],
        [ 9., 13.],
        [10., 12.],
        [11., 11.],
        [12., 10.],
        [13.,  9.],
        [14.,  8.],
        [15.,  7.],
        [16.,  6.],
        [17.,  5.],
        [18.,  4.],
        [19.,  3.],
        [20.,  2.],
        [21.,  1.],
        [22.,  0.],
        [23.,  1.],
        [24.,  2.],
        [25.,  3.],
        [26.,  4.],
        [27.,  5.],
        [28.,  6.],
        [29.,  7.],
        [30.,  8.],
        [31.,  9.],
        [32., 10.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[11., 14.],
        [10., 13.],
        [ 9., 12.],
        [ 8., 11.],
        [ 7., 10.],
        [ 6.,  9.],
  

loss: 0.5036 ||:  11%|█         | 111/1021 [00:40<02:00,  7.55it/s]

tensor([[13., 41.],
        [12., 40.],
        [11., 39.],
        [10., 38.],
        [ 9., 37.],
        [ 8., 36.],
        [ 7., 35.],
        [ 6., 34.],
        [ 5., 33.],
        [ 4., 32.],
        [ 3., 31.],
        [ 2., 30.],
        [ 1., 29.],
        [ 0., 28.],
        [ 0., 27.],
        [ 0., 26.],
        [ 0., 25.],
        [ 0., 24.],
        [ 0., 23.],
        [ 0., 22.],
        [ 1., 21.],
        [ 2., 20.],
        [ 3., 19.],
        [ 4., 18.],
        [ 5., 17.],
        [ 6., 16.],
        [ 7., 15.],
        [ 8., 14.],
        [ 9., 13.],
        [10., 12.],
        [11., 11.],
        [12., 10.],
        [13.,  9.],
        [14.,  8.],
        [15.,  7.],
        [16.,  6.],
        [17.,  5.],
        [18.,  4.],
        [19.,  3.],
        [20.,  2.],
        [21.,  1.],
        [22.,  0.],
        [23.,  1.],
        [24.,  2.],
        [25.,  3.],
        [26.,  4.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],


loss: 0.5026 ||:  11%|█         | 113/1021 [00:40<01:51,  8.17it/s]

tensor([[ 2., 14.],
        [ 1., 13.],
        [ 0., 12.],
        [ 1., 11.],
        [ 2., 10.],
        [ 3.,  9.],
        [ 4.,  8.],
        [ 5.,  7.],
        [ 6.,  6.],
        [ 7.,  5.],
        [ 8.,  4.],
        [ 9.,  3.],
        [10.,  2.],
        [11.,  1.],
        [12.,  0.],
        [13.,  1.],
        [14.,  2.],
        [15.,  3.],
        [16.,  4.],
        [17.,  5.],
        [18.,  6.],
        [19.,  7.],
        [20.,  8.],
        [21.,  9.],
        [22., 10.],
        [23., 11.],
        [24., 12.],
        [25., 13.],
        [26., 14.],
        [27., 15.],
        [28., 16.],
        [29., 17.],
        [30., 18.],
        [31., 19.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[10., 14.],
        [ 9., 13.],
        [ 8., 12.],
        [ 7., 11.],
        [ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
  

loss: 0.4987 ||:  11%|█▏        | 115/1021 [00:40<02:02,  7.40it/s]

tensor([[14., 37.],
        [13., 36.],
        [12., 35.],
        [11., 34.],
        [10., 33.],
        [ 9., 32.],
        [ 8., 31.],
        [ 7., 30.],
        [ 6., 29.],
        [ 5., 28.],
        [ 4., 27.],
        [ 3., 26.],
        [ 2., 25.],
        [ 1., 24.],
        [ 0., 23.],
        [ 1., 22.],
        [ 2., 21.],
        [ 3., 20.],
        [ 4., 19.],
        [ 5., 18.],
        [ 6., 17.],
        [ 7., 16.],
        [ 8., 15.],
        [ 9., 14.],
        [10., 13.],
        [11., 12.],
        [12., 11.],
        [13., 10.],
        [14.,  9.],
        [15.,  8.],
        [16.,  7.],
        [17.,  6.],
        [18.,  5.],
        [19.,  4.],
        [20.,  3.],
        [21.,  2.],
        [22.,  1.],
        [23.,  0.],
        [24.,  1.],
        [25.,  2.],
        [26.,  3.],
        [27.,  4.],
        [28.,  5.],
        [29.,  6.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],


loss: 0.4936 ||:  11%|█▏        | 117/1021 [00:41<02:29,  6.03it/s]

tensor([[16., 40.],
        [15., 39.],
        [14., 38.],
        [13., 37.],
        [12., 36.],
        [11., 35.],
        [10., 34.],
        [ 9., 33.],
        [ 8., 32.],
        [ 7., 31.],
        [ 6., 30.],
        [ 5., 29.],
        [ 4., 28.],
        [ 3., 27.],
        [ 2., 26.],
        [ 1., 25.],
        [ 0., 24.],
        [ 0., 23.],
        [ 1., 22.],
        [ 2., 21.],
        [ 3., 20.],
        [ 4., 19.],
        [ 5., 18.],
        [ 6., 17.],
        [ 7., 16.],
        [ 8., 15.],
        [ 9., 14.],
        [10., 13.],
        [11., 12.],
        [12., 11.],
        [13., 10.],
        [14.,  9.],
        [15.,  8.],
        [16.,  7.],
        [17.,  6.],
        [18.,  5.],
        [19.,  4.],
        [20.,  3.],
        [21.,  2.],
        [22.,  1.],
        [23.,  0.],
        [24.,  1.],
        [25.,  2.],
        [26.,  3.],
        [27.,  4.],
        [28.,  5.],
        [29.,  6.],
        [30.,  7.],
        [31.,  8.],
        [32.,  9.],


loss: 0.4935 ||:  12%|█▏        | 119/1021 [00:41<02:05,  7.21it/s]

tensor([[ 4., 18.],
        [ 3., 17.],
        [ 2., 16.],
        [ 1., 15.],
        [ 0., 14.],
        [ 0., 13.],
        [ 0., 12.],
        [ 0., 11.],
        [ 1., 10.],
        [ 2.,  9.],
        [ 3.,  8.],
        [ 4.,  7.],
        [ 5.,  6.],
        [ 6.,  5.],
        [ 7.,  4.],
        [ 8.,  3.],
        [ 9.,  2.],
        [10.,  1.],
        [11.,  0.],
        [12.,  1.],
        [13.,  2.],
        [14.,  3.],
        [15.,  4.],
        [16.,  5.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[4., 6.],
        [3., 5.],
        [2., 4.],
        [1., 3.],
        [0., 2.],
        [1., 1.],
        [2., 0.],
        [3., 1.],
        [4., 2.],
        [5., 3.],
        [6., 4.],
        [7., 5.],
        [0., 0.],
        [0., 0.]], device='cuda:0')
tensor([[ 3., 22.],
        [ 2., 21.],
        [ 1., 20.],
        [ 0., 19.],
        [ 1., 18.],
        [ 2., 17.],
        [ 3.

loss: 0.4971 ||:  12%|█▏        | 122/1021 [00:41<01:54,  7.85it/s]

tensor([[32., 41.],
        [31., 40.],
        [30., 39.],
        [29., 38.],
        [28., 37.],
        [27., 36.],
        [26., 35.],
        [25., 34.],
        [24., 33.],
        [23., 32.],
        [22., 31.],
        [21., 30.],
        [20., 29.],
        [19., 28.],
        [18., 27.],
        [17., 26.],
        [16., 25.],
        [15., 24.],
        [14., 23.],
        [13., 22.],
        [12., 21.],
        [11., 20.],
        [10., 19.],
        [ 9., 18.],
        [ 8., 17.],
        [ 7., 16.],
        [ 6., 15.],
        [ 5., 14.],
        [ 4., 13.],
        [ 3., 12.],
        [ 2., 11.],
        [ 1., 10.],
        [ 0.,  9.],
        [ 1.,  8.],
        [ 2.,  7.],
        [ 3.,  6.],
        [ 4.,  5.],
        [ 5.,  4.],
        [ 6.,  3.],
        [ 7.,  2.],
        [ 8.,  1.],
        [ 9.,  0.],
        [10.,  1.],
        [11.,  2.],
        [12.,  3.],
        [13.,  4.],
        [14.,  5.],
        [15.,  6.],
        [16.,  7.],
        [17.,  8.],


loss: 0.5000 ||:  12%|█▏        | 125/1021 [00:42<01:44,  8.55it/s]

tensor([[ 7., 13.],
        [ 6., 12.],
        [ 5., 11.],
        [ 4., 10.],
        [ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 1.,  5.],
        [ 2.,  4.],
        [ 3.,  3.],
        [ 4.,  2.],
        [ 5.,  1.],
        [ 6.,  0.],
        [ 7.,  1.],
        [ 8.,  2.]], device='cuda:0')
tensor([[ 6., 30.],
        [ 5., 29.],
        [ 4., 28.],
        [ 3., 27.],
        [ 2., 26.],
        [ 1., 25.],
        [ 0., 24.],
        [ 1., 23.],
        [ 2., 22.],
        [ 3., 21.],
        [ 4., 20.],
        [ 5., 19.],
        [ 6., 18.],
        [ 7., 17.],
        [ 8., 16.],
        [ 9., 15.],
        [10., 14.],
        [11., 13.],
        [12., 12.],
        [13., 11.],
        [14., 10.],
        [15.,  9.],
        [16.,  8.],
        [17.,  7.],
        [18.,  6.],
        [19.,  5.],
        [20.,  4.],
        [21.,  3.],
        [22.,  2.],
        [23.,  1.],
        [24.,  0.],
        [25.,  0.],
        [26.,  1.],
  

loss: 0.4974 ||:  12%|█▏        | 126/1021 [00:42<02:11,  6.80it/s]

tensor([[36., 53.],
        [35., 52.],
        [34., 51.],
        [33., 50.],
        [32., 49.],
        [31., 48.],
        [30., 47.],
        [29., 46.],
        [28., 45.],
        [27., 44.],
        [26., 43.],
        [25., 42.],
        [24., 41.],
        [23., 40.],
        [22., 39.],
        [21., 38.],
        [20., 37.],
        [19., 36.],
        [18., 35.],
        [17., 34.],
        [16., 33.],
        [15., 32.],
        [14., 31.],
        [13., 30.],
        [12., 29.],
        [11., 28.],
        [10., 27.],
        [ 9., 26.],
        [ 8., 25.],
        [ 7., 24.],
        [ 6., 23.],
        [ 5., 22.],
        [ 4., 21.],
        [ 3., 20.],
        [ 2., 19.],
        [ 1., 18.],
        [ 0., 17.],
        [ 0., 16.],
        [ 1., 15.],
        [ 2., 14.],
        [ 3., 13.],
        [ 4., 12.],
        [ 5., 11.],
        [ 6., 10.],
        [ 7.,  9.],
        [ 8.,  8.],
        [ 9.,  7.],
        [10.,  6.],
        [11.,  5.],
        [12.,  4.],


loss: 0.4967 ||:  12%|█▏        | 127/1021 [00:42<02:05,  7.15it/s]

tensor([[ 9., 22.],
        [ 8., 21.],
        [ 7., 20.],
        [ 6., 19.],
        [ 5., 18.],
        [ 4., 17.],
        [ 3., 16.],
        [ 2., 15.],
        [ 1., 14.],
        [ 0., 13.],
        [ 1., 12.],
        [ 2., 11.],
        [ 3., 10.],
        [ 4.,  9.],
        [ 5.,  8.],
        [ 6.,  7.],
        [ 7.,  6.],
        [ 8.,  5.],
        [ 9.,  4.],
        [10.,  3.],
        [11.,  2.],
        [12.,  1.],
        [13.,  0.],
        [14.,  1.],
        [15.,  2.],
        [16.,  3.],
        [17.,  4.],
        [18.,  5.],
        [19.,  6.],
        [20.,  7.],
        [21.,  8.],
        [22.,  9.],
        [23., 10.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[17., 20.],
        [16., 19.],
        [15., 18.],
        [14., 17.],
        [13., 16.],
        [12., 15.],
        [11., 14.],
        [10., 13.],
        [ 9., 12.],
        [ 8., 11.],
        [ 7., 10.],
  

loss: 0.4975 ||:  13%|█▎        | 129/1021 [00:42<01:56,  7.63it/s]

tensor([[ 3., 29.],
        [ 2., 28.],
        [ 1., 27.],
        [ 0., 26.],
        [ 1., 25.],
        [ 2., 24.],
        [ 3., 23.],
        [ 4., 22.],
        [ 5., 21.],
        [ 6., 20.],
        [ 7., 19.],
        [ 8., 18.],
        [ 9., 17.],
        [10., 16.],
        [11., 15.],
        [12., 14.],
        [13., 13.],
        [14., 12.],
        [15., 11.],
        [16., 10.],
        [17.,  9.],
        [18.,  8.],
        [19.,  7.],
        [20.,  6.],
        [21.,  5.],
        [22.,  4.],
        [23.,  3.],
        [24.,  2.],
        [25.,  1.],
        [26.,  0.],
        [27.,  1.],
        [28.,  2.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[13., 34.],
        [12., 33.],
        [11., 32.],
        [10., 31.],
        [ 9., 30.],
        [ 8., 29.],
        [ 7., 28.],
        [ 6., 27.],
        [ 5., 26.],
        [ 4., 25.],
        [ 3., 24.],
  

loss: 0.4957 ||:  13%|█▎        | 131/1021 [00:42<02:02,  7.26it/s]

tensor([[ 5., 23.],
        [ 4., 22.],
        [ 3., 21.],
        [ 2., 20.],
        [ 1., 19.],
        [ 0., 18.],
        [ 1., 17.],
        [ 2., 16.],
        [ 3., 15.],
        [ 4., 14.],
        [ 5., 13.],
        [ 6., 12.],
        [ 7., 11.],
        [ 8., 10.],
        [ 9.,  9.],
        [10.,  8.],
        [11.,  7.],
        [12.,  6.],
        [13.,  5.],
        [14.,  4.],
        [15.,  3.],
        [16.,  2.],
        [17.,  1.],
        [18.,  0.],
        [19.,  1.],
        [20.,  2.],
        [21.,  3.],
        [22.,  4.],
        [23.,  5.],
        [24.,  6.],
        [25.,  7.],
        [26.,  8.],
        [27.,  9.],
        [28., 10.],
        [29., 11.],
        [30., 12.],
        [31., 13.],
        [32., 14.],
        [33., 15.],
        [34., 16.],
        [35., 17.],
        [36., 18.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]],

loss: 0.4957 ||:  13%|█▎        | 133/1021 [00:43<01:52,  7.86it/s]

tensor([[ 7., 26.],
        [ 6., 25.],
        [ 5., 24.],
        [ 4., 23.],
        [ 3., 22.],
        [ 2., 21.],
        [ 1., 20.],
        [ 0., 19.],
        [ 1., 18.],
        [ 2., 17.],
        [ 3., 16.],
        [ 4., 15.],
        [ 5., 14.],
        [ 6., 13.],
        [ 7., 12.],
        [ 8., 11.],
        [ 9., 10.],
        [10.,  9.],
        [11.,  8.],
        [12.,  7.],
        [13.,  6.],
        [14.,  5.],
        [15.,  4.],
        [16.,  3.],
        [17.,  2.],
        [18.,  1.],
        [19.,  0.],
        [20.,  1.],
        [21.,  2.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[48., 52.],
        [47., 51.],
        [46., 50.],
        [45., 49.],
        [44., 48.],
        [43., 47.],
        [42., 46.],
        [41., 45.],
        [40., 44.],
        [39., 43.],
        [38., 42.],
        [37., 41.],
        [36., 40.],
        [35., 39.],
        [34., 38.],
        [33., 37.],
  

loss: 0.4934 ||:  13%|█▎        | 134/1021 [00:43<02:11,  6.74it/s]

tensor([[ 9., 15.],
        [ 8., 14.],
        [ 7., 13.],
        [ 6., 12.],
        [ 5., 11.],
        [ 4., 10.],
        [ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 1.,  5.],
        [ 2.,  4.],
        [ 3.,  3.],
        [ 4.,  2.],
        [ 5.,  1.],
        [ 6.,  0.],
        [ 7.,  1.],
        [ 8.,  2.],
        [ 9.,  3.],
        [10.,  4.],
        [11.,  5.],
        [12.,  6.],
        [13.,  7.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[54., 63.],
        [53., 62.],
        [52., 61.],
        [51., 60.],
        [50., 59.],
        [49., 58.],
        [48., 57.],
        [47., 56.],
        [46., 55.],
        [45., 54.],
        [44., 53.],
        [43., 52.],
        [42., 51.],
        [41., 50.],
        [40., 49.],
        [39., 48.],
        [38., 47.],
        [37., 46.],
        [36., 45.],
        [35., 44.],
        [34., 43.],
        [33., 42.],
  

loss: 0.4896 ||:  13%|█▎        | 137/1021 [00:43<02:30,  5.87it/s]

tensor([[ 2., 46.],
        [ 1., 45.],
        [ 0., 44.],
        [ 0., 43.],
        [ 0., 42.],
        [ 1., 41.],
        [ 2., 40.],
        [ 3., 39.],
        [ 4., 38.],
        [ 5., 37.],
        [ 6., 36.],
        [ 7., 35.],
        [ 8., 34.],
        [ 9., 33.],
        [10., 32.],
        [11., 31.],
        [12., 30.],
        [13., 29.],
        [14., 28.],
        [15., 27.],
        [16., 26.],
        [17., 25.],
        [18., 24.],
        [19., 23.],
        [20., 22.],
        [21., 21.],
        [22., 20.],
        [23., 19.],
        [24., 18.],
        [25., 17.],
        [26., 16.],
        [27., 15.],
        [28., 14.],
        [29., 13.],
        [30., 12.],
        [31., 11.],
        [32., 10.],
        [33.,  9.],
        [34.,  8.],
        [35.,  7.],
        [36.,  6.],
        [37.,  5.],
        [38.,  4.],
        [39.,  3.],
        [40.,  2.],
        [41.,  1.],
        [42.,  0.],
        [43.,  0.],
        [44.,  1.],
        [45.,  2.],


loss: 0.4884 ||:  14%|█▎        | 139/1021 [00:44<02:21,  6.21it/s]

tensor([[33., 47.],
        [32., 46.],
        [31., 45.],
        [30., 44.],
        [29., 43.],
        [28., 42.],
        [27., 41.],
        [26., 40.],
        [25., 39.],
        [24., 38.],
        [23., 37.],
        [22., 36.],
        [21., 35.],
        [20., 34.],
        [19., 33.],
        [18., 32.],
        [17., 31.],
        [16., 30.],
        [15., 29.],
        [14., 28.],
        [13., 27.],
        [12., 26.],
        [11., 25.],
        [10., 24.],
        [ 9., 23.],
        [ 8., 22.],
        [ 7., 21.],
        [ 6., 20.],
        [ 5., 19.],
        [ 4., 18.],
        [ 3., 17.],
        [ 2., 16.],
        [ 1., 15.],
        [ 0., 14.],
        [ 1., 13.],
        [ 2., 12.],
        [ 3., 11.],
        [ 4., 10.],
        [ 5.,  9.],
        [ 6.,  8.],
        [ 7.,  7.],
        [ 8.,  6.],
        [ 9.,  5.],
        [10.,  4.],
        [11.,  3.],
        [12.,  2.],
        [13.,  1.],
        [14.,  0.],
        [15.,  1.],
        [16.,  2.],


loss: 0.4856 ||:  14%|█▎        | 140/1021 [00:44<02:27,  5.96it/s]

tensor([[19., 42.],
        [18., 41.],
        [17., 40.],
        [16., 39.],
        [15., 38.],
        [14., 37.],
        [13., 36.],
        [12., 35.],
        [11., 34.],
        [10., 33.],
        [ 9., 32.],
        [ 8., 31.],
        [ 7., 30.],
        [ 6., 29.],
        [ 5., 28.],
        [ 4., 27.],
        [ 3., 26.],
        [ 2., 25.],
        [ 1., 24.],
        [ 0., 23.],
        [ 1., 22.],
        [ 2., 21.],
        [ 3., 20.],
        [ 4., 19.],
        [ 5., 18.],
        [ 6., 17.],
        [ 7., 16.],
        [ 8., 15.],
        [ 9., 14.],
        [10., 13.],
        [11., 12.],
        [12., 11.],
        [13., 10.],
        [14.,  9.],
        [15.,  8.],
        [16.,  7.],
        [17.,  6.],
        [18.,  5.],
        [19.,  4.],
        [20.,  3.],
        [21.,  2.],
        [22.,  1.],
        [23.,  0.],
        [24.,  0.],
        [25.,  1.],
        [26.,  2.],
        [27.,  3.],
        [28.,  4.],
        [29.,  5.],
        [30.,  6.],


loss: 0.4825 ||:  14%|█▍        | 142/1021 [00:44<02:43,  5.38it/s]

tensor([[48., 56.],
        [47., 55.],
        [46., 54.],
        [45., 53.],
        [44., 52.],
        [43., 51.],
        [42., 50.],
        [41., 49.],
        [40., 48.],
        [39., 47.],
        [38., 46.],
        [37., 45.],
        [36., 44.],
        [35., 43.],
        [34., 42.],
        [33., 41.],
        [32., 40.],
        [31., 39.],
        [30., 38.],
        [29., 37.],
        [28., 36.],
        [27., 35.],
        [26., 34.],
        [25., 33.],
        [24., 32.],
        [23., 31.],
        [22., 30.],
        [21., 29.],
        [20., 28.],
        [19., 27.],
        [18., 26.],
        [17., 25.],
        [16., 24.],
        [15., 23.],
        [14., 22.],
        [13., 21.],
        [12., 20.],
        [11., 19.],
        [10., 18.],
        [ 9., 17.],
        [ 8., 16.],
        [ 7., 15.],
        [ 6., 14.],
        [ 5., 13.],
        [ 4., 12.],
        [ 3., 11.],
        [ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 1.,  7.],


loss: 0.4776 ||:  14%|█▍        | 145/1021 [00:45<01:58,  7.39it/s]

tensor([[ 2., 12.],
        [ 1., 11.],
        [ 0., 10.],
        [ 1.,  9.],
        [ 2.,  8.],
        [ 3.,  7.],
        [ 4.,  6.],
        [ 5.,  5.],
        [ 6.,  4.],
        [ 7.,  3.],
        [ 8.,  2.],
        [ 9.,  1.],
        [10.,  0.],
        [11.,  1.],
        [12.,  2.],
        [13.,  3.],
        [14.,  4.],
        [15.,  5.],
        [16.,  6.],
        [17.,  7.],
        [18.,  8.],
        [19.,  9.],
        [20., 10.],
        [21., 11.],
        [22., 12.],
        [23., 13.],
        [24., 14.],
        [25., 15.],
        [26., 16.],
        [27., 17.],
        [28., 18.],
        [29., 19.],
        [30., 20.],
        [31., 21.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[13., 22.],
        [12., 21.],
        [11., 20.],
        [10., 19.],
        [ 9., 18.],
        [ 8., 17.],
        [ 7., 16.],
        [ 6., 15.],
        [ 5., 14.],
  

loss: 0.4777 ||:  14%|█▍        | 147/1021 [00:45<01:48,  8.05it/s]

tensor([[ 9., 10.],
        [ 8.,  9.],
        [ 7.,  8.],
        [ 6.,  7.],
        [ 5.,  6.],
        [ 4.,  5.],
        [ 3.,  4.],
        [ 2.,  3.],
        [ 1.,  2.],
        [ 0.,  1.],
        [ 1.,  0.],
        [ 2.,  1.],
        [ 3.,  2.],
        [ 4.,  3.],
        [ 5.,  4.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 6., 34.],
        [ 5., 33.],
        [ 4., 32.],
        [ 3., 31.],
        [ 2., 30.],
        [ 1., 29.],
        [ 0., 28.],
        [ 1., 27.],
        [ 2., 26.],
        [ 3., 25.],
        [ 4., 24.],
        [ 5., 23.],
        [ 6., 22.],
        [ 7., 21.],
        [ 8., 20.],
        [ 9., 19.],
        [10., 18.],
        [11., 17.],
        [12., 16.],
        [13., 15.],
        [14., 14.],
        [15., 13.],
        [16., 12.],
        [17., 11.],
        [18., 10.],
        [19.,  9.],
        [20.,  8.],
        [21.,  7.],
        [22.,  6.],
        [23.,  5.],
        [24.,  4.],
  

loss: 0.4828 ||:  15%|█▍        | 149/1021 [00:45<01:35,  9.11it/s]

tensor([[ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 0.,  5.],
        [ 0.,  4.],
        [ 0.,  3.],
        [ 1.,  2.],
        [ 2.,  1.],
        [ 3.,  0.],
        [ 4.,  1.],
        [ 5.,  2.],
        [ 6.,  3.],
        [ 7.,  4.],
        [ 8.,  5.],
        [ 9.,  6.],
        [10.,  7.],
        [11.,  8.],
        [12.,  9.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 1., 32.],
        [ 0., 31.],
        [ 0., 30.],
        [ 0., 29.],
        [ 1., 28.],
        [ 2., 27.],
        [ 3., 26.],
        [ 4., 25.],
        [ 5., 24.],
        [ 6., 23.],
        [ 7., 22.],
        [ 8., 21.],
        [ 9., 20.],
        [10., 19.],
        [11., 18.],
        [12., 17.],
        [13., 16.],
        [14., 15.],
        [15., 14.],
        [16., 13.],
        [17., 12.],
        [18., 11.],
        [19., 10.],
        [20.,  9.],
  

loss: 0.4823 ||:  15%|█▍        | 151/1021 [00:45<01:43,  8.45it/s]

tensor([[21., 32.],
        [20., 31.],
        [19., 30.],
        [18., 29.],
        [17., 28.],
        [16., 27.],
        [15., 26.],
        [14., 25.],
        [13., 24.],
        [12., 23.],
        [11., 22.],
        [10., 21.],
        [ 9., 20.],
        [ 8., 19.],
        [ 7., 18.],
        [ 6., 17.],
        [ 5., 16.],
        [ 4., 15.],
        [ 3., 14.],
        [ 2., 13.],
        [ 1., 12.],
        [ 0., 11.],
        [ 1., 10.],
        [ 2.,  9.],
        [ 3.,  8.],
        [ 4.,  7.],
        [ 5.,  6.],
        [ 6.,  5.],
        [ 7.,  4.],
        [ 8.,  3.],
        [ 9.,  2.],
        [10.,  1.],
        [11.,  0.],
        [12.,  1.],
        [13.,  2.],
        [ 0.,  0.]], device='cuda:0')
tensor([[12., 13.],
        [11., 12.],
        [10., 11.],
        [ 9., 10.],
        [ 8.,  9.],
        [ 7.,  8.],
        [ 6.,  7.],
        [ 5.,  6.],
        [ 4.,  5.],
        [ 3.,  4.],
        [ 2.,  3.],
        [ 1.,  2.],
        [ 0.,  1.],
  

loss: 0.4789 ||:  15%|█▍        | 153/1021 [00:45<01:40,  8.63it/s]

tensor([[ 4., 24.],
        [ 3., 23.],
        [ 2., 22.],
        [ 1., 21.],
        [ 0., 20.],
        [ 1., 19.],
        [ 2., 18.],
        [ 3., 17.],
        [ 4., 16.],
        [ 5., 15.],
        [ 6., 14.],
        [ 7., 13.],
        [ 8., 12.],
        [ 9., 11.],
        [10., 10.],
        [11.,  9.],
        [12.,  8.],
        [13.,  7.],
        [14.,  6.],
        [15.,  5.],
        [16.,  4.],
        [17.,  3.],
        [18.,  2.],
        [19.,  1.],
        [20.,  0.],
        [21.,  1.],
        [22.,  2.],
        [23.,  3.],
        [24.,  4.],
        [25.,  5.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 4., 14.],
        [ 3., 13.],
        [ 2., 12.],
        [ 1., 11.],
        [ 0., 10.],
        [ 1.,  9.],
        [ 2.,  8.],
        [ 3.,  7.],
        [ 4.,  6.],
        [ 5.,  5.],
        [ 6.,  4.],
        [ 7.,  3.],
        [ 8.,  2.],
        [ 9.,  1.],
        [10.,  0.],
        [11.,  1.],
  

loss: 0.4784 ||:  15%|█▌        | 156/1021 [00:46<01:48,  8.01it/s]

tensor([[16., 20.],
        [15., 19.],
        [14., 18.],
        [13., 17.],
        [12., 16.],
        [11., 15.],
        [10., 14.],
        [ 9., 13.],
        [ 8., 12.],
        [ 7., 11.],
        [ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],
        [ 2.,  2.],
        [ 3.,  1.],
        [ 4.,  0.],
        [ 5.,  1.],
        [ 6.,  2.],
        [ 7.,  3.],
        [ 8.,  4.],
        [ 9.,  5.],
        [10.,  6.],
        [11.,  7.],
        [12.,  8.],
        [13.,  9.],
        [14., 10.],
        [15., 11.],
        [16., 12.],
        [17., 13.],
        [18., 14.],
        [19., 15.],
        [20., 16.],
        [21., 17.],
        [22., 18.],
        [23., 19.],
        [24., 20.],
        [25., 21.],
        [26., 22.],
        [27., 23.],
        [28., 24.],
        [29., 25.],
        [30., 26.],
        [31., 27.],
        [32., 28.],
        [33., 29.],


loss: 0.4760 ||:  15%|█▌        | 157/1021 [00:46<01:49,  7.91it/s]

tensor([[44., 56.],
        [43., 55.],
        [42., 54.],
        [41., 53.],
        [40., 52.],
        [39., 51.],
        [38., 50.],
        [37., 49.],
        [36., 48.],
        [35., 47.],
        [34., 46.],
        [33., 45.],
        [32., 44.],
        [31., 43.],
        [30., 42.],
        [29., 41.],
        [28., 40.],
        [27., 39.],
        [26., 38.],
        [25., 37.],
        [24., 36.],
        [23., 35.],
        [22., 34.],
        [21., 33.],
        [20., 32.],
        [19., 31.],
        [18., 30.],
        [17., 29.],
        [16., 28.],
        [15., 27.],
        [14., 26.],
        [13., 25.],
        [12., 24.],
        [11., 23.],
        [10., 22.],
        [ 9., 21.],
        [ 8., 20.],
        [ 7., 19.],
        [ 6., 18.],
        [ 5., 17.],
        [ 4., 16.],
        [ 3., 15.],
        [ 2., 14.],
        [ 1., 13.],
        [ 0., 12.],
        [ 1., 11.],
        [ 2., 10.],
        [ 3.,  9.],
        [ 4.,  8.],
        [ 5.,  7.],


loss: 0.4750 ||:  16%|█▌        | 159/1021 [00:46<02:15,  6.38it/s]

tensor([[ 2., 12.],
        [ 1., 11.],
        [ 0., 10.],
        [ 1.,  9.],
        [ 2.,  8.],
        [ 3.,  7.],
        [ 4.,  6.],
        [ 5.,  5.],
        [ 6.,  4.],
        [ 7.,  3.],
        [ 8.,  2.],
        [ 9.,  1.],
        [10.,  0.],
        [11.,  0.],
        [12.,  0.],
        [13.,  0.],
        [14.,  1.],
        [15.,  2.],
        [16.,  3.],
        [17.,  4.],
        [18.,  5.],
        [19.,  6.],
        [20.,  7.],
        [21.,  8.],
        [22.,  9.],
        [23., 10.],
        [24., 11.],
        [25., 12.],
        [26., 13.],
        [27., 14.],
        [28., 15.],
        [29., 16.],
        [30., 17.],
        [31., 18.],
        [32., 19.],
        [33., 20.],
        [34., 21.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[13., 43.],
        [12., 42.],
        [11., 41.],
        [10., 40.],
        [ 9., 39.],
        [ 8., 38.],
        [ 7., 37.],
  

loss: 0.4749 ||:  16%|█▌        | 161/1021 [00:47<02:09,  6.65it/s]

tensor([[14., 26.],
        [13., 25.],
        [12., 24.],
        [11., 23.],
        [10., 22.],
        [ 9., 21.],
        [ 8., 20.],
        [ 7., 19.],
        [ 6., 18.],
        [ 5., 17.],
        [ 4., 16.],
        [ 3., 15.],
        [ 2., 14.],
        [ 1., 13.],
        [ 0., 12.],
        [ 1., 11.],
        [ 2., 10.],
        [ 3.,  9.],
        [ 4.,  8.],
        [ 5.,  7.],
        [ 6.,  6.],
        [ 7.,  5.],
        [ 8.,  4.],
        [ 9.,  3.],
        [10.,  2.],
        [11.,  1.],
        [12.,  0.],
        [13.,  1.],
        [14.,  2.],
        [15.,  3.],
        [16.,  4.],
        [17.,  5.],
        [18.,  6.],
        [19.,  7.],
        [20.,  8.],
        [21.,  9.],
        [22., 10.],
        [23., 11.],
        [24., 12.],
        [25., 13.]], device='cuda:0')
tensor([[ 1., 19.],
        [ 0., 18.],
        [ 0., 17.],
        [ 0., 16.],
        [ 1., 15.],
        [ 2., 14.],
        [ 3., 13.],
        [ 4., 12.],
        [ 5., 11.],
  

loss: 0.4787 ||:  16%|█▌        | 164/1021 [00:47<01:42,  8.35it/s]

tensor([[1., 3.],
        [0., 2.],
        [1., 1.],
        [2., 0.],
        [3., 1.],
        [4., 2.],
        [0., 0.],
        [0., 0.],
        [0., 0.]], device='cuda:0')
tensor([[ 9., 20.],
        [ 8., 19.],
        [ 7., 18.],
        [ 6., 17.],
        [ 5., 16.],
        [ 4., 15.],
        [ 3., 14.],
        [ 2., 13.],
        [ 1., 12.],
        [ 0., 11.],
        [ 0., 10.],
        [ 0.,  9.],
        [ 1.,  8.],
        [ 2.,  7.],
        [ 3.,  6.],
        [ 4.,  5.],
        [ 5.,  4.],
        [ 6.,  3.],
        [ 7.,  2.],
        [ 8.,  1.],
        [ 9.,  0.],
        [10.,  1.],
        [11.,  2.],
        [12.,  3.],
        [13.,  4.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[18., 28.],
        [17., 27.],
        [16., 26.],
        [15., 25.],
        [14., 24.],
        [13., 23.],
        [12., 22.],
        [11., 21.],
  

loss: 0.4779 ||:  16%|█▋        | 166/1021 [00:47<01:43,  8.26it/s]

tensor([[14., 25.],
        [13., 24.],
        [12., 23.],
        [11., 22.],
        [10., 21.],
        [ 9., 20.],
        [ 8., 19.],
        [ 7., 18.],
        [ 6., 17.],
        [ 5., 16.],
        [ 4., 15.],
        [ 3., 14.],
        [ 2., 13.],
        [ 1., 12.],
        [ 0., 11.],
        [ 1., 10.],
        [ 2.,  9.],
        [ 3.,  8.],
        [ 4.,  7.],
        [ 5.,  6.],
        [ 6.,  5.],
        [ 7.,  4.],
        [ 8.,  3.],
        [ 9.,  2.],
        [10.,  1.],
        [11.,  0.],
        [12.,  1.],
        [13.,  2.],
        [14.,  3.],
        [15.,  4.],
        [16.,  5.],
        [17.,  6.],
        [18.,  7.],
        [19.,  8.],
        [20.,  9.],
        [21., 10.],
        [22., 11.],
        [23., 12.],
        [24., 13.],
        [25., 14.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 9., 19.],
        [ 8., 18.],
        [ 7., 17.],
        [ 6., 16.],
        [ 5., 15.],
  

loss: 0.4775 ||:  16%|█▋        | 168/1021 [00:47<02:03,  6.91it/s]

tensor([[ 7., 61.],
        [ 6., 60.],
        [ 5., 59.],
        [ 4., 58.],
        [ 3., 57.],
        [ 2., 56.],
        [ 1., 55.],
        [ 0., 54.],
        [ 1., 53.],
        [ 2., 52.],
        [ 3., 51.],
        [ 4., 50.],
        [ 5., 49.],
        [ 6., 48.],
        [ 7., 47.],
        [ 8., 46.],
        [ 9., 45.],
        [10., 44.],
        [11., 43.],
        [12., 42.],
        [13., 41.],
        [14., 40.],
        [15., 39.],
        [16., 38.],
        [17., 37.],
        [18., 36.],
        [19., 35.],
        [20., 34.],
        [21., 33.],
        [22., 32.],
        [23., 31.],
        [24., 30.],
        [25., 29.],
        [26., 28.],
        [27., 27.],
        [28., 26.],
        [29., 25.],
        [30., 24.],
        [31., 23.],
        [32., 22.],
        [33., 21.],
        [34., 20.],
        [35., 19.],
        [36., 18.],
        [37., 17.],
        [38., 16.],
        [39., 15.],
        [40., 14.],
        [41., 13.],
        [42., 12.],


loss: 0.4773 ||:  17%|█▋        | 170/1021 [00:48<02:05,  6.77it/s]

tensor([[18., 39.],
        [17., 38.],
        [16., 37.],
        [15., 36.],
        [14., 35.],
        [13., 34.],
        [12., 33.],
        [11., 32.],
        [10., 31.],
        [ 9., 30.],
        [ 8., 29.],
        [ 7., 28.],
        [ 6., 27.],
        [ 5., 26.],
        [ 4., 25.],
        [ 3., 24.],
        [ 2., 23.],
        [ 1., 22.],
        [ 0., 21.],
        [ 1., 20.],
        [ 2., 19.],
        [ 3., 18.],
        [ 4., 17.],
        [ 5., 16.],
        [ 6., 15.],
        [ 7., 14.],
        [ 8., 13.],
        [ 9., 12.],
        [10., 11.],
        [11., 10.],
        [12.,  9.],
        [13.,  8.],
        [14.,  7.],
        [15.,  6.],
        [16.,  5.],
        [17.,  4.],
        [18.,  3.],
        [19.,  2.],
        [20.,  1.],
        [21.,  0.],
        [22.,  1.],
        [23.,  2.],
        [24.,  3.],
        [25.,  4.],
        [26.,  5.],
        [27.,  6.],
        [28.,  7.],
        [29.,  8.],
        [30.,  9.],
        [31., 10.],


loss: 0.4767 ||:  17%|█▋        | 171/1021 [00:48<02:09,  6.57it/s]

tensor([[18., 20.],
        [17., 19.],
        [16., 18.],
        [15., 17.],
        [14., 16.],
        [13., 15.],
        [12., 14.],
        [11., 13.],
        [10., 12.],
        [ 9., 11.],
        [ 8., 10.],
        [ 7.,  9.],
        [ 6.,  8.],
        [ 5.,  7.],
        [ 4.,  6.],
        [ 3.,  5.],
        [ 2.,  4.],
        [ 1.,  3.],
        [ 0.,  2.],
        [ 1.,  1.],
        [ 2.,  0.],
        [ 3.,  1.],
        [ 4.,  2.],
        [ 5.,  3.],
        [ 6.,  4.],
        [ 7.,  5.],
        [ 8.,  6.],
        [ 9.,  7.],
        [10.,  8.],
        [11.,  9.],
        [12., 10.],
        [13., 11.],
        [14., 12.],
        [15., 13.],
        [16., 14.],
        [17., 15.],
        [18., 16.],
        [19., 17.],
        [20., 18.],
        [21., 19.],
        [22., 20.],
        [23., 21.],
        [24., 22.],
        [25., 23.],
        [26., 24.],
        [27., 25.],
        [28., 26.],
        [29., 27.],
        [ 0.,  0.],
        [ 0.,  0.],


loss: 0.4749 ||:  17%|█▋        | 172/1021 [00:48<02:24,  5.86it/s]

tensor([[ 7., 13.],
        [ 6., 12.],
        [ 5., 11.],
        [ 4., 10.],
        [ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 1.,  5.],
        [ 2.,  4.],
        [ 3.,  3.],
        [ 4.,  2.],
        [ 5.,  1.],
        [ 6.,  0.],
        [ 7.,  1.],
        [ 8.,  2.]], device='cuda:0')
tensor([[37., 60.],
        [36., 59.],
        [35., 58.],
        [34., 57.],
        [33., 56.],
        [32., 55.],
        [31., 54.],
        [30., 53.],
        [29., 52.],
        [28., 51.],
        [27., 50.],
        [26., 49.],
        [25., 48.],
        [24., 47.],
        [23., 46.],
        [22., 45.],
        [21., 44.],
        [20., 43.],
        [19., 42.],
        [18., 41.],
        [17., 40.],
        [16., 39.],
        [15., 38.],
        [14., 37.],
        [13., 36.],
        [12., 35.],
        [11., 34.],
        [10., 33.],
        [ 9., 32.],
        [ 8., 31.],
        [ 7., 30.],
        [ 6., 29.],
        [ 5., 28.],
  

loss: 0.4756 ||:  17%|█▋        | 175/1021 [00:49<02:26,  5.78it/s]

tensor([[ 5., 22.],
        [ 4., 21.],
        [ 3., 20.],
        [ 2., 19.],
        [ 1., 18.],
        [ 0., 17.],
        [ 1., 16.],
        [ 2., 15.],
        [ 3., 14.],
        [ 4., 13.],
        [ 5., 12.],
        [ 6., 11.],
        [ 7., 10.],
        [ 8.,  9.],
        [ 9.,  8.],
        [10.,  7.],
        [11.,  6.],
        [12.,  5.],
        [13.,  4.],
        [14.,  3.],
        [15.,  2.],
        [16.,  1.],
        [17.,  0.],
        [18.,  1.],
        [19.,  2.],
        [20.,  3.],
        [21.,  4.],
        [22.,  5.],
        [23.,  6.],
        [24.,  7.],
        [25.,  8.],
        [26.,  9.],
        [27., 10.],
        [28., 11.],
        [29., 12.],
        [30., 13.],
        [31., 14.],
        [32., 15.],
        [33., 16.],
        [34., 17.],
        [35., 18.],
        [36., 19.],
        [37., 20.],
        [38., 21.],
        [39., 22.],
        [40., 23.],
        [41., 24.],
        [42., 25.],
        [43., 26.],
        [44., 27.],


loss: 0.4738 ||:  17%|█▋        | 178/1021 [00:49<01:59,  7.04it/s]

tensor([[ 8., 16.],
        [ 7., 15.],
        [ 6., 14.],
        [ 5., 13.],
        [ 4., 12.],
        [ 3., 11.],
        [ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 1.,  7.],
        [ 2.,  6.],
        [ 3.,  5.],
        [ 4.,  4.],
        [ 5.,  3.],
        [ 6.,  2.],
        [ 7.,  1.],
        [ 8.,  0.],
        [ 9.,  1.],
        [10.,  2.],
        [ 0.,  0.]], device='cuda:0')
tensor([[31., 39.],
        [30., 38.],
        [29., 37.],
        [28., 36.],
        [27., 35.],
        [26., 34.],
        [25., 33.],
        [24., 32.],
        [23., 31.],
        [22., 30.],
        [21., 29.],
        [20., 28.],
        [19., 27.],
        [18., 26.],
        [17., 25.],
        [16., 24.],
        [15., 23.],
        [14., 22.],
        [13., 21.],
        [12., 20.],
        [11., 19.],
        [10., 18.],
        [ 9., 17.],
        [ 8., 16.],
        [ 7., 15.],
        [ 6., 14.],
        [ 5., 13.],
        [ 4., 12.],
        [ 3., 11.],
  

loss: 0.4722 ||:  18%|█▊        | 179/1021 [00:49<02:03,  6.84it/s]

tensor([[ 6., 18.],
        [ 5., 17.],
        [ 4., 16.],
        [ 3., 15.],
        [ 2., 14.],
        [ 1., 13.],
        [ 0., 12.],
        [ 0., 11.],
        [ 0., 10.],
        [ 1.,  9.],
        [ 2.,  8.],
        [ 3.,  7.],
        [ 4.,  6.],
        [ 5.,  5.],
        [ 6.,  4.],
        [ 7.,  3.],
        [ 8.,  2.],
        [ 9.,  1.],
        [10.,  0.],
        [11.,  1.],
        [12.,  2.],
        [13.,  3.],
        [14.,  4.],
        [15.,  5.],
        [16.,  6.],
        [17.,  7.],
        [18.,  8.],
        [19.,  9.],
        [20., 10.],
        [21., 11.],
        [22., 12.],
        [23., 13.],
        [24., 14.],
        [25., 15.],
        [26., 16.],
        [27., 17.],
        [28., 18.],
        [29., 19.],
        [30., 20.],
        [31., 21.],
        [32., 22.],
        [33., 23.],
        [34., 24.],
        [35., 25.],
        [36., 26.],
        [37., 27.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],


loss: 0.4714 ||:  18%|█▊        | 182/1021 [00:49<01:50,  7.61it/s]

tensor([[ 4., 10.],
        [ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 1.,  5.],
        [ 2.,  4.],
        [ 3.,  3.],
        [ 4.,  2.],
        [ 5.,  1.],
        [ 6.,  0.],
        [ 7.,  1.],
        [ 8.,  2.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 3., 15.],
        [ 2., 14.],
        [ 1., 13.],
        [ 0., 12.],
        [ 1., 11.],
        [ 2., 10.],
        [ 3.,  9.],
        [ 4.,  8.],
        [ 5.,  7.],
        [ 6.,  6.],
        [ 7.,  5.],
        [ 8.,  4.],
        [ 9.,  3.],
        [10.,  2.],
        [11.,  1.],
        [12.,  0.],
        [13.,  1.],
        [14.,  2.],
        [15.,  3.],
        [16.,  4.],
        [17.,  5.],
        [18.,  6.],
        [19.,  7.],
        [20.,  8.],
        [21.,  9.],
        [22., 10.],
        [23., 11.],
        [24., 12.],
        [25., 13.],
        [26., 14.],
        [27., 15.],
        [28., 16.],
        [29., 17.],
  

loss: 0.4714 ||:  18%|█▊        | 185/1021 [00:50<01:46,  7.83it/s]

tensor([[1., 3.],
        [0., 2.],
        [1., 1.],
        [2., 0.],
        [3., 1.],
        [4., 2.],
        [5., 3.],
        [6., 4.],
        [0., 0.],
        [0., 0.]], device='cuda:0')
tensor([[11., 28.],
        [10., 27.],
        [ 9., 26.],
        [ 8., 25.],
        [ 7., 24.],
        [ 6., 23.],
        [ 5., 22.],
        [ 4., 21.],
        [ 3., 20.],
        [ 2., 19.],
        [ 1., 18.],
        [ 0., 17.],
        [ 1., 16.],
        [ 2., 15.],
        [ 3., 14.],
        [ 4., 13.],
        [ 5., 12.],
        [ 6., 11.],
        [ 7., 10.],
        [ 8.,  9.],
        [ 9.,  8.],
        [10.,  7.],
        [11.,  6.],
        [12.,  5.],
        [13.,  4.],
        [14.,  3.],
        [15.,  2.],
        [16.,  1.],
        [17.,  0.],
        [18.,  1.],
        [19.,  2.],
        [20.,  3.],
        [21.,  4.],
        [22.,  5.],
        [23.,  6.],
        [24.,  7.],
        [25.,  8.],
        [26.,  9.],
        [27., 10.],
        [28., 11.],
  

loss: 0.4706 ||:  18%|█▊        | 186/1021 [00:50<01:51,  7.48it/s]

tensor([[27., 31.],
        [26., 30.],
        [25., 29.],
        [24., 28.],
        [23., 27.],
        [22., 26.],
        [21., 25.],
        [20., 24.],
        [19., 23.],
        [18., 22.],
        [17., 21.],
        [16., 20.],
        [15., 19.],
        [14., 18.],
        [13., 17.],
        [12., 16.],
        [11., 15.],
        [10., 14.],
        [ 9., 13.],
        [ 8., 12.],
        [ 7., 11.],
        [ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 0.,  3.],
        [ 0.,  2.],
        [ 1.,  1.],
        [ 2.,  0.],
        [ 3.,  0.],
        [ 4.,  1.],
        [ 5.,  2.],
        [ 6.,  3.],
        [ 7.,  4.],
        [ 8.,  5.],
        [ 9.,  6.],
        [10.,  7.],
        [11.,  8.],
        [12.,  9.],
        [13., 10.],
        [14., 11.],
        [15., 12.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
te

loss: 0.4696 ||:  18%|█▊        | 187/1021 [00:50<02:10,  6.41it/s]

tensor([[1., 6.],
        [0., 5.],
        [0., 4.],
        [1., 3.],
        [2., 2.],
        [3., 1.],
        [4., 0.],
        [5., 1.],
        [6., 2.],
        [0., 0.],
        [0., 0.],
        [0., 0.]], device='cuda:0')
tensor([[ 8., 67.],
        [ 7., 66.],
        [ 6., 65.],
        [ 5., 64.],
        [ 4., 63.],
        [ 3., 62.],
        [ 2., 61.],
        [ 1., 60.],
        [ 0., 59.],
        [ 0., 58.],
        [ 0., 57.],
        [ 0., 56.],
        [ 0., 55.],
        [ 0., 54.],
        [ 1., 53.],
        [ 2., 52.],
        [ 3., 51.],
        [ 4., 50.],
        [ 5., 49.],
        [ 6., 48.],
        [ 7., 47.],
        [ 8., 46.],
        [ 9., 45.],
        [10., 44.],
        [11., 43.],
        [12., 42.],
        [13., 41.],
        [14., 40.],
        [15., 39.],
        [16., 38.],
        [17., 37.],
        [18., 36.],
        [19., 35.],
        [20., 34.],
        [21., 33.],
        [22., 32.],
        [23., 31.],
        [24., 30.],
      

loss: 0.4694 ||:  19%|█▊        | 191/1021 [00:51<01:50,  7.53it/s]

tensor([[ 2., 11.],
        [ 1., 10.],
        [ 0.,  9.],
        [ 1.,  8.],
        [ 2.,  7.],
        [ 3.,  6.],
        [ 4.,  5.],
        [ 5.,  4.],
        [ 6.,  3.],
        [ 7.,  2.],
        [ 8.,  1.],
        [ 9.,  0.],
        [10.,  1.],
        [11.,  2.],
        [12.,  3.],
        [13.,  4.],
        [14.,  5.],
        [15.,  6.],
        [16.,  7.],
        [17.,  8.],
        [18.,  9.],
        [19., 10.]], device='cuda:0')
tensor([[ 9., 12.],
        [ 8., 11.],
        [ 7., 10.],
        [ 6.,  9.],
        [ 5.,  8.],
        [ 4.,  7.],
        [ 3.,  6.],
        [ 2.,  5.],
        [ 1.,  4.],
        [ 0.,  3.],
        [ 1.,  2.],
        [ 2.,  1.],
        [ 3.,  0.],
        [ 4.,  1.],
        [ 5.,  2.],
        [ 6.,  3.],
        [ 7.,  4.],
        [ 8.,  5.],
        [ 9.,  6.],
        [10.,  7.],
        [11.,  8.],
        [12.,  9.],
        [13., 10.],
        [14., 11.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], d

loss: 0.4691 ||:  19%|█▉        | 192/1021 [00:51<01:43,  8.01it/s]

tensor([[ 2.,  7.],
        [ 1.,  6.],
        [ 0.,  5.],
        [ 1.,  4.],
        [ 2.,  3.],
        [ 3.,  2.],
        [ 4.,  1.],
        [ 5.,  0.],
        [ 6.,  1.],
        [ 7.,  2.],
        [ 8.,  3.],
        [ 9.,  4.],
        [10.,  5.],
        [11.,  6.],
        [12.,  7.],
        [13.,  8.],
        [14.,  9.],
        [15., 10.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[13., 20.],
        [12., 19.],
        [11., 18.],
        [10., 17.],
        [ 9., 16.],
        [ 8., 15.],
        [ 7., 14.],
        [ 6., 13.],
        [ 5., 12.],
        [ 4., 11.],
        [ 3., 10.],
        [ 2.,  9.],
        [ 1.,  8.],
        [ 0.,  7.],
        [ 0.,  6.],
        [ 1.,  5.],
        [ 2.,  4.],
        [ 3.,  3.],
        [ 4.,  2.],
        [ 5.,  1.],
        [ 6.,  0.],
        [ 7.,  1.],
        [ 8.,  2.],
        [ 9.,  3.],
        [10.,  4.],
        [11.,  5.],
        [12.,  6.],
  

loss: 0.4664 ||:  19%|█▉        | 195/1021 [00:51<01:40,  8.18it/s]

tensor([[25., 29.],
        [24., 28.],
        [23., 27.],
        [22., 26.],
        [21., 25.],
        [20., 24.],
        [19., 23.],
        [18., 22.],
        [17., 21.],
        [16., 20.],
        [15., 19.],
        [14., 18.],
        [13., 17.],
        [12., 16.],
        [11., 15.],
        [10., 14.],
        [ 9., 13.],
        [ 8., 12.],
        [ 7., 11.],
        [ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],
        [ 2.,  2.],
        [ 3.,  1.],
        [ 4.,  0.],
        [ 5.,  1.],
        [ 6.,  2.],
        [ 7.,  3.],
        [ 8.,  4.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 3., 10.],
        [ 2.,  9.],
        [ 1.,  8.],
        [ 0.,  7.],
        [ 0.,  6.],
        [ 1.,  5.],
        [ 2.,  4.],
        [ 3.,  3.],
        [ 4.,  2.],
        [ 5.,  1.],
        [ 6.,  0.],
        [ 7.,  1.],
        [ 8.,  2.],
  

loss: 0.4645 ||:  19%|█▉        | 197/1021 [00:51<01:59,  6.87it/s]

tensor([[41., 47.],
        [40., 46.],
        [39., 45.],
        [38., 44.],
        [37., 43.],
        [36., 42.],
        [35., 41.],
        [34., 40.],
        [33., 39.],
        [32., 38.],
        [31., 37.],
        [30., 36.],
        [29., 35.],
        [28., 34.],
        [27., 33.],
        [26., 32.],
        [25., 31.],
        [24., 30.],
        [23., 29.],
        [22., 28.],
        [21., 27.],
        [20., 26.],
        [19., 25.],
        [18., 24.],
        [17., 23.],
        [16., 22.],
        [15., 21.],
        [14., 20.],
        [13., 19.],
        [12., 18.],
        [11., 17.],
        [10., 16.],
        [ 9., 15.],
        [ 8., 14.],
        [ 7., 13.],
        [ 6., 12.],
        [ 5., 11.],
        [ 4., 10.],
        [ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 1.,  5.],
        [ 2.,  4.],
        [ 3.,  3.],
        [ 4.,  2.],
        [ 5.,  1.],
        [ 6.,  0.],
        [ 7.,  0.],
        [ 8.,  1.],


loss: 0.4648 ||:  19%|█▉        | 199/1021 [00:52<01:51,  7.37it/s]

tensor([[26., 37.],
        [25., 36.],
        [24., 35.],
        [23., 34.],
        [22., 33.],
        [21., 32.],
        [20., 31.],
        [19., 30.],
        [18., 29.],
        [17., 28.],
        [16., 27.],
        [15., 26.],
        [14., 25.],
        [13., 24.],
        [12., 23.],
        [11., 22.],
        [10., 21.],
        [ 9., 20.],
        [ 8., 19.],
        [ 7., 18.],
        [ 6., 17.],
        [ 5., 16.],
        [ 4., 15.],
        [ 3., 14.],
        [ 2., 13.],
        [ 1., 12.],
        [ 0., 11.],
        [ 1., 10.],
        [ 2.,  9.],
        [ 3.,  8.],
        [ 4.,  7.],
        [ 5.,  6.],
        [ 6.,  5.],
        [ 7.,  4.],
        [ 8.,  3.],
        [ 9.,  2.],
        [10.,  1.],
        [11.,  0.],
        [12.,  1.],
        [13.,  2.],
        [14.,  3.],
        [15.,  4.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 1., 35.],
        [ 0., 34.],
        [ 0., 33.],
        [ 1., 32.],
        [ 2., 31.],
        [ 3., 30.],
  

loss: 0.4631 ||:  20%|█▉        | 201/1021 [00:52<01:59,  6.89it/s]

tensor([[ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 0.,  3.],
        [ 1.,  2.],
        [ 2.,  1.],
        [ 3.,  0.],
        [ 4.,  0.],
        [ 5.,  0.],
        [ 6.,  0.],
        [ 7.,  1.],
        [ 8.,  2.],
        [ 9.,  3.],
        [10.,  4.],
        [11.,  5.],
        [12.,  6.],
        [13.,  7.],
        [14.,  8.],
        [15.,  9.],
        [16., 10.],
        [17., 11.],
        [18., 12.],
        [19., 13.],
        [20., 14.],
        [21., 15.],
        [22., 16.],
        [23., 17.],
        [24., 18.],
        [25., 19.],
        [26., 20.],
        [27., 21.],
        [28., 22.],
        [29., 23.],
        [30., 24.],
        [31., 25.],
        [32., 26.],
        [33., 27.],
        [34., 28.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 7., 13.],
        [ 6., 12.],
  

loss: 0.4638 ||:  20%|█▉        | 203/1021 [00:52<02:02,  6.68it/s]

tensor([[15., 16.],
        [14., 15.],
        [13., 14.],
        [12., 13.],
        [11., 12.],
        [10., 11.],
        [ 9., 10.],
        [ 8.,  9.],
        [ 7.,  8.],
        [ 6.,  7.],
        [ 5.,  6.],
        [ 4.,  5.],
        [ 3.,  4.],
        [ 2.,  3.],
        [ 1.,  2.],
        [ 0.,  1.],
        [ 1.,  0.],
        [ 2.,  0.],
        [ 3.,  1.],
        [ 4.,  2.],
        [ 5.,  3.],
        [ 6.,  4.],
        [ 7.,  5.],
        [ 8.,  6.],
        [ 9.,  7.],
        [10.,  8.],
        [11.,  9.],
        [12., 10.],
        [13., 11.],
        [14., 12.],
        [15., 13.],
        [16., 14.],
        [17., 15.],
        [18., 16.],
        [19., 17.],
        [20., 18.],
        [21., 19.],
        [22., 20.],
        [23., 21.],
        [24., 22.],
        [25., 23.],
        [26., 24.],
        [27., 25.],
        [28., 26.],
        [29., 27.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],


loss: 0.4618 ||:  20%|██        | 205/1021 [00:53<02:03,  6.63it/s]

tensor([[ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],
        [ 2.,  2.],
        [ 3.,  1.],
        [ 4.,  0.],
        [ 5.,  1.],
        [ 6.,  2.],
        [ 7.,  3.],
        [ 8.,  4.],
        [ 9.,  5.],
        [10.,  6.],
        [11.,  7.],
        [12.,  8.],
        [13.,  9.],
        [14., 10.],
        [15., 11.],
        [16., 12.],
        [17., 13.],
        [18., 14.],
        [19., 15.],
        [20., 16.],
        [21., 17.],
        [22., 18.],
        [23., 19.],
        [24., 20.],
        [25., 21.],
        [26., 22.],
        [27., 23.],
        [28., 24.],
        [29., 25.],
        [30., 26.],
        [31., 27.],
        [32., 28.],
        [33., 29.],
        [34., 30.],
        [35., 31.],
        [36., 32.],
        [37., 33.],
        [38., 34.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 2.,  9.],
        [ 1.,  8.],
        [ 0.,  7.],
  

loss: 0.4608 ||:  20%|██        | 207/1021 [00:53<01:51,  7.33it/s]

tensor([[ 2., 37.],
        [ 1., 36.],
        [ 0., 35.],
        [ 1., 34.],
        [ 2., 33.],
        [ 3., 32.],
        [ 4., 31.],
        [ 5., 30.],
        [ 6., 29.],
        [ 7., 28.],
        [ 8., 27.],
        [ 9., 26.],
        [10., 25.],
        [11., 24.],
        [12., 23.],
        [13., 22.],
        [14., 21.],
        [15., 20.],
        [16., 19.],
        [17., 18.],
        [18., 17.],
        [19., 16.],
        [20., 15.],
        [21., 14.],
        [22., 13.],
        [23., 12.],
        [24., 11.],
        [25., 10.],
        [26.,  9.],
        [27.,  8.],
        [28.,  7.],
        [29.,  6.],
        [30.,  5.],
        [31.,  4.],
        [32.,  3.],
        [33.,  2.],
        [34.,  1.],
        [35.,  0.],
        [36.,  1.],
        [37.,  2.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 6., 18.],
        [ 5., 17.],
        [ 4., 16.],
  

loss: 0.4600 ||:  20%|██        | 208/1021 [00:53<02:03,  6.59it/s]

tensor([[ 6.,  8.],
        [ 5.,  7.],
        [ 4.,  6.],
        [ 3.,  5.],
        [ 2.,  4.],
        [ 1.,  3.],
        [ 0.,  2.],
        [ 1.,  1.],
        [ 2.,  0.],
        [ 3.,  1.],
        [ 4.,  2.],
        [ 5.,  3.],
        [ 6.,  4.],
        [ 7.,  5.],
        [ 8.,  6.],
        [ 9.,  7.],
        [10.,  8.],
        [11.,  9.],
        [12., 10.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 1., 30.],
        [ 0., 29.],
        [ 1., 28.],
        [ 2., 27.],
        [ 3., 26.],
        [ 4., 25.],
        [ 5., 24.],
        [ 6., 23.],
        [ 7., 22.],
        [ 8., 21.],
        [ 9., 20.],
        [10., 19.],
        [11., 18.],
        [12., 17.],
        [13., 16.],
        [14., 15.],
        [15., 14.],
        [16., 13.],
        [17., 12.],
        [18., 11.],
        [19., 10.],
        [20.,  9.],
        [21.,  8.],
        [22.,  7.],
        [23.,  6.],
        [24.,  5.],
        [25.,  4.],
  

loss: 0.4573 ||:  21%|██        | 211/1021 [00:53<02:03,  6.54it/s]

tensor([[31., 35.],
        [30., 34.],
        [29., 33.],
        [28., 32.],
        [27., 31.],
        [26., 30.],
        [25., 29.],
        [24., 28.],
        [23., 27.],
        [22., 26.],
        [21., 25.],
        [20., 24.],
        [19., 23.],
        [18., 22.],
        [17., 21.],
        [16., 20.],
        [15., 19.],
        [14., 18.],
        [13., 17.],
        [12., 16.],
        [11., 15.],
        [10., 14.],
        [ 9., 13.],
        [ 8., 12.],
        [ 7., 11.],
        [ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],
        [ 2.,  2.],
        [ 3.,  1.],
        [ 4.,  0.],
        [ 5.,  1.],
        [ 6.,  2.],
        [ 7.,  3.],
        [ 8.,  4.],
        [ 9.,  5.],
        [10.,  6.],
        [11.,  7.],
        [12.,  8.],
        [13.,  9.],
        [14., 10.],
        [15., 11.],
        [16., 12.],
        [17., 13.],
        [18., 14.],


loss: 0.4574 ||:  21%|██        | 214/1021 [00:54<01:44,  7.70it/s]

tensor([[ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],
        [ 2.,  2.],
        [ 3.,  1.],
        [ 4.,  0.],
        [ 5.,  1.],
        [ 6.,  2.],
        [ 7.,  3.],
        [ 8.,  4.],
        [ 9.,  5.],
        [10.,  6.],
        [11.,  7.],
        [12.,  8.],
        [13.,  9.],
        [14., 10.],
        [15., 11.],
        [16., 12.],
        [17., 13.],
        [18., 14.],
        [19., 15.],
        [20., 16.],
        [21., 17.],
        [22., 18.],
        [23., 19.],
        [24., 20.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 4., 10.],
        [ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 1.,  5.],
        [ 2.,  4.],
        [ 3.,  3.],
        [ 4.,  2.],
        [ 5.,  1.],
        [ 6.,  0.],
  

loss: 0.4584 ||:  21%|██▏       | 217/1021 [00:54<01:53,  7.07it/s]

tensor([[11., 12.],
        [10., 11.],
        [ 9., 10.],
        [ 8.,  9.],
        [ 7.,  8.],
        [ 6.,  7.],
        [ 5.,  6.],
        [ 4.,  5.],
        [ 3.,  4.],
        [ 2.,  3.],
        [ 1.,  2.],
        [ 0.,  1.],
        [ 1.,  0.],
        [ 2.,  1.],
        [ 3.,  2.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 2., 17.],
        [ 1., 16.],
        [ 0., 15.],
        [ 1., 14.],
        [ 2., 13.],
        [ 3., 12.],
        [ 4., 11.],
        [ 5., 10.],
        [ 6.,  9.],
        [ 7.,  8.],
        [ 8.,  7.],
        [ 9.,  6.],
        [10.,  5.],
        [11.,  4.],
        [12.,  3.],
        [13.,  2.],
        [14.,  1.],
        [15.,  0.],
        [16.,  1.],
        [17.,  2.],
        [18.,  3.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 1.,  7.],
        [ 2.,  6.],
        [ 3.,  5.],
        [ 4.,  4.],
        [ 5.,  3.],
    

loss: 0.4579 ||:  21%|██▏       | 219/1021 [00:54<02:07,  6.29it/s]

tensor([[39., 45.],
        [38., 44.],
        [37., 43.],
        [36., 42.],
        [35., 41.],
        [34., 40.],
        [33., 39.],
        [32., 38.],
        [31., 37.],
        [30., 36.],
        [29., 35.],
        [28., 34.],
        [27., 33.],
        [26., 32.],
        [25., 31.],
        [24., 30.],
        [23., 29.],
        [22., 28.],
        [21., 27.],
        [20., 26.],
        [19., 25.],
        [18., 24.],
        [17., 23.],
        [16., 22.],
        [15., 21.],
        [14., 20.],
        [13., 19.],
        [12., 18.],
        [11., 17.],
        [10., 16.],
        [ 9., 15.],
        [ 8., 14.],
        [ 7., 13.],
        [ 6., 12.],
        [ 5., 11.],
        [ 4., 10.],
        [ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 1.,  5.],
        [ 2.,  4.],
        [ 3.,  3.],
        [ 4.,  2.],
        [ 5.,  1.],
        [ 6.,  0.],
        [ 7.,  1.],
        [ 8.,  2.],
        [ 9.,  3.],
        [10.,  4.],


loss: 0.4568 ||:  22%|██▏       | 220/1021 [00:55<02:09,  6.17it/s]

tensor([[10., 17.],
        [ 9., 16.],
        [ 8., 15.],
        [ 7., 14.],
        [ 6., 13.],
        [ 5., 12.],
        [ 4., 11.],
        [ 3., 10.],
        [ 2.,  9.],
        [ 1.,  8.],
        [ 0.,  7.],
        [ 1.,  6.],
        [ 2.,  5.],
        [ 3.,  4.],
        [ 4.,  3.],
        [ 5.,  2.],
        [ 6.,  1.],
        [ 7.,  0.],
        [ 8.,  0.],
        [ 9.,  1.],
        [10.,  2.],
        [11.,  3.],
        [12.,  4.],
        [13.,  5.],
        [14.,  6.],
        [15.,  7.],
        [16.,  8.],
        [17.,  9.],
        [18., 10.],
        [19., 11.],
        [20., 12.],
        [21., 13.],
        [22., 14.],
        [23., 15.],
        [24., 16.],
        [25., 17.],
        [26., 18.],
        [27., 19.],
        [28., 20.],
        [29., 21.],
        [30., 22.],
        [31., 23.],
        [32., 24.],
        [33., 25.],
        [34., 26.],
        [35., 27.],
        [36., 28.],
        [37., 29.],
        [38., 30.],
        [39., 31.],


loss: 0.4575 ||:  22%|██▏       | 222/1021 [00:55<02:17,  5.80it/s]

tensor([[ 2., 13.],
        [ 1., 12.],
        [ 0., 11.],
        [ 1., 10.],
        [ 2.,  9.],
        [ 3.,  8.],
        [ 4.,  7.],
        [ 5.,  6.],
        [ 6.,  5.],
        [ 7.,  4.],
        [ 8.,  3.],
        [ 9.,  2.],
        [10.,  1.],
        [11.,  0.],
        [12.,  1.],
        [13.,  2.],
        [14.,  3.],
        [15.,  4.],
        [16.,  5.],
        [17.,  6.],
        [18.,  7.],
        [19.,  8.],
        [20.,  9.],
        [21., 10.],
        [22., 11.],
        [23., 12.],
        [24., 13.],
        [25., 14.],
        [26., 15.],
        [27., 16.],
        [28., 17.],
        [29., 18.],
        [30., 19.],
        [31., 20.],
        [32., 21.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 2.,  3.],
        [ 1.,  2.],
        [ 0.,  1.],
        [ 1.,  0.],
        [ 2.,  1.],
        [ 3.,  2.],
        [ 4.,  3.],
        [ 5.,  4.],
        [ 6.,  5.],
        [ 7.,  6.],
        [ 8.,  7.],
        [ 9.,  8.],
  

loss: 0.4587 ||:  22%|██▏       | 225/1021 [00:55<01:53,  7.02it/s]

tensor([[ 1., 16.],
        [ 0., 15.],
        [ 1., 14.],
        [ 2., 13.],
        [ 3., 12.],
        [ 4., 11.],
        [ 5., 10.],
        [ 6.,  9.],
        [ 7.,  8.],
        [ 8.,  7.],
        [ 9.,  6.],
        [10.,  5.],
        [11.,  4.],
        [12.,  3.],
        [13.,  2.],
        [14.,  1.],
        [15.,  0.],
        [16.,  1.],
        [17.,  2.],
        [18.,  3.],
        [19.,  4.],
        [20.,  5.],
        [21.,  6.],
        [22.,  7.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 1.,  8.],
        [ 0.,  7.],
        [ 1.,  6.],
        [ 2.,  5.],
        [ 3.,  4.],
        [ 4.,  3.],
        [ 5.,  2.],
        [ 6.,  1.],
        [ 7.,  0.],
        [ 8.,  1.],
        [ 9.,  2.],
        [10.,  3.],
        [11.,  4.],
        [12.,  5.],
        [13.,  6.],
        [14.,  7.],
        [15.,  8.],
        [16.,  9.],
        [17., 10.],
        [18., 11.],
        [19., 12.],
        [20., 13.],
        [ 0.,  0.],
        [ 0.,  0.],
  

loss: 0.4581 ||:  22%|██▏       | 227/1021 [00:56<01:59,  6.63it/s]

tensor([[25., 31.],
        [24., 30.],
        [23., 29.],
        [22., 28.],
        [21., 27.],
        [20., 26.],
        [19., 25.],
        [18., 24.],
        [17., 23.],
        [16., 22.],
        [15., 21.],
        [14., 20.],
        [13., 19.],
        [12., 18.],
        [11., 17.],
        [10., 16.],
        [ 9., 15.],
        [ 8., 14.],
        [ 7., 13.],
        [ 6., 12.],
        [ 5., 11.],
        [ 4., 10.],
        [ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 0.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],
        [ 2.,  2.],
        [ 3.,  1.],
        [ 4.,  0.],
        [ 5.,  0.],
        [ 6.,  1.],
        [ 7.,  2.],
        [ 8.,  3.],
        [ 9.,  4.],
        [10.,  5.],
        [11.,  6.],
        [12.,  7.],
        [13.,  8.],
        [14.,  9.],
        [15., 10.],
        [16., 11.],
        [17., 12.],
        [18., 13.],
        [19., 14.],
        [20., 15.],
        [21., 16.],
        [22., 17.],


loss: 0.4581 ||:  22%|██▏       | 229/1021 [00:56<01:45,  7.48it/s]

tensor([[ 7., 18.],
        [ 6., 17.],
        [ 5., 16.],
        [ 4., 15.],
        [ 3., 14.],
        [ 2., 13.],
        [ 1., 12.],
        [ 0., 11.],
        [ 1., 10.],
        [ 2.,  9.],
        [ 3.,  8.],
        [ 4.,  7.],
        [ 5.,  6.],
        [ 6.,  5.],
        [ 7.,  4.],
        [ 8.,  3.],
        [ 9.,  2.],
        [10.,  1.],
        [11.,  0.],
        [12.,  1.],
        [13.,  2.],
        [14.,  3.],
        [15.,  4.],
        [16.,  5.],
        [17.,  6.],
        [18.,  7.],
        [19.,  8.],
        [20.,  9.],
        [21., 10.],
        [22., 11.],
        [23., 12.],
        [24., 13.],
        [25., 14.],
        [26., 15.],
        [27., 16.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 3., 23.],
        [ 2., 22.],
        [ 1., 21.],
        [ 0., 20.],
        [ 1., 19.],
        [ 2., 18.],
        [ 3., 17.],
  

loss: 0.4564 ||:  23%|██▎       | 231/1021 [00:56<02:04,  6.34it/s]

tensor([[47., 57.],
        [46., 56.],
        [45., 55.],
        [44., 54.],
        [43., 53.],
        [42., 52.],
        [41., 51.],
        [40., 50.],
        [39., 49.],
        [38., 48.],
        [37., 47.],
        [36., 46.],
        [35., 45.],
        [34., 44.],
        [33., 43.],
        [32., 42.],
        [31., 41.],
        [30., 40.],
        [29., 39.],
        [28., 38.],
        [27., 37.],
        [26., 36.],
        [25., 35.],
        [24., 34.],
        [23., 33.],
        [22., 32.],
        [21., 31.],
        [20., 30.],
        [19., 29.],
        [18., 28.],
        [17., 27.],
        [16., 26.],
        [15., 25.],
        [14., 24.],
        [13., 23.],
        [12., 22.],
        [11., 21.],
        [10., 20.],
        [ 9., 19.],
        [ 8., 18.],
        [ 7., 17.],
        [ 6., 16.],
        [ 5., 15.],
        [ 4., 14.],
        [ 3., 13.],
        [ 2., 12.],
        [ 1., 11.],
        [ 0., 10.],
        [ 0.,  9.],
        [ 1.,  8.],


loss: 0.4554 ||:  23%|██▎       | 232/1021 [00:56<02:09,  6.11it/s]

tensor([[ 4., 17.],
        [ 3., 16.],
        [ 2., 15.],
        [ 1., 14.],
        [ 0., 13.],
        [ 1., 12.],
        [ 2., 11.],
        [ 3., 10.],
        [ 4.,  9.],
        [ 5.,  8.],
        [ 6.,  7.],
        [ 7.,  6.],
        [ 8.,  5.],
        [ 9.,  4.],
        [10.,  3.],
        [11.,  2.],
        [12.,  1.],
        [13.,  0.],
        [14.,  1.],
        [15.,  2.],
        [16.,  3.],
        [17.,  4.],
        [18.,  5.],
        [19.,  6.],
        [20.,  7.],
        [21.,  8.],
        [22.,  9.],
        [23., 10.],
        [24., 11.],
        [25., 12.],
        [26., 13.],
        [27., 14.],
        [28., 15.],
        [29., 16.],
        [30., 17.],
        [31., 18.],
        [32., 19.],
        [33., 20.],
        [34., 21.],
        [35., 22.],
        [36., 23.],
        [37., 24.],
        [38., 25.],
        [39., 26.],
        [40., 27.],
        [41., 28.],
        [42., 29.],
        [43., 30.],
        [44., 31.],
        [45., 32.],


loss: 0.4558 ||:  23%|██▎       | 235/1021 [00:57<01:53,  6.95it/s]

tensor([[11., 24.],
        [10., 23.],
        [ 9., 22.],
        [ 8., 21.],
        [ 7., 20.],
        [ 6., 19.],
        [ 5., 18.],
        [ 4., 17.],
        [ 3., 16.],
        [ 2., 15.],
        [ 1., 14.],
        [ 0., 13.],
        [ 0., 12.],
        [ 1., 11.],
        [ 2., 10.],
        [ 3.,  9.],
        [ 4.,  8.],
        [ 5.,  7.],
        [ 6.,  6.],
        [ 7.,  5.],
        [ 8.,  4.],
        [ 9.,  3.],
        [10.,  2.],
        [11.,  1.],
        [12.,  0.],
        [13.,  1.],
        [14.,  2.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 3.,  6.],
        [ 2.,  5.],
        [ 1.,  4.],
        [ 0.,  3.],
        [ 1.,  2.],
        [ 2.,  1.],
        [ 3.,  0.],
        [ 4.,  1.],
        [ 5.,  2.],
        [ 6.,  3.],
        [ 7.,  4.],
        [ 8.,  5.],
        [ 9.,  6.],
        [10.,  7.],
        [11.,  8.],
        [12.,  9.],
        [13., 10.],
        [14., 11.],
        [15., 12.],
  

loss: 0.4563 ||:  23%|██▎       | 236/1021 [00:57<01:58,  6.63it/s]

tensor([[ 5., 57.],
        [ 4., 56.],
        [ 3., 55.],
        [ 2., 54.],
        [ 1., 53.],
        [ 0., 52.],
        [ 1., 51.],
        [ 2., 50.],
        [ 3., 49.],
        [ 4., 48.],
        [ 5., 47.],
        [ 6., 46.],
        [ 7., 45.],
        [ 8., 44.],
        [ 9., 43.],
        [10., 42.],
        [11., 41.],
        [12., 40.],
        [13., 39.],
        [14., 38.],
        [15., 37.],
        [16., 36.],
        [17., 35.],
        [18., 34.],
        [19., 33.],
        [20., 32.],
        [21., 31.],
        [22., 30.],
        [23., 29.],
        [24., 28.],
        [25., 27.],
        [26., 26.],
        [27., 25.],
        [28., 24.],
        [29., 23.],
        [30., 22.],
        [31., 21.],
        [32., 20.],
        [33., 19.],
        [34., 18.],
        [35., 17.],
        [36., 16.],
        [37., 15.],
        [38., 14.],
        [39., 13.],
        [40., 12.],
        [41., 11.],
        [42., 10.],
        [43.,  9.],
        [44.,  8.],


loss: 0.4547 ||:  23%|██▎       | 238/1021 [00:57<01:49,  7.14it/s]

tensor([[16., 38.],
        [15., 37.],
        [14., 36.],
        [13., 35.],
        [12., 34.],
        [11., 33.],
        [10., 32.],
        [ 9., 31.],
        [ 8., 30.],
        [ 7., 29.],
        [ 6., 28.],
        [ 5., 27.],
        [ 4., 26.],
        [ 3., 25.],
        [ 2., 24.],
        [ 1., 23.],
        [ 0., 22.],
        [ 1., 21.],
        [ 2., 20.],
        [ 3., 19.],
        [ 4., 18.],
        [ 5., 17.],
        [ 6., 16.],
        [ 7., 15.],
        [ 8., 14.],
        [ 9., 13.],
        [10., 12.],
        [11., 11.],
        [12., 10.],
        [13.,  9.],
        [14.,  8.],
        [15.,  7.],
        [16.,  6.],
        [17.,  5.],
        [18.,  4.],
        [19.,  3.],
        [20.,  2.],
        [21.,  1.],
        [22.,  0.],
        [23.,  1.],
        [24.,  2.],
        [25.,  3.],
        [26.,  4.],
        [27.,  5.],
        [28.,  6.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 5., 12.],
        [ 4., 11.],
  

loss: 0.4529 ||:  24%|██▎       | 240/1021 [00:58<02:03,  6.34it/s]

tensor([[ 1., 38.],
        [ 0., 37.],
        [ 0., 36.],
        [ 1., 35.],
        [ 2., 34.],
        [ 3., 33.],
        [ 4., 32.],
        [ 5., 31.],
        [ 6., 30.],
        [ 7., 29.],
        [ 8., 28.],
        [ 9., 27.],
        [10., 26.],
        [11., 25.],
        [12., 24.],
        [13., 23.],
        [14., 22.],
        [15., 21.],
        [16., 20.],
        [17., 19.],
        [18., 18.],
        [19., 17.],
        [20., 16.],
        [21., 15.],
        [22., 14.],
        [23., 13.],
        [24., 12.],
        [25., 11.],
        [26., 10.],
        [27.,  9.],
        [28.,  8.],
        [29.,  7.],
        [30.,  6.],
        [31.,  5.],
        [32.,  4.],
        [33.,  3.],
        [34.,  2.],
        [35.,  1.],
        [36.,  0.],
        [37.,  0.],
        [38.,  0.],
        [39.,  1.],
        [40.,  2.],
        [41.,  3.],
        [42.,  4.],
        [43.,  5.],
        [44.,  6.],
        [45.,  7.],
        [46.,  8.],
        [ 0.,  0.],


loss: 0.4520 ||:  24%|██▍       | 243/1021 [00:58<02:01,  6.41it/s]

tensor([[ 5.,  7.],
        [ 4.,  6.],
        [ 3.,  5.],
        [ 2.,  4.],
        [ 1.,  3.],
        [ 0.,  2.],
        [ 1.,  1.],
        [ 2.,  0.],
        [ 3.,  1.],
        [ 4.,  2.],
        [ 5.,  3.],
        [ 6.,  4.],
        [ 7.,  5.],
        [ 8.,  6.],
        [ 9.,  7.],
        [10.,  8.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[29., 34.],
        [28., 33.],
        [27., 32.],
        [26., 31.],
        [25., 30.],
        [24., 29.],
        [23., 28.],
        [22., 27.],
        [21., 26.],
        [20., 25.],
        [19., 24.],
        [18., 23.],
        [17., 22.],
        [16., 21.],
        [15., 20.],
        [14., 19.],
        [13., 18.],
        [12., 17.],
        [11., 16.],
        [10., 15.],
        [ 9., 14.],
        [ 8., 13.],
        [ 7., 12.],
        [ 6., 11.],
        [ 5., 10.],
        [ 4.,  9.],
        [ 3.,  8.],
        [ 2.,  7.],
        [ 1.,  6.],
        [ 0.,  5.],
  

loss: 0.4522 ||:  24%|██▍       | 244/1021 [00:58<01:49,  7.13it/s]

tensor([[ 3.,  5.],
        [ 2.,  4.],
        [ 1.,  3.],
        [ 0.,  2.],
        [ 1.,  1.],
        [ 2.,  0.],
        [ 3.,  0.],
        [ 4.,  0.],
        [ 5.,  0.],
        [ 6.,  0.],
        [ 7.,  0.],
        [ 8.,  1.],
        [ 9.,  2.],
        [10.,  3.],
        [11.,  4.],
        [12.,  5.],
        [13.,  6.],
        [14.,  7.],
        [15.,  8.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 6., 16.],
        [ 5., 15.],
        [ 4., 14.],
        [ 3., 13.],
        [ 2., 12.],
        [ 1., 11.],
        [ 0., 10.],
        [ 1.,  9.],
        [ 2.,  8.],
        [ 3.,  7.],
        [ 4.,  6.],
        [ 5.,  5.],
        [ 6.,  4.],
        [ 7.,  3.],
        [ 8.,  2.],
        [ 9.,  1.],
        [10.,  0.],
        [11.,  0.],
        [12.,  1.],
  

loss: 0.4514 ||:  24%|██▍       | 246/1021 [00:58<01:46,  7.28it/s]

tensor([[ 3., 36.],
        [ 2., 35.],
        [ 1., 34.],
        [ 0., 33.],
        [ 1., 32.],
        [ 2., 31.],
        [ 3., 30.],
        [ 4., 29.],
        [ 5., 28.],
        [ 6., 27.],
        [ 7., 26.],
        [ 8., 25.],
        [ 9., 24.],
        [10., 23.],
        [11., 22.],
        [12., 21.],
        [13., 20.],
        [14., 19.],
        [15., 18.],
        [16., 17.],
        [17., 16.],
        [18., 15.],
        [19., 14.],
        [20., 13.],
        [21., 12.],
        [22., 11.],
        [23., 10.],
        [24.,  9.],
        [25.,  8.],
        [26.,  7.],
        [27.,  6.],
        [28.,  5.],
        [29.,  4.],
        [30.,  3.],
        [31.,  2.],
        [32.,  1.],
        [33.,  0.],
        [34.,  1.],
        [35.,  2.]], device='cuda:0')
tensor([[51., 60.],
        [50., 59.],
        [49., 58.],
        [48., 57.],
        [47., 56.],
        [46., 55.],
        [45., 54.],
        [44., 53.],
        [43., 52.],
        [42., 51.],
  

loss: 0.4511 ||:  24%|██▍       | 248/1021 [00:59<02:01,  6.36it/s]

tensor([[29., 40.],
        [28., 39.],
        [27., 38.],
        [26., 37.],
        [25., 36.],
        [24., 35.],
        [23., 34.],
        [22., 33.],
        [21., 32.],
        [20., 31.],
        [19., 30.],
        [18., 29.],
        [17., 28.],
        [16., 27.],
        [15., 26.],
        [14., 25.],
        [13., 24.],
        [12., 23.],
        [11., 22.],
        [10., 21.],
        [ 9., 20.],
        [ 8., 19.],
        [ 7., 18.],
        [ 6., 17.],
        [ 5., 16.],
        [ 4., 15.],
        [ 3., 14.],
        [ 2., 13.],
        [ 1., 12.],
        [ 0., 11.],
        [ 1., 10.],
        [ 2.,  9.],
        [ 3.,  8.],
        [ 4.,  7.],
        [ 5.,  6.],
        [ 6.,  5.],
        [ 7.,  4.],
        [ 8.,  3.],
        [ 9.,  2.],
        [10.,  1.],
        [11.,  0.],
        [12.,  1.],
        [13.,  2.],
        [14.,  3.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]],

loss: 0.4506 ||:  24%|██▍       | 250/1021 [00:59<02:00,  6.40it/s]

tensor([[15., 42.],
        [14., 41.],
        [13., 40.],
        [12., 39.],
        [11., 38.],
        [10., 37.],
        [ 9., 36.],
        [ 8., 35.],
        [ 7., 34.],
        [ 6., 33.],
        [ 5., 32.],
        [ 4., 31.],
        [ 3., 30.],
        [ 2., 29.],
        [ 1., 28.],
        [ 0., 27.],
        [ 1., 26.],
        [ 2., 25.],
        [ 3., 24.],
        [ 4., 23.],
        [ 5., 22.],
        [ 6., 21.],
        [ 7., 20.],
        [ 8., 19.],
        [ 9., 18.],
        [10., 17.],
        [11., 16.],
        [12., 15.],
        [13., 14.],
        [14., 13.],
        [15., 12.],
        [16., 11.],
        [17., 10.],
        [18.,  9.],
        [19.,  8.],
        [20.,  7.],
        [21.,  6.],
        [22.,  5.],
        [23.,  4.],
        [24.,  3.],
        [25.,  2.],
        [26.,  1.],
        [27.,  0.],
        [28.,  1.],
        [29.,  2.],
        [30.,  3.],
        [31.,  4.],
        [32.,  5.],
        [33.,  6.],
        [34.,  7.],


loss: 0.4500 ||:  25%|██▍       | 252/1021 [00:59<02:04,  6.19it/s]

tensor([[16., 20.],
        [15., 19.],
        [14., 18.],
        [13., 17.],
        [12., 16.],
        [11., 15.],
        [10., 14.],
        [ 9., 13.],
        [ 8., 12.],
        [ 7., 11.],
        [ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 0.,  3.],
        [ 1.,  2.],
        [ 2.,  1.],
        [ 3.,  0.],
        [ 4.,  1.],
        [ 5.,  2.],
        [ 6.,  3.],
        [ 7.,  4.],
        [ 8.,  5.],
        [ 9.,  6.],
        [10.,  7.],
        [11.,  8.],
        [12.,  9.],
        [13., 10.],
        [14., 11.],
        [15., 12.],
        [16., 13.],
        [17., 14.],
        [18., 15.],
        [19., 16.],
        [20., 17.],
        [21., 18.],
        [22., 19.],
        [23., 20.],
        [24., 21.],
        [25., 22.],
        [26., 23.],
        [27., 24.],
        [28., 25.],
        [29., 26.],
        [30., 27.]], device='cuda:0')
tensor([[ 1., 24.],
  

loss: 0.4497 ||:  25%|██▍       | 254/1021 [01:00<01:51,  6.90it/s]

tensor([[15., 22.],
        [14., 21.],
        [13., 20.],
        [12., 19.],
        [11., 18.],
        [10., 17.],
        [ 9., 16.],
        [ 8., 15.],
        [ 7., 14.],
        [ 6., 13.],
        [ 5., 12.],
        [ 4., 11.],
        [ 3., 10.],
        [ 2.,  9.],
        [ 1.,  8.],
        [ 0.,  7.],
        [ 1.,  6.],
        [ 2.,  5.],
        [ 3.,  4.],
        [ 4.,  3.],
        [ 5.,  2.],
        [ 6.,  1.],
        [ 7.,  0.],
        [ 8.,  1.],
        [ 9.,  2.],
        [10.,  3.],
        [11.,  4.],
        [12.,  5.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[23., 33.],
        [22., 32.],
        [21., 31.],
        [20., 30.],
        [19., 29.],
        [18., 28.],
        [17., 27.],
        [16., 26.],
        [15., 25.],
        [14., 24.],
        [13., 23.],
        [12., 22.],
        [11., 21.],
        [10., 20.],
        [ 9., 19.],
        [ 8., 18.],
        [ 7., 17.],
  

loss: 0.4490 ||:  25%|██▍       | 255/1021 [01:00<01:51,  6.87it/s]

tensor([[ 6., 20.],
        [ 5., 19.],
        [ 4., 18.],
        [ 3., 17.],
        [ 2., 16.],
        [ 1., 15.],
        [ 0., 14.],
        [ 0., 13.],
        [ 0., 12.],
        [ 1., 11.],
        [ 2., 10.],
        [ 3.,  9.],
        [ 4.,  8.],
        [ 5.,  7.],
        [ 6.,  6.],
        [ 7.,  5.],
        [ 8.,  4.],
        [ 9.,  3.],
        [10.,  2.],
        [11.,  1.],
        [12.,  0.],
        [13.,  1.],
        [14.,  2.],
        [15.,  3.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 1., 35.],
        [ 0., 34.],
        [ 1., 33.],
        [ 2., 32.],
        [ 3., 31.],
        [ 4., 30.],
        [ 5., 29.],
        [ 6., 28.],
        [ 7., 27.],
        [ 8., 26.],
        [ 9., 25.],
        [10., 24.],
        [11., 23.],
        [12., 22.],
        [13., 21.],
        [14., 20.],
        [15., 19.],
        [16., 18.],
        [17., 17.],
        [18., 16.],
        [19., 15.],
        [20., 14.],
        [21., 13.],
  

loss: 0.4489 ||:  25%|██▌       | 257/1021 [01:00<01:49,  6.98it/s]

tensor([[10., 19.],
        [ 9., 18.],
        [ 8., 17.],
        [ 7., 16.],
        [ 6., 15.],
        [ 5., 14.],
        [ 4., 13.],
        [ 3., 12.],
        [ 2., 11.],
        [ 1., 10.],
        [ 0.,  9.],
        [ 1.,  8.],
        [ 2.,  7.],
        [ 3.,  6.],
        [ 4.,  5.],
        [ 5.,  4.],
        [ 6.,  3.],
        [ 7.,  2.],
        [ 8.,  1.],
        [ 9.,  0.],
        [10.,  1.],
        [11.,  2.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[47., 76.],
        [46., 75.],
        [45., 74.],
        [44., 73.],
        [43., 72.],
        [42., 71.],
        [41., 70.],
        [40., 69.],
        [39., 68.],
        [38., 67.],
        [37., 66.],
        [36., 65.],
        [35., 64.],
        [34., 63.],
        [33., 62.],
        [32., 61.],
        [31., 60.],
        [30., 59.],
        [29., 58.],
        [28., 57.],
        [27., 56.],
        [26., 55.],
        [25., 54.],
  

loss: 0.4472 ||:  25%|██▌       | 260/1021 [01:01<01:50,  6.89it/s]

tensor([[ 4., 16.],
        [ 3., 15.],
        [ 2., 14.],
        [ 1., 13.],
        [ 0., 12.],
        [ 0., 11.],
        [ 0., 10.],
        [ 0.,  9.],
        [ 1.,  8.],
        [ 2.,  7.],
        [ 3.,  6.],
        [ 4.,  5.],
        [ 5.,  4.],
        [ 6.,  3.],
        [ 7.,  2.],
        [ 8.,  1.],
        [ 9.,  0.],
        [10.,  0.],
        [11.,  0.],
        [12.,  1.],
        [13.,  2.],
        [14.,  3.],
        [15.,  4.],
        [16.,  5.],
        [17.,  6.],
        [18.,  7.],
        [19.,  8.],
        [20.,  9.],
        [21., 10.],
        [22., 11.],
        [23., 12.],
        [24., 13.],
        [25., 14.],
        [26., 15.],
        [27., 16.],
        [28., 17.],
        [29., 18.],
        [30., 19.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 1., 14.],
        [ 0., 13.],
        [ 1., 12.],
        [ 2., 11.],
        [ 3., 10.],
        [ 4.,  9.],
  

loss: 0.4474 ||:  26%|██▌       | 262/1021 [01:01<01:51,  6.82it/s]

tensor([[44., 75.],
        [43., 74.],
        [42., 73.],
        [41., 72.],
        [40., 71.],
        [39., 70.],
        [38., 69.],
        [37., 68.],
        [36., 67.],
        [35., 66.],
        [34., 65.],
        [33., 64.],
        [32., 63.],
        [31., 62.],
        [30., 61.],
        [29., 60.],
        [28., 59.],
        [27., 58.],
        [26., 57.],
        [25., 56.],
        [24., 55.],
        [23., 54.],
        [22., 53.],
        [21., 52.],
        [20., 51.],
        [19., 50.],
        [18., 49.],
        [17., 48.],
        [16., 47.],
        [15., 46.],
        [14., 45.],
        [13., 44.],
        [12., 43.],
        [11., 42.],
        [10., 41.],
        [ 9., 40.],
        [ 8., 39.],
        [ 7., 38.],
        [ 6., 37.],
        [ 5., 36.],
        [ 4., 35.],
        [ 3., 34.],
        [ 2., 33.],
        [ 1., 32.],
        [ 0., 31.],
        [ 1., 30.],
        [ 2., 29.],
        [ 3., 28.],
        [ 4., 27.],
        [ 5., 26.],


loss: 0.4467 ||:  26%|██▌       | 263/1021 [01:01<02:10,  5.79it/s]

tensor([[ 5., 18.],
        [ 4., 17.],
        [ 3., 16.],
        [ 2., 15.],
        [ 1., 14.],
        [ 0., 13.],
        [ 1., 12.],
        [ 2., 11.],
        [ 3., 10.],
        [ 4.,  9.],
        [ 5.,  8.],
        [ 6.,  7.],
        [ 7.,  6.],
        [ 8.,  5.],
        [ 9.,  4.],
        [10.,  3.],
        [11.,  2.],
        [12.,  1.],
        [13.,  0.],
        [14.,  1.],
        [15.,  2.],
        [16.,  3.],
        [17.,  4.],
        [18.,  5.],
        [19.,  6.],
        [20.,  7.],
        [21.,  8.],
        [22.,  9.],
        [23., 10.],
        [24., 11.],
        [25., 12.],
        [26., 13.],
        [27., 14.],
        [28., 15.],
        [29., 16.],
        [30., 17.],
        [31., 18.],
        [32., 19.],
        [33., 20.],
        [34., 21.],
        [35., 22.],
        [36., 23.],
        [37., 24.],
        [38., 25.],
        [39., 26.],
        [40., 27.],
        [41., 28.],
        [42., 29.],
        [43., 30.],
        [44., 31.],


loss: 0.4463 ||:  26%|██▌       | 265/1021 [01:01<01:45,  7.16it/s]

tensor([[ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],
        [ 2.,  2.],
        [ 3.,  1.],
        [ 4.,  0.],
        [ 5.,  1.],
        [ 6.,  2.],
        [ 7.,  3.],
        [ 8.,  4.],
        [ 9.,  5.],
        [10.,  6.],
        [11.,  7.],
        [12.,  8.],
        [13.,  9.],
        [14., 10.],
        [15., 11.],
        [16., 12.],
        [17., 13.],
        [18., 14.],
        [19., 15.],
        [20., 16.],
        [21., 17.],
        [22., 18.],
        [23., 19.],
        [24., 20.],
        [25., 21.],
        [26., 22.],
        [27., 23.],
        [ 0.,  0.]], device='cuda:0')
tensor([[14., 29.],
        [13., 28.],
        [12., 27.],
        [11., 26.],
        [10., 25.],
        [ 9., 24.],
        [ 8., 23.],
        [ 7., 22.],
        [ 6., 21.],
        [ 5., 20.],
        [ 4., 19.],
        [ 3., 18.],
        [ 2., 17.],
        [ 1., 16.],
  

loss: 0.4457 ||:  26%|██▌       | 266/1021 [01:02<02:01,  6.22it/s]

tensor([[48., 59.],
        [47., 58.],
        [46., 57.],
        [45., 56.],
        [44., 55.],
        [43., 54.],
        [42., 53.],
        [41., 52.],
        [40., 51.],
        [39., 50.],
        [38., 49.],
        [37., 48.],
        [36., 47.],
        [35., 46.],
        [34., 45.],
        [33., 44.],
        [32., 43.],
        [31., 42.],
        [30., 41.],
        [29., 40.],
        [28., 39.],
        [27., 38.],
        [26., 37.],
        [25., 36.],
        [24., 35.],
        [23., 34.],
        [22., 33.],
        [21., 32.],
        [20., 31.],
        [19., 30.],
        [18., 29.],
        [17., 28.],
        [16., 27.],
        [15., 26.],
        [14., 25.],
        [13., 24.],
        [12., 23.],
        [11., 22.],
        [10., 21.],
        [ 9., 20.],
        [ 8., 19.],
        [ 7., 18.],
        [ 6., 17.],
        [ 5., 16.],
        [ 4., 15.],
        [ 3., 14.],
        [ 2., 13.],
        [ 1., 12.],
        [ 0., 11.],
        [ 1., 10.],


loss: 0.4471 ||:  26%|██▌       | 267/1021 [01:02<01:55,  6.53it/s]

tensor([[21., 34.],
        [20., 33.],
        [19., 32.],
        [18., 31.],
        [17., 30.],
        [16., 29.],
        [15., 28.],
        [14., 27.],
        [13., 26.],
        [12., 25.],
        [11., 24.],
        [10., 23.],
        [ 9., 22.],
        [ 8., 21.],
        [ 7., 20.],
        [ 6., 19.],
        [ 5., 18.],
        [ 4., 17.],
        [ 3., 16.],
        [ 2., 15.],
        [ 1., 14.],
        [ 0., 13.],
        [ 1., 12.],
        [ 2., 11.],
        [ 3., 10.],
        [ 4.,  9.],
        [ 5.,  8.],
        [ 6.,  7.],
        [ 7.,  6.],
        [ 8.,  5.],
        [ 9.,  4.],
        [10.,  3.],
        [11.,  2.],
        [12.,  1.],
        [13.,  0.],
        [14.,  1.],
        [15.,  2.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 7., 19.],
        [ 6., 18.],
        [ 5., 17.],
        [ 4., 16.],
        [ 3., 15.],
        [ 2., 14.],
  

loss: 0.4486 ||:  26%|██▋       | 269/1021 [01:02<01:47,  7.01it/s]

tensor([[17., 23.],
        [16., 22.],
        [15., 21.],
        [14., 20.],
        [13., 19.],
        [12., 18.],
        [11., 17.],
        [10., 16.],
        [ 9., 15.],
        [ 8., 14.],
        [ 7., 13.],
        [ 6., 12.],
        [ 5., 11.],
        [ 4., 10.],
        [ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 1.,  5.],
        [ 2.,  4.],
        [ 3.,  3.],
        [ 4.,  2.],
        [ 5.,  1.],
        [ 6.,  0.],
        [ 7.,  0.],
        [ 8.,  0.],
        [ 9.,  1.],
        [10.,  2.],
        [11.,  3.],
        [12.,  4.],
        [13.,  5.],
        [14.,  6.],
        [15.,  7.],
        [16.,  8.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[21., 25.],
        [20., 24.],
        [19., 23.],
        [18., 22.],
        [17., 21.],
        [16., 20.],
        [15., 19.],
        [14., 18.],
        [13., 17.],
  

loss: 0.4461 ||:  27%|██▋       | 271/1021 [01:02<02:02,  6.12it/s]

tensor([[39., 43.],
        [38., 42.],
        [37., 41.],
        [36., 40.],
        [35., 39.],
        [34., 38.],
        [33., 37.],
        [32., 36.],
        [31., 35.],
        [30., 34.],
        [29., 33.],
        [28., 32.],
        [27., 31.],
        [26., 30.],
        [25., 29.],
        [24., 28.],
        [23., 27.],
        [22., 26.],
        [21., 25.],
        [20., 24.],
        [19., 23.],
        [18., 22.],
        [17., 21.],
        [16., 20.],
        [15., 19.],
        [14., 18.],
        [13., 17.],
        [12., 16.],
        [11., 15.],
        [10., 14.],
        [ 9., 13.],
        [ 8., 12.],
        [ 7., 11.],
        [ 6., 10.],
        [ 5.,  9.],
        [ 4.,  8.],
        [ 3.,  7.],
        [ 2.,  6.],
        [ 1.,  5.],
        [ 0.,  4.],
        [ 1.,  3.],
        [ 2.,  2.],
        [ 3.,  1.],
        [ 4.,  0.],
        [ 5.,  1.],
        [ 6.,  2.],
        [ 7.,  3.],
        [ 8.,  4.],
        [ 9.,  5.],
        [10.,  6.],


loss: 0.4460 ||:  27%|██▋       | 272/1021 [01:03<02:02,  6.09it/s]

tensor([[ 3., 39.],
        [ 2., 38.],
        [ 1., 37.],
        [ 0., 36.],
        [ 1., 35.],
        [ 2., 34.],
        [ 3., 33.],
        [ 4., 32.],
        [ 5., 31.],
        [ 6., 30.],
        [ 7., 29.],
        [ 8., 28.],
        [ 9., 27.],
        [10., 26.],
        [11., 25.],
        [12., 24.],
        [13., 23.],
        [14., 22.],
        [15., 21.],
        [16., 20.],
        [17., 19.],
        [18., 18.],
        [19., 17.],
        [20., 16.],
        [21., 15.],
        [22., 14.],
        [23., 13.],
        [24., 12.],
        [25., 11.],
        [26., 10.],
        [27.,  9.],
        [28.,  8.],
        [29.,  7.],
        [30.,  6.],
        [31.,  5.],
        [32.,  4.],
        [33.,  3.],
        [34.,  2.],
        [35.,  1.],
        [36.,  0.],
        [37.,  1.],
        [38.,  2.],
        [39.,  3.],
        [40.,  4.],
        [41.,  5.],
        [42.,  6.],
        [43.,  7.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],


loss: 0.4464 ||:  27%|██▋       | 274/1021 [01:03<01:56,  6.41it/s]

tensor([[34., 39.],
        [33., 38.],
        [32., 37.],
        [31., 36.],
        [30., 35.],
        [29., 34.],
        [28., 33.],
        [27., 32.],
        [26., 31.],
        [25., 30.],
        [24., 29.],
        [23., 28.],
        [22., 27.],
        [21., 26.],
        [20., 25.],
        [19., 24.],
        [18., 23.],
        [17., 22.],
        [16., 21.],
        [15., 20.],
        [14., 19.],
        [13., 18.],
        [12., 17.],
        [11., 16.],
        [10., 15.],
        [ 9., 14.],
        [ 8., 13.],
        [ 7., 12.],
        [ 6., 11.],
        [ 5., 10.],
        [ 4.,  9.],
        [ 3.,  8.],
        [ 2.,  7.],
        [ 1.,  6.],
        [ 0.,  5.],
        [ 1.,  4.],
        [ 2.,  3.],
        [ 3.,  2.],
        [ 4.,  1.],
        [ 5.,  0.],
        [ 6.,  1.],
        [ 7.,  2.],
        [ 8.,  3.],
        [ 9.,  4.],
        [10.,  5.],
        [11.,  6.],
        [12.,  7.],
        [13.,  8.],
        [14.,  9.],
        [15., 10.],


loss: 0.4464 ||:  27%|██▋       | 276/1021 [01:03<01:41,  7.35it/s]

tensor([[ 6., 22.],
        [ 5., 21.],
        [ 4., 20.],
        [ 3., 19.],
        [ 2., 18.],
        [ 1., 17.],
        [ 0., 16.],
        [ 0., 15.],
        [ 1., 14.],
        [ 2., 13.],
        [ 3., 12.],
        [ 4., 11.],
        [ 5., 10.],
        [ 6.,  9.],
        [ 7.,  8.],
        [ 8.,  7.],
        [ 9.,  6.],
        [10.,  5.],
        [11.,  4.],
        [12.,  3.],
        [13.,  2.],
        [14.,  1.],
        [15.,  0.],
        [16.,  1.],
        [17.,  2.],
        [18.,  3.],
        [19.,  4.],
        [20.,  5.],
        [21.,  6.],
        [22.,  7.],
        [23.,  8.],
        [24.,  9.],
        [25., 10.],
        [ 0.,  0.]], device='cuda:0')
tensor([[49., 54.],
        [48., 53.],
        [47., 52.],
        [46., 51.],
        [45., 50.],
        [44., 49.],
        [43., 48.],
        [42., 47.],
        [41., 46.],
        [40., 45.],
        [39., 44.],
        [38., 43.],
        [37., 42.],
        [36., 41.],
        [35., 40.],
  

loss: 0.4459 ||:  27%|██▋       | 278/1021 [01:03<01:56,  6.39it/s]

tensor([[14., 40.],
        [13., 39.],
        [12., 38.],
        [11., 37.],
        [10., 36.],
        [ 9., 35.],
        [ 8., 34.],
        [ 7., 33.],
        [ 6., 32.],
        [ 5., 31.],
        [ 4., 30.],
        [ 3., 29.],
        [ 2., 28.],
        [ 1., 27.],
        [ 0., 26.],
        [ 1., 25.],
        [ 2., 24.],
        [ 3., 23.],
        [ 4., 22.],
        [ 5., 21.],
        [ 6., 20.],
        [ 7., 19.],
        [ 8., 18.],
        [ 9., 17.],
        [10., 16.],
        [11., 15.],
        [12., 14.],
        [13., 13.],
        [14., 12.],
        [15., 11.],
        [16., 10.],
        [17.,  9.],
        [18.,  8.],
        [19.,  7.],
        [20.,  6.],
        [21.,  5.],
        [22.,  4.],
        [23.,  3.],
        [24.,  2.],
        [25.,  1.],
        [26.,  0.],
        [27.,  1.],
        [28.,  2.],
        [29.,  3.],
        [30.,  4.],
        [31.,  5.],
        [32.,  6.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]],

loss: 0.4455 ||:  28%|██▊       | 281/1021 [01:04<01:37,  7.58it/s]

tensor([[ 3.,  6.],
        [ 2.,  5.],
        [ 1.,  4.],
        [ 0.,  3.],
        [ 1.,  2.],
        [ 2.,  1.],
        [ 3.,  0.],
        [ 4.,  1.],
        [ 5.,  2.],
        [ 6.,  3.],
        [ 7.,  4.],
        [ 8.,  5.],
        [ 9.,  6.],
        [10.,  7.],
        [11.,  8.],
        [12.,  9.],
        [13., 10.],
        [14., 11.],
        [15., 12.],
        [16., 13.],
        [17., 14.],
        [18., 15.],
        [19., 16.],
        [20., 17.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[12., 17.],
        [11., 16.],
        [10., 15.],
        [ 9., 14.],
        [ 8., 13.],
        [ 7., 12.],
        [ 6., 11.],
        [ 5., 10.],
        [ 4.,  9.],
        [ 3.,  8.],
        [ 2.,  7.],
        [ 1.,  6.],
        [ 0.,  5.],
        [ 1.,  4.],
        [ 2.,  3.],
        [ 3.,  2.],
        [ 4.,  1.],
        [ 5.,  0.],
        [ 6.,  0.],
        [ 7.,  1.],
        [ 8.,  2.],
  

loss: 0.4436 ||:  28%|██▊       | 283/1021 [01:04<02:10,  5.63it/s]

tensor([[35., 38.],
        [34., 37.],
        [33., 36.],
        [32., 35.],
        [31., 34.],
        [30., 33.],
        [29., 32.],
        [28., 31.],
        [27., 30.],
        [26., 29.],
        [25., 28.],
        [24., 27.],
        [23., 26.],
        [22., 25.],
        [21., 24.],
        [20., 23.],
        [19., 22.],
        [18., 21.],
        [17., 20.],
        [16., 19.],
        [15., 18.],
        [14., 17.],
        [13., 16.],
        [12., 15.],
        [11., 14.],
        [10., 13.],
        [ 9., 12.],
        [ 8., 11.],
        [ 7., 10.],
        [ 6.,  9.],
        [ 5.,  8.],
        [ 4.,  7.],
        [ 3.,  6.],
        [ 2.,  5.],
        [ 1.,  4.],
        [ 0.,  3.],
        [ 0.,  2.],
        [ 1.,  1.],
        [ 2.,  0.],
        [ 3.,  1.],
        [ 4.,  2.],
        [ 5.,  3.],
        [ 6.,  4.],
        [ 7.,  5.],
        [ 8.,  6.],
        [ 9.,  7.],
        [10.,  8.],
        [11.,  9.],
        [12., 10.],
        [13., 11.],


loss: 0.4424 ||:  28%|██▊       | 284/1021 [01:04<02:10,  5.64it/s]

tensor([[ 6., 35.],
        [ 5., 34.],
        [ 4., 33.],
        [ 3., 32.],
        [ 2., 31.],
        [ 1., 30.],
        [ 0., 29.],
        [ 1., 28.],
        [ 2., 27.],
        [ 3., 26.],
        [ 4., 25.],
        [ 5., 24.],
        [ 6., 23.],
        [ 7., 22.],
        [ 8., 21.],
        [ 9., 20.],
        [10., 19.],
        [11., 18.],
        [12., 17.],
        [13., 16.],
        [14., 15.],
        [15., 14.],
        [16., 13.],
        [17., 12.],
        [18., 11.],
        [19., 10.],
        [20.,  9.],
        [21.,  8.],
        [22.,  7.],
        [23.,  6.],
        [24.,  5.],
        [25.,  4.],
        [26.,  3.],
        [27.,  2.],
        [28.,  1.],
        [29.,  0.],
        [30.,  0.],
        [31.,  0.],
        [32.,  0.],
        [33.,  0.],
        [34.,  1.],
        [35.,  2.],
        [36.,  3.],
        [37.,  4.],
        [38.,  5.],
        [39.,  6.],
        [40.,  7.],
        [41.,  8.],
        [ 0.,  0.],
        [ 0.,  0.],


loss: 0.4423 ||:  28%|██▊       | 286/1021 [01:05<02:09,  5.67it/s]

tensor([[57., 62.],
        [56., 61.],
        [55., 60.],
        [54., 59.],
        [53., 58.],
        [52., 57.],
        [51., 56.],
        [50., 55.],
        [49., 54.],
        [48., 53.],
        [47., 52.],
        [46., 51.],
        [45., 50.],
        [44., 49.],
        [43., 48.],
        [42., 47.],
        [41., 46.],
        [40., 45.],
        [39., 44.],
        [38., 43.],
        [37., 42.],
        [36., 41.],
        [35., 40.],
        [34., 39.],
        [33., 38.],
        [32., 37.],
        [31., 36.],
        [30., 35.],
        [29., 34.],
        [28., 33.],
        [27., 32.],
        [26., 31.],
        [25., 30.],
        [24., 29.],
        [23., 28.],
        [22., 27.],
        [21., 26.],
        [20., 25.],
        [19., 24.],
        [18., 23.],
        [17., 22.],
        [16., 21.],
        [15., 20.],
        [14., 19.],
        [13., 18.],
        [12., 17.],
        [11., 16.],
        [10., 15.],
        [ 9., 14.],
        [ 8., 13.],


loss: 0.4422 ||:  28%|██▊       | 287/1021 [01:05<02:08,  5.73it/s]

tensor([[ 1., 24.],
        [ 0., 23.],
        [ 0., 22.],
        [ 0., 21.],
        [ 1., 20.],
        [ 2., 19.],
        [ 3., 18.],
        [ 4., 17.],
        [ 5., 16.],
        [ 6., 15.],
        [ 7., 14.],
        [ 8., 13.],
        [ 9., 12.],
        [10., 11.],
        [11., 10.],
        [12.,  9.],
        [13.,  8.],
        [14.,  7.],
        [15.,  6.],
        [16.,  5.],
        [17.,  4.],
        [18.,  3.],
        [19.,  2.],
        [20.,  1.],
        [21.,  0.],
        [22.,  1.],
        [23.,  2.],
        [24.,  3.],
        [25.,  4.],
        [26.,  5.],
        [27.,  6.],
        [28.,  7.],
        [29.,  8.],
        [30.,  9.],
        [31., 10.],
        [32., 11.],
        [33., 12.],
        [34., 13.],
        [35., 14.],
        [36., 15.],
        [37., 16.],
        [38., 17.],
        [39., 18.],
        [40., 19.],
        [41., 20.],
        [42., 21.],
        [43., 22.],
        [44., 23.],
        [ 0.,  0.],
        [ 0.,  0.],


loss: 0.4419 ||:  28%|██▊       | 289/1021 [01:05<02:00,  6.10it/s]

tensor([[ 5., 40.],
        [ 4., 39.],
        [ 3., 38.],
        [ 2., 37.],
        [ 1., 36.],
        [ 0., 35.],
        [ 1., 34.],
        [ 2., 33.],
        [ 3., 32.],
        [ 4., 31.],
        [ 5., 30.],
        [ 6., 29.],
        [ 7., 28.],
        [ 8., 27.],
        [ 9., 26.],
        [10., 25.],
        [11., 24.],
        [12., 23.],
        [13., 22.],
        [14., 21.],
        [15., 20.],
        [16., 19.],
        [17., 18.],
        [18., 17.],
        [19., 16.],
        [20., 15.],
        [21., 14.],
        [22., 13.],
        [23., 12.],
        [24., 11.],
        [25., 10.],
        [26.,  9.],
        [27.,  8.],
        [28.,  7.],
        [29.,  6.],
        [30.,  5.],
        [31.,  4.],
        [32.,  3.],
        [33.,  2.],
        [34.,  1.],
        [35.,  0.],
        [36.,  1.],
        [37.,  2.],
        [38.,  3.],
        [39.,  4.],
        [40.,  5.],
        [41.,  6.],
        [42.,  7.],
        [43.,  8.],
        [ 0.,  0.],


loss: 0.4413 ||:  28%|██▊       | 290/1021 [01:05<01:57,  6.20it/s]

tensor([[24., 27.],
        [23., 26.],
        [22., 25.],
        [21., 24.],
        [20., 23.],
        [19., 22.],
        [18., 21.],
        [17., 20.],
        [16., 19.],
        [15., 18.],
        [14., 17.],
        [13., 16.],
        [12., 15.],
        [11., 14.],
        [10., 13.],
        [ 9., 12.],
        [ 8., 11.],
        [ 7., 10.],
        [ 6.,  9.],
        [ 5.,  8.],
        [ 4.,  7.],
        [ 3.,  6.],
        [ 2.,  5.],
        [ 1.,  4.],
        [ 0.,  3.],
        [ 1.,  2.],
        [ 2.,  1.],
        [ 3.,  0.],
        [ 4.,  0.],
        [ 5.,  0.],
        [ 6.,  1.],
        [ 7.,  2.],
        [ 8.,  3.],
        [ 9.,  4.],
        [10.,  5.],
        [11.,  6.],
        [12.,  7.],
        [13.,  8.],
        [14.,  9.],
        [15., 10.],
        [16., 11.],
        [17., 12.],
        [18., 13.],
        [19., 14.],
        [20., 15.],
        [21., 16.],
        [22., 17.],
        [23., 18.],
        [24., 19.],
        [25., 20.],


loss: 0.4402 ||:  29%|██▊       | 292/1021 [01:06<02:00,  6.05it/s]

tensor([[ 1., 14.],
        [ 0., 13.],
        [ 1., 12.],
        [ 2., 11.],
        [ 3., 10.],
        [ 4.,  9.],
        [ 5.,  8.],
        [ 6.,  7.],
        [ 7.,  6.],
        [ 8.,  5.],
        [ 9.,  4.],
        [10.,  3.],
        [11.,  2.],
        [12.,  1.],
        [13.,  0.],
        [14.,  1.],
        [15.,  2.],
        [16.,  3.],
        [17.,  4.],
        [18.,  5.],
        [19.,  6.],
        [20.,  7.],
        [21.,  8.],
        [22.,  9.],
        [23., 10.],
        [24., 11.],
        [25., 12.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[84., 90.],
        [83., 89.],
        [82., 88.],
        [81., 87.],
        [80., 86.],
        [79., 85.],
        [78., 84.],
        [77., 83.],
        [76., 82.],
        [75., 81.],
        [74., 80.],
        [73., 79.],
        [72., 78.],
        [71., 77.],
        [70., 76.],
        [69., 75.],
        [68., 74.],
        [67., 73.],
        [66., 72.],
  

loss: 0.4392 ||:  29%|██▉       | 294/1021 [01:06<02:20,  5.19it/s]

tensor([[17., 25.],
        [16., 24.],
        [15., 23.],
        [14., 22.],
        [13., 21.],
        [12., 20.],
        [11., 19.],
        [10., 18.],
        [ 9., 17.],
        [ 8., 16.],
        [ 7., 15.],
        [ 6., 14.],
        [ 5., 13.],
        [ 4., 12.],
        [ 3., 11.],
        [ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 0.,  7.],
        [ 1.,  6.],
        [ 2.,  5.],
        [ 3.,  4.],
        [ 4.,  3.],
        [ 5.,  2.],
        [ 6.,  1.],
        [ 7.,  0.],
        [ 8.,  1.],
        [ 9.,  2.],
        [10.,  3.],
        [11.,  4.],
        [12.,  5.],
        [13.,  6.],
        [14.,  7.],
        [15.,  8.],
        [16.,  9.],
        [17., 10.],
        [18., 11.],
        [19., 12.],
        [20., 13.],
        [21., 14.],
        [22., 15.],
        [23., 16.],
        [24., 17.],
        [25., 18.],
        [26., 19.],
        [27., 20.],
        [28., 21.],
        [29., 22.],
        [30., 23.],
        [31., 24.],


loss: 0.4388 ||:  29%|██▉       | 296/1021 [01:06<01:55,  6.29it/s]

tensor([[ 1., 12.],
        [ 0., 11.],
        [ 0., 10.],
        [ 1.,  9.],
        [ 2.,  8.],
        [ 3.,  7.],
        [ 4.,  6.],
        [ 5.,  5.],
        [ 6.,  4.],
        [ 7.,  3.],
        [ 8.,  2.],
        [ 9.,  1.],
        [10.,  0.],
        [11.,  1.],
        [12.,  2.],
        [13.,  3.],
        [14.,  4.],
        [15.,  5.],
        [16.,  6.],
        [17.,  7.],
        [18.,  8.],
        [19.,  9.],
        [20., 10.],
        [21., 11.],
        [22., 12.],
        [23., 13.],
        [24., 14.],
        [25., 15.],
        [26., 16.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 4., 10.],
        [ 3.,  9.],
        [ 2.,  8.],
        [ 1.,  7.],
        [ 0.,  6.],
        [ 1.,  5.],
        [ 2.,  4.],
        [ 3.,  3.],
        [ 4.,  2.],
        [ 5.,  1.],
        [ 6.,  0.],
        [ 7.,  1.],
        [ 8.,  2.],
        [ 9.,  3.],
        [10.,  4.],
        [11.,  5.],
  

loss: 0.4378 ||:  29%|██▉       | 299/1021 [01:07<01:38,  7.33it/s]

tensor([[11., 14.],
        [10., 13.],
        [ 9., 12.],
        [ 8., 11.],
        [ 7., 10.],
        [ 6.,  9.],
        [ 5.,  8.],
        [ 4.,  7.],
        [ 3.,  6.],
        [ 2.,  5.],
        [ 1.,  4.],
        [ 0.,  3.],
        [ 1.,  2.],
        [ 2.,  1.],
        [ 3.,  0.],
        [ 4.,  1.],
        [ 5.,  2.],
        [ 6.,  3.],
        [ 7.,  4.],
        [ 8.,  5.],
        [ 9.,  6.],
        [10.,  7.],
        [11.,  8.],
        [12.,  9.],
        [13., 10.]], device='cuda:0')
tensor([[20., 25.],
        [19., 24.],
        [18., 23.],
        [17., 22.],
        [16., 21.],
        [15., 20.],
        [14., 19.],
        [13., 18.],
        [12., 17.],
        [11., 16.],
        [10., 15.],
        [ 9., 14.],
        [ 8., 13.],
        [ 7., 12.],
        [ 6., 11.],
        [ 5., 10.],
        [ 4.,  9.],
        [ 3.,  8.],
        [ 2.,  7.],
        [ 1.,  6.],
        [ 0.,  5.],
        [ 1.,  4.],
        [ 2.,  3.],
        [ 3.,  2.],
  

loss: 0.4374 ||:  29%|██▉       | 301/1021 [01:07<01:32,  7.78it/s]

tensor([[11., 28.],
        [10., 27.],
        [ 9., 26.],
        [ 8., 25.],
        [ 7., 24.],
        [ 6., 23.],
        [ 5., 22.],
        [ 4., 21.],
        [ 3., 20.],
        [ 2., 19.],
        [ 1., 18.],
        [ 0., 17.],
        [ 1., 16.],
        [ 2., 15.],
        [ 3., 14.],
        [ 4., 13.],
        [ 5., 12.],
        [ 6., 11.],
        [ 7., 10.],
        [ 8.,  9.],
        [ 9.,  8.],
        [10.,  7.],
        [11.,  6.],
        [12.,  5.],
        [13.,  4.],
        [14.,  3.],
        [15.,  2.],
        [16.,  1.],
        [17.,  0.],
        [18.,  1.],
        [19.,  2.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[53., 68.],
        [52., 67.],
        [51., 66.],
        [50., 65.],
        [49., 64.],
        [48., 63.],
        [47., 62.],
        [46., 61.],
        [45., 60.],
        [44., 59.],
  

loss: 0.4380 ||:  30%|██▉       | 304/1021 [01:07<01:34,  7.56it/s]

tensor([[ 7., 28.],
        [ 6., 27.],
        [ 5., 26.],
        [ 4., 25.],
        [ 3., 24.],
        [ 2., 23.],
        [ 1., 22.],
        [ 0., 21.],
        [ 1., 20.],
        [ 2., 19.],
        [ 3., 18.],
        [ 4., 17.],
        [ 5., 16.],
        [ 6., 15.],
        [ 7., 14.],
        [ 8., 13.],
        [ 9., 12.],
        [10., 11.],
        [11., 10.],
        [12.,  9.],
        [13.,  8.],
        [14.,  7.],
        [15.,  6.],
        [16.,  5.],
        [17.,  4.],
        [18.,  3.],
        [19.,  2.],
        [20.,  1.],
        [21.,  0.],
        [22.,  1.],
        [23.,  2.],
        [ 0.,  0.]], device='cuda:0')
tensor([[14., 22.],
        [13., 21.],
        [12., 20.],
        [11., 19.],
        [10., 18.],
        [ 9., 17.],
        [ 8., 16.],
        [ 7., 15.],
        [ 6., 14.],
        [ 5., 13.],
        [ 4., 12.],
        [ 3., 11.],
        [ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 1.,  7.],
        [ 2.,  6.],
  

loss: 0.4377 ||:  30%|██▉       | 305/1021 [01:08<01:46,  6.69it/s]

tensor([[24., 32.],
        [23., 31.],
        [22., 30.],
        [21., 29.],
        [20., 28.],
        [19., 27.],
        [18., 26.],
        [17., 25.],
        [16., 24.],
        [15., 23.],
        [14., 22.],
        [13., 21.],
        [12., 20.],
        [11., 19.],
        [10., 18.],
        [ 9., 17.],
        [ 8., 16.],
        [ 7., 15.],
        [ 6., 14.],
        [ 5., 13.],
        [ 4., 12.],
        [ 3., 11.],
        [ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 0.,  7.],
        [ 1.,  6.],
        [ 2.,  5.],
        [ 3.,  4.],
        [ 4.,  3.],
        [ 5.,  2.],
        [ 6.,  1.],
        [ 7.,  0.],
        [ 8.,  1.],
        [ 9.,  2.],
        [10.,  3.],
        [11.,  4.],
        [12.,  5.],
        [13.,  6.],
        [14.,  7.],
        [15.,  8.],
        [16.,  9.],
        [17., 10.],
        [18., 11.],
        [19., 12.],
        [20., 13.],
        [21., 14.],
        [22., 15.],
        [23., 16.],
        [24., 17.],


loss: 0.4376 ||:  30%|███       | 307/1021 [01:08<01:42,  7.00it/s]

tensor([[ 2.,  7.],
        [ 1.,  6.],
        [ 0.,  5.],
        [ 1.,  4.],
        [ 2.,  3.],
        [ 3.,  2.],
        [ 4.,  1.],
        [ 5.,  0.],
        [ 6.,  1.],
        [ 7.,  2.],
        [ 8.,  3.],
        [ 9.,  4.],
        [10.,  5.],
        [11.,  6.],
        [12.,  7.],
        [13.,  8.],
        [14.,  9.],
        [15., 10.],
        [16., 11.],
        [17., 12.],
        [18., 13.],
        [19., 14.],
        [20., 15.],
        [21., 16.],
        [22., 17.],
        [23., 18.],
        [24., 19.],
        [25., 20.],
        [26., 21.],
        [27., 22.],
        [28., 23.],
        [29., 24.],
        [30., 25.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[13., 25.],
        [12., 24.],
        [11., 23.],
        [10., 22.],
        [ 9., 21.],
        [ 8., 20.],
        [ 7., 19.],
        [ 6., 18.],
        [ 5., 17.],
        [ 4., 16.],
        [ 3., 15.],
        [ 2., 14.],
        [ 1., 13.],
        [ 0., 12.],
  

loss: 0.4374 ||:  30%|███       | 310/1021 [01:08<01:36,  7.38it/s]

tensor([[ 1., 16.],
        [ 0., 15.],
        [ 1., 14.],
        [ 2., 13.],
        [ 3., 12.],
        [ 4., 11.],
        [ 5., 10.],
        [ 6.,  9.],
        [ 7.,  8.],
        [ 8.,  7.],
        [ 9.,  6.],
        [10.,  5.],
        [11.,  4.],
        [12.,  3.],
        [13.,  2.],
        [14.,  1.],
        [15.,  0.],
        [16.,  1.],
        [17.,  2.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[15., 16.],
        [14., 15.],
        [13., 14.],
        [12., 13.],
        [11., 12.],
        [10., 11.],
        [ 9., 10.],
        [ 8.,  9.],
        [ 7.,  8.],
        [ 6.,  7.],
        [ 5.,  6.],
        [ 4.,  5.],
        [ 3.,  4.],
        [ 2.,  3.],
        [ 1.,  2.],
        [ 0.,  1.],
        [ 1.,  0.],
        [ 2.,  1.],
        [ 3.,  2.],
        [ 4.,  3.],
        [ 5.,  4.],
        [ 6.,  5.],
        [ 7.,  6.],
        [ 8.,  7.],
        [ 9.,  8.],
        [10.,  9.],
  

loss: 0.4371 ||:  31%|███       | 312/1021 [01:08<01:34,  7.48it/s]

tensor([[12., 27.],
        [11., 26.],
        [10., 25.],
        [ 9., 24.],
        [ 8., 23.],
        [ 7., 22.],
        [ 6., 21.],
        [ 5., 20.],
        [ 4., 19.],
        [ 3., 18.],
        [ 2., 17.],
        [ 1., 16.],
        [ 0., 15.],
        [ 1., 14.],
        [ 2., 13.],
        [ 3., 12.],
        [ 4., 11.],
        [ 5., 10.],
        [ 6.,  9.],
        [ 7.,  8.],
        [ 8.,  7.],
        [ 9.,  6.],
        [10.,  5.],
        [11.,  4.],
        [12.,  3.],
        [13.,  2.],
        [14.,  1.],
        [15.,  0.],
        [16.,  1.],
        [17.,  2.],
        [18.,  3.],
        [19.,  4.],
        [20.,  5.],
        [21.,  6.],
        [22.,  7.],
        [23.,  8.],
        [24.,  9.],
        [25., 10.],
        [26., 11.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 6., 24.],
        [ 5., 23.],
        [ 4., 22.],
        [ 3., 21.],
        [ 2., 20.],
  

loss: 0.4360 ||:  31%|███       | 314/1021 [01:09<01:49,  6.43it/s]

tensor([[24., 36.],
        [23., 35.],
        [22., 34.],
        [21., 33.],
        [20., 32.],
        [19., 31.],
        [18., 30.],
        [17., 29.],
        [16., 28.],
        [15., 27.],
        [14., 26.],
        [13., 25.],
        [12., 24.],
        [11., 23.],
        [10., 22.],
        [ 9., 21.],
        [ 8., 20.],
        [ 7., 19.],
        [ 6., 18.],
        [ 5., 17.],
        [ 4., 16.],
        [ 3., 15.],
        [ 2., 14.],
        [ 1., 13.],
        [ 0., 12.],
        [ 1., 11.],
        [ 2., 10.],
        [ 3.,  9.],
        [ 4.,  8.],
        [ 5.,  7.],
        [ 6.,  6.],
        [ 7.,  5.],
        [ 8.,  4.],
        [ 9.,  3.],
        [10.,  2.],
        [11.,  1.],
        [12.,  0.],
        [13.,  1.],
        [14.,  2.],
        [15.,  3.],
        [16.,  4.],
        [17.,  5.],
        [18.,  6.],
        [19.,  7.],
        [20.,  8.],
        [21.,  9.],
        [22., 10.],
        [23., 11.],
        [24., 12.],
        [25., 13.],


loss: 0.4358 ||:  31%|███       | 315/1021 [01:09<01:45,  6.69it/s]

tensor([[24., 26.],
        [23., 25.],
        [22., 24.],
        [21., 23.],
        [20., 22.],
        [19., 21.],
        [18., 20.],
        [17., 19.],
        [16., 18.],
        [15., 17.],
        [14., 16.],
        [13., 15.],
        [12., 14.],
        [11., 13.],
        [10., 12.],
        [ 9., 11.],
        [ 8., 10.],
        [ 7.,  9.],
        [ 6.,  8.],
        [ 5.,  7.],
        [ 4.,  6.],
        [ 3.,  5.],
        [ 2.,  4.],
        [ 1.,  3.],
        [ 0.,  2.],
        [ 1.,  1.],
        [ 2.,  0.],
        [ 3.,  0.],
        [ 4.,  0.],
        [ 5.,  1.],
        [ 6.,  2.],
        [ 7.,  3.],
        [ 8.,  4.],
        [ 9.,  5.],
        [10.,  6.],
        [11.,  7.],
        [12.,  8.],
        [13.,  9.],
        [14., 10.],
        [15., 11.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[16., 27.],
        [15., 26.],
        [14., 25.],
        [13., 24.],
        [12., 23.],
        [11., 22.],
        [10., 21.],
  

loss: 0.4347 ||:  31%|███       | 317/1021 [01:09<01:48,  6.49it/s]

tensor([[38., 46.],
        [37., 45.],
        [36., 44.],
        [35., 43.],
        [34., 42.],
        [33., 41.],
        [32., 40.],
        [31., 39.],
        [30., 38.],
        [29., 37.],
        [28., 36.],
        [27., 35.],
        [26., 34.],
        [25., 33.],
        [24., 32.],
        [23., 31.],
        [22., 30.],
        [21., 29.],
        [20., 28.],
        [19., 27.],
        [18., 26.],
        [17., 25.],
        [16., 24.],
        [15., 23.],
        [14., 22.],
        [13., 21.],
        [12., 20.],
        [11., 19.],
        [10., 18.],
        [ 9., 17.],
        [ 8., 16.],
        [ 7., 15.],
        [ 6., 14.],
        [ 5., 13.],
        [ 4., 12.],
        [ 3., 11.],
        [ 2., 10.],
        [ 1.,  9.],
        [ 0.,  8.],
        [ 1.,  7.],
        [ 2.,  6.],
        [ 3.,  5.],
        [ 4.,  4.],
        [ 5.,  3.],
        [ 6.,  2.],
        [ 7.,  1.],
        [ 8.,  0.],
        [ 9.,  1.],
        [10.,  2.],
        [11.,  3.],


loss: 0.4346 ||:  31%|███       | 319/1021 [01:10<01:45,  6.66it/s]

tensor([[ 5., 10.],
        [ 4.,  9.],
        [ 3.,  8.],
        [ 2.,  7.],
        [ 1.,  6.],
        [ 0.,  5.],
        [ 1.,  4.],
        [ 2.,  3.],
        [ 3.,  2.],
        [ 4.,  1.],
        [ 5.,  0.],
        [ 6.,  1.],
        [ 7.,  2.],
        [ 8.,  3.],
        [ 9.,  4.],
        [10.,  5.],
        [11.,  6.],
        [12.,  7.],
        [13.,  8.],
        [14.,  9.],
        [15., 10.],
        [16., 11.],
        [17., 12.],
        [18., 13.],
        [19., 14.],
        [20., 15.],
        [21., 16.],
        [22., 17.],
        [23., 18.],
        [24., 19.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[30., 46.],
        [29., 45.],
        [28., 44.],
        [27., 43.],
        [26., 42.],
        [25., 41.],
        [24., 40.],
        [23., 39.],
        [22., 38.],
        [21., 37.],
        [20., 36.],
        [19., 35.],
        [18., 34.],
        [17., 33.],
  

loss: 0.4338 ||:  31%|███▏      | 321/1021 [01:10<01:43,  6.78it/s]

tensor([[ 2., 32.],
        [ 1., 31.],
        [ 0., 30.],
        [ 0., 29.],
        [ 0., 28.],
        [ 1., 27.],
        [ 2., 26.],
        [ 3., 25.],
        [ 4., 24.],
        [ 5., 23.],
        [ 6., 22.],
        [ 7., 21.],
        [ 8., 20.],
        [ 9., 19.],
        [10., 18.],
        [11., 17.],
        [12., 16.],
        [13., 15.],
        [14., 14.],
        [15., 13.],
        [16., 12.],
        [17., 11.],
        [18., 10.],
        [19.,  9.],
        [20.,  8.],
        [21.,  7.],
        [22.,  6.],
        [23.,  5.],
        [24.,  4.],
        [25.,  3.],
        [26.,  2.],
        [27.,  1.],
        [28.,  0.],
        [29.,  1.],
        [30.,  2.],
        [31.,  3.],
        [32.,  4.],
        [33.,  5.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 1.,  8.],
        [ 0.,  7.],
        [ 1.,  6.],
        [ 2.,  5.],
        [ 3.,  4.],
        [ 4.,  3.],
  

loss: 0.4360 ||:  32%|███▏      | 324/1021 [01:10<01:26,  8.03it/s]

tensor([[ 1.,  9.],
        [ 0.,  8.],
        [ 1.,  7.],
        [ 2.,  6.],
        [ 3.,  5.],
        [ 4.,  4.],
        [ 5.,  3.],
        [ 6.,  2.],
        [ 7.,  1.],
        [ 8.,  0.],
        [ 9.,  1.],
        [10.,  2.],
        [11.,  3.],
        [12.,  4.],
        [13.,  5.],
        [14.,  6.],
        [15.,  7.],
        [16.,  8.],
        [17.,  9.],
        [18., 10.],
        [19., 11.],
        [20., 12.],
        [21., 13.]], device='cuda:0')
tensor([[14., 21.],
        [13., 20.],
        [12., 19.],
        [11., 18.],
        [10., 17.],
        [ 9., 16.],
        [ 8., 15.],
        [ 7., 14.],
        [ 6., 13.],
        [ 5., 12.],
        [ 4., 11.],
        [ 3., 10.],
        [ 2.,  9.],
        [ 1.,  8.],
        [ 0.,  7.],
        [ 1.,  6.],
        [ 2.,  5.],
        [ 3.,  4.],
        [ 4.,  3.],
        [ 5.,  2.],
        [ 6.,  1.],
        [ 7.,  0.],
        [ 8.,  1.],
        [ 9.,  2.],
        [10.,  3.],
        [11.,  4.],
  

loss: 0.4353 ||:  32%|███▏      | 325/1021 [01:10<01:29,  7.74it/s]

tensor([[ 2., 23.],
        [ 1., 22.],
        [ 0., 21.],
        [ 0., 20.],
        [ 1., 19.],
        [ 2., 18.],
        [ 3., 17.],
        [ 4., 16.],
        [ 5., 15.],
        [ 6., 14.],
        [ 7., 13.],
        [ 8., 12.],
        [ 9., 11.],
        [10., 10.],
        [11.,  9.],
        [12.,  8.],
        [13.,  7.],
        [14.,  6.],
        [15.,  5.],
        [16.,  4.],
        [17.,  3.],
        [18.,  2.],
        [19.,  1.],
        [20.,  0.],
        [21.,  1.],
        [22.,  2.],
        [23.,  3.],
        [24.,  4.],
        [25.,  5.],
        [26.,  6.],
        [27.,  7.],
        [28.,  8.],
        [29.,  9.],
        [30., 10.],
        [31., 11.],
        [32., 12.],
        [33., 13.],
        [34., 14.],
        [35., 15.],
        [36., 16.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[ 5., 10.],
        [ 4.,  9.],
        [ 3.,  8.],
        [ 2.,  7.],
  

loss: 0.4353 ||:  32%|███▏      | 328/1021 [01:11<01:17,  9.00it/s]

tensor([[ 5., 10.],
        [ 4.,  9.],
        [ 3.,  8.],
        [ 2.,  7.],
        [ 1.,  6.],
        [ 0.,  5.],
        [ 1.,  4.],
        [ 2.,  3.],
        [ 3.,  2.],
        [ 4.,  1.],
        [ 5.,  0.],
        [ 6.,  1.],
        [ 7.,  2.],
        [ 8.,  3.],
        [ 9.,  4.],
        [10.,  5.],
        [11.,  6.],
        [12.,  7.],
        [13.,  8.],
        [14.,  9.],
        [15., 10.],
        [16., 11.],
        [17., 12.],
        [18., 13.],
        [19., 14.],
        [20., 15.],
        [21., 16.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]], device='cuda:0')
tensor([[74., 86.],
        [73., 85.],
        [72., 84.],
        [71., 83.],
        [70., 82.],
        [69., 81.],
        [68., 80.],
        [67., 79.],
        [66., 78.],
        [65., 77.],
        [64., 76.],
        [63., 75.],
        [62., 74.],
        [61., 73.],
        [60., 72.],
        [59., 71.],
  

loss: 0.4343 ||:  32%|███▏      | 330/1021 [01:11<01:56,  5.93it/s]

tensor([[ 5., 16.],
        [ 4., 15.],
        [ 3., 14.],
        [ 2., 13.],
        [ 1., 12.],
        [ 0., 11.],
        [ 1., 10.],
        [ 2.,  9.],
        [ 3.,  8.],
        [ 4.,  7.],
        [ 5.,  6.],
        [ 6.,  5.],
        [ 7.,  4.],
        [ 8.,  3.],
        [ 9.,  2.],
        [10.,  1.],
        [11.,  0.],
        [12.,  1.],
        [13.,  2.],
        [14.,  3.],
        [15.,  4.],
        [16.,  5.],
        [17.,  6.],
        [18.,  7.],
        [19.,  8.],
        [20.,  9.],
        [21., 10.],
        [22., 11.],
        [23., 12.],
        [24., 13.],
        [25., 14.],
        [26., 15.],
        [27., 16.],
        [28., 17.],
        [29., 18.],
        [30., 19.],
        [31., 20.],
        [32., 21.],
        [33., 22.],
        [34., 23.],
        [35., 24.],
        [36., 25.],
        [37., 26.],
        [38., 27.],
        [39., 28.],
        [40., 29.],
        [41., 30.],
        [42., 31.],
        [43., 32.],
        [44., 33.],


loss: 0.4341 ||:  32%|███▏      | 331/1021 [01:11<01:43,  6.65it/s]

tensor([[ 1.,  2.],
        [ 0.,  1.],
        [ 1.,  0.],
        [ 2.,  1.],
        [ 3.,  2.],
        [ 4.,  3.],
        [ 5.,  4.],
        [ 6.,  5.],
        [ 7.,  6.],
        [ 8.,  7.],
        [ 9.,  8.],
        [10.,  9.],
        [11., 10.],
        [12., 11.],
        [13., 12.],
        [14., 13.],
        [15., 14.],
        [16., 15.],
        [17., 16.],
        [18., 17.],
        [19., 18.]], device='cuda:0')
tensor([[28., 50.],
        [27., 49.],
        [26., 48.],
        [25., 47.],
        [24., 46.],
        [23., 45.],
        [22., 44.],
        [21., 43.],
        [20., 42.],
        [19., 41.],
        [18., 40.],
        [17., 39.],
        [16., 38.],
        [15., 37.],
        [14., 36.],
        [13., 35.],
        [12., 34.],
        [11., 33.],
        [10., 32.],
        [ 9., 31.],
        [ 8., 30.],
        [ 7., 29.],
        [ 6., 28.],
        [ 5., 27.],
        [ 4., 26.],
        [ 3., 25.],
        [ 2., 24.],
        [ 1., 23.],
  

KeyboardInterrupt: 

In [None]:
    # load model
#     model.load_state_dict(T.load(model_folder + "model.th"))

In [None]:
    # save 
#     with open(model_folder+'model.th', 'wb') as f:
#         T.save(model.state_dict(), f)

In [None]:
    # training data analysis
    seq_iterator = BasicIterator(batch_size=config.batch_size)
    seq_iterator.index_with(vocab)
    
    predictor = Predictor(model, seq_iterator, cuda_device=0 if USE_GPU else -1)
    train_preds = predictor.predict(train_ds) 
    
    label_types = [r_idx2label.get(i.fields['label'].label) for i in train_ds]
    predict_types = [r_idx2label.get(i) for i in np.argmax(train_preds, axis=-1)]
    err_analyze(train_ds, label_types, predict_types, "train")

In [None]:
    plot_comfusion_matrix(label_types, predict_types, output_path, "train_full")

In [None]:
    # testing data analysis
    
    # AllenNLP DatasetReader
    reader = RelationDatasetReader(
        is_training=True, 
        ace05_reader=ace05_reader, 
        token_indexers={"tokens": token_indexer}
    )
    
    test_ds = reader.read(test_path)
    print(len(test_ds))
    seq_iterator = BasicIterator(batch_size=config.batch_size)
    seq_iterator.index_with(vocab)
    
    predictor = Predictor(model, seq_iterator, cuda_device=0 if USE_GPU else -1)
    test_preds = predictor.predict(test_ds) 
    
    label_types = [r_idx2label.get(i.fields['label'].label) for i in test_ds]
    predict_types = [r_idx2label.get(i) for i in np.argmax(test_preds, axis=-1)]  
    
    err_analyze(test_ds, label_types, predict_types, "test")

In [None]:
    plot_comfusion_matrix(label_types, predict_types, output_path, "test_full")