In [17]:
import tensorflow as tf
import tensorflow.keras as keras
from tensorflow.keras import metrics
from read_tfrecord import *
from mtcnn_model import Rnet,cls_ohem,cal_accuracy,bbox_ohem, landmark_ohem
from tqdm import tqdm

In [18]:
data_path = "data/24/train_RNet_landmark.tfrecord_shuffle"

In [19]:
def load_pokemon(mode='train'):
    """ 加载pokemon数据集的工具！
    :param root:    数据集存储的目录
    :param mode:    mode:当前加载的数据是train,val,还是test
    :return:
    """
    # # 创建数字编码表,范围0-4;
    # name2label = {}  # "sq...":0   类别名:类标签;  字典 可以看一下目录,一共有5个文件夹,5个类别：0-4范围;
    # for name in sorted(os.listdir(os.path.join(root))):     # 列出所有目录;
    #     if not os.path.isdir(os.path.join(root, name)):
    #         continue
    #     # 给每个类别编码一个数字
    #     name2label[name] = len(name2label.keys())
 
    # 读取Label信息;保存索引文件images.csv
    # [file1,file2,], 对应的标签[3,1] 2个一一对应的list对象。
    # 根据目录,把每个照片的路径提取出来,以及每个照片路径所对应的类别都存储起来，存储到CSV文件中。
    size = 24
    images,labels,boxes,landmarks = red_tf(data_path,size)
 
    # 图片切割成，训练70%，验证15%，测试15%。
    if mode == 'train':                                                     # 70% 训练集
        images = images[:int(0.7 * len(images))]
        labels = labels[:int(0.7 * len(labels))]
        boxes  = boxes[:int(0.7 * len(boxes))]
        landmarks = landmarks[:int(0.7 * len(landmarks))]
    elif mode == 'val':                                                     # 15% = 70%->85%  验证集
        images = images[int(0.7 * len(images)):int(0.85 * len(images))]
        labels = labels[int(0.7 * len(labels)):int(0.85 * len(labels))]
        boxes = boxes[int(0.7 * len(boxes)):int(0.85 * len(boxes))]
        landmarks = landmarks[int(0.7 * len(landmarks)):int(0.85 * len(landmarks))]
    else:                                                                   # 15% = 70%->85%  测试集
        images = images[int(0.85 * len(images)):]
        labels = labels[int(0.85 * len(labels)):]
        boxes = boxes[int(0.85 * len(boxes)):]
        landmarks = landmarks[int(0.85 * len(landmarks)):]
    ima = tf.data.Dataset.from_tensor_slices(images)
    lab = tf.data.Dataset.from_tensor_slices(labels)
    roi = tf.data.Dataset.from_tensor_slices(boxes)
    land = tf.data.Dataset.from_tensor_slices(landmarks)
 
    #train_data = tf.data.Dataset.zip((ima, lab, roi,land)).shuffle(1000).batch(16)
    train_data = tf.data.Dataset.zip((ima, lab, roi,land)).batch(16)
    train_data = list(train_data.as_numpy_iterator())
    return train_data

# 图像色相变换
def image_color_distort(inputs):
    inputs = tf.image.random_contrast(inputs, lower=0.5, upper=1.5)
    inputs = tf.image.random_brightness(inputs, max_delta=0.2)
    inputs = tf.image.random_hue(inputs,max_delta= 0.2)
    inputs = tf.image.random_saturation(inputs,lower = 0.5, upper= 1.5)
    return inputs

In [21]:
def train(eopch):
    model = Rnet()
    #model.load_weights("rnet.h5")
 
    optimizer = keras.optimizers.Adam(learning_rate=1e-3)
    off = 1000
    acc_meter = metrics.Accuracy()
    for epoch in tqdm(range(eopch)):
 
        for i,(img,lab,boxes,landmarks) in enumerate(load_pokemon("train")):
 
 
            img = image_color_distort(img)
            # 开一个gradient tape, 计算梯度
            with tf.GradientTape() as tape:
                print(lab)
                cls_prob, bbox_pred, landmark_pred = model(img)
                cls_loss = cls_ohem(cls_prob, lab)
                bbox_loss = bbox_ohem(bbox_pred, boxes,lab)
                landmark_loss = landmark_ohem(landmark_pred, landmarks, lab)
                # accuracy = cal_accuracy(cls_prob, label_batch)
 
 
                total_loss_value = cls_loss + 0.5 * bbox_loss + 0.5 * landmark_loss
                grads = tape.gradient(total_loss_value, model.trainable_variables)
                optimizer.apply_gradients(zip(grads, model.trainable_variables))
            if i % 200 == 0:
                print('Training loss (for one batch) at step %s: %s' % (i, float(total_loss_value)))
                print('Seen so far: %s samples' % ((i + 1) * 16))
 
 
        for i, (v_img, v_lab1, boxes, landmarks) in enumerate(load_pokemon("val")):
            v_img = image_color_distort(v_img)
            with tf.GradientTape() as tape:
                cls_prob, bbox_pred, landmark_pred = model(v_img)
                cls_loss = cls_ohem(cls_prob, v_lab1)
                bbox_loss = bbox_ohem(bbox_pred, boxes,v_lab1)
                landmark_loss = landmark_ohem(landmark_pred, landmarks, v_lab1)
                # accuracy = cal_accuracy(cls_prob, label_batch)
 
 
                total_loss_value = cls_loss + 0.5 * bbox_loss + 0.5 * landmark_loss
                grads = tape.gradient(total_loss_value, model.trainable_variables)
                optimizer.apply_gradients(zip(grads, model.trainable_variables))
            if i % 200 == 0:
                print('val___ loss (for one batch) at step %s: %s' % (i, float(total_loss_value)))
                print('Seen so far: %s samples' % ((i + 1) * 16))
    model.save_weights('./Weights/Rnet_wight/rnet_30.ckpt')

In [22]:
train(30)

  0%|          | 0/30 [00:00<?, ?it/s]

[-2. -1. -1. -2.  0.  1. -2. -2. -1.  1. -1.  1. -2. -1.  0.  1.]
Training loss (for one batch) at step 0: 2.540825366973877
Seen so far: 16 samples
[ 1.  1. -2.  1.  1. -1. -1. -2. -1.  1. -2.  1. -2.  1. -2.  0.]
[ 1.  1.  0.  0. -2.  0. -1.  1.  1.  1. -2.  1. -1. -2.  0. -2.]
[ 0.  0.  1. -2.  1. -1. -2. -2.  1.  0.  1.  1. -1.  0.  1.  0.]
[-1. -2. -1. -2. -1. -1. -1.  1.  1.  1.  0. -2.  1.  0. -2.  1.]
[ 1.  1. -1. -1.  1.  0. -2.  1. -2. -1. -2.  1.  0.  1. -1.  1.]
[ 1. -2. -2.  0.  0. -2. -2. -1.  0. -2.  0. -1. -2.  0. -2. -2.]
[ 0. -1.  1.  0.  1.  1.  1.  1. -1. -2.  1. -1. -2.  1.  1. -1.]
[-1.  1. -1.  0.  1.  1.  0. -1.  0.  0.  0. -1. -1.  0. -2. -2.]
[ 1. -1. -2. -2.  0. -1.  1. -2. -2. -2.  1. -2. -2.  0. -1.  1.]
[ 1. -2. -2.  0.  0. -2. -2.  1.  0.  0.  1. -2.  1.  0. -2.  1.]
[ 1.  1. -1.  0.  1. -1.  0.  1. -2.  1.  0.  1. -1.  1. -1. -1.]
[-1. -2. -1. -1. -2. -1.  0. -2. -2.  0. -1.  0. -2. -2. -2.  1.]
[ 1.  0.  0. -2. -1. -1.  1. -1. -2. -2.  0.  0. -2.  0.  0

[ 1.  0. -1. -1.  0. -1.  1.  1.  1.  0.  1. -1. -1.  0.  0. -2.]
[-2. -1.  0.  1. -2.  0. -2.  0. -2.  1. -2. -2. -1. -2.  0.  1.]
[-2. -1.  0.  1.  0. -2. -1. -2. -1. -1. -2. -2. -1.  1. -1.  0.]
[ 1. -2.  0. -1.  0.  1.  1. -1. -1.  1. -1. -2.  1.  0.  0.  1.]
[ 0. -2.  0.  1.  0.  1.  1.  0.  1.  1. -2. -2.  1. -2.  0.  1.]
[-1. -1.  1. -1.  0. -2.  0.  0. -1.  0.  0.  1.  1.  1. -2.  0.]
[-1. -2. -1.  0. -1. -2.  1.  0.  0. -1. -1.  1. -1. -1.  0.  1.]
[ 1.  1.  1.  1. -2.  0.  0.  0. -2.  1.  0. -2. -1.  1. -1. -2.]
[ 1.  1. -2. -2.  0. -1. -2. -2.  1.  0.  0.  1.  1.  0. -1.  1.]
[ 0. -1.  0.  1. -1.  1. -1. -2.  0.  0.  0. -2. -1.  1. -1. -1.]
[ 0.  1. -1. -1.  1.  1.  1. -1.  0.  0. -1. -1.  0.  0.  0.  1.]
[ 0. -1. -2. -1. -1. -1.  0.  1.  0.  1.  1.  0.  0.  1. -2.  1.]
[ 0. -1. -1.  1. -1.  0.  0.  0. -1. -1.  1. -2.  0. -2. -1. -1.]
[ 0.  0. -1.  0. -2.  0. -2.  1. -2. -2.  1. -1.  0.  1.  1. -2.]
[-1.  1.  0. -1.  0. -1.  0.  0.  0.  0.  0.  1.  1. -1. -1.  1.]
[-1. -2.  

[ 1. -2.  1.  1. -1.  1.  1. -1. -2. -1.  0. -2. -2. -2. -2. -1.]
[-1. -1. -2.  1. -2. -1.  1. -1.  1. -2.  1.  1. -1. -1. -1.  1.]
[ 0. -1.  1. -2.  1. -1. -1. -1. -1. -2. -2.  0. -2.  1. -1.  0.]
[ 1. -1.  1.  0. -1.  1.  1. -1.  0.  1.  1. -1.  1. -2. -2. -1.]
[-1. -2. -1. -2.  0. -1.  0.  1.  0. -2. -2.  1.  0. -1. -1.  1.]
[ 0. -2.  0.  1. -2.  1.  1.  1.  1.  0.  0.  1. -1. -2.  1. -1.]
[ 0. -1.  1. -2. -1.  0. -1. -1.  0.  1.  1.  0. -2.  0. -1. -2.]
[-2.  1. -2.  1. -1. -1. -2.  0.  1. -2.  0. -2.  1.  0. -1. -1.]
[-2. -1.  0.  1. -2.  1.  1.  1. -1. -1.  0. -2.  1. -1. -2. -2.]
[ 1. -1. -2.  1. -1.  0.  1.  1.  1. -1.  1. -1. -2.  1.  1.  1.]
[ 1.  1.  1. -2. -2.  0.  1. -2. -2.  1. -1.  1. -1.  1.  1.  0.]
[ 0. -2. -1.  1. -2. -2.  0. -1.  1.  1. -1.  1. -1.  0.  1. -1.]
[-1. -1. -1.  0. -1.  0.  1.  0.  0. -2.  0. -1. -2.  0. -1. -1.]
[ 0.  1. -1. -2. -2.  1.  1.  0. -2. -1. -1.  1. -1.  1.  1.  0.]
[ 1.  1. -2. -2.  1.  1.  1.  1.  0.  1.  1. -1.  0.  0.  1.  0.]
[ 1. -1. -

[-1. -2. -2.  1.  1. -2.  1. -2.  0.  0.  1.  0.  0.  0.  0.  1.]
[-2.  0. -2. -1.  1. -2. -2. -1.  1. -2.  0. -1. -1. -2.  1. -2.]
[-2. -2. -2. -1. -1.  0. -2. -1. -2.  0. -1. -1.  1.  1. -1. -1.]
[ 1. -1. -1. -2. -1. -1.  1.  1. -2.  1.  1. -2. -2. -1. -2.  1.]
[-1.  0. -1.  0.  0.  0.  0.  0.  1.  1. -2. -2.  1. -1. -2. -1.]
[-2. -2.  0. -1. -1.  0. -1. -1. -2. -2. -2.  1. -1. -2.  1.  0.]
[-1.  0.  1. -1.  1.  0.  0.  0. -2. -2.  1. -2. -1. -2.  1. -1.]
[-2.  0.  0. -2. -2.  0.  0.  1. -1.  0. -1. -1.  1.  1. -2.  0.]
[-2. -1.  0.  0.  1.  1. -1. -1.  0.  0. -2. -2. -1.  1. -2. -2.]
[-1.  1. -1.  0. -2. -2. -1. -2.  1. -1.  0.  1.  1.  1. -1. -1.]
[ 0.  0. -1.  0. -1.  0. -2.  1. -1. -2. -2.  1.  0.  1.  1. -1.]
[-1. -1.  1.  0. -1.  1. -1.  0.  1.  1.  1.  1.  0.  0.  1.  1.]
[-2. -1.  0.  0. -2.  0.  1.  0. -1. -2.  1. -2. -1.  1. -1.  0.]
[ 0.  1.  0. -1. -2. -2. -1.  1. -2. -1.  0. -1.  1. -2. -1. -2.]
[ 1. -1. -1.  0. -1.  1.  0.  1. -2.  1.  0. -2.  1.  0. -2. -2.]
[ 1.  0. -

[-2. -2. -1.  1. -2. -2.  0. -2.  1.  0.  0. -1.  0. -2.  0. -2.]
[ 0.  0.  1. -2.  1. -1.  0. -2.  0.  1. -2.  1. -2. -2.  1. -1.]
[ 1. -1. -1. -1. -2.  0. -2.  0. -1.  1. -1. -1.  0. -1.  0. -1.]
[ 1.  1.  0.  1.  0. -2.  0.  1.  0.  1.  1. -2.  0. -1.  0.  0.]
[-1. -2.  1.  0. -1.  0. -2. -1. -2. -1.  1. -1. -1. -1. -1.  0.]
[-2.  0.  0.  1.  1. -2.  1. -1. -2.  0.  1.  0. -2. -2. -2. -2.]
[ 1.  0. -1. -1.  1.  0. -1.  1.  0.  0. -2.  1.  0.  1.  0.  0.]
[ 0. -1. -1.  1.  1.  1. -1.  0.  1. -1.  0.  0.  1.  1. -1. -2.]
[ 1. -2.  0.  1.  0.  1.  0.  1.  1.  1. -2. -2. -1. -1.  1.  0.]
[-1. -2. -2.  1.  0. -1. -1.  0.  0. -2. -2. -1. -2. -1. -1.  0.]
[ 0.  0.  1. -1.  1. -2. -2.  1. -2. -1.  0. -1. -1. -2. -2. -1.]
[ 0.  0. -2.  0. -2. -1. -2. -1. -2.  1.  1.  0. -1.  1.  0.  0.]
[-1.  1. -1.  0. -1.  1. -2. -2.  1. -1.  1. -1. -2.  0. -2. -2.]
[ 0.  0. -1.  1. -1. -2. -1.  0.  0.  0.  0. -1. -1.  0.  0.  0.]
[ 1.  0.  0.  1.  0. -1. -1.  0.  0.  1.  1.  1.  1.  0. -1.  1.]
[-2.  0. -

[-1.  1.  0.  1.  1. -2. -2.  1.  1. -2.  1.  0.  0.  0. -1. -2.]
Training loss (for one batch) at step 600: 0.39294782280921936
Seen so far: 9616 samples
[ 1. -1.  1.  0.  1. -1.  1. -1. -2. -1. -1.  0.  1.  0.  1. -2.]
[ 0.  0. -2. -1.  0. -1. -1.  0. -2. -2. -1.  1.  0.  1.  1.  0.]
[-2.  0. -1. -1. -1. -1.  1.  1.  0.  0. -1.  0. -2. -2.  1. -2.]
[ 0.  0. -2. -2. -1. -1.  0. -2.  1.  0.  1.  0. -1.  0. -2.  1.]
[-2.  1.  1. -2.  0. -2. -1. -1.  0.  0. -1. -1.  0.  0. -1.  1.]
[ 0. -2. -1.  0.  0.  1. -1. -1.  0.  0. -1.  1. -2.  0. -2.  1.]
[ 0.  1.  1.  0. -1. -2. -1. -1. -1. -2. -2. -2.  0. -2.  1. -1.]
[-1.  1. -2. -1.  1.  0.  1.  0. -1.  1.  0.  1. -2.  0.  0.  0.]
[-2. -1.  0. -1.  0. -1.  1. -1. -1. -2.  1. -1. -2.  1.  1. -2.]
[ 1.  1.  0.  0. -2.  1.  1.  0. -2. -2.  0. -1.  1.  1.  1. -2.]
[ 0. -2.  1. -1. -2. -1.  1. -2.  1.  1.  0. -2.  0.  1. -1. -1.]
[ 0.  0. -2.  1. -2. -2.  1.  0.  0.  0. -1.  0. -1. -2. -2.  0.]
[-1. -1.  0. -1.  0.  1.  0.  1. -2. -1.  1. -2.  0. 

[ 1.  1. -2. -2. -1.  1.  1. -1.  1. -2.  1. -2.  0. -2.  1.  1.]
[ 0.  1.  1. -1.  1. -2.  1.  1. -1. -2. -2. -1. -2. -1. -2. -1.]
[-1.  1. -2. -1. -2.  0.  1. -2. -2.  1. -1. -2. -2. -1. -2.  1.]
[-1. -1. -2.  0.  0. -2.  1. -2.  1. -2.  0. -1. -2.  0. -1. -2.]
[ 0. -2.  0.  1. -1.  1.  1. -1.  0. -1.  0.  1. -1. -1. -1. -1.]
[-2. -1. -1.  0. -1. -1. -1.  0.  1. -2. -1.  1.  0. -1.  1.  1.]
[-1.  0.  1.  0. -2. -2.  0. -2.  0. -2.  1. -2.  1. -2.  0. -2.]
[-1. -1.  1.  0.  1.  1.  1. -1.  0. -2.  1.  0.  0.  1. -2.  1.]
[ 0. -1.  0. -2. -2.  1. -2.  1. -1. -1. -2.  1.  1.  0.  1. -1.]
[-1. -1. -2. -1.  0.  0. -2. -2. -1. -1. -2.  1. -2. -1. -1. -2.]
[-2. -1.  1.  1.  1. -1.  1. -1.  0. -2. -2. -2.  1. -2.  0. -1.]
[-2. -2. -1. -1. -2. -1.  1. -2. -2. -2.  1.  1.  0. -1. -2.  0.]
[-1.  1. -1.  1.  1.  1.  0. -1. -2.  0.  0. -1. -1. -1. -1. -1.]
[ 1.  1.  1.  1.  0. -2.  0.  1.  1.  0.  0. -2.  1.  0.  1. -1.]
[-2. -2.  1. -1.  0.  1.  1.  1.  1.  1. -2. -1.  1.  1. -2. -1.]
[ 1. -1.  

[-1.  1. -1. -1. -2.  1. -2.  1.  0. -1.  0.  1.  1.  1. -2. -2.]
[-1. -2. -1.  0.  0.  1.  1.  1.  0.  0. -2.  1.  1.  0.  0. -2.]
[-2.  0.  1.  1. -1.  0. -1. -2. -1. -1. -2. -2. -1.  1. -2.  0.]
[-1.  1. -1. -1. -1.  1.  1. -2. -1. -1. -2.  0.  0. -1.  0. -2.]
[ 1. -1.  0.  0.  0.  1.  1. -2. -2. -1.  1. -2. -2. -2.  0.  0.]
[ 0.  0.  1.  1.  0.  1.  0. -2.  0.  0.  1.  1.  0.  1. -1. -2.]
[ 0.  0. -1.  1.  1.  1. -2. -2.  1. -2. -1.  1. -1. -2.  1. -2.]
[-1. -1. -1.  0. -2.  1.  1. -1. -1.  0. -1. -2. -1.  1.  0. -2.]
[ 0.  0. -1.  1. -1. -1. -2.  0. -2.  1. -2.  1.  0.  1.  0.  0.]
[ 0.  0.  1.  0. -2.  1.  0.  0.  0. -1. -2. -1. -1.  1.  1. -2.]
[ 1.  1.  1.  1.  0. -2. -2.  1.  0.  0. -1. -1. -2. -2.  0.  0.]
[ 0. -2. -1. -2.  0.  0.  0. -1. -1. -2. -1. -1.  0. -2. -2.  0.]
[-2.  1.  1. -2. -1. -1.  0.  1. -1. -2.  1.  1. -1. -2. -2. -2.]
[-1.  0.  1. -1.  1.  0.  1.  1.  1.  0. -2.  1.  0. -2. -1. -1.]
[ 1.  0. -1. -2.  1. -2. -1. -2.  1. -2.  1.  1. -1.  0.  0.  1.]
[ 0. -2.  

[-2. -2. -1. -2.  0. -1.  1. -2. -1. -1. -1.  0.  0.  0.  0. -2.]
[ 0. -2. -2. -2. -2.  1.  1.  1.  1.  0. -2. -1.  1.  1. -1.  1.]
[-2. -2. -1.  1. -2. -1.  0.  1. -2. -1.  1.  0.  1.  0. -2.  0.]
[-1. -1. -1. -1. -1. -1.  0. -1. -2.  0. -2.  1.  1. -2. -1. -2.]
[-2. -1.  1.  1. -2.  0. -2. -2.  1.  0.  0.  0. -1.  1.  0. -2.]
[ 1.  1.  1. -1.  0.  1. -1. -1.  1. -1.  1.  1. -1.  1. -2. -1.]
[-2.  1. -2.  1. -2. -1.  1.  1. -2.  1.  1. -1. -2. -1. -2. -1.]
[ 0.  1.  0.  1.  1.  1.  1. -2. -1.  1. -2.  1.  0. -2.  1. -1.]
[ 1. -1.  0.  0. -2.  1.  1.  1.  0.  0. -1.  1. -2.  1. -2. -2.]
[ 0. -1.  1.  1.  0. -2. -2.  1.  1.  1.  0. -1.  0.  1.  1.  0.]
[ 0. -2.  1. -1. -2.  1. -1. -1.  0.  1.  0.  0.  1. -2. -1.  1.]
[ 1. -2.  1. -1. -2. -1. -2. -1. -1. -2.  1.  0. -2.  0. -2.  1.]
[-2.  0. -2. -2. -1. -2.  0.  0. -2. -1.  0. -1.  1.  1.  1.  0.]
[ 0.  0.  1.  1. -1. -2. -1. -2. -2. -2.  1. -2. -1. -1. -2.  1.]
[-2. -1.  1.  0. -2.  1.  0.  1.  1. -1.  1.  1.  1. -2. -1. -1.]
[ 1. -1. -

  3%|▎         | 1/30 [01:27<42:08, 87.18s/it]

[-1. -1. -1.  1. -2. -2.  1. -2.  0. -1. -2. -2. -2.  0. -2. -2.]
Training loss (for one batch) at step 0: 0.4729599058628082
Seen so far: 16 samples
[ 0.  1.  0.  0. -2.  0.  1. -1. -1. -2. -2. -1.  0.  1.  1.  0.]
[ 0. -2. -2.  1. -1. -2.  0. -2.  0. -1. -1.  0.  1.  0.  0.  1.]
[ 1. -1. -2.  1. -1. -2. -2. -2. -1.  0. -2.  0. -2.  0.  1.  0.]
[ 0.  0. -2.  1.  0. -1.  1. -2.  0.  1.  0.  0. -2.  0.  0. -2.]
[-2. -2. -1. -2.  1. -2. -1. -1. -1.  1. -1.  1. -2. -1.  1.  0.]
[ 0.  0.  0.  1.  1. -1.  1. -1.  1.  0. -2. -1.  1.  0. -1.  1.]
[ 1. -1. -1. -2. -2. -2. -2. -1.  1.  0.  1. -2. -1. -1.  1.  0.]
[-2. -2. -1.  0.  1.  0.  1.  0.  1.  1.  0. -1. -1. -2. -2. -2.]
[ 0.  0. -2.  0. -1. -1. -1.  1. -2. -1.  0. -2. -2. -2. -2.  1.]
[-1. -1.  1.  1. -2. -1. -1. -2.  0.  0.  1.  0.  0.  0.  0. -2.]
[ 1. -1. -2.  1. -1.  1.  0.  0.  0. -1. -2. -1.  1. -1. -1. -2.]
[-1. -1.  1.  1.  1.  0.  1. -1.  0. -2.  1. -2. -1. -2. -2.  1.]
[-2. -1.  0. -1. -2.  0. -2. -2. -2.  1.  1. -2.  0. -2. -

[-2.  1.  0.  0. -2. -2. -2. -1.  0.  1.  0. -1.  1. -2.  1.  0.]
[ 1. -2. -2.  1.  1. -1. -2. -1. -1.  0. -1. -2.  0.  0.  1. -2.]
[-1.  1. -1. -1. -1. -1.  0.  0. -1.  1. -1. -1.  1.  0.  1. -2.]
[ 0.  1.  1.  0.  1.  1.  1.  1. -1.  0. -2.  1. -2.  0.  0.  1.]
[-2.  1. -2.  1. -1.  0.  0. -2.  0. -2. -2. -1. -1.  1.  1.  1.]
[ 1. -2.  0.  0. -2.  0. -1. -1.  1. -1.  0. -1.  0. -2.  1.  1.]
[ 0.  0. -2. -1.  1. -1. -1. -1.  1.  1.  0.  1. -1.  1.  1. -1.]
[-1.  1. -2.  1.  1.  1.  0. -1. -1.  1.  0.  1. -2. -2. -2. -1.]
[-1. -2.  0. -1. -2.  0.  1.  1. -1. -2.  1. -2.  1.  1.  1.  1.]
[ 0.  0.  0. -1. -2. -1. -1. -2.  1.  0.  1.  1.  1.  0.  0. -2.]
[-2. -1. -2.  0. -2. -1.  0.  0.  1. -1. -2.  1. -2.  1.  0. -2.]
[ 1.  0.  1. -2.  0. -1. -2.  0.  0. -2.  0. -1. -2. -2.  1. -1.]
[-2.  0.  0.  0. -1.  1. -1. -1.  1.  1. -1.  1.  0.  0.  1.  1.]
[-2.  0. -1.  0.  0. -2. -2.  0. -2. -1. -2.  1.  1.  1. -1.  0.]
[-2.  0.  0.  1.  0.  0. -1.  0.  1. -1. -1. -1. -2.  1.  0.  1.]
[ 0.  1.  

[ 1. -1.  1. -1.  0. -1. -2. -1. -1. -2. -1.  1.  0.  0. -1. -2.]
[ 1. -2. -1. -1.  0.  0. -1.  0. -2.  1. -2.  1.  1. -2.  1. -2.]
[ 0.  1.  1. -1. -1. -2.  0.  0. -1.  1. -1. -2.  0.  1. -2.  0.]
[ 1.  1.  1. -1.  1.  0. -1. -1. -2. -2. -1.  0. -1. -1.  1. -1.]
[ 1.  1. -1.  0. -1.  0.  1.  1.  1. -2. -2. -2.  0.  0.  1. -1.]
[-1. -1. -2.  1.  0.  0. -1. -2. -1.  0. -1. -2.  0. -1. -2.  1.]
[-2.  1. -2. -1. -1. -1. -2.  0. -1.  1.  0. -2.  0. -2. -1. -2.]
[-1.  1. -2.  1. -2. -2. -1.  0. -1.  0. -2. -1.  1. -1. -1. -1.]
[-2. -1. -1. -1.  1.  0.  1.  1.  1.  1. -1.  1. -1.  1. -2.  1.]
[ 0. -2. -1.  0. -2.  1.  1. -2. -1. -1.  1.  0.  1.  1.  0. -2.]
[-2. -1. -2. -2. -2.  1. -1. -2. -2.  0.  0.  1. -1. -2. -1. -1.]
[-1.  1. -2.  1. -1.  1. -2.  0. -2.  1. -1. -2.  0. -2.  0.  1.]
[-2.  0.  1. -1. -2. -2. -1.  1. -1. -1.  1. -2.  1.  0.  1. -1.]
[-2. -1.  1.  1.  1. -1.  1.  1. -1.  0. -2.  0.  1. -1. -2. -1.]
[ 1. -2. -1. -2.  0.  0.  1. -1.  1. -1.  0.  1. -1.  0. -1. -2.]
[ 0.  1. -

[ 0.  0. -2. -1. -2.  1.  0.  1.  1.  0.  1. -2. -2. -2. -1. -2.]
[-2.  1. -1.  1.  1.  0.  0.  1.  1. -2. -1.  1.  1. -1. -1.  1.]
[ 0.  0.  1.  1. -2.  0. -2.  1. -2. -2.  0.  1.  0. -1.  1. -2.]
[ 1.  1. -1. -2. -2. -1.  1. -1.  0.  1.  1. -2.  1. -2. -1. -1.]
[-2.  0. -2.  1.  1. -2. -1.  1.  1.  0.  0. -2.  1.  1.  1. -1.]
[-2.  0.  0. -2.  0.  1.  0. -1.  1.  0.  0. -1.  0.  0. -1. -2.]
[-2.  0.  1.  0.  1.  0.  1. -2.  1.  1. -2. -1.  1.  1.  1. -2.]
[-1. -1. -2.  0.  1. -2. -2. -1. -2.  0. -2.  0.  1. -2. -1. -2.]
[ 1. -2.  1.  1.  0. -1.  1.  1. -2. -2.  0. -2.  0.  0.  1. -2.]
[-1. -1.  1. -1. -1.  0. -2. -2. -1.  0.  1. -1.  0.  1.  0. -1.]
[ 0. -2. -1. -1.  0.  0.  1. -1.  1.  1. -1. -2.  1. -1.  0.  0.]
[ 0. -1. -1.  0. -2.  0. -1.  0. -2.  1. -1. -1. -2.  1.  0. -2.]
[ 1.  0. -2. -2. -2. -1.  1. -2.  0. -1.  1.  1. -2.  1.  0.  0.]
[ 0.  1. -1. -1.  0.  0. -2. -1. -1.  0. -1. -2.  1.  1. -2. -1.]
[-1.  0. -1.  0. -2.  0.  1.  0. -1.  1. -2.  0. -2. -1.  0. -2.]
[ 0. -2.  

[ 0.  0.  1.  0. -1.  1.  0.  0. -1. -1.  0.  0.  1.  1.  0. -2.]
[-1. -1.  1. -1.  1.  0.  0. -2.  0.  1. -1. -1. -1. -2. -2.  0.]
[ 1.  1.  0. -2.  1. -1.  0. -1.  1.  0. -1.  1. -2. -2. -2.  1.]
[-1. -2.  0.  1.  0.  0. -1.  0.  1. -2. -2.  0.  1.  0. -1.  1.]
[-1. -2. -2.  1. -1.  1. -2.  0. -1. -2.  1.  0. -1. -2. -1.  1.]
[-2. -1. -1. -1.  0.  0. -1. -1.  0.  1.  1.  1.  1. -2.  1. -1.]
[-2.  1.  0.  1.  0. -2.  0.  1.  0. -1.  0.  1.  1.  0.  1. -2.]
[ 1. -1. -2. -2. -2.  0.  0. -2.  0. -2. -2.  1. -1. -2. -2.  0.]
[-1. -1. -1. -2. -2. -2. -1.  1.  1.  1. -2. -2.  1. -2. -2.  0.]
[ 0. -2.  1.  1.  0. -1. -1.  1. -2. -2.  0.  0.  1. -2.  1.  1.]
[ 0.  1. -2. -2.  0. -2.  1.  0.  0. -1. -2. -1. -2.  0.  0. -1.]
[ 0.  1.  0.  1. -1. -1.  0.  1. -2. -1. -2.  1.  1. -2. -1. -1.]
[ 0.  1.  1.  1.  1. -2.  1. -1.  0.  0.  1. -1. -2.  1.  0. -1.]
[ 1. -2. -1. -2.  0.  0.  0. -1.  1. -2.  0.  0.  0. -2.  0. -2.]
[-2.  0.  1.  0.  1. -2.  1. -2.  0. -2.  0.  0. -1. -2.  0.  1.]
[-1.  1.  

[-2.  0. -2.  1. -1. -2. -1. -2.  0.  0. -2. -1. -2. -2.  0.  0.]
[ 1.  0. -2.  1.  1. -1.  0.  1. -2. -2. -2. -2. -2. -1. -2.  1.]
[ 1. -1.  1.  0.  0. -1. -2. -2. -1.  1. -1. -2.  1.  1. -2.  0.]
[-2.  1. -2. -1. -2. -1.  0. -1.  1.  1. -1. -1.  0. -1.  1. -1.]
[-2.  0.  0. -2.  0. -1. -1. -1. -1. -1.  0. -2.  0.  0.  0.  1.]
[-1.  1. -1. -1. -1. -2. -1.  1. -1. -1.  0. -1.  0.  0. -2.  0.]
[-2. -1. -2.  0. -2.  0.  0.  0. -2.  1. -1.  1. -2. -1.  0. -1.]
[ 1. -1.  1.  1.  0.  1. -2. -2.  0. -2. -2. -1.  0.  0.  0.  1.]
[ 0.  1.  0. -2.  1. -1.  1. -2. -1.  0. -1. -1. -1. -1. -2. -2.]
[-1. -2. -2. -1. -2.  0. -1.  0.  0.  0. -2.  1. -2.  0. -1. -2.]
[-2.  1.  1. -1. -1.  0. -1.  0.  0.  1.  0.  0. -2. -2.  1. -1.]
[ 1. -1.  1. -2.  0.  1.  0.  1. -1.  1.  1. -2.  1.  0. -1. -2.]
[ 1.  0. -1.  1. -1.  1.  0.  0.  0.  1.  0.  0. -2.  0. -1.  0.]
[-1.  1. -2. -1. -1. -1.  0. -2. -2.  1. -1. -2.  1.  1. -1.  1.]
[ 1.  1.  1.  0. -2.  1. -1.  1. -2. -1.  0.  0. -1. -2. -2.  1.]
[-1. -2.  

[ 0. -2. -1. -1.  0. -2. -2. -2.  1. -2.  1. -1. -1. -2. -2.  1.]
[ 1. -2. -2.  1.  1.  0.  1.  0. -2. -1.  1.  0.  0. -1.  0. -1.]
[-1.  0.  0.  1.  1. -1.  1.  0.  1. -1.  0. -1.  1. -1. -2.  1.]
[ 0.  1. -2. -2.  0.  1. -2.  1. -2. -2.  0.  0.  1.  0.  0. -1.]
[ 1.  1. -2.  0.  1.  1. -1. -1. -1.  0.  1.  0. -1. -1.  1.  1.]
[-2. -1.  0. -2. -2. -2. -1. -2.  1.  1.  0.  0.  0. -1.  0. -2.]
[-2.  0.  1.  1.  1. -2.  1.  0.  0.  0.  0.  1.  0.  0.  0.  1.]
[-2.  1.  0. -2.  0.  1.  1.  0.  1. -2. -1.  0. -1.  1. -2. -2.]
[ 1.  1. -2. -2. -1.  1.  0. -1. -2.  1.  0.  1.  1.  0. -1.  0.]
[-1.  1.  1.  1. -1. -1.  0.  1. -1.  0. -1.  1.  1.  0. -2.  0.]
[ 1. -2. -1. -1. -2.  1.  0.  0.  1. -2. -1.  1.  0.  1. -2.  1.]
[-1. -2.  1.  0.  0.  1. -2.  1.  0.  0. -1. -1.  1. -1. -2. -2.]
[ 0. -2.  1. -1.  0. -2. -1. -2.  1.  1. -1.  0.  0.  1. -2.  1.]
[-2. -1.  1.  0. -2.  1.  0.  0. -1. -1. -1. -1.  1.  0.  1. -1.]
[-1. -2. -2.  1. -1. -2. -2. -1.  0. -2. -1.  0. -1.  1. -2. -2.]
[ 1. -2. -

[-1.  1.  1. -1.  1. -1.  1.  0.  1.  1.  0.  0.  1. -2.  1. -1.]
[ 1.  1. -1. -1. -1.  1. -2.  0. -2.  1. -2.  1. -2. -1.  0. -2.]
[ 0.  1. -2.  1. -1. -2.  1.  0.  0.  1. -2.  1.  1. -1.  0. -2.]
[ 0. -1. -1. -2. -2.  0.  1.  1.  1. -1. -2. -2. -1.  0.  1. -1.]
[ 0.  1.  1. -1. -1. -2. -2. -2.  0. -1. -2.  0.  0.  1.  0.  1.]
[ 0.  0. -2.  0.  0.  0.  0. -2. -2.  1. -2. -1.  0.  0.  1. -2.]
[ 1.  0.  0.  1.  1. -2. -1.  0.  1. -2. -1. -2.  1.  0.  0. -2.]
[ 0.  0. -1.  0. -1. -1.  1. -1.  1.  1.  1.  0.  0. -1.  0.  0.]
[ 0.  0. -1. -2.  0. -2.  0. -1.  1. -2.  0. -2. -2.  1.  1. -1.]
[-2.  1. -2. -1.  0. -2.  0.  1. -1. -1. -2.  1. -2. -1.  0.  1.]
[ 0.  1.  1.  1. -1.  1. -1. -2. -2.  0.  0.  0. -1. -1.  1. -1.]
[-2. -2.  1. -2. -1.  1.  0. -2. -1. -1. -2.  1. -1. -1. -1.  1.]
[ 1.  1.  1.  1.  1.  0. -1. -1.  1.  1. -1.  1.  1.  0. -2.  1.]
[-2. -2. -2. -2. -2. -2. -1. -2. -1.  1. -2.  0.  0. -2. -2.  1.]
[-2. -1.  0.  0.  1.  1.  1.  1.  1.  1. -1. -2.  0.  0. -2. -1.]
[-1. -1.  

[ 0.  1.  1.  1. -1.  1. -2. -2. -2.  0.  1.  1. -1. -2.  1.  1.]
[ 1. -1. -1.  1.  1. -2. -1. -1.  0.  1. -1. -2.  1.  0. -1.  1.]
[ 1. -1.  0. -1. -1. -1. -1. -2. -1. -2.  0. -2. -2.  1. -2. -1.]
[ 0.  0.  1.  1.  1.  1. -2. -2.  0. -1. -2.  1. -2. -1. -1.  0.]
[ 0. -2. -1.  1. -2. -1. -1. -2. -1. -1. -1. -2. -1.  1.  1. -2.]
[-2. -2.  1.  1. -2.  1. -2.  1.  1. -1.  1. -1. -2.  0.  0.  1.]
[-1.  1. -2.  1.  0.  1. -1. -1. -1. -1. -2. -2.  0.  0. -2.  1.]
[-1.  1.  0.  0. -1.  1. -2. -2.  0. -1. -1.  1. -2.  1. -2.  1.]
[-1. -2.  1.  1. -1.  0.  0.  1.  0. -1. -2. -1. -2.  1. -2.  1.]
[ 1. -1. -2. -2. -2. -1. -2.  0. -2.  1.  0.  0. -2. -2.  0. -2.]
[-1. -1. -1.  1.  0.  0.  1.  1. -2. -2.  1.  1. -2. -2.  1.  1.]
[-1.  1.  1.  1. -2.  1.  1. -2. -2.  1. -2. -2.  0. -1.  1.  1.]
[-2.  0. -2. -2. -2.  1. -2. -1. -1.  1. -1. -2.  0. -1. -2. -1.]
[ 1.  0. -2.  0. -1.  1. -1.  0.  0. -2. -2.  1. -1.  0. -2. -2.]
[ 1. -2. -1. -1. -1.  0. -1.  0.  1.  1. -1.  1.  0.  0.  1.  1.]
[-2.  0.  

  7%|▋         | 2/30 [02:53<40:32, 86.86s/it]

[ 0. -2. -1. -2.  0. -2. -1.  0. -2. -1. -2. -2. -1. -2.  1.  1.]
Training loss (for one batch) at step 0: 0.4803604185581207
Seen so far: 16 samples
[ 1.  0.  1.  1.  0.  1. -2.  1.  0.  1. -1. -2. -2.  1.  0.  1.]
[-1.  0. -1. -1.  0.  0.  0.  1. -1.  0.  1.  1. -1.  1.  1.  1.]
[-1.  0. -1.  1. -2.  1. -2.  1. -1.  1.  1. -1. -2. -2.  0.  0.]
[-2. -1.  1. -2.  0.  0. -2.  1.  1. -2. -1.  0.  0.  0.  0.  0.]
[-1.  1. -2.  0. -2.  1.  1.  1.  0. -1.  0. -2.  0. -1.  1. -1.]
[-2. -2. -2. -2. -2. -1.  0. -2.  1. -1. -1. -2. -2.  1.  0.  1.]
[ 1.  1.  0. -2.  1.  0.  1.  1.  1.  1.  1.  1. -1.  0. -1.  0.]
[ 1.  0.  0.  1. -2. -2.  1.  0.  0.  0.  1. -2.  1. -1. -2.  0.]
[ 0. -1. -2. -1.  1. -1.  0. -2. -1.  1. -1.  1.  0.  1.  0. -2.]
[-1.  1. -1. -1. -2. -2.  1. -2. -1. -1.  0. -1. -1.  1.  1. -2.]
[ 1.  1. -2. -2.  1. -1.  1. -1. -2.  0. -2. -1.  1. -1. -1. -1.]
[-1.  1.  1. -1. -1. -2. -2. -2.  0.  0. -1.  0.  0. -2. -1. -1.]
[-1.  1.  1. -1.  0.  1.  0. -1. -1.  1. -2.  1. -1.  1. -

[ 0. -1. -2.  0.  1.  1. -1.  1. -2.  0. -2.  0. -2. -2. -2. -1.]
[-2.  0. -1.  1.  1. -2.  0.  1.  1.  0.  0. -2.  0.  0.  0.  0.]
[-1. -1.  0.  0.  1. -2. -2. -1.  0. -2. -1. -1. -2. -2.  0.  0.]
[ 1. -2.  1.  0.  1.  0. -1.  1.  0.  1.  0.  1.  0.  1. -2. -2.]
[ 1. -2.  0.  1.  1.  0.  1.  0.  0.  0.  0. -2. -2. -1.  0. -1.]
[-2.  0. -1. -2.  1. -2. -2.  0. -2. -1. -2.  0. -2.  0. -2.  0.]
[-2.  1.  1.  0. -2.  0. -1. -2. -1. -2.  0.  1.  1. -1.  1. -2.]
[ 0.  1.  1. -2. -1. -1.  0.  0. -2.  0. -2. -1. -1. -1.  1.  0.]
[ 1.  1.  1.  1. -2. -1. -1. -1. -2.  1. -1.  1.  0.  1. -1. -1.]
[ 0.  0.  1. -2. -1. -2. -1.  0.  1.  1. -2.  0.  1. -2. -1.  1.]
[-2. -1.  0. -2.  0. -2.  0. -2.  0. -2.  1. -1. -1. -2. -1. -2.]
[-2.  0.  1.  0.  1.  1.  0. -1.  1. -2.  0. -2.  1.  0. -1.  1.]
[-2. -1. -2. -2.  1. -2. -2.  0.  0.  0.  1.  0.  0.  0.  1.  1.]
[ 0. -1.  0.  1.  1.  0. -2. -1. -1. -2.  1. -1. -1.  1.  0. -2.]
[ 1. -1. -2.  0.  0. -2. -1.  0. -2.  1. -1.  1. -2. -1.  0. -1.]
[-2. -1. -

[-1. -1. -2. -1. -1. -1.  1.  1.  0.  1.  0.  0.  1.  0.  1. -1.]
[-1.  0. -2. -1. -1.  1.  0.  1. -1. -1. -1. -1. -2. -2. -2. -2.]
[ 1.  0. -2.  0.  1. -1. -1.  0. -2.  0.  0. -1.  1. -2. -1. -1.]
[ 0.  1.  1.  1. -1. -1.  1. -1.  1.  1.  1.  1. -2. -2.  0. -2.]
[ 1. -1.  1. -1.  0. -2. -1.  1.  0.  1. -2.  1. -2.  1.  1. -2.]
[ 1. -1.  0. -1.  0.  0. -1.  0.  1.  0.  1.  0. -1.  1.  1.  0.]
[-1. -1.  1. -1.  1.  1. -1. -1.  1. -2. -2.  1. -2. -2.  1. -1.]
[-2.  1.  1.  0.  0. -2. -1. -2. -1. -1. -1.  1.  0.  0. -2.  0.]
[-1. -1.  1. -2.  1. -2. -1.  0.  1.  1.  1.  0.  0. -1.  0. -2.]
[ 1. -1.  1. -2.  1.  0. -1. -2. -1. -2. -2. -2. -2.  0. -2.  1.]
[-1.  1.  0. -2. -2. -1. -2. -1.  0.  1.  1.  1. -2.  0.  1.  0.]
[-1.  1. -2.  1.  0. -1.  0.  1.  1. -2. -2.  1. -1.  1. -1. -2.]
[ 0.  0.  0.  1. -2. -2.  0. -2.  1. -1. -1. -2. -2.  0.  0. -1.]
[ 0.  1.  0. -2.  1.  1. -2.  0. -1. -1.  0. -2. -2.  1. -1. -1.]
[-1. -2. -2. -1. -1.  1. -2. -1.  0.  1.  1. -2.  0. -2. -1.  1.]
[-2. -2. -

[ 0. -2. -1. -1.  0.  1.  1.  1.  1.  1. -2. -2.  0.  0.  1.  1.]
[ 0. -1.  1.  0.  0. -2. -2. -2.  1. -2.  0.  0.  0. -2. -1.  0.]
[ 0.  0.  0.  1. -1. -1.  0.  0. -1. -1.  1. -1.  0.  0.  1.  1.]
[-2. -2. -2.  1. -1. -1.  1.  1.  0. -2.  1.  1.  0.  1.  0.  1.]
[-1. -2.  0.  0. -1.  1.  0. -2. -2. -1.  1.  1.  1. -1. -2. -1.]
[ 0.  1.  0. -1.  0. -1. -2. -2. -2.  1. -2.  0. -2. -2.  0. -1.]
[-2.  0. -2.  1.  1.  0.  1. -2. -2. -1.  0.  1. -1.  1. -2. -1.]
[-1. -2. -1.  1. -1.  1. -2. -1. -1. -2. -1.  0.  1.  0.  0. -1.]
[-1.  1. -1. -1.  1.  1. -1.  0.  1. -1. -2.  0. -2. -1. -1. -2.]
[-1.  0.  1.  1.  1. -1. -2. -2. -2. -1. -1. -1. -2. -2. -1.  0.]
[ 1.  1.  1.  1.  1.  1. -1.  0.  0.  0.  0. -2.  1.  0. -2. -2.]
[ 1. -2.  1.  1. -2.  1.  1. -2. -1. -2. -1.  1.  0. -1. -1.  1.]
[ 1. -1. -2. -1. -2. -2. -1. -2.  1.  1. -1. -1.  0.  0. -2.  0.]
[-1.  1.  0. -1.  0. -1.  0. -2. -2.  0.  1.  1.  1.  1. -1.  0.]
[ 0.  1. -2.  1. -1.  0. -1.  1. -2. -1. -2.  1.  1. -2. -2.  1.]
[-1. -2.  

[-1. -1.  1. -1. -1. -1. -2. -2. -1.  1. -1. -1.  0.  1.  0.  0.]
[ 0.  0.  0.  0. -2. -2. -2.  0.  0.  0. -1. -2. -2.  0. -2. -1.]
[-1. -2. -2. -1.  1. -2. -1.  0. -2. -2.  0. -2.  1.  1. -2. -1.]
[ 1.  1.  0.  0.  1. -1.  1.  0.  0. -2. -2. -1.  1.  0.  1. -1.]
[ 1.  0.  0.  0.  1. -1.  1. -1. -1. -1. -2.  0.  1.  0. -2. -1.]
[-2.  0.  1. -1. -2.  0.  0.  1.  1.  0.  1. -2.  0.  0. -2. -1.]
[ 1.  1.  1. -2.  0. -1. -1.  0. -2. -1. -2.  0. -1. -1. -2. -1.]
[ 0. -2.  1.  1. -1. -1.  0. -2. -1. -2. -1.  1. -1.  1.  1.  1.]
[-1.  0.  0.  0.  0. -2. -1. -1. -2. -1. -2.  1. -2.  1. -1.  1.]
[-1.  1.  0. -1.  1.  1.  0. -2. -1. -2.  1. -1.  0.  0. -1.  1.]
[-2.  0.  0. -1.  0. -1.  0. -2.  0.  0.  1.  1.  0.  1. -2.  1.]
[-1.  0.  1.  0. -1. -2.  1.  0.  1. -1. -1. -2. -2. -1. -2.  1.]
[-1.  0. -2. -2. -2. -2. -1.  0.  1. -1.  0. -2. -2.  0. -1.  1.]
[ 1.  0.  0. -1. -1.  1.  0. -2.  0.  1. -2.  0. -2.  1.  0.  1.]
[-1. -2. -2.  1. -2.  0. -2.  1. -1. -1. -2.  1. -2. -1. -1.  0.]
[-1.  0.  

[-2.  0. -1. -1. -2.  1. -2. -1.  0. -2. -1. -1. -1. -2. -2.  1.]
[ 0. -1.  0.  1. -2.  1. -2.  0. -1.  1.  0.  0. -2. -1. -1.  1.]
[ 1.  0. -2.  1.  0. -2. -1. -1.  1. -2. -2. -1. -2.  1.  0. -2.]
[ 0. -1. -1. -2. -1. -1. -2. -1.  1.  0. -2.  1.  1.  1.  0.  0.]
[-1. -1.  0.  0.  1.  1. -1.  0. -2. -1. -2. -2.  1.  0.  0. -2.]
[ 0. -1.  1.  0. -1.  0.  1.  1. -1.  1. -1. -1. -2. -1. -1.  1.]
[ 1.  0.  0.  1.  0. -2. -2. -2.  1. -2. -1. -1. -1.  0.  0. -1.]
[-2. -1. -2. -2.  1. -2. -2.  1.  1. -2. -1. -1. -1. -2.  1.  1.]
[ 1.  1. -1. -1.  0. -2. -1. -1. -1. -2. -1.  0.  1. -2. -2.  0.]
[-2. -1. -2.  1.  0.  0.  1. -1.  0. -1. -1. -2. -2.  0.  1. -2.]
[ 0.  1. -1. -2.  0. -1. -2.  0.  1. -2.  1. -2.  0. -2. -2. -1.]
[-2. -1.  0.  0. -2. -2.  0.  0.  0.  0. -1.  0.  0.  0. -2.  1.]
[-1. -2. -2. -2.  1. -2.  0.  1.  0.  0.  0.  0. -1. -2. -2. -2.]
[-1.  0.  0.  1.  1. -1.  0. -1. -2.  0.  1. -2. -1. -2. -2.  0.]
[ 1. -2. -1.  0.  1.  1.  0.  0. -2.  1. -1. -2.  0. -2. -1. -2.]
[ 1. -1.  

[ 1. -1.  0.  1. -2. -1. -2. -1.  0. -1. -1. -2. -2.  1. -2. -2.]
[ 1. -2.  1.  1. -1.  1. -1.  1. -1.  0.  1. -2. -2.  0.  1. -2.]
[-1.  1.  0.  0.  1.  0.  1. -2.  1. -1.  1. -1.  1.  1.  0.  0.]
[ 0.  1.  1.  0. -1. -2.  0. -2. -1.  0.  0. -2.  1.  1.  1.  0.]
[-1.  0. -1.  1.  1.  0.  1.  0. -1.  1. -1. -1. -1.  0.  1. -1.]
[ 1. -2.  0.  1. -1. -2.  0. -2. -1.  1. -2.  0.  0. -2.  1.  1.]
[-2.  0.  0.  0. -1.  0. -1. -1.  0.  1.  0.  1. -1.  1. -1.  0.]
[-1. -2.  1.  0. -2. -2.  0. -1.  1.  1.  0.  1.  1.  0. -1.  0.]
[ 1.  0.  1. -1. -2. -1.  0.  0.  1. -2. -2. -1.  1. -2.  1.  1.]
[-2.  1.  0.  0. -2.  1. -2. -1. -1.  0. -2.  0. -2. -2.  1.  0.]
[-1.  1. -2.  1.  0. -2. -1. -1.  0.  0. -2. -2.  1.  1. -1.  1.]
[ 0.  1.  1.  0.  0.  1.  1.  1. -2.  1.  1.  0. -1. -2.  1. -1.]
[ 0.  1. -1.  1. -1. -2.  0.  1.  1. -2. -1. -1. -2.  0. -1.  1.]
[-1. -1.  0. -1.  1. -2.  0.  1.  1.  1. -2.  0.  1.  0.  1. -2.]
[ 1.  0.  0. -2.  1. -1.  0.  0.  1.  1. -1. -2.  1.  0.  0.  1.]
[ 1.  1.  

[-1.  1.  0.  0.  0.  1. -1. -1. -2. -2.  1.  1. -2. -2. -1. -2.]
[-1.  0.  0. -1.  0.  1. -1. -1.  0.  1.  0.  0.  1. -1. -2. -2.]
[ 0.  0.  0. -2. -1.  1. -1.  0. -1.  0.  0.  1.  0. -2. -1. -2.]
[-2.  1. -1.  1. -2. -1.  1.  0.  0.  1. -1. -2.  0. -2.  0.  0.]
[-2.  1.  0.  1. -1.  1. -2.  0. -2. -1.  0.  1. -2. -1.  1. -2.]
[ 0. -1. -1.  0. -2. -2. -2.  1. -2. -1.  0.  1. -1. -2. -1.  1.]
[-1.  1.  0.  1.  0.  1.  1. -2. -1.  0.  1.  1. -2.  0.  0.  0.]
[ 1.  0.  0.  1. -1. -2.  1. -2. -2. -1. -1.  0.  0. -1.  1.  1.]
[ 0.  1. -1.  1. -1.  0. -1.  0. -2. -2. -2.  0.  0.  1. -1. -1.]
[-1.  0.  0.  1. -2. -2.  0. -1. -2.  0.  1. -1. -2.  0.  0.  0.]
[ 1. -2.  1.  0. -1.  1. -2.  0. -1.  1.  0. -2. -1.  1. -1.  1.]
[ 1. -1. -1. -2. -1. -1.  1.  1.  1. -1. -1.  0. -1. -2. -2. -1.]
[ 0. -2.  1.  1. -2. -1.  1.  0. -1.  1.  0. -2.  0.  0. -2. -1.]
[-2. -1.  0.  0.  1. -2. -2.  0. -2.  0. -2. -2.  0.  0.  1.  0.]
[-2. -1. -1. -2. -2. -2.  0.  1. -2. -1.  0. -1. -1. -2. -2. -2.]
[ 0. -2. -

[ 0. -2.  1. -2. -1.  1.  1. -1. -2.  0. -1.  0.  0. -2. -2.  0.]
[ 1. -1. -2.  0.  1.  1. -2. -2.  1.  0. -2. -2.  1. -1. -2. -1.]
[ 1.  0. -2. -1. -2.  1. -2. -2.  0.  1. -2. -2. -2.  1.  0.  0.]
[-2.  1. -1. -1. -2. -1.  1. -2.  1.  0. -2. -1. -2. -2.  1.  1.]
[-2.  0. -1. -1. -1.  1.  1.  1.  0. -1.  0.  1. -1.  0.  0.  0.]
[-2.  0. -1. -2. -2. -2.  1. -1. -1. -2.  1. -2. -2. -1.  1.  1.]
[ 0. -2. -1.  0.  1. -2. -2.  0. -1.  1.  1.  1. -1.  1. -1. -2.]
[ 1. -2.  1. -2.  0. -1.  1. -2. -2. -1.  1. -2. -2.  0. -2. -2.]
[ 0.  1. -2.  1. -2.  1.  0.  0. -2. -1.  1.  0. -2.  0.  1.  0.]
[ 1. -2. -2.  1. -2.  1. -2. -2. -1.  1.  1. -2. -1.  0. -2. -2.]
[-1. -1.  1.  0.  0. -2. -1. -2.  1.  1.  0. -1.  1.  0.  1.  1.]
[-2.  0. -2.  1.  1.  0. -1.  1.  1.  1.  0.  1.  1. -2. -2.  0.]
[ 0. -1. -1.  0.  0. -1. -1. -2. -1. -1. -2.  1. -1.  0.  1. -2.]
[ 1.  1. -2.  0. -2. -2. -1. -2. -2. -2. -2.  1.  1. -2. -2.  1.]
[ 1.  0. -2.  0. -1. -1.  1. -1.  1. -1. -1. -1.  1.  0. -2. -1.]
[ 1.  0. -

 10%|█         | 3/30 [04:20<39:07, 86.96s/it]

[-1.  0. -2.  0.  0.  1.  1.  0. -1. -2.  0.  1.  0.  1.  0.  1.]
Training loss (for one batch) at step 0: 0.12833018600940704
Seen so far: 16 samples
[ 0. -2.  1. -1.  0.  1. -1. -2. -1. -1. -1.  0. -2. -1. -2.  1.]
[-1. -2. -2. -1.  0.  0. -1.  0. -1.  1. -2. -1. -1.  1.  1. -2.]
[ 1.  0. -2.  0. -1.  0. -2.  0. -1. -1.  1. -2. -1. -2.  0. -2.]
[-2. -2.  1. -2.  1. -2.  1.  1. -1.  1.  0.  1. -2.  0.  1. -1.]
[-1.  0. -2.  1.  1.  0.  1. -1.  0.  1. -1. -2. -1.  1. -2. -2.]
[-1. -1.  0. -2.  1.  1.  1.  0.  0.  1.  1.  1.  0.  1.  0. -2.]
[-2.  0.  1. -1. -2. -1.  1.  1. -1.  1.  0. -2.  1.  0. -2.  0.]
[-2. -1.  0. -1. -1. -2. -1. -1. -2. -1.  0.  1. -1.  0. -2. -1.]
[-1. -1. -2. -1.  0.  0. -1. -2.  1.  0. -1. -2.  1.  0. -2.  1.]
[-2. -2.  0.  1.  0.  1.  0. -1. -2. -2.  1. -1.  1.  1.  1.  1.]
[-2. -1.  0. -1. -1. -2. -1.  0. -1. -1.  1.  1.  0.  0.  1. -1.]
[-2. -1.  0.  0.  0. -2. -2. -2. -2.  0.  0.  0.  1. -2.  0. -2.]
[-2.  0.  0. -2.  0.  1. -2.  1. -1. -2. -2.  0. -1.  1. 

[ 1.  0.  0. -2.  1.  1.  0.  0. -2.  0. -1. -1. -2.  0. -1.  1.]
[-1.  1.  1. -1.  1. -2.  0.  1. -1.  0. -1. -2. -2. -1.  1. -1.]
[-1.  1. -1.  1.  0. -1.  0.  0.  0.  0.  1. -1. -2.  0.  1.  1.]
[-1.  1. -1. -1. -2. -2. -2. -2.  0. -1.  1.  1. -2.  1.  0.  0.]
[-1.  1.  1.  0.  1. -2.  0.  1. -1. -2. -1. -2. -2.  0.  0.  1.]
[ 0.  1. -2.  0. -2. -1.  1.  0. -1. -1. -2.  1.  0.  0. -1.  1.]
[-1. -1. -1. -1. -2.  0. -2. -1.  0. -2. -2.  1. -1. -1. -1.  1.]
[-1.  0. -1. -1. -1.  1. -2.  1. -2. -1. -2. -2.  1. -1.  0. -2.]
[ 1.  1.  1. -2. -1. -2. -1. -1. -1. -2. -2.  1.  1.  1. -2. -2.]
[ 1.  0.  0.  0. -2.  0. -1. -2.  0. -2.  0. -2.  0.  0. -2.  1.]
[ 1.  0. -1. -2. -1.  1. -2. -2.  0. -2. -2.  0. -1.  0. -1.  0.]
[-1.  1. -1. -1. -1.  0. -2. -1.  1. -1. -1.  0. -2. -1.  0. -2.]
[-2.  1.  0. -1. -1.  0. -1.  0. -2. -1.  1.  1. -2. -2. -2. -2.]
[-2. -2. -2.  0.  0. -1.  1. -1. -1. -1. -1. -1. -1.  1. -2. -2.]
[-1.  0.  1.  1.  1. -2.  1.  1. -1. -2.  0.  1. -1.  1.  0. -2.]
[-1.  0.  

[ 0. -2. -1.  1. -1.  0.  0. -2. -2.  1.  1.  1. -2.  1. -1. -2.]
[ 1.  0.  0.  0. -2. -1.  0. -1.  0.  1. -1. -2. -2.  1.  0.  1.]
[ 1.  1. -1.  0.  0. -2. -2.  0.  0. -2.  0.  1. -2.  0. -1.  0.]
[-2. -1. -2. -2. -1. -2.  1.  0. -1.  0. -1. -2. -2.  1.  0. -2.]
[-1.  1.  1.  0.  1. -1.  1.  1.  0.  0. -2.  0.  0.  0. -1. -1.]
[-1. -1. -1.  1.  1.  0. -2. -1.  1. -1. -1.  0.  0.  0. -2. -1.]
[-2. -2. -2. -2.  0. -2. -2. -2.  1.  0. -2.  1.  1. -2.  0. -1.]
[-2.  1. -1. -1.  0.  1.  1.  0. -2.  0. -2. -1. -1.  0. -1.  0.]
[ 1. -2.  1. -1. -1. -2. -2. -2.  1. -1. -1.  1. -2.  0.  1. -1.]
[-2. -2. -2. -2. -1. -1. -2. -1.  1. -2.  1. -1. -2. -1.  1. -2.]
[-1. -2.  1. -1.  0.  1.  1.  1.  0.  1.  1. -2. -1.  1. -1.  0.]
[-2.  1. -2. -2.  1. -2. -2. -2. -2.  0. -1.  0.  1. -1. -2.  1.]
[-1. -2. -1. -2. -2. -1.  1.  0.  1. -2.  1. -2. -2.  0.  1.  1.]
[ 1. -1. -1.  0. -2. -1. -2.  0.  0. -1. -1.  0.  0.  1.  1. -1.]
[ 1. -2. -1.  1.  1. -1. -1.  1. -1.  0.  1.  1.  0.  1. -1.  1.]
[-1.  0. -

[ 0. -2. -1. -1.  0.  1.  1. -1.  0. -2. -2.  0.  0. -1.  0. -2.]
[ 1.  1.  1.  0. -1.  1. -2. -2. -2. -2.  1.  1.  1.  0.  1.  0.]
[ 0. -2. -1. -2. -2.  0. -2.  1.  1. -1. -2.  1. -1.  0.  0.  1.]
[-1. -1.  1.  0.  1. -1. -1. -2.  0.  0.  1.  0. -1.  0.  0.  0.]
[ 1.  0.  0.  0.  0.  0.  1.  0.  0. -2.  0. -1. -1.  1.  0. -2.]
[-2.  0.  1. -2.  0. -2. -2.  0. -1. -2.  1.  0.  1. -1. -1. -2.]
[ 0.  0.  1. -2.  1. -2. -2. -2. -1. -2.  0.  0.  0. -2.  0. -2.]
[ 1. -1.  0.  0. -2.  1. -1. -1. -2. -1. -2.  1. -1.  0.  1. -2.]
[ 1.  1. -2.  1.  0. -2.  1. -1.  1.  0. -1.  0.  0.  1. -2.  1.]
[ 0. -1.  0.  1. -2.  0.  0.  1. -1. -2. -2.  1. -2.  0.  0. -2.]
[-2. -1.  1.  0.  1. -1. -2. -2. -1.  0. -2.  0.  0. -2.  0.  1.]
[ 0. -2.  1.  0. -1.  1. -1. -2.  0.  0. -1. -2.  0.  1.  1. -2.]
[-2. -2. -1. -2. -1.  0. -1. -1.  1. -1.  0.  0. -1. -1. -2.  1.]
[-2.  1. -1. -1. -1. -1.  1. -2. -2.  1. -2.  1. -1.  0.  1.  0.]
[-2.  1.  1.  0.  1. -2. -1.  0.  0.  0.  1.  1.  1. -2. -2.  1.]
[-2.  1.  

[-2.  1.  0. -1.  1. -1. -2. -2.  0. -1.  0. -2. -1. -2.  1. -2.]
[-2.  0. -2. -2.  0.  0.  0.  1. -2. -2.  0. -2.  1.  1.  0.  1.]
[ 0. -2.  0. -1.  0.  1. -2.  0.  1. -1. -1.  0.  1.  0. -2. -1.]
[-1. -1.  1.  1. -2. -1. -1. -2.  1. -1. -2.  1.  1.  0. -2.  1.]
[ 0.  0. -2. -1.  0.  0. -2. -1. -2. -1. -2.  0. -2.  1.  1. -2.]
[ 0. -2. -1.  1. -2. -2.  1. -2.  0. -1.  0.  1. -1.  0.  0. -1.]
[-2. -2.  1.  0.  1. -1.  0. -2.  0.  0.  0.  1. -1.  1. -2. -1.]
[-1. -1. -2.  0. -1. -1. -2.  1.  0.  1. -2.  0. -2. -2. -1.  0.]
[ 1. -2.  0.  1.  1.  0.  1.  1. -2. -1.  1.  1. -2. -2. -1. -2.]
[ 0.  1.  0. -1.  1.  0.  1. -2. -1. -2.  1. -2.  0.  0.  1.  0.]
[-2. -2. -2. -1.  0.  0.  0.  0.  1.  1.  0. -2. -1. -2. -2. -2.]
[ 1. -1. -2.  0.  1. -2.  1. -1.  1.  0.  1. -1.  0. -1. -2. -1.]
[ 1.  1. -1. -2. -2.  0.  0.  0. -2. -1.  1.  1.  0. -2.  1.  0.]
[ 1. -2.  1. -1.  0.  0.  0. -2.  0.  0.  0.  0. -1. -2. -2.  0.]
[ 0. -2.  0. -1. -2.  0.  1. -1. -1.  0.  1.  0.  1. -1. -2. -1.]
[ 0.  0. -

[ 0.  1.  0. -2.  0.  0.  0. -2. -2. -2.  0. -2. -1. -2.  1.  0.]
[-1.  0.  1. -1.  0.  1.  1. -2.  0.  1. -2.  1. -2. -2.  0.  0.]
[-2.  1. -2. -2. -1. -1. -1. -1. -1. -1. -2.  0.  1.  0.  0. -1.]
[ 0.  1. -2.  1.  0. -1. -1. -2.  1. -2.  0. -1. -2.  0.  0. -1.]
[-1.  1. -1.  0. -2. -2.  0.  1. -1. -1. -1.  0.  0.  0.  0. -1.]
[-2.  1.  1.  1.  0.  0.  1.  0.  1. -1.  1.  1. -1.  0. -2. -2.]
[-1.  1.  1. -1.  1.  0. -2. -1. -1. -2. -1. -1.  0. -1.  0. -1.]
[-1.  0.  0.  1.  0. -2.  1.  0.  0.  1. -1. -2. -1. -1.  0. -1.]
[-1. -1. -2.  1. -1. -2.  0.  0. -1. -2. -1. -1. -1.  0. -1.  1.]
[-2.  0. -2.  0.  0. -1.  0. -2. -2. -2.  0.  0.  1. -2. -1.  0.]
[-2.  1.  1.  0. -1. -1.  0. -1.  0. -2. -1.  0.  0.  1. -2.  1.]
[-2.  0.  0.  1.  1.  1.  1. -2. -2. -2.  1. -1. -2.  0.  0. -2.]
[ 0. -2. -1. -2. -1.  0.  0. -2.  1.  0. -2. -2.  1.  0.  1. -1.]
[-1. -2.  0. -1. -1.  1. -1.  0. -1. -1. -1. -2.  1.  0.  1.  1.]
[-1.  0.  1.  1. -1.  1. -2.  1.  1.  1. -1. -2.  0. -2.  0.  1.]
[-2.  0.  

[-1. -2.  1.  1.  1.  1. -2.  1. -2.  0.  1.  0.  0. -1. -2. -1.]
[-1. -2. -2.  0. -1.  1.  0. -1. -2. -2. -2. -1. -1. -1.  1.  1.]
[-2.  1. -2.  1.  1. -1. -1.  1. -1.  1.  0.  0.  1.  1. -2. -2.]
[-2. -2.  1. -2.  0. -2. -1. -1.  1. -1.  0. -1.  0.  1.  1.  0.]
[ 1. -2.  1.  0.  0.  0. -2.  0.  0. -2.  1. -2.  0.  0.  1.  1.]
[-2. -2. -1.  1. -1. -2.  0. -1.  0. -2. -2. -2.  0.  1. -2.  0.]
[ 0.  1. -2.  1.  1.  0. -2.  1.  1.  1.  1.  0. -1.  1. -2. -2.]
[ 1. -1. -1. -1. -1.  1. -1. -1.  0. -1.  1.  1.  1. -1.  1.  1.]
[-2.  0.  0.  1. -2. -2. -2.  0. -1.  0. -2. -1.  1.  0. -1. -1.]
[-1. -1.  0. -1.  0.  0. -2. -2.  1.  1. -1.  0. -1.  0. -1.  0.]
[-2.  1. -1. -2. -1.  0. -1.  1. -1.  1.  0.  0.  1. -2.  0.  1.]
[-1. -1. -1.  1. -1. -2. -1.  0. -1.  1. -1.  1. -1. -2. -2.  1.]
[-1. -1.  0. -2. -2.  0. -1. -1.  1. -2. -1.  0. -1.  1.  0.  0.]
[-1. -1.  1. -2. -2.  0.  1.  0. -1.  1. -2.  1. -1. -2. -2.  1.]
[ 1.  1. -1. -1.  0.  0.  1.  0.  1. -2. -2. -2. -1.  1. -1. -1.]
[ 1.  0.  

[ 0. -2. -1.  1.  1.  0. -2.  0.  0. -2.  0.  0. -1.  1.  1. -1.]
[-1.  0. -2.  0. -1. -1.  0.  1. -2. -2. -2.  0.  0. -2. -2. -1.]
[-2.  1.  0. -2.  1. -2.  0. -2.  1.  0. -1.  1. -2. -2. -1.  1.]
[ 1. -2.  1.  1.  0.  1.  0.  0. -1.  0.  1.  0. -1. -2.  0.  1.]
[ 1.  0. -2.  0.  1.  0. -2. -1.  0. -2. -1. -2. -2.  1. -1.  0.]
[-1. -1.  1. -1. -2.  0.  0. -1. -2.  1.  1.  1. -1.  0. -2.  1.]
[-1. -1.  0.  0.  1. -1. -2. -2. -2.  0.  0.  1.  0.  1.  0.  0.]
[-2.  1.  0.  0.  0. -2. -1. -1.  1.  1. -1. -1.  1.  1. -2. -1.]
[-2. -2.  1.  0. -1. -1.  0. -2. -1.  0. -2.  0. -1.  0. -2. -1.]
[ 1.  0.  0.  1. -1.  0. -2.  0. -2.  0. -1.  1. -1. -2.  0.  0.]
[ 0.  0.  0.  1.  1.  1. -1.  0.  1.  1.  0.  1.  1. -1.  0. -1.]
[-2. -2.  0.  0. -1.  0.  1.  0. -1. -1.  0. -1.  1.  1.  1. -1.]
[ 1.  0. -2. -2. -2.  0.  0.  1.  1.  1. -1. -2. -2.  1.  0. -2.]
[-1. -2.  0. -2.  1.  1.  1.  0.  0. -2.  0.  1. -1.  1.  0. -2.]
[ 1. -1.  0. -2.  1. -1.  0. -1. -2. -2.  0. -2.  1. -1.  0. -2.]
[ 1. -2. -

[-1. -1.  0. -2. -1. -1. -2. -2.  0. -2. -1. -1. -1. -1. -1.  1.]
[ 1.  0.  1.  0.  0. -2. -1.  0.  1.  0. -1. -1.  1.  1. -1.  1.]
[-2. -1.  0. -2. -1.  0. -1. -1. -1. -1. -1.  1.  1.  1. -1. -2.]
[-2.  0.  1.  0. -1. -1. -2.  1. -1.  0. -2.  1.  0. -2. -2.  1.]
[ 1. -2. -1.  1. -2. -1.  0.  1.  1.  1. -1. -1. -1.  1. -2.  0.]
[ 1. -2. -2.  0.  0.  0. -2.  1. -1.  1.  1. -1. -2. -1. -2. -1.]
[ 1. -2.  1.  1.  1.  1.  0. -2.  1. -2. -1. -1.  1.  1.  1.  1.]
[ 0.  0.  0.  1.  1. -1.  1. -1. -1.  1.  1.  1. -1.  1.  1. -1.]
[ 0.  1. -2.  1. -1.  0. -1. -1. -2.  1.  0.  1. -2.  0.  1. -2.]
[-1. -1. -1.  1.  1. -2.  0.  1. -1.  0.  0.  0.  1. -1. -1. -2.]
[ 0.  0. -2.  1.  1.  1.  0. -2.  1.  1.  0. -1. -2. -2. -1. -1.]
[ 1.  0. -1. -2. -2. -1.  1.  0.  0. -2.  0. -2. -2. -2.  0. -2.]
[ 0. -1.  1. -2. -1. -1. -2. -1.  1.  1. -2.  0. -1.  1. -1.  0.]
[ 0. -2.  0.  0.  1. -2. -1.  0.  0.  0. -1.  1. -2.  0.  0. -1.]
[ 0.  0. -1. -2.  0. -2.  0. -1.  1.  1.  1.  1.  0.  0. -1. -1.]
[-2.  0.  

 13%|█▎        | 4/30 [05:48<37:42, 87.02s/it]

[-2. -1.  1. -1. -2.  0. -2. -1. -1. -1.  0.  1. -1. -2.  1. -1.]
Training loss (for one batch) at step 0: 0.1182740181684494
Seen so far: 16 samples
[-2. -2.  0. -2. -1.  0. -1.  1.  1.  0. -2. -1.  0.  1. -2. -2.]
[-1.  0.  0.  1. -1.  0.  0. -2.  1.  1. -2.  0. -2. -1.  1.  0.]
[-1. -2.  1. -2. -1. -2.  1.  0.  0. -1. -1.  0.  0. -2. -2.  1.]
[ 1. -2. -1.  0.  1.  1.  0. -2. -2.  0.  0. -1.  0. -2.  1.  1.]
[-1. -1.  1.  1. -1. -1. -2.  0. -2. -2.  1.  1.  0.  1.  0.  0.]
[ 0. -1. -2. -2.  0.  1. -2.  0.  0. -1.  0.  1.  1. -1. -1. -2.]
[-2.  1. -1.  0. -1. -2.  1.  0.  0.  1.  1.  0.  0.  1.  0. -2.]
[ 0.  0.  0.  0. -2.  0. -2. -1. -2.  1. -2.  0.  1.  1. -2. -1.]
[-2. -2.  0.  0. -1.  0.  1. -1.  1. -2. -2. -1.  0. -2. -2.  0.]
[-1.  0. -2. -2. -2. -1. -2.  1.  1. -1.  0.  0.  1. -2. -1.  1.]
[-1. -2.  1.  0.  0. -2. -2.  1.  1. -1. -2. -1.  0. -1. -2. -2.]
[ 1. -1. -1. -2. -1.  1.  1.  0.  1. -1.  0. -1. -2.  1. -2.  0.]
[ 0. -1.  1. -1.  1.  0.  0. -2.  0. -1.  1.  0.  1. -2. -

[ 0. -2.  1.  0. -2.  1. -2.  0.  1. -1. -2.  0.  0. -1.  1. -2.]
[ 0. -2. -2. -1. -2.  1. -2. -1.  0. -1.  0.  0. -1.  1.  1.  0.]
[-1.  0.  0.  0. -2. -2. -2.  0.  1.  0. -1. -2.  0.  0. -2.  0.]
[ 0. -1.  1.  0. -1. -1. -2.  1. -2. -1. -2. -2.  0. -2.  0.  1.]
[ 0.  1.  0.  1. -2. -1. -1.  1. -1. -2. -1.  0.  1.  0.  0.  1.]
[-1. -2.  1.  0. -2.  0. -2.  1.  0. -1.  1. -1.  0.  1. -1. -2.]
[-1.  0.  0.  1.  0.  0.  0. -1.  1.  0.  0.  1. -1.  0.  0.  0.]
[ 1. -1. -1. -1. -1. -1.  1.  1.  0. -2.  1. -1. -2.  0.  1.  1.]
[ 0. -2.  1.  0. -1.  1. -1. -2.  0. -1.  0. -1. -2. -1.  0. -1.]
[-1. -1. -2. -2.  1.  1. -1.  0. -2.  0.  0.  0.  0.  0.  1. -2.]
[-1.  1.  0.  0. -1. -1.  1. -1.  0.  0. -1. -2.  1.  0.  1.  0.]
[ 0.  0. -2. -2. -1. -2. -1. -2.  0. -2.  0.  1. -2.  0.  1. -1.]
[-1. -1. -2.  0.  1.  0.  0. -2. -2.  0. -2.  1. -2. -1. -1.  0.]
[-1.  1. -1. -2. -2.  1.  1. -1. -2.  1.  0.  0. -2. -1.  0.  0.]
[-2.  0. -2. -2. -1.  0. -2.  1.  1.  0.  0. -2.  1.  0. -1.  1.]
[ 1. -1. -

[ 1.  1.  1. -1. -1. -1. -2.  0.  0. -2.  0. -1.  0.  1. -1. -2.]
[ 1. -2.  0. -2.  0.  1. -2. -2.  1.  1. -2. -2. -2.  0.  0.  0.]
[-2. -1.  1.  1. -1. -2.  1. -1. -1.  1.  1. -1.  0.  0. -1. -1.]
[-2.  0.  0.  0.  0. -1.  1. -2. -1. -1.  1. -1.  1.  1. -1.  0.]
[-1.  1.  0. -2. -2.  1.  1. -2.  0. -1. -2. -2.  1.  1. -1. -1.]
[-1. -2. -1. -2.  1.  1.  1.  1.  1. -1.  1.  0.  0.  1. -2. -1.]
[-1. -1. -2.  0. -2. -1. -2.  0. -2. -1. -2.  0. -1. -1.  0.  1.]
[ 1. -1. -2. -2. -2.  1.  0. -1.  0.  1.  1.  1. -2. -2. -2.  1.]
[-2.  1. -1. -2. -1.  1.  0. -1. -1.  0. -1.  0. -2.  1. -2.  0.]
[-1.  1. -1. -1. -2. -1. -1. -1.  1.  1.  0.  0. -2.  1.  1.  1.]
[-2. -1.  0.  1.  0.  1. -2. -1.  0.  0. -1.  0.  1.  0. -1. -1.]
[ 1. -2.  0. -2.  0. -1.  0.  0.  1. -1. -1. -1. -2. -1.  0.  0.]
[ 0.  0.  0.  0. -2. -1.  1.  1.  0. -1. -2. -2. -2. -2. -1. -2.]
[-2.  1.  0.  0.  1.  1.  0. -2. -1. -1. -1. -1. -2.  1.  0.  1.]
[-2. -1. -2.  1.  1.  0. -2.  0.  1.  0. -2. -2.  0.  0.  1.  0.]
[-2. -2.  

[-2.  0.  1.  0.  0.  1.  0.  1.  0. -2.  1.  0. -1. -1.  1. -1.]
[ 0. -1.  0. -1.  1.  1. -1.  1.  0.  0. -2.  1.  0. -1.  0.  0.]
[ 0.  1. -2.  1.  0.  1. -2.  0.  1. -2.  1.  0.  1. -1. -1.  1.]
[ 1.  0. -2. -1.  0. -2. -1.  1.  0. -2. -1. -1. -1. -2.  0.  0.]
[-1. -2. -2.  0.  1.  1.  1. -2. -1. -2.  0.  1.  0. -2. -2. -1.]
[ 1. -1. -1. -1.  0. -2.  0. -1.  0. -2. -1. -2.  1.  0. -2.  0.]
[ 0.  1.  1. -1. -1.  0. -1. -2.  1.  0. -2. -1. -1. -2.  0.  0.]
[ 0. -1. -2.  1. -2.  0.  1. -2. -2.  1. -2.  1. -1. -1.  0. -1.]
[-1. -1.  1.  1. -1. -1.  1.  1.  0. -1.  0.  1.  0. -2. -2. -1.]
[ 0. -1.  0. -1.  1.  0.  0. -1.  0. -2.  0. -1. -2.  0. -1. -2.]
[-2.  1. -1. -1.  1. -1.  1.  0.  0. -2.  0.  1.  1.  1.  1.  1.]
[-1. -1.  0. -1. -2. -1.  0. -1.  1. -1. -1.  0. -2.  0.  0. -2.]
[-1.  1.  1. -1. -1. -1. -2. -2.  1. -2.  1.  0. -2. -1. -2. -1.]
[ 0. -1.  0. -2. -2.  0. -1.  1. -2.  0.  1.  1.  0.  1.  0. -2.]
[ 1.  1.  1. -1. -2. -1.  0. -2. -1. -2.  0.  0. -2. -1. -1.  0.]
[-2.  1. -

[-1.  0. -1.  0.  0.  1.  0. -2. -1. -1.  0. -2.  0. -1. -2.  0.]
[ 1. -2.  0. -1. -2.  1. -2.  0. -2.  1. -1. -1. -2. -2.  0.  1.]
[ 0. -2. -2.  1.  1.  0. -2.  0. -1.  0. -1. -1.  1. -2.  0.  0.]
[ 1.  0. -2.  1.  0.  0.  0.  0.  0.  0. -2. -2. -2. -1. -2.  1.]
[-2. -1.  1.  0. -2. -1.  1. -2. -2.  0.  0.  0.  1.  0. -2. -1.]
[-2.  1. -1.  1.  0.  0. -1. -2. -1.  0. -2.  0. -2. -1.  1.  0.]
[-1. -2. -1. -1.  0. -1. -1.  0. -1. -1. -2.  0.  1.  0. -2. -2.]
[-1.  0. -2.  0.  0. -1.  0.  1.  0.  1. -1.  1.  1.  1. -2.  0.]
[ 1. -2.  0. -2.  0.  1.  0.  1.  0.  0. -1.  1.  0. -1.  1. -1.]
[ 1. -2.  0.  1.  1. -2. -1.  1.  0.  1. -2.  1. -1. -1.  0. -1.]
[-1. -1. -1. -1. -1.  0. -2.  0. -1. -2.  0.  0. -1.  0. -1.  0.]
[-1.  1. -1.  0. -1. -1. -1.  1.  0. -2.  1.  1.  0.  1.  1.  0.]
[ 1.  0.  0. -2.  0.  0.  0. -2.  1. -1.  1.  0. -1.  0.  0.  1.]
[-1.  0. -2.  1.  0. -2.  0.  1. -1.  1. -2.  0. -1. -1. -2. -2.]
[ 0. -1. -1. -2. -1. -2. -2. -1. -1.  1.  1. -1.  1.  0.  0.  0.]
[ 0. -2.  

[ 1.  1.  1.  1. -1.  0. -2.  0. -1.  1. -1. -1. -2. -1.  1. -1.]
[ 1.  1. -2.  0. -2. -1.  1.  0.  1. -1. -2.  0.  0. -1. -2.  0.]
[ 0. -2. -1. -2.  0. -1. -1.  0.  1.  1.  0. -1. -1. -1.  0. -1.]
[ 1.  0. -2.  0.  1. -2. -2.  0. -1.  0.  1.  1. -1. -1. -2.  1.]
[ 1.  1. -1. -2.  0.  1. -1. -2.  1.  0. -2.  0. -1.  0. -2.  0.]
[-2. -1.  0.  1. -2. -1.  0. -1. -1.  0.  0. -1.  0.  1. -1.  0.]
[ 1.  0.  0.  0. -2. -2.  1.  1.  1. -2.  0. -2.  1. -2.  0.  1.]
[-2.  1. -2.  1.  1. -2. -2.  1. -1. -1.  0.  0. -2. -1. -2. -1.]
[ 1.  1. -1. -1. -1.  0. -2.  1.  0.  1.  1. -1.  1.  1. -2. -2.]
[-2. -1. -1. -2. -1. -1.  0. -2. -2.  1. -2. -1.  0.  1.  1.  1.]
[-2.  0. -1.  0. -2. -1. -1. -2. -2. -2. -2. -2.  1.  0. -2.  0.]
[ 1.  0. -1.  1.  1. -2.  1.  1. -1. -1.  0.  0. -2. -1.  0.  1.]
[ 1. -2. -1.  1.  0.  0.  0. -1. -1. -2.  0. -2.  1.  0. -2.  1.]
[ 1.  1. -1. -1.  1.  0.  0.  1.  1.  0.  0. -1. -2. -1.  0. -1.]
[-2.  0.  0.  1.  1.  1.  1. -1.  1. -1.  1.  1. -1.  0.  0.  1.]
[-1.  1. -

[ 1. -1.  1.  1.  0. -1. -2.  1. -1. -2. -2. -1. -1. -2. -1.  0.]
[-2.  0.  0. -1.  0. -2. -1. -2.  0. -2.  1. -2. -2.  1.  0.  0.]
[-2. -1.  1.  1.  0. -2. -2. -2.  0. -2. -1.  1.  1.  1.  1. -1.]
[ 1. -1. -1.  1.  1.  1.  0.  0.  0. -2.  1. -1.  0.  1. -1.  1.]
[-2.  1.  0. -1. -1. -2.  0. -2.  0.  1. -1.  0.  1. -1. -1. -1.]
[-2.  1.  1.  1. -1.  0.  0. -2. -1.  1. -2.  1. -2.  1. -1. -1.]
[-2. -2. -2. -1. -2.  1. -2. -2. -2.  0.  0.  1.  0.  1. -1.  0.]
[-2.  1.  0. -2.  1.  1.  1. -2.  1. -1. -2.  1.  0. -1.  0.  0.]
[ 1.  1.  0.  0.  0. -1. -1.  1. -1. -1.  0.  1.  0.  0.  0. -1.]
[ 0. -2.  1.  0.  0.  0. -1.  1.  1. -1.  1.  1. -2.  1. -2. -1.]
[-2. -2.  0. -1. -2. -2. -2.  0.  0.  1.  1.  1. -1.  0.  1. -1.]
[-2.  0.  0.  1. -2.  0. -1. -1.  1. -2.  1. -1. -2.  0. -1.  1.]
[-2. -2.  1. -1. -1. -2. -2.  1. -2.  0.  1.  1. -1.  0.  1.  0.]
[ 1.  1.  1.  1.  0.  1. -1.  1.  1. -1.  0.  0.  0. -1. -2.  0.]
[-2.  1.  1. -2.  1.  1.  0. -1. -1. -1.  1. -1. -2.  1. -1.  1.]
[ 1.  1. -

[-2.  1. -1.  1.  0.  1. -2. -2.  1.  0. -1.  1. -1. -2.  0.  0.]
[-2.  0. -2. -2. -2.  0. -1. -2.  1. -2. -1. -1. -2. -2. -2. -2.]
[-1.  0.  1. -1. -1.  1. -1.  0.  0. -2. -1. -1. -2. -2.  0.  1.]
[ 1. -1.  1. -1. -2. -1. -1.  1. -2.  1.  0.  1. -2.  0.  0.  1.]
[ 1.  1.  0.  0. -2. -2.  0.  0. -1.  1. -1.  0.  1. -2. -2. -2.]
[ 1. -2.  0. -2.  1.  1. -2. -1. -2. -2.  0.  1. -1.  1.  0. -2.]
[ 0.  0. -1.  0. -1.  0.  0. -2. -2. -1.  1. -2. -1.  0. -2. -2.]
[-2.  0. -1. -2. -1.  0.  1. -2.  1. -1.  1. -2.  1. -2.  1.  1.]
[ 1.  1. -1.  1. -2.  0.  0.  0. -1.  1.  1.  1. -1. -2.  0.  1.]
[ 1.  0.  0. -2.  0.  0.  1.  1. -2. -2.  0. -2. -2.  0. -2.  0.]
[-2.  1.  0.  0. -2. -1. -1. -2.  1.  0.  1. -2. -1. -1. -2. -2.]
[ 1.  1. -1.  0.  0. -1. -1.  0. -1. -2.  1.  0.  1. -1.  1.  1.]
[-1.  0.  0. -2. -2. -1. -1.  0.  1. -2.  0. -2.  0. -2. -2. -1.]
[-1. -2. -1.  1.  0.  0.  1.  1. -1.  1. -1.  1. -2.  1. -2. -2.]
[-2. -2.  0. -1.  1.  0.  0. -2.  0.  0.  0. -1. -2.  1. -1.  0.]
[ 0. -2.  

[-2.  1.  1.  1. -1. -2. -2. -1. -2.  1. -2. -1.  0.  0.  1. -1.]
[ 0.  1.  0.  1.  1.  0.  0. -1.  1. -1.  1.  0.  0. -2. -1.  1.]
[-2.  0. -2.  0. -2. -2.  1. -2.  0. -2.  0.  1. -1. -2. -1. -2.]
[ 1. -2.  0.  0.  1. -1.  0.  1.  0. -1. -2. -2.  1. -2.  0.  0.]
[-1. -2.  0.  1.  0.  1. -1. -1.  0.  0. -2.  0.  1.  1.  0.  1.]
[ 0.  1. -1. -2. -2. -1. -2. -2.  0.  0.  0. -2. -1. -1.  0.  1.]
[-2.  1. -2.  1.  0.  0.  1. -1. -1. -1. -2.  0. -2.  1. -2.  1.]
[-1.  1.  1.  1.  0. -1. -1.  1. -1. -2.  1. -1.  1. -2. -2.  1.]
[-1.  0.  0. -1.  0. -1. -1. -2. -2. -2. -1.  1. -1.  1. -2.  1.]
[-1.  0. -2. -1.  0. -2.  1. -1.  0.  1.  1. -1. -1.  1. -2.  1.]
[ 1.  1. -2.  0.  0.  1.  0. -2. -2.  0.  1.  0.  1.  1.  1. -2.]
[ 1. -2.  0. -2.  0.  0. -1. -1. -2. -2.  0. -2.  1. -2.  0.  0.]
[ 1.  0.  1. -1. -2.  0. -2.  0. -1.  1.  1.  1.  1.  0.  1. -2.]
[ 0. -2. -1.  0.  0. -1.  1. -1.  1. -2.  1. -1. -1. -1. -2.  1.]
[-1.  0.  1. -2. -2. -2.  0. -1.  0. -1. -2.  1. -2.  1.  1.  0.]
[-2. -2. -

 17%|█▋        | 5/30 [07:19<36:51, 88.46s/it]

[-2.  1.  1. -1.  1.  0.  0. -1. -1. -2. -2. -2. -1.  1.  0. -2.]
Training loss (for one batch) at step 0: 0.15203078091144562
Seen so far: 16 samples
[ 1.  1. -1. -1.  1. -1. -1.  1. -2. -2. -1.  0. -1.  0.  0.  1.]
[ 1. -2. -1.  1.  1. -2. -2. -2.  0. -1.  0. -1.  0.  0.  1. -1.]
[ 0.  0. -1. -2. -1. -1.  1.  0. -2.  0.  0. -2.  0.  0. -1. -2.]
[ 0. -1.  1. -2.  1.  1. -1. -1. -2.  1.  0.  0. -2. -2.  1. -1.]
[-1. -2. -2.  1.  1.  1.  1. -2. -1.  0. -1.  1. -2.  0.  0. -2.]
[-1.  0. -1.  1. -1. -2. -1. -2.  0.  1. -1. -2. -1. -2. -1.  1.]
[-2. -2.  0. -2. -1.  0.  1.  0.  0. -1.  0.  1.  1.  0. -2. -2.]
[-2. -1.  1. -1. -2.  0. -1. -1. -1. -1. -2. -1. -1.  0. -1.  0.]
[-2. -1. -1. -1.  1.  1.  1. -1.  1.  1. -2. -1.  0.  1. -2.  0.]
[ 0. -2. -2.  0.  1. -1.  1.  1. -2.  0.  1. -2.  1. -1.  1.  1.]
[-1.  1.  0. -2. -1. -1. -2.  1.  0.  1. -2.  0.  1. -2. -1.  1.]
[ 0.  0.  1.  1.  1.  1.  0. -2.  1. -2.  1.  0.  0. -1. -2.  1.]
[-2.  0.  1.  1.  0. -1.  0. -2.  0. -2.  1.  1. -2. -2. 

[ 1. -2.  1.  1.  1. -1. -2. -2. -1.  1. -2. -2. -1.  0.  1.  1.]
[ 0. -1. -2.  0. -2. -1. -2. -1.  0. -2. -1.  1. -1. -2.  0. -1.]
[ 0. -2.  1.  1.  1. -2. -2. -2. -1.  0.  1.  1.  1.  0. -2. -1.]
[-1. -1. -2.  1.  0. -1. -1. -1. -1.  1. -1.  1. -2. -2. -2. -1.]
[-1.  0. -2. -1.  1. -1.  0.  0. -2. -2.  1. -1. -1. -1.  1.  1.]
[-1. -2.  1.  0.  1.  0. -1.  1. -2.  0.  1.  1. -1.  0. -1.  0.]
[ 0. -2. -1. -1. -2.  1.  1.  1.  0.  1. -1. -2. -2.  1.  1. -1.]
[-1.  1. -1. -1.  0.  0. -1. -2. -1. -2. -2. -2. -1.  0. -1. -1.]
[-2.  0. -2.  0. -1.  0. -2.  0. -1.  1.  1. -2.  1.  1. -2.  0.]
[-1.  0.  0. -1. -2. -1.  1.  1. -1. -2.  0. -1. -1. -2.  1.  1.]
[-2.  0. -1.  0.  0.  0. -1.  1. -2. -2. -2.  0. -2. -2. -2. -1.]
[ 0.  0.  0. -2.  0. -2.  0. -1. -2.  1.  1. -2. -2.  1. -2. -2.]
[-2.  0.  0. -1. -1. -2. -2.  1.  1.  1.  0.  1.  0.  1.  0.  0.]
[ 1. -1. -2. -1.  0. -2.  1.  1. -1.  1. -1.  0. -1. -2. -1. -1.]
[ 0. -2. -1. -2.  0. -2.  0. -1.  0. -1. -1. -1.  0. -1.  0. -2.]
[-2. -1. -

[-1. -2.  0. -1.  0.  0. -1.  1. -1.  0. -2. -1.  0.  0. -2.  1.]
[-2.  1. -2. -2. -2. -2.  1.  0.  1.  1. -2.  0. -2. -2. -1. -2.]
[ 1. -2.  1.  1.  1.  1. -2.  0.  0. -2. -2. -2. -1.  0. -1.  1.]
[-2.  0.  1. -1. -1.  0. -2. -2.  1.  1. -2.  1.  0. -2. -2.  0.]
[ 1.  0.  1.  0.  1.  1. -2. -1. -2. -1.  0. -2. -1.  1. -1.  0.]
[ 0.  1. -1. -1. -1. -1. -2. -1.  0. -2. -2.  1.  1.  0.  0. -1.]
[ 1.  1. -1.  1. -2.  0. -2.  1.  1. -2.  0.  1.  1. -1. -1.  1.]
[ 0. -2.  1. -2.  1. -2. -1.  1.  0. -1. -1. -2. -1. -1. -2.  0.]
[ 1.  0. -2. -2. -2.  0.  0.  1. -1.  1.  1.  0.  0. -2. -2. -1.]
[ 1.  1.  1. -2. -1. -2.  1.  0. -1.  0.  1.  0.  0.  1.  1. -1.]
[ 0. -1.  1.  0. -1.  1. -1. -1.  1.  0.  1. -1.  0.  1.  1. -2.]
[-2.  0. -2.  1. -1. -1.  0. -1. -2. -2. -2. -1.  0.  1. -1. -1.]
[-1. -1.  1.  0.  0.  1.  0. -2.  0. -2.  1. -1. -2. -2.  0. -1.]
[-1. -2. -1.  1.  1. -1. -1. -2.  0. -2.  1.  1.  0. -2. -1. -2.]
[ 1.  0.  1.  1. -2. -2.  1. -2.  0.  1. -1. -2.  1. -2.  0. -2.]
[-2.  0. -

[ 0.  1. -2. -1.  0. -2. -1.  0.  1. -1.  1.  0.  1. -2.  0.  0.]
[ 0. -2.  0. -1.  1. -2. -1.  1. -1. -1. -1. -1. -1. -1. -2.  1.]
[ 0.  0. -1.  0. -2.  1. -2.  0.  1.  1.  0. -2. -2. -1. -2.  0.]
[ 0.  0.  1. -1.  0. -2.  0. -2. -2.  0. -2.  1.  1.  0.  1. -2.]
[-2. -2. -2.  0.  1. -1. -2.  1. -2.  1.  0. -2.  1. -2.  1.  0.]
[ 1. -2. -2. -2.  0.  0. -1. -1.  0.  0. -1. -1.  1.  1. -1.  1.]
[-1.  0.  0. -1.  1. -1.  1.  0. -1. -2. -1.  0. -2. -2. -2.  0.]
[-1.  1.  1.  0.  0. -2. -2.  0.  1.  1.  0. -1.  0.  0. -2.  1.]
[-2.  1.  1. -2. -1.  0.  1.  1.  0. -1. -2.  1. -1.  0.  1. -1.]
[-2. -1. -1.  0. -1.  1.  0. -2. -1.  0.  1.  0.  1. -2.  1. -1.]
[-2. -1. -2. -1.  1. -1. -1.  0.  0.  1.  0.  0. -1. -1.  0.  1.]
[ 0. -1. -1.  1.  1.  1. -2.  1. -2. -1. -2. -2. -1.  0.  1.  1.]
[-1.  1.  1.  1.  1. -1.  1.  1.  1.  1.  1.  0. -1.  0. -1.  0.]
[-2. -2. -2. -2. -2. -1. -1.  0.  0. -1.  0.  1.  1. -2.  1. -2.]
[ 1. -2. -2.  1. -1.  0.  0. -2. -2. -1.  0.  1.  1.  0.  0. -2.]
[-1. -2. -

[-1.  1.  1. -1.  1. -1.  0.  1. -2.  1. -1.  0. -1.  0. -1.  0.]
[-2.  0. -2. -1. -2. -1.  1. -1.  0. -1.  0. -1.  0. -1.  0. -2.]
[-2.  0. -1.  0.  1.  0.  0. -1. -1. -2. -1.  0.  0.  1. -1.  1.]
[ 0.  0. -2.  0.  1. -2. -1. -1. -2. -1.  1. -2.  0.  1. -1.  0.]
[ 0.  0. -2. -1. -1.  0. -1. -2.  0.  1.  1. -2. -1.  1. -1.  1.]
[-2. -2. -1. -2. -2. -2.  1.  1.  1.  1.  0.  0.  0.  0. -1.  1.]
[ 0.  1.  0.  0.  0. -2. -1. -2.  0. -1.  0.  1. -1.  0.  0.  0.]
[-1. -2. -1.  1.  0.  1. -2. -1.  1.  1. -2. -1. -2.  0. -1.  1.]
[-2. -2.  1.  1. -2. -1. -2.  0.  0.  0.  1. -2. -1.  0.  0.  0.]
[-1. -2. -1.  0.  0.  1.  1. -2. -1.  0. -1. -2.  0.  1. -1. -1.]
[ 1. -1. -2. -1.  0.  1. -1.  1.  1.  0.  0.  1. -2. -1. -1. -1.]
[ 0.  1. -2.  1. -1. -1. -1. -2. -1. -2.  1. -2. -2.  1. -2.  1.]
[ 0.  1.  0. -2. -1.  1. -1. -2.  0. -1. -2.  1. -2. -1.  1. -1.]
[ 1.  1. -1.  1.  1. -2.  1.  0.  1. -2. -1.  1.  1. -2.  1.  0.]
[ 0. -2. -1.  0. -1. -1. -2. -2. -2. -2.  1. -2.  0. -1.  0.  0.]
[ 0.  1.  

[ 0.  0.  1. -1.  0. -2. -1.  0. -1. -2.  1. -1. -2. -2. -1. -2.]
[ 1. -1. -1. -1. -1.  0.  0. -2. -2.  0. -1.  0.  1. -1.  1.  1.]
[ 0.  0.  1. -2.  1.  0. -1. -1. -2. -1.  1.  1.  0.  0.  1. -2.]
[ 0. -2.  1.  1. -2. -2.  0. -1.  0.  1.  0.  0. -1.  1. -1. -2.]
[-1. -1. -1.  1. -1. -1. -1. -1.  0.  0. -2.  1. -1.  1.  1.  0.]
[-2.  1.  1. -2.  1. -2.  1.  0. -2. -2.  1.  0. -2. -2. -1. -1.]
[-1.  0.  0.  0. -1. -1. -1.  1.  0.  0.  0.  0. -1. -2.  1.  1.]
[ 0. -2.  1.  1.  1.  1.  1. -1. -1. -2. -2.  1.  0.  0.  1. -1.]
[-1. -2.  0.  0.  0.  0.  0. -2.  1.  0.  0.  0.  1. -1. -2. -2.]
[ 1. -1. -2. -2. -1. -1. -1.  1. -2. -2.  1. -1.  0.  0.  1.  0.]
[-1.  1.  1. -2.  1.  0. -1. -2. -2.  1.  0.  0.  0. -2.  0.  0.]
[-2. -2.  0. -1.  0. -2.  1.  0.  1. -2. -2.  0. -2.  1. -1. -2.]
[ 1. -1.  1. -1.  0.  0. -1.  1.  1. -1. -2. -1. -1. -2. -1.  1.]
[-2.  0. -1. -2. -2.  1. -2. -1.  1. -1.  1. -2.  1.  1.  1. -1.]
[-2.  1. -2.  0.  0. -1. -2. -1. -1.  1.  1.  1. -2.  1.  0.  0.]
[-2.  1.  

[ 0.  0.  0.  0.  0.  0. -1. -2. -1. -2. -1.  1.  0. -1. -2.  0.]
[ 0. -2.  0. -2. -1.  1.  1. -1. -1.  1. -1.  0.  1.  0. -1.  1.]
[-2. -1. -2.  0.  0. -2. -2. -1.  1. -2.  0.  0. -1.  1.  1.  1.]
[ 1.  1. -2.  1. -2. -2. -2.  0. -2.  1. -1.  1. -1.  1.  1.  1.]
[ 0. -2. -2.  1.  1. -2. -2. -2. -1.  0. -1. -1.  0.  0. -2.  1.]
[-1. -1. -1.  1. -1.  0.  1. -2. -1. -1. -2.  1. -1.  0.  0.  1.]
[-2. -2.  1. -1.  1.  1. -2. -2.  1. -1. -2. -2.  0.  1.  1.  1.]
[ 1.  0.  0.  0.  1.  0. -1.  1. -1.  0. -2.  0.  0. -2. -2.  1.]
[ 1.  0. -1.  0. -2.  1. -2. -1. -2.  0.  0.  0. -1.  1.  1. -1.]
[-2. -2.  1.  0.  0.  0. -2.  1. -2. -1. -1. -1.  0.  1.  1. -2.]
[-2. -2.  0.  1. -2.  0. -2.  1.  1. -1.  0.  1.  0.  0. -2. -1.]
[-1. -1.  1.  0.  1. -1. -1.  1.  1.  1. -1.  1. -2. -1.  0.  0.]
[-2.  1.  1.  1.  0.  0.  1. -2.  0.  0.  0. -1. -1.  0. -1. -1.]
[ 1. -2.  1. -1.  0. -1.  1. -1.  1.  0. -2.  0.  0.  1.  0. -2.]
[ 1.  1. -2. -1. -2.  1. -1.  1. -1.  0. -1.  1.  1. -1. -2.  1.]
[-2. -2. -

[-1.  0.  0. -1.  1. -1. -1.  1.  1. -1. -2.  1. -1.  0. -1.  0.]
[ 1. -2.  1.  0. -1. -2.  1.  0.  0.  1. -1. -2.  0.  1.  1. -1.]
[-2.  0. -1. -1. -1. -1. -1.  0.  1. -2.  1. -1. -1. -1. -1. -2.]
[-1. -2. -1. -2. -2.  0.  0. -1. -1.  0.  0. -1. -1. -2.  1. -2.]
[ 0.  1. -1.  0.  1.  1.  1.  0.  1.  0.  1. -1. -1.  0. -1.  1.]
[ 1. -1.  1. -1.  0. -1. -2. -2.  0. -2. -1. -1.  1.  1.  1.  0.]
[ 1.  1. -2. -2. -2. -2. -1.  1.  0.  0.  0. -1.  0.  0.  1. -2.]
[ 0. -2. -1. -2.  0. -1. -2.  1.  0. -2.  0.  0. -2.  1. -2.  1.]
[ 1.  0. -1.  1.  0.  0.  1.  0.  1.  1.  0. -2. -2.  0. -2.  0.]
[-1. -2.  0. -1. -1. -2.  0. -1.  0. -1. -1.  0. -2.  1. -2. -1.]
[ 1. -2.  0.  1.  1. -1.  1.  0. -1. -2.  0. -2.  0. -2.  0.  0.]
[-2.  0.  1. -1.  1. -2. -2.  1. -2. -2.  1.  1. -1. -1.  1.  1.]
[ 0. -1. -1. -2. -2. -2. -1.  1.  0.  0.  0.  0.  0.  0.  1. -1.]
[ 1. -2. -2.  0. -2. -2.  0.  1.  1.  1. -1. -2. -1.  0.  0. -2.]
[-1. -1.  0.  1.  0.  0.  1. -1. -2. -1.  0. -2. -1.  1.  0. -1.]
[ 0. -2. -

[ 0.  1.  0. -2.  0. -2. -2. -2. -1.  0. -2. -2.  0. -1.  0.  0.]
[ 1.  1.  1. -1.  1. -1. -2.  1. -1.  1. -1. -1. -1. -2.  0.  0.]
[-2.  0.  0.  1.  0. -2. -2. -2.  1. -1.  1. -2.  1.  0. -2.  1.]
[-2. -1. -2. -2.  0.  0. -2. -2. -2. -2. -2. -2. -1.  1.  0.  1.]
[-2. -2. -1.  0. -1.  1.  1.  1. -2.  1. -2. -1. -2.  1. -2. -1.]
[ 0. -2. -2.  0. -2. -1. -2.  1.  0.  1.  1. -2.  1.  1.  0. -2.]
[-1.  1.  0. -1.  1.  1. -1. -1.  0.  1.  0.  0. -1. -2.  1. -2.]
[-1. -1.  1. -1.  1. -2.  0. -2. -1.  1.  0. -1. -1.  0.  0. -1.]
[ 0. -2. -1.  1. -2. -1. -2. -2. -2. -1. -2. -2. -1.  0.  0. -1.]
[-1.  1.  0. -2.  0.  1. -1. -2.  1. -1.  0. -1.  0. -1.  0.  1.]
[-1.  1. -1.  1.  1. -1.  1.  0.  0.  1. -2. -1. -2. -1.  0. -2.]
[-2.  1.  0.  1.  0.  1. -2. -2. -1.  1.  1.  0. -2. -1. -1.  0.]
[-1. -2.  1.  0.  1. -2. -1.  0.  0.  1. -1.  1.  0.  1. -1.  1.]
[-1.  1.  0.  1. -1.  1. -1. -2. -1.  0. -1.  0. -2.  1. -1.  1.]
[-1.  0. -1. -2. -1.  0.  1.  1. -2. -1. -2. -1. -1. -2.  1.  1.]
[-2.  0. -

 20%|██        | 6/30 [08:55<36:29, 91.22s/it]

[ 1. -1.  1. -1.  0.  0. -1.  0.  0. -2. -1. -1. -2.  0. -2. -2.]
Training loss (for one batch) at step 0: 0.07705315202474594
Seen so far: 16 samples
[ 0.  0. -1. -1. -2.  0. -2. -1. -2.  0.  0.  0.  0.  0.  1.  1.]
[ 1.  1. -1.  0. -2.  1.  1. -1. -2.  0. -1.  1.  0. -2.  0.  1.]
[-2. -2.  0.  0. -1.  1. -1. -1.  0. -2. -1. -1. -2. -2. -2. -1.]
[-1.  0. -2. -1.  1. -1. -1.  0.  1.  0. -2. -2.  0. -2.  1.  1.]
[ 0.  1. -2.  0.  1. -1.  0. -1.  1. -1. -1. -1. -1.  0.  1. -2.]
[ 1.  1.  0. -1. -2.  1.  1.  0.  0.  0. -1. -1. -1.  1. -2.  1.]
[-1.  0. -2.  1.  0. -1.  1.  0. -2.  1.  0. -2. -2.  0. -1. -2.]
[ 0.  0.  1. -1. -2. -1. -1. -1. -2.  0.  1.  1.  1.  1.  1. -2.]
[ 0. -2. -1.  1.  1. -2. -2. -2. -1.  1. -2.  1.  1. -1.  0. -2.]
[-1. -2.  0.  1.  1. -1. -2.  1. -1.  0. -1. -1.  0. -2.  1. -1.]
[ 0. -1. -1.  0. -2. -2. -1. -2. -2.  0.  1. -2.  1. -1.  1. -1.]
[ 1.  0.  1. -2.  0.  1. -2.  0.  1. -1. -2. -1.  1. -1. -2.  0.]
[-1.  1. -1.  0. -2.  1. -2. -1.  1.  1.  0. -1. -1. -2. 

[ 0. -1.  0.  1. -2.  0. -1.  1. -2.  0. -2. -1.  1. -1.  0.  1.]
[ 0.  1.  1.  0.  1. -2. -1.  0.  1.  1.  1.  1. -1.  1.  1.  1.]
[ 0.  1.  0. -2.  1. -1.  1. -2.  1. -2.  1. -2. -2.  0.  0.  1.]
[ 1. -2. -2. -1. -1. -1. -2. -1.  0.  1. -1. -2. -2. -1. -2.  1.]
[ 0. -2. -2.  1. -1.  0.  1.  1.  0. -2. -2. -1. -1.  0.  0. -1.]
[ 1.  0. -1.  0.  1.  1. -2.  1. -2.  0.  0. -1.  1.  0.  1.  0.]
[ 1.  1.  0. -1. -2.  0. -1.  1.  0.  0.  0. -1.  0. -1.  1.  1.]
[ 1. -2.  0.  0.  0.  0.  1.  0.  0. -2. -1.  1.  1.  1.  1.  1.]
[ 0. -1.  1.  1. -1.  0.  1. -2.  1.  1.  0. -1.  1. -1. -2. -1.]
[-1.  1.  1. -1.  1. -2. -2. -1.  1.  1.  0.  0. -2. -1.  1. -2.]
[ 1. -1. -1. -1.  1. -2.  0.  0.  0. -2.  1. -1.  0.  1. -2.  0.]
[ 1.  0.  0. -2. -1. -1. -1.  1.  1.  1.  0.  1. -2. -2. -2.  0.]
[ 0.  0.  0.  1.  1.  0. -2. -2. -1. -1.  0.  1. -1. -1. -1. -1.]
[-1. -2.  0.  1. -2.  1.  0.  1. -1.  0. -2.  1. -1. -2. -2. -2.]
[ 0. -2.  1. -2.  0. -1. -2.  1. -2. -1. -1.  1. -2.  0.  0.  1.]
[ 0. -2. -

[-1.  1.  0.  0. -1. -2.  1. -2. -2. -1.  1.  1.  1. -1.  1.  1.]
[ 0. -1.  0.  1. -2.  0. -1.  1. -1.  0.  1. -2. -2. -1.  0. -2.]
[-1.  1.  1. -2. -1. -1. -1.  1. -1. -2.  0. -1.  1.  1. -1. -1.]
[ 1.  0.  0. -1. -2. -2. -2.  1. -1.  1.  0.  0. -2. -2.  0.  0.]
[-1. -1. -1.  0. -2. -1. -1.  0.  0.  1. -1.  0.  1.  1.  1. -2.]
[ 1. -1. -1. -2.  0.  1. -1.  0.  0.  1. -2.  0.  1.  1.  1. -2.]
[ 1.  1. -1. -2. -2.  1. -1. -2. -2. -2. -1.  1. -2.  1. -2. -1.]
[-1. -2.  0.  1. -1.  1. -2.  0.  1.  0.  0.  1.  1.  1.  1.  1.]
[-1. -1. -1. -1.  0.  0.  0. -1. -1.  0.  0. -1.  1. -1. -2. -1.]
[ 1. -2. -1. -2. -2.  0. -2.  0. -2. -2.  1. -2. -1. -1.  1. -2.]
[-2. -1.  0. -1. -1. -1.  0. -1.  0.  0.  0. -1.  1. -1. -2. -2.]
[ 1. -1.  0. -1.  0.  0.  1.  1.  0. -1.  1. -2. -2.  0.  1.  1.]
[-1. -2.  1. -1. -1. -1.  1. -1. -2.  0. -1.  1. -2.  0.  1.  0.]
[ 1. -2.  0.  0. -1.  0.  0.  0. -1.  0. -2.  1.  0. -1.  0.  1.]
[-1. -2. -1.  0. -1.  1.  0.  0.  1. -1. -2.  1.  1.  1.  0.  1.]
[-1.  0.  

[ 0.  0. -1.  0. -1. -2.  0. -2. -2. -2. -2.  0. -1. -2. -2. -1.]
[-1.  1. -1. -2. -2.  1. -2.  0.  0.  1.  1. -2.  0.  0.  1. -2.]
[ 0.  0.  1.  0.  1.  1. -2. -2.  0.  0. -1. -2. -1. -2. -2.  0.]
[-2. -2.  1. -2. -2. -1. -1. -2. -1.  1. -1. -2. -1. -2.  0. -2.]
[-1. -2.  0. -1.  0.  1.  0. -1.  1.  0.  0. -2.  0.  1. -2. -2.]
[ 0. -2. -2.  1.  1. -2. -1.  1.  0. -1. -2.  1.  1. -1.  1. -2.]
[ 1.  0.  0. -2. -1.  1. -2. -1. -2.  0. -1.  1. -1. -2. -1. -1.]
[ 0.  0. -1. -1. -1. -2. -1.  1.  1. -1. -1.  1.  1.  1.  1.  1.]
[ 1. -2. -2. -2.  0.  0. -1. -2. -1. -2. -2. -2. -1.  0.  0. -2.]
[-2. -2. -2.  0. -1.  0.  1.  1.  0. -2. -1. -2. -1.  0.  1. -2.]
[ 0. -1. -2.  0.  0.  1. -2. -1.  0. -1. -2.  0.  0. -1. -1. -1.]
[-1.  1. -2. -2. -1. -1. -2. -2. -2. -1. -2.  0. -2.  0. -1.  0.]
[-2.  0. -1. -1.  0. -2. -2.  1. -1.  1. -2.  1. -2.  0. -2.  0.]
[ 1. -1. -2. -1.  1.  1. -2.  1.  1. -1. -1.  1. -1.  1. -1. -2.]
[-2.  0.  1.  1. -2.  0.  0. -1.  0. -1. -1. -2.  0. -2. -2.  0.]
[-1. -1.  

[ 0. -1.  0. -1. -1. -1. -1.  0.  1.  0.  1.  1. -2.  1.  0.  1.]
[-2.  1. -2. -2.  1.  1. -2.  0. -2. -2. -1.  1. -2. -2.  1.  1.]
[-2.  1. -1. -1. -1. -1.  1.  0. -2.  0. -1. -1.  1. -1. -1. -1.]
[-1.  1. -1. -1.  0. -1.  1.  1. -2.  0.  1. -2.  1.  1. -1. -2.]
[-1.  0. -2.  1.  0.  0. -1.  1.  1. -1.  1.  1.  0. -2. -2. -2.]
[ 0. -1. -2.  0.  1.  0.  0.  1. -2. -2.  0. -1. -1.  0. -2.  1.]
[-2. -2.  1.  1. -1. -2.  1. -1. -2.  1.  1. -1. -1. -2.  0.  0.]
[-1. -2.  1.  1. -2.  0.  1.  1. -1. -1. -1. -2.  1. -1. -1. -1.]
[-2. -1.  0.  1. -1. -1.  1.  0.  0. -2.  1. -2.  1. -2. -1.  0.]
[ 0.  0. -1. -1. -2. -2. -2. -2. -1. -1.  0. -2.  0.  1. -2. -2.]
[ 0. -1.  1. -1. -2. -2.  1. -2.  1.  0. -1. -2.  1.  1. -2.  0.]
[ 0. -2.  0. -1.  0.  1.  0.  1.  0.  1. -1.  1.  0.  1.  0. -2.]
[ 0. -1. -1. -2. -1. -2.  1.  0.  0.  0.  1.  1. -1.  0. -2.  1.]
[-1.  0. -2. -1.  0. -1. -2.  0.  1.  1.  1.  0. -1. -1.  0. -1.]
[-1.  1.  1. -2.  1. -1. -2.  0.  0.  0. -2.  0. -2. -1.  0.  0.]
[ 1. -1.  

[ 0.  0. -2.  0. -1.  1. -1. -1. -2. -2.  1.  1.  0.  0.  0. -2.]
[-2. -1.  0.  0. -1.  0.  0. -1. -2. -1. -1.  0. -1.  0.  0. -2.]
[ 0.  0.  1.  1. -1.  0. -2.  1. -1.  0. -2.  0.  0.  0. -1.  1.]
[ 1. -2. -2. -2.  0. -1.  0.  1. -1. -1.  0.  1.  1.  0. -2. -2.]
[-1. -2.  1.  1.  0.  0. -2. -1. -2. -1. -2. -1.  0.  0. -2. -2.]
[-2.  0. -1.  1.  1. -2.  1. -1. -1. -1. -2. -1.  1.  1. -2.  0.]
[-2.  0.  1. -1.  1. -2. -2.  1. -1.  1. -2.  1. -1. -1. -1.  1.]
[ 0.  1. -2. -2.  0.  0. -1. -2.  1. -2.  0. -2.  1. -2.  0.  1.]
[-1. -2.  1. -2.  1. -2. -2. -1. -1. -1.  1.  0. -1.  1.  0. -2.]
[ 0.  0.  0. -1.  0.  1.  1. -2.  0. -1.  0.  0.  1. -2.  1. -1.]
[-2.  0.  1.  0.  0. -1. -2. -2.  0.  1. -2. -1.  1.  0. -1. -2.]
[-2. -1.  0. -2.  1. -2.  0.  1.  0. -2.  1. -1.  1.  0. -2.  1.]
[-2. -2. -1. -2.  0.  0.  1.  1.  0. -1. -2.  0. -1.  1. -1. -2.]
[ 1. -1. -1.  1.  1.  1. -2.  0. -2. -2.  0.  1. -2.  0.  0.  1.]
[ 1.  0. -2.  0.  0.  0. -2.  0. -1. -1. -1. -1.  1.  1.  1.  0.]
[ 1. -2.  

[-2.  0. -2. -1.  1. -1.  0.  0.  1.  1. -1.  1.  1. -1.  0.  0.]
[ 1. -1.  1. -2. -1. -1.  1. -2. -1. -2.  1.  1.  0. -2.  0.  1.]
[-2.  0. -1. -2.  1. -1.  1.  0. -1. -2.  1.  1.  1.  1. -1.  1.]
[ 0.  1. -2. -1. -1.  1.  1. -2. -2. -1. -2.  1. -2. -2. -1.  1.]
[ 1.  0.  0. -1. -1.  0. -2. -2. -2. -1. -2.  1.  1. -2. -2. -1.]
[ 1. -1.  1.  0. -1. -1.  0.  0.  0. -1.  1.  0.  0. -1. -2. -1.]
[ 0.  1. -2.  1. -1.  0. -1. -1.  1.  1. -2.  0.  0.  0.  1. -2.]
[-2.  1.  0.  1.  1. -1.  1.  0.  1. -2.  1.  0. -1. -2. -2.  0.]
[ 0. -1. -2.  0.  1.  1. -1.  0. -1.  0. -2. -1.  0. -2. -2.  1.]
[-1.  1.  1. -2. -1.  0. -1. -1.  1.  1.  1.  1. -1. -2. -1. -2.]
[-2.  1. -1.  1. -1.  1.  1.  1.  0. -1. -2.  1.  1.  1. -1.  0.]
[-1.  1.  0.  1. -2. -1. -2. -2. -2.  1.  1.  1. -2.  0. -2. -1.]
[ 1.  0. -2.  0. -1. -2.  1.  1. -1. -1. -2. -2. -1.  1. -1.  1.]
[-1. -1.  1. -2. -2.  0.  1.  0.  1. -2. -2. -2.  1. -2.  1.  0.]
[ 1. -2.  1.  1.  0. -2. -1. -2.  0. -2.  0. -1.  1. -2. -2.  1.]
[-1.  0.  

[-2. -1.  1.  1.  1. -2.  1. -2.  0.  0. -2.  0.  1.  1.  1. -2.]
[ 0.  1.  1.  1.  1. -2.  1.  1.  1.  0. -2. -1. -2. -2. -2.  0.]
[ 1.  1.  1.  0. -1. -2. -2. -2. -1.  1. -2. -1.  0.  1. -2. -2.]
[ 0.  1.  0.  1.  0.  1. -1.  1.  1.  0. -2. -1. -2.  0. -2. -2.]
[ 1. -1.  1.  1.  1. -2. -1. -1.  0.  1.  1. -2. -2. -2. -2.  1.]
[ 1. -1. -1.  1.  0. -1. -2. -2. -1. -2.  1. -1. -1.  0.  1. -2.]
[-1.  0. -1.  0. -1.  1.  0. -2.  1.  0. -1.  1. -1. -2.  1.  0.]
[ 1. -2.  0.  0. -2.  0.  0.  0. -1.  1.  1.  0. -2.  1. -1. -2.]
[ 0.  1. -1. -1. -1. -1. -2.  0. -2. -1. -1.  1.  0. -2. -1. -1.]
[-1.  0. -1.  0.  1. -1. -1.  1. -2. -2.  1. -1. -1. -2.  1. -2.]
[ 1.  1. -1.  0. -2.  1.  0.  0. -1. -1. -1.  0.  0. -1. -1.  1.]
[-1.  1.  0.  1.  1.  1. -1.  1.  0.  1.  1. -1.  1.  0.  1. -1.]
[-2. -1.  0.  1.  1. -2. -1. -2.  1.  1. -1. -2.  0. -1.  1.  1.]
[-2. -1.  1.  1. -2.  1. -2.  0. -1.  0.  1.  1.  1.  0. -1. -1.]
[ 0.  0.  1. -1. -2.  1.  0.  0. -2.  0. -1.  0.  0. -2. -1. -1.]
[-1.  1.  

[-2.  0. -2. -1.  0. -2. -2. -1.  0. -2.  1. -1.  0. -2.  1.  0.]
[ 1. -2.  1.  1.  0. -1. -1.  1. -1. -1.  0. -1. -2.  0.  1. -1.]
[-2.  0.  0.  0.  1.  1.  0.  1. -1. -1. -2. -2. -2. -2.  1.  1.]
[ 0.  0.  1.  0.  1. -2.  1. -1.  1. -2.  1. -2. -2. -1.  1. -2.]
[ 0. -1.  0.  1. -2. -1.  0.  0. -2.  1.  0.  0. -1. -2. -2.  1.]
[-2.  0. -1.  1.  0.  1.  0. -2.  0.  1.  1.  1.  1. -1. -1. -1.]
[ 1. -2.  1.  0. -2.  1. -1.  0. -1. -2. -1. -2. -1. -2. -1. -1.]
[ 1. -2.  1.  1.  0.  1.  0. -1.  0. -1.  1. -2.  0.  1. -2. -2.]
[-1.  0. -2. -2. -1.  0. -1. -1. -1.  1. -1. -2. -1. -2. -1. -2.]
[ 0.  1. -1. -1.  1. -2.  0. -2. -2. -1. -2.  0.  0. -1.  0.  1.]
[-1. -1. -2. -1. -2.  1. -2. -1. -1.  0.  1.  1.  1. -2.  1.  1.]
[-2. -1. -1. -2.  1. -1.  0. -2.  1. -2. -1. -1.  0. -1.  0. -1.]
[ 1.  0. -2. -1. -2.  0.  1.  1.  1.  0. -2. -2. -1. -1. -1.  0.]
[ 0. -1.  1.  0.  0.  1.  0.  1.  0.  0.  1. -1.  1.  1.  0. -1.]
[-1. -2. -1.  0. -1. -1. -2. -1. -2. -2.  0. -1. -1. -1. -2.  0.]
[-2. -2. -

 23%|██▎       | 7/30 [10:21<34:19, 89.53s/it]

[ 1. -2.  0. -2.  1.  1. -2. -2. -1. -2.  1. -2.  1. -1.  0.  1.]
Training loss (for one batch) at step 0: 0.04437916725873947
Seen so far: 16 samples
[-2. -1.  0.  1.  1.  0. -2.  0. -1. -1.  1.  0. -1. -2. -1.  0.]
[-1. -2. -2.  0.  0. -2.  1.  0. -2. -1.  1.  1. -2. -2. -2.  1.]
[ 0. -2.  1.  1.  0.  1.  0. -1. -1. -2. -2. -2.  0. -1. -1.  1.]
[-1. -2. -1.  1.  1. -1. -1. -2.  1.  0.  1.  1.  1. -2. -1.  0.]
[ 1.  0.  0.  0. -1.  0.  0. -1. -1.  1. -1. -1. -2. -1.  1. -1.]
[-1.  0. -2.  1.  1. -2.  1.  1. -1. -1.  0.  0. -1.  0.  0.  1.]
[-1. -1.  0. -2.  1. -1. -2. -2.  0. -2.  0. -2.  1.  1.  1. -1.]
[-2.  1. -2. -2.  0. -1. -1.  0.  0. -2. -1. -2. -1. -2.  1.  1.]
[-1.  0. -1.  1.  0. -1. -1. -2. -1. -1.  0.  0.  0. -1.  1. -2.]
[ 0. -1. -2.  0. -1. -2.  0.  1.  0.  1.  1. -2.  1.  0.  1.  1.]
[ 1. -1.  1. -2. -2. -1.  0.  0. -2. -2.  1. -1. -2.  1. -2. -2.]
[-1.  1. -1. -2.  1.  0.  1. -2.  0. -2.  0.  0. -2. -2.  1. -1.]
[ 0. -2.  1. -1.  0.  0.  1. -1. -2. -1.  0.  1. -2.  0. 

[ 1.  1.  0. -1.  0.  0.  1. -2. -1.  1.  1.  1. -1. -2. -2.  0.]
[-2.  0.  0.  0.  0.  1. -1. -2. -1. -2.  1. -2.  1.  1.  0.  0.]
[ 1.  0. -1.  1. -2.  0. -2.  0.  0.  0.  0.  1. -1.  0.  0.  0.]
[ 1. -2.  1.  1. -2. -2.  1.  1.  0. -1. -2.  0. -2.  0.  1. -2.]
[-1.  0.  0.  0. -2.  0. -1.  0.  0. -1.  1.  0.  0.  0. -2. -1.]
[ 1.  1.  1. -2.  1. -1. -2. -2.  0. -2.  0. -2. -2. -2. -1. -2.]
[ 1. -1.  1.  0.  1. -1. -1. -1.  0.  0. -1. -2.  1.  1.  0. -1.]
[ 1. -1.  1. -1. -1. -1.  0.  1. -2.  0.  0.  1.  1. -1.  1.  0.]
[-1. -1.  0.  0. -1. -1. -1. -2.  0. -2.  0.  1.  1.  0. -2.  1.]
[-2.  0.  1.  1.  0. -1. -1. -2. -1. -2.  0. -2.  0. -2.  0. -2.]
[-2.  0. -1.  1. -1.  1. -2.  1.  0. -1. -2. -1.  1.  1.  0. -1.]
[-1. -1.  0. -2. -1. -2. -2. -2.  0.  0. -2.  0. -2.  1. -2.  1.]
[-1. -2. -1. -1.  1. -2. -1. -2. -2. -2.  1. -1. -2.  1.  0. -1.]
[-1. -1.  1. -1. -1.  1. -1.  0.  1.  0. -2. -2.  0.  0. -2.  0.]
[-1.  0.  0. -1.  0.  0. -2.  1. -1. -2.  1.  0.  0. -1.  1. -1.]
[ 0. -2.  

[ 1. -1.  1. -2. -1.  0.  0. -2.  1.  1. -1. -2.  1.  0.  1. -1.]
[ 0. -2.  1.  0.  0. -1. -2. -1. -2. -1.  0. -2.  0.  1. -2.  0.]
[ 0. -1. -1. -2.  0. -1. -1.  1. -1.  0.  1.  1. -2.  0.  0.  0.]
[ 0.  0.  1. -1. -1. -1. -2. -2.  0. -1. -1.  1.  0.  1. -2.  0.]
[ 1.  1. -1. -1.  0.  1.  1. -2. -2. -2.  1.  1.  0.  1.  0. -2.]
[-1.  0.  0. -1. -2. -1. -2.  1.  1.  1.  1. -1. -1. -1. -1.  1.]
[ 0. -2.  1. -2. -2.  1.  0.  1.  0. -2. -1.  0. -1.  0. -1. -2.]
[ 1. -1.  0. -2.  1. -1. -2.  0. -2. -2. -2.  0.  1. -2.  0. -1.]
[ 0. -2.  0. -2.  1. -2. -2.  1.  1.  0.  1.  1. -1.  1.  0.  1.]
[-1. -2.  0. -2.  0. -2.  1.  0.  1.  1.  0.  1. -1.  0.  1.  0.]
[-2. -1.  1. -1. -1.  1.  0.  1.  1.  1. -1. -2.  0. -2. -1.  0.]
[-2.  0.  1.  1.  0.  1. -2.  1.  1. -2.  0. -1. -2. -1.  1. -1.]
[ 1. -2. -1.  0.  0.  0.  1.  1.  0. -2.  1.  1. -2.  1. -2. -1.]
[-1. -2. -2. -2. -1. -1.  0. -2. -2. -1. -2. -2.  0. -2. -1.  0.]
[ 1. -2. -1.  0.  1.  1.  0. -2. -1. -1. -1.  1. -2. -1.  0. -1.]
[-1. -1. -

[ 1.  0.  1.  0. -1. -2.  1. -2. -2. -1.  1.  1.  1. -1. -1.  1.]
[ 1. -1. -1. -1.  1. -1. -2.  0. -2. -2.  0. -1. -2. -2.  0.  1.]
[ 0.  1. -2.  0. -2.  1. -2.  1. -2. -2.  1.  1. -1.  1.  1.  1.]
[-1. -2. -2.  0.  0.  0.  1.  0.  0.  1.  0.  1.  0. -1. -2. -1.]
[ 0.  0. -2. -1.  1. -1.  1. -2.  0. -2.  1.  1. -1. -1.  0.  0.]
[-1.  0. -1.  0.  0.  0. -1.  1. -1.  1. -2. -1. -2.  0. -1.  0.]
[ 0. -2. -1.  0. -1.  0.  1. -1. -1. -1. -1.  0.  1. -1. -2.  1.]
[-2. -2. -1. -1. -1.  1. -2.  0. -1. -2.  0. -1.  1.  0.  1. -1.]
[-1.  0.  0. -1.  1. -2. -2. -1. -2.  0. -2. -2.  1.  1. -1.  1.]
[-1.  0.  1. -1.  0.  1.  0. -1. -1.  0.  0.  1. -2.  1.  1. -2.]
[ 0.  1. -2. -1. -2.  0.  0. -1.  0. -2. -2. -1. -1.  0. -2.  0.]
[ 1. -2. -2.  1. -1.  0.  0.  0.  1. -1.  0. -2. -2. -2. -1. -2.]
[-2. -1. -1.  1.  1.  0.  1.  1. -1.  0. -1.  1.  1. -2. -1.  1.]
[-1. -2. -2. -2. -2.  1.  0.  1. -1. -2. -2. -1.  0. -2.  0.  0.]
[-1. -1. -2. -1. -2. -2.  0. -2.  0. -1.  0.  0.  0. -1.  0.  1.]
[ 0. -1. -

[ 1.  0.  1.  1.  0. -2. -2.  1. -1.  1. -1.  1. -2. -2. -2. -2.]
[ 1. -2.  0.  0. -1.  0.  0. -2.  0. -1.  0. -1. -1. -2. -1. -1.]
[-2.  0. -1.  0. -2.  0. -1.  0.  1. -2.  1. -2. -1. -1.  1.  1.]
[-1. -2. -1.  0. -1. -1. -2.  0. -2. -1.  0.  0.  1.  0. -2. -1.]
[-2.  1.  0. -1.  0. -2.  0.  1. -1.  1. -2.  1. -2. -1.  1. -1.]
[-1. -1. -2. -2.  1.  1.  0. -2. -1. -1. -2.  1. -1. -2.  1.  1.]
[ 1.  1.  0. -1.  0.  1. -1.  0. -2. -2. -1.  0. -2.  1. -2. -2.]
[-1. -2. -2.  0. -2. -2.  1. -2.  0.  0. -2. -1.  1.  1. -1. -2.]
[ 1. -2.  0.  1. -1.  1.  1. -1. -2.  0. -1.  0.  0. -1.  0. -1.]
[ 1. -2.  1. -1.  1. -1. -2. -1. -1.  1. -1. -2. -1. -2.  1.  1.]
[ 0.  1. -1.  0.  1. -1.  1. -1. -1. -2.  1.  0. -1. -2. -2.  0.]
[ 0. -1. -2. -2. -2. -2. -2.  0. -2.  0.  0.  0. -2.  1.  1. -2.]
[ 0.  1. -1. -2. -2.  1. -2. -2.  0. -2.  0. -1.  0.  0. -2.  0.]
[-1.  1.  1. -2. -2. -1.  1.  1.  0. -1. -2. -1.  0.  0.  1.  0.]
[-2.  0.  0.  1. -2. -1.  0.  0.  1. -2.  0.  0.  1. -1.  0. -2.]
[-1.  1. -

[-1. -2.  1.  0. -2.  0. -2. -1. -2.  0. -2.  1.  1.  0.  1. -1.]
[ 1.  0. -1.  1. -1.  0. -2.  0.  0. -2. -2. -1.  1. -2.  0.  1.]
[ 0.  1. -2.  0. -1.  0. -1.  1. -2. -2.  1.  1. -2. -2. -1.  0.]
[-1. -2. -1. -2.  0. -1.  0.  1.  1.  0.  1.  1. -1. -2. -2. -2.]
[-1. -1.  0.  0.  1. -2.  0.  1. -2.  0. -2. -1.  1. -2.  1.  0.]
[ 1.  0.  1.  0. -1.  0.  0.  0.  0.  0. -1.  1.  1.  1. -2. -2.]
[-2. -1. -1.  0. -2. -2. -1.  1.  1. -2. -1. -1. -1. -1.  0.  0.]
[-2.  0. -2.  0. -1. -1. -1. -2.  1.  1.  1. -1.  0. -2.  1. -1.]
[-2.  1.  1.  0. -1.  1.  0. -2.  0. -1. -1. -2. -2.  0. -1.  1.]
[-2. -2.  0. -1. -1.  0.  0.  1. -2. -1.  0.  1.  1. -2.  0.  0.]
[-1. -1. -1. -1.  0.  0. -2. -1. -2.  0. -1.  0. -1.  1. -1. -1.]
[-1. -1. -2. -1.  1. -1.  1. -1.  0. -1.  0.  0.  0. -1. -2.  1.]
[ 0.  0. -1.  1.  1.  1. -2. -2. -1. -2.  1.  0.  0.  1. -1.  1.]
[ 0. -2. -2.  1.  0.  0. -1. -2. -1. -1.  1.  1. -1.  0. -1.  0.]
[-2. -2.  1.  0. -1. -1.  1.  0. -2.  1. -1. -1.  0. -2. -2.  1.]
[ 1. -2.  

[ 1. -1. -2. -2. -2. -2.  1. -1.  1. -1.  1. -2. -2. -2. -1.  0.]
[ 1. -1. -1.  0. -1.  0. -2.  0. -2.  1. -2. -2. -2. -1.  0. -2.]
[ 0.  0. -2.  1. -2.  0.  0. -1.  1.  0.  1.  0. -2. -2.  1. -2.]
[-2.  0. -1.  0. -2.  1.  0. -2. -1.  0. -1.  0.  0. -1. -2. -2.]
[ 1.  1. -1. -2.  1. -1. -2.  1.  1. -2.  1. -1.  1.  1. -1.  1.]
[ 1. -2.  0. -1. -1. -1. -1.  1.  1.  1. -2.  0. -1.  1. -1. -2.]
[-1.  1. -2.  1. -1. -1.  0.  0. -2.  0. -1. -2. -2. -2.  1. -2.]
[-2. -1.  0.  1. -1. -2.  1. -1.  0.  1.  1. -1.  0.  1. -1. -1.]
[-2.  1. -1. -1.  0. -2. -1.  0. -1.  1. -2. -2. -2. -2.  0.  1.]
[-1. -2.  1. -2. -2. -2. -2. -1. -1. -2. -1.  1.  1. -1. -1. -2.]
[ 1.  0.  1. -2. -1. -1.  1.  0. -1.  1.  0.  1.  1. -2.  0.  1.]
[-2. -1. -1.  1.  0.  1.  1.  0. -1. -2. -1. -1.  1.  1. -2.  0.]
[-1. -2.  1.  0.  1. -2.  1.  0.  1. -1. -2.  1.  1.  1.  1.  0.]
[-2. -2.  0. -1. -2.  1. -2. -2. -2.  0. -1. -2.  0. -1. -2. -2.]
[-2. -2.  1.  1. -2.  0.  1.  0.  0.  1. -1.  1. -2.  1. -2.  0.]
[ 1. -1.  

[-1. -1.  0.  0.  0.  1. -1. -2.  0.  1. -2. -1. -2.  1.  1.  1.]
[-1.  1.  1. -2. -2. -2. -1. -2.  0. -1.  0. -2.  0. -1.  0.  0.]
[-1.  0.  0. -2. -2. -1. -1. -2. -2.  1.  0. -1. -1. -2.  0.  0.]
[ 1.  0. -2.  0.  1. -1.  1.  1. -1. -1.  1. -2.  1. -1. -1.  0.]
[-2. -1.  0. -1.  0. -1.  1. -2. -1. -1.  1.  1. -1. -1. -1. -1.]
[-1. -1. -2. -1.  1. -1. -2. -2. -1.  0.  0.  0. -1.  0.  1.  0.]
[ 1.  0. -2. -2. -1. -2.  0. -1. -1.  1.  0.  1. -2.  0. -1.  1.]
[-2.  1.  0. -1.  1. -1. -2. -2.  0. -1. -2.  1. -1. -1.  0. -1.]
[-1. -1.  0. -2. -1.  1.  0. -1.  1.  1. -1.  0. -2.  0. -2.  0.]
[-1.  1.  1.  0. -1.  1.  0.  0. -2. -2.  1. -2.  0.  0.  1.  0.]
[-2.  0. -1.  1. -2.  1.  1. -2. -2.  0.  0.  1. -2.  0. -2.  0.]
[-2.  0.  0. -1.  0.  0.  0.  1. -2. -1. -2.  1.  0. -2.  1. -2.]
[ 1. -2. -2.  0. -2. -1.  0.  0. -1.  0.  0.  0.  1. -2. -2.  1.]
[ 1. -2.  0.  1.  1.  1.  1.  0.  1.  0.  0.  1. -1.  0.  1.  1.]
[-2. -2. -2. -2.  0.  0.  1.  0.  0.  1.  1. -1.  0. -1.  0. -2.]
[-1. -2.  

[ 1. -2. -2.  1.  0. -2.  1.  1.  1.  1. -1. -1. -2.  0. -2.  0.]
[ 1. -2.  0.  0.  1.  1. -1. -2. -2.  0. -2. -1.  0. -1. -2. -1.]
[-1.  1.  0. -1.  1. -1. -2. -2. -2. -1. -1.  1. -2. -2.  1.  0.]
[ 1.  1. -2.  1.  1. -2.  1. -2.  1.  1.  0.  1. -1. -2. -2. -2.]
[ 0.  1.  0. -2. -1.  0. -1. -1. -2.  1. -2. -2.  1. -1.  0. -2.]
[-1.  0. -1. -1.  0.  1.  1. -1. -2. -2. -1. -1.  0. -2.  0. -1.]
[-2.  1. -2.  0.  0.  0. -1. -1. -2.  0.  1. -1. -1.  1. -2. -1.]
[-2.  0. -1. -2.  1. -2.  1. -1.  1.  0.  0. -2.  0. -2. -2.  0.]
[ 0.  0. -2.  0.  0.  1. -2.  0.  1. -1.  0.  0.  0. -1. -2. -2.]
[-1. -1. -2.  0. -1. -1.  0.  0. -2.  1. -2. -2.  1. -1. -2. -2.]
Training loss (for one batch) at step 1000: 0.04879855737090111
Seen so far: 16016 samples
[ 1.  1.  1.  1.  0. -1. -1.  1.  0. -2. -1. -2. -2. -2.  0.  0.]
[-2.  1. -2.  0.  0.  0.  1.  1. -1. -2. -1. -2. -2. -1.  0. -2.]
[-1. -1.  0. -2. -2.  1. -2.  1.  1.  0.  1. -1.  0.  1. -2.  1.]
[ 1. -1. -1. -2.  1.  0.  0. -1. -1. -1.  1.  1. -2

 27%|██▋       | 8/30 [11:44<31:59, 87.27s/it]

[ 0. -2. -1. -2.  1.  0. -2.  0.  1.  0.  0. -2. -2. -2. -1. -2.]
Training loss (for one batch) at step 0: 0.05035926029086113
Seen so far: 16 samples
[-1. -2.  0.  1. -2.  0.  0. -1. -1.  0.  1. -2. -1. -2. -2. -2.]
[ 1. -2.  1.  0.  0.  1.  1.  0. -1.  1. -2.  1.  1. -2.  0. -1.]
[ 0. -2. -1. -1. -1.  0.  1.  1. -2.  1.  1.  1. -1. -2. -1. -1.]
[ 0. -1.  1.  0.  1.  1.  1.  0.  1.  0.  0. -2. -1. -2.  1. -2.]
[-2.  0.  0.  0. -1.  1.  1. -1. -1. -1.  0. -2.  1. -1.  0. -1.]
[-2. -2.  1.  1.  1.  1.  1.  0.  1.  1. -2.  1. -1. -2. -1.  0.]
[-2.  1. -1. -2. -2.  0.  0.  1.  0. -1. -2.  0.  0. -1.  0.  0.]
[-1. -2.  0.  0.  0.  1.  1.  1. -1. -1.  1.  1.  0. -2. -2.  0.]
[-2. -2. -1.  1.  0. -2.  0. -2.  1. -1. -2.  1.  0. -2.  1. -1.]
[ 0.  1. -1. -1. -1.  1. -2.  1.  0. -1.  1.  0. -2.  1.  1.  0.]
[-1. -2. -1.  0.  0. -1.  0.  0. -2.  0.  0.  1.  1. -1. -1. -2.]
[ 1.  1. -1.  1.  1.  0.  0.  0.  0.  0.  0.  1.  0. -1. -2. -1.]
[-2. -1. -2.  1.  0.  0. -1.  1. -2.  0. -2. -2.  1.  1. 

[ 1. -1. -1. -1. -1. -2.  1. -1.  1. -2. -2. -1.  0. -2.  1.  0.]
[ 0. -2. -2. -1.  0. -1.  1.  0. -2.  1.  1.  0.  1. -2. -1.  1.]
[-1.  0.  0.  1.  1. -1.  0.  1. -2. -1.  0. -1. -2.  0. -1.  1.]
[-1. -2. -2. -2.  0.  0.  0. -2. -1.  1.  0.  0.  0.  1. -2.  1.]
[-2. -1. -2.  0. -2.  1. -1. -2. -2.  1.  1. -1.  0. -1. -1.  0.]
[ 0.  0. -2.  1.  0. -1.  1.  1. -1.  0. -2.  1. -1. -1.  0. -1.]
[ 1.  1.  0.  1. -1. -1.  1.  1. -2.  0.  0. -2.  0.  1.  0.  0.]
[ 0. -1.  1. -1.  0.  0. -1. -2.  1.  1.  1.  0. -1.  0.  0.  1.]
[ 1.  0.  1.  1. -2.  0.  0. -1.  1. -2.  1.  0.  1. -1. -1.  1.]
[ 0. -2.  0. -2.  0.  0. -1. -1. -1.  0. -1. -2. -2.  0. -2.  1.]
[ 1.  1.  1. -1.  0.  0. -2. -1. -1.  1. -1. -2. -2. -2.  1. -1.]
[-2.  1. -1. -1.  1.  1.  0. -1. -1.  0.  0.  0. -1.  0.  1.  0.]
[ 1.  1. -2.  0. -1. -1. -1. -1.  0. -2. -2. -1.  1. -1. -1.  1.]
[-1. -2.  1.  0. -2.  0. -1.  0.  1.  1.  0.  1. -1. -2.  1.  1.]
[ 0.  1. -2. -1. -2.  1.  0.  1. -1.  0. -1.  1.  0. -2.  1. -2.]
[ 0.  1. -

[-2.  1.  0. -1.  1.  0.  0.  0.  0.  1.  1.  1.  0. -1.  0. -1.]
[ 1. -1. -1. -2.  1. -2.  1. -1. -2. -2.  1.  0.  1. -2. -2. -2.]
[-1.  0. -2.  1.  0.  1. -2.  0. -1.  1. -1. -2. -1. -1.  0.  1.]
[-2.  0.  0.  0. -1.  0. -1.  1.  1. -1. -1.  0.  0.  0.  1.  0.]
[ 1. -1.  1.  1.  1.  1.  1.  1. -2. -1.  0. -1.  1.  0.  1. -2.]
[-2. -2. -2.  1. -2.  0. -2.  0.  0. -2.  1. -2.  1. -1.  1.  1.]
[ 0. -2. -1.  1. -1. -1. -1. -1.  0. -1. -2. -1.  0.  0. -2. -1.]
[-2.  0. -1.  1. -2.  0.  1.  1. -1. -2. -2.  1.  0. -2.  0. -2.]
[-2. -2. -2.  0.  1. -2. -2. -2.  1.  0.  0.  0. -1.  1. -1. -1.]
[ 1. -1.  0. -2.  0. -1.  0.  0.  1.  0.  0. -1.  0. -1. -1.  0.]
[-2. -1.  1. -2.  0.  1. -2.  0. -2.  0. -2.  1.  1. -1.  0. -2.]
[-1. -1.  1.  0. -1. -2. -2.  1. -2. -2. -1.  0.  1.  1. -1. -1.]
[ 0.  0. -1.  0. -2. -2. -2.  1.  0.  1. -1. -1. -1. -2.  1.  1.]
[ 0. -2.  1. -1. -1.  0. -2. -2.  0. -1.  1.  0. -1. -2. -2.  1.]
[-2. -1.  1. -2. -2.  1.  0.  1. -1.  1.  0.  0.  0.  1. -2.  1.]
[ 1. -1. -

[ 1. -2. -2. -1. -2.  1. -2.  0.  0.  1.  1. -1.  1. -2.  1. -2.]
[-1. -1.  0. -2. -2. -2.  1. -2. -1.  0. -2.  1. -2.  1.  0. -2.]
[ 0. -2. -1. -1. -2. -2.  1. -2.  1.  1.  0. -2. -1.  0. -1. -2.]
[ 1. -2. -2. -2. -1. -1.  0. -1.  1. -2. -1.  0. -2.  1.  0.  1.]
[ 0.  1.  0. -1. -2. -2. -2.  0. -2.  1.  1. -1. -2.  1. -1.  1.]
[-1. -2.  0.  1. -2. -2.  1. -1.  1.  0. -2. -2.  1. -2.  1. -1.]
[-1. -1.  0. -2.  1.  0. -2. -2. -2. -2. -1. -2.  0.  0. -1. -1.]
[-2.  0. -2.  1.  1. -1. -2. -1. -2. -2. -1. -1. -1. -2. -2.  0.]
[-2. -2.  0. -2. -2. -2. -1. -2.  1. -1. -1. -1. -2.  1.  0. -2.]
[-2. -2. -1.  0.  0. -1. -2. -1. -1.  0. -1. -1. -2.  1. -2. -1.]
[-2.  1.  1. -1.  0.  1. -2. -2.  0. -2.  0. -1. -2. -1.  1.  0.]
[-1.  0. -2. -2. -1. -2.  1.  1. -1.  1.  0. -1.  1.  1.  1.  0.]
[ 0.  0. -2.  0. -1.  0.  1.  0.  0.  1.  1.  1.  0. -2. -1.  0.]
[-1.  1. -2. -2. -2. -2. -1.  1.  1.  0.  1.  0.  1.  1. -1. -1.]
[ 1. -1. -2. -2. -1. -2. -2. -2. -2.  1.  0. -1.  0. -1. -2. -2.]
[ 1. -2. -

[ 1. -1. -2.  0.  0. -1.  0. -1.  0.  1.  0.  0. -2.  0.  0.  1.]
[ 0.  1. -1. -1. -1.  1.  1.  1. -2.  0.  1.  0. -2.  0.  0. -1.]
[-2. -2. -2.  0.  1.  1.  1.  0. -1.  0. -2. -2.  0.  0. -2. -2.]
[ 1. -2. -1.  1. -1.  1. -2. -2. -1.  1.  1.  1.  0.  1. -2. -1.]
[-1.  0.  0. -2.  0. -2. -2. -2. -2. -2.  1.  0. -2. -1. -2. -2.]
[ 1. -2.  0.  1.  1. -1.  0. -2. -1.  0. -1.  0.  0.  1. -1. -1.]
[-2.  1. -1. -1.  0.  0. -1. -1.  0.  0. -1.  0.  1. -2.  0.  0.]
[ 1.  0. -2.  0. -1. -1.  1. -1. -2. -1. -2.  1. -1.  0. -1.  0.]
[ 1.  0.  0.  0.  0.  1. -2. -1.  0.  0.  1.  1.  1. -1. -2. -1.]
[ 0.  0. -1.  0. -2. -2.  1. -1. -1.  1. -2.  0. -1. -1. -2.  0.]
[ 0.  1. -1. -2. -2. -1. -2. -1. -1.  1.  0. -1.  0. -2.  1. -2.]
[ 0.  0.  1.  0.  0.  1. -2.  1.  0.  0. -1. -1.  0. -1. -2.  1.]
[-1.  1.  1.  0. -1.  0.  0. -1.  0.  0. -1.  0. -1. -2. -1. -2.]
[ 1.  1. -2. -1. -2.  0.  1.  1.  1. -1. -1.  0. -2. -1. -2. -1.]
[ 0. -2.  1.  0.  1. -2.  0.  1. -2.  0.  1. -1. -1. -2.  1.  1.]
[ 0. -1. -

[-1.  1. -1.  1.  0.  0.  0. -2.  0. -2.  1.  0.  1.  0.  0. -2.]
[-1. -1.  1.  0.  0.  1. -1. -2.  0. -2. -1. -1. -1. -1.  0.  0.]
[-1.  0. -1. -2.  1. -1. -2. -1. -1.  0. -2. -1. -2.  1.  0. -1.]
[ 1. -1. -1. -1. -1.  0. -2.  1.  1.  0.  1.  1.  0.  1. -1. -2.]
[-1.  0.  0.  0.  0. -2. -1. -2.  0. -1. -2. -1.  0. -2. -2. -2.]
[-2. -1.  0. -2. -1. -1.  0. -2.  1. -2.  1. -1. -1. -2. -2. -1.]
[ 1. -2.  1.  1.  0. -2. -1. -2.  0. -1.  0. -2.  1. -2. -1.  0.]
[ 1.  0.  1.  0. -1. -1.  0.  1. -2.  0.  0.  0.  0.  0. -1.  0.]
[-1.  0.  1. -2. -2. -2.  0. -2. -2.  1. -1.  1. -2.  0. -1.  1.]
[ 0. -2.  1.  0. -2. -1.  1. -2.  1. -2.  0.  1. -2. -1. -2. -2.]
[-1. -2.  0.  1. -1. -2.  1. -1. -1. -2.  1. -1. -1. -1. -1.  1.]
[ 1. -2.  1.  0. -2. -1.  0.  1.  1.  0. -1.  1.  0.  0.  0.  1.]
[ 1. -1.  0.  0.  1. -2.  0.  1.  0.  0. -1.  0. -2. -1.  1.  1.]
[ 1.  0.  1. -1. -2. -1.  1. -1. -1.  1. -2.  0. -2. -2. -1.  1.]
[-2. -1.  1.  1.  1. -1. -1. -2.  0.  0. -1.  1. -2.  0. -2.  1.]
[ 0.  1.  

[ 1.  1. -1.  1.  1.  0.  0.  1.  0. -2.  1. -2. -2.  1. -1. -1.]
[-1.  1.  1. -1. -1. -1. -2. -1. -1.  0. -2. -1. -1. -2.  0.  1.]
[-1.  0. -2. -1.  0. -2.  1.  0.  1.  0.  0. -1. -1.  0. -1.  1.]
[ 0. -1.  1. -1. -2. -2. -1.  0.  1.  1. -2. -1.  0.  0. -2.  1.]
[ 0. -1.  0. -2. -2.  1.  0.  0.  0. -1.  1. -2. -2.  1.  1. -1.]
[ 0. -1.  0. -1.  1.  1.  1. -1. -2. -2.  0.  1.  1.  0.  1.  0.]
[-1. -2. -1.  1.  0. -1.  0.  1.  0. -1. -2. -1. -1.  1.  1.  0.]
[-1. -1. -2.  1. -2. -1.  0. -2. -1.  1.  1.  0.  1. -2.  1.  0.]
[-2. -2.  1.  0.  1.  1. -1.  0. -2. -1.  1.  1.  0.  1. -1. -2.]
[ 0.  1. -1. -1.  1.  1. -1. -2. -1. -1.  1. -2.  0. -1.  1.  0.]
[ 0. -1. -2. -1. -1.  1.  0. -1. -1. -2.  0. -1.  0. -2. -2.  0.]
[-2.  1. -1. -2.  1.  1.  1.  0.  0.  1. -1. -2. -2. -1.  1.  0.]
[ 1. -2. -1.  0.  0. -2. -2. -2. -1.  1. -1.  0.  1. -2. -2.  1.]
[-1. -1.  1.  1.  0. -2. -1.  0.  0. -1. -1. -1.  0.  1. -1. -1.]
[-2. -2. -2. -2.  1.  0. -2. -2.  0. -2.  0.  1.  0. -1. -1.  1.]
[-1. -1.  

[-1.  1. -1. -1.  1. -2. -1.  0.  1.  1. -2.  1. -1. -1.  1.  1.]
[-1. -2. -2.  0.  0. -1. -1.  1.  1.  1. -1.  1.  0.  0. -1. -1.]
[ 0. -2.  1. -2. -1.  1. -1. -2. -2. -2. -1. -2. -2. -1.  0.  0.]
[ 1.  0.  0.  1.  1. -1.  1. -2.  0. -1.  1.  0. -1. -1. -1.  1.]
[-1.  0. -2.  1. -2.  1.  1.  0. -2.  0.  0. -1.  0.  1. -1. -1.]
[ 1.  1. -2. -2.  0.  1.  0.  0.  1. -1. -2. -1.  0. -1.  1. -2.]
[ 0.  0. -1. -1.  1. -2.  0. -1.  1. -1.  1.  0.  1.  0.  0. -1.]
[ 1.  0.  1.  1. -2. -2.  0.  0.  0. -2.  0.  1.  1.  1.  1. -2.]
[ 0.  1. -1.  1. -2. -2. -1.  0.  0.  0. -2.  1. -2. -2. -1.  0.]
[ 0.  0. -2. -1.  0.  0.  0.  0.  0. -2. -2. -1.  1.  1.  1. -1.]
[-2. -1. -1. -1. -2. -2.  1.  0. -2.  1.  1. -1.  1.  0.  1. -2.]
[ 1.  1.  0. -2.  0. -2.  1. -1. -1.  0. -1. -2. -1. -1.  1.  1.]
[ 1.  1.  0.  1.  1. -2. -1.  0. -2.  1.  1.  1.  1. -2. -2. -1.]
[ 0. -1. -1. -1.  0. -1.  1. -2.  1. -1. -1. -2. -1. -2. -2. -2.]
[ 0. -2.  0. -2.  1.  0. -2.  1. -1.  1.  1.  1. -2. -1. -1. -1.]
[ 1.  0.  

[-2.  0. -1.  0.  0. -2.  1.  1. -1. -2. -2. -2.  0. -1.  0.  1.]
[ 0. -2.  1. -2.  1.  1. -1.  1.  0.  1. -1.  0. -1.  1. -2.  1.]
[-2.  1. -2. -1.  1. -2.  0. -1.  1. -2. -1. -2.  1. -2.  1. -2.]
[-2. -1.  1. -1.  1.  0.  1. -1.  1.  1.  0.  1.  1.  0.  1.  1.]
[ 1.  1.  1. -2.  1. -2.  1. -2.  0. -1. -2. -2.  0. -2. -1.  1.]
[ 0. -2. -1.  0. -2. -2.  1. -2.  0. -2. -1.  1. -2.  1. -2. -2.]
[-2.  1.  0. -2. -2.  1.  1. -1.  1. -1. -2.  1.  1. -1. -1. -1.]
[ 0. -2. -2. -1.  0.  1.  1. -1. -1.  1.  0. -1. -1.  0. -2. -2.]
[ 0. -2.  0.  1. -1. -2. -2. -2.  0.  0. -1.  1.  1. -2.  1.  1.]
[ 1.  0. -2. -1.  1. -1.  0. -1.  0. -1.  0. -1.  0. -2. -1. -1.]
[ 1.  1. -1.  1.  0. -1. -2.  1.  0.  1.  1.  0.  1.  1.  1. -2.]
[ 0.  0.  1. -2.  0. -2.  0. -2. -2.  0. -2.  1.  0. -1. -1. -1.]
[-1.  0.  0.  0. -1.  1.  0. -2. -1. -1.  0. -2. -2. -1. -2. -1.]
[ 0. -2. -1. -2. -1.  0.  0.  1.  0.  0. -2.  1. -1.  0. -1.  0.]
[ 0. -2.  1.  0. -1.  1. -1.  0.  1.  1.  0.  0.  0. -2. -2.  1.]
[-2. -2.  

 30%|███       | 9/30 [13:10<30:24, 86.89s/it]

[ 1.  0. -1. -1. -2. -1.  1. -2.  1.  1. -1. -1. -2. -2. -1. -2.]
Training loss (for one batch) at step 0: 0.04488334432244301
Seen so far: 16 samples
[ 0.  1.  0. -1.  0.  1.  1. -1. -1. -2.  1.  1.  1.  0.  0.  0.]
[-2.  0.  1.  0.  1.  0.  1.  0. -2. -1. -1.  0.  0. -1. -2. -1.]
[-1. -1. -2.  1. -1. -2.  1.  1. -2.  1.  1. -1. -1.  0.  0.  0.]
[-2.  1. -1. -1. -2.  1. -2. -2. -2.  0. -2.  0.  0.  1.  1.  1.]
[ 1.  1.  0. -2.  0.  0.  1. -1. -2. -1. -1. -1.  0. -2.  1.  0.]
[ 0.  0.  0.  0.  0.  1. -1. -2. -2. -2. -1. -1. -2. -1.  1. -2.]
[-2. -2. -2.  0. -2. -2. -2.  1.  0. -2.  1. -2. -1. -1.  0.  1.]
[ 1.  0.  1. -2.  1.  1.  0. -1.  1. -1.  1.  0. -1. -2. -2.  1.]
[ 1.  0. -2. -1. -2. -1.  1.  0. -2. -2. -1. -2.  0. -1. -2.  1.]
[ 1. -2. -1.  1. -1.  1. -2. -1. -1. -1.  0.  0. -1.  0.  0. -2.]
[ 1.  1. -2. -2.  0.  0. -2. -2.  1.  1.  1.  1. -2.  0.  1. -2.]
[ 0.  1.  1.  0.  1.  0.  0.  1. -2.  0.  1.  1. -2. -2. -1. -1.]
[ 1. -2. -1.  1.  0. -2.  1.  1. -2.  1.  1.  1. -2.  0. 

[ 0. -1. -2. -1. -1.  1.  0.  0. -2. -2. -2. -2.  1.  0.  1. -2.]
[-2.  1.  1. -2. -1.  1. -1. -2.  0. -1. -1.  0.  1.  1.  1. -1.]
[-2.  0. -1.  1. -2.  0. -1. -1.  0.  0. -2. -2.  1. -2. -2.  1.]
[ 1.  0.  0. -1.  0. -2.  0.  0.  1.  1. -1.  0.  0.  1.  1. -2.]
[-2. -2. -2. -1.  0. -2. -2.  1.  0.  0.  0. -2.  1. -2. -1.  0.]
[ 1. -2. -1.  0. -1.  0. -1. -1.  1.  0.  0. -1.  0. -1.  1.  0.]
[ 0.  0.  0.  1.  0.  0.  0. -1. -1.  1. -2.  1.  0.  1. -1.  0.]
[-2.  0.  0. -1.  0.  0. -1.  1. -2.  0. -1. -2. -2. -1. -1. -1.]
[-1.  0. -1. -2.  0. -2. -1.  0.  1. -2. -2. -1.  0.  0. -2.  1.]
[-1. -2. -2.  1. -2. -1.  1.  0. -2.  1.  0. -2. -2.  1.  0.  1.]
[ 1.  1.  1. -2. -2.  0.  1.  0.  1. -1. -1.  0.  1. -1. -2. -2.]
[-2. -1. -1.  0.  0.  1.  1.  0.  1. -2. -2.  1. -2.  1.  0. -1.]
[ 1. -1.  1. -2.  0. -2.  0.  0. -2. -2.  1. -2. -2. -1.  0. -1.]
[-1. -1. -2. -2. -1.  1. -1.  1. -1.  1. -2.  1. -1. -2.  1. -2.]
[ 0.  1. -2.  0.  0.  1. -1.  0.  1.  1. -1. -1. -1. -1. -2.  1.]
[-1. -1. -

[-2.  1. -1. -1.  0.  1. -1.  0.  0.  1. -2.  0. -2.  1. -1.  1.]
[ 1. -1.  0. -2. -1. -2.  0. -2.  1.  0. -1. -1. -1.  1.  1.  1.]
[-2. -2.  0. -1.  1.  0.  1.  0. -1. -1.  1.  1. -1.  0.  0.  0.]
[-2. -1. -2. -1.  1.  0.  0.  0. -2. -1.  1. -1. -2. -1. -2.  0.]
[-1.  0. -2. -2.  1.  1. -1.  0. -2.  0. -2.  1. -2.  0. -2.  1.]
[-2.  0. -2. -1. -1. -2. -1. -2. -2. -1. -1. -1. -2. -2. -1.  1.]
[ 1.  0. -2.  0.  0.  1.  1. -1.  1.  0. -2.  0. -2. -2.  1. -2.]
[ 1. -2.  1. -1. -1.  0.  0.  1. -2. -1.  1. -2. -2. -1.  1. -1.]
[ 0. -1.  0. -1.  0.  0. -1.  0. -2. -1.  1.  1.  0. -2.  0. -2.]
[-1. -1. -1.  1. -1. -2.  0.  0.  0.  1.  1.  0. -1.  0.  0. -2.]
[-1. -1.  0.  1. -2.  1. -1.  1. -2. -1. -2.  0. -2. -1. -1.  1.]
[ 0.  1.  1. -1. -1. -1. -1. -2.  1. -2.  0.  1.  1.  1. -2. -2.]
[ 0. -1. -1. -2. -1.  0. -1. -2.  0.  0. -1.  1. -1.  0. -1. -2.]
[ 0.  0. -2.  0.  1.  0. -2.  1.  1.  1. -2.  0.  0. -2. -2.  0.]
[-1. -2. -1.  0.  1.  1. -1. -1.  0. -2.  1. -1. -1. -1.  1. -1.]
[-2.  1.  

[ 1. -2. -2.  0. -2. -1.  1. -1.  0.  0.  0.  1. -2.  0.  1.  1.]
[-1.  0.  1.  0.  1. -1.  0.  1. -1. -2. -1. -2.  0. -2.  0. -1.]
[ 0. -2.  0. -1.  1. -2.  0.  1.  0.  1.  1.  0. -1. -2.  1.  0.]
[ 0. -2.  1. -2.  1.  1. -1.  1.  1.  0.  0.  1.  0. -1.  1. -1.]
[-2. -2.  1.  0.  0.  0. -2.  0. -2.  0.  0.  0. -2.  0.  1. -1.]
[ 1.  1.  0. -2. -2. -2.  1. -1.  0. -2.  0. -1.  0.  0.  0. -1.]
[ 0. -1.  1. -1. -2.  0.  0. -1. -1. -1.  1.  0.  0.  1. -2. -1.]
[ 1. -2. -2. -1. -2. -2. -1.  0. -1.  0. -2.  1.  0. -2.  0.  0.]
[ 0.  1. -1. -2.  1. -1.  1.  1. -2. -2.  0. -2. -1. -1.  0.  1.]
[ 1.  0. -2. -2. -1. -2.  1. -2.  0.  1. -1.  0.  0.  1. -2. -2.]
[-1. -1. -2. -2.  0.  1.  0. -1. -1.  0. -1. -2. -1.  1.  1. -1.]
[ 0.  1. -2.  0. -1.  1. -1.  0. -1. -2.  1. -1.  1. -1. -2.  1.]
[-2.  1.  0.  1.  0. -1. -2.  1. -1.  1.  0.  0.  1.  0.  1.  1.]
[-2. -2.  1.  1.  1. -1. -1. -2.  0. -2.  0.  0. -1. -2.  1.  1.]
[ 1.  0.  0. -1.  1.  0.  0. -2. -2.  0.  0. -1.  1.  1. -1. -1.]
[-2.  0. -

[ 0. -2.  1.  0. -1.  0.  1. -2.  1.  1.  1.  1. -2.  0. -2.  0.]
[-1. -2. -2. -1. -2.  0. -2. -2.  1. -1.  0. -2. -1.  1.  0. -1.]
[-1.  0.  0. -2. -2. -2.  1. -2.  1. -1. -1. -1. -2.  1. -2.  0.]
[ 0. -1. -1. -1.  1. -1. -2. -2.  1.  0.  1. -2.  1.  0. -1. -1.]
[-1. -1.  0.  0.  1. -2.  0. -2.  0. -2. -2.  0. -1. -2. -2.  0.]
[ 0.  0.  1. -1. -2. -1. -2. -2. -1.  0. -2. -1.  0.  1.  0. -1.]
[ 0.  1.  0.  0.  1. -1. -1. -1. -2. -2.  0.  0.  0.  0. -2. -1.]
[-2.  0.  0.  0.  1. -2.  1. -2. -2. -1.  0.  0. -2.  1. -1. -1.]
[-2.  1. -1.  0. -2. -2. -2. -1. -2.  0. -1.  1. -2.  0.  1.  0.]
[-1.  0. -2. -2.  1.  1.  0.  1. -1. -2.  0. -1.  0.  0.  0.  1.]
[-2.  0. -2.  1.  0. -1. -1.  0.  1. -1.  1.  1. -1. -1.  0. -1.]
[ 1.  0.  0. -2.  1. -1.  1.  1.  0.  1.  0.  1.  0. -2.  1. -1.]
[-2. -1. -2.  1. -1. -1. -1.  1.  0.  1.  0.  0.  1.  1.  0. -2.]
[ 0.  0. -1.  1.  1.  1.  1. -2. -1. -2.  1. -2.  0. -2.  1. -1.]
[ 0. -1.  0. -1.  0.  1.  0.  0.  0.  1.  1. -1.  0. -2. -1. -2.]
[-1. -1.  

[-2. -1. -1. -1. -2.  1. -2. -1. -1.  1.  0. -1.  1. -1. -1.  1.]
[ 1.  0.  0. -1.  0.  1. -1.  0. -2. -2. -1.  1.  1.  0. -1.  1.]
[-1. -2.  1.  0. -2.  1.  1.  1. -1.  0. -1.  1.  0. -2. -1.  0.]
[ 0. -2. -1. -2. -2. -2. -2.  0. -2.  0.  1.  1. -2. -2.  0. -2.]
[-2. -2.  0. -2. -1.  0.  0. -1.  1. -2. -2. -2. -1.  0. -2.  1.]
[ 0.  1.  0.  0. -2.  0.  1.  0.  0. -1.  1.  1. -2.  0.  0. -2.]
[ 1. -1. -2.  0. -1.  1.  1. -2.  0. -2.  0. -1. -1.  1.  0.  1.]
[-2. -2. -2.  1. -1. -2. -2. -2. -2.  1.  1. -1.  1. -2.  0.  1.]
[-2. -2. -2.  0.  0. -1.  0.  0. -1. -2.  0.  0.  1.  1.  1.  1.]
[-2. -1.  0.  1.  0. -1. -2. -1.  1. -2. -2. -2.  1.  1. -1. -1.]
[-1. -1. -2.  1.  1. -1. -2. -1.  0. -1. -1. -1. -1. -1.  0.  1.]
[ 0. -2. -1. -2.  1.  1. -1.  0.  0.  1.  1. -1.  1. -2.  1.  0.]
[-1. -2. -1.  0. -2. -2. -1. -1. -1. -2.  1.  1. -1.  0. -1.  1.]
[-2. -2. -2. -1. -1. -1.  0. -1.  1.  0.  0. -1. -1.  0.  0.  0.]
[-1.  0.  1.  1.  1.  0.  1. -1. -2.  1.  1. -2.  0.  1. -2. -2.]
[ 0.  1.  

[-2.  0. -2. -2.  1.  1.  1. -1.  0.  1.  1. -2. -1.  0.  1. -2.]
[ 1. -1.  0. -1.  1.  0.  1.  1.  1. -2. -2. -1. -2.  1.  0. -1.]
[-1.  1.  1.  0. -1.  0. -2. -2. -1. -2. -1. -2.  1.  1.  1.  0.]
[-1. -2. -2.  1. -2.  1. -2.  1. -2.  0.  0.  0. -1. -1. -2.  1.]
[ 1.  1. -2. -1. -1. -1.  1.  0. -1.  1. -1. -2. -2.  0. -2.  1.]
[-2. -1. -2. -2.  0.  0.  0.  0.  1. -1.  0.  1.  0. -1. -2.  1.]
[ 0.  0. -1.  1.  0. -2.  0.  1.  0.  1. -1. -1.  0.  0.  1. -1.]
[ 1.  0.  0.  1.  1.  0. -2.  0.  0.  1. -2.  0.  1. -1. -2.  1.]
[ 0. -1.  1. -2.  1.  0. -1.  1.  0.  1. -1. -2.  1. -1. -2. -2.]
[-2. -1. -1.  0.  1. -1. -2.  1.  0.  1.  0. -2. -1.  0.  1. -2.]
[-2.  1. -2.  1.  0.  1. -1. -2. -1. -2.  0. -1.  1.  0. -2. -2.]
[-2. -2. -2. -1. -1. -1. -2.  1.  1.  1.  0.  0. -1.  1.  1.  1.]
[-2.  0. -1. -2.  0.  0.  1. -1. -1. -2.  0.  0. -2. -1. -1.  0.]
[-1. -1. -1. -1.  0. -2.  0.  1. -1. -2. -1.  0.  0. -2. -1. -1.]
[ 1. -2. -2.  0. -1. -2. -1. -1. -2.  0. -1. -2.  0.  1.  0.  1.]
[ 1. -1.  

[-1. -1. -2. -2. -1. -1.  1.  0.  1.  1.  0. -1. -1. -2. -2. -2.]
[ 0.  0.  1. -2.  1.  1. -2. -2.  1.  0.  0.  1.  1.  0.  0.  0.]
[ 0. -2.  0.  0.  1.  0.  0. -1.  1. -1.  0. -2. -1.  1.  1.  1.]
[ 1. -2.  0. -1.  0. -2. -1.  1. -1.  1.  0. -2. -1. -1.  1.  1.]
[-2.  1. -1.  1.  0. -2. -2.  0.  1.  0. -2.  1.  1.  0.  0. -2.]
[ 1.  1. -1. -1.  0.  0. -2. -1.  1.  1.  0.  1. -2.  1. -2.  0.]
[-2. -2.  0. -2. -1. -1. -2.  1.  0. -1.  0. -2.  0. -1.  0. -1.]
[-1.  1.  0. -1. -2.  0.  1.  1.  0.  1. -2.  1. -1.  1.  1. -1.]
[-2.  1. -1.  1. -1. -2.  1.  1. -2. -2.  1.  0.  1.  1. -1.  1.]
[-1.  1.  1. -2. -2.  0.  0. -2. -1.  1. -2. -2.  1. -1. -1.  0.]
[ 1. -2. -2.  0.  0.  1. -2.  1.  1. -2.  1.  1. -1.  0. -1. -1.]
[-2. -1. -2. -1. -2.  0.  0.  0.  0.  0. -2. -2. -1. -1.  0. -1.]
[-2.  0.  1.  0.  1.  0. -1.  1.  1.  0.  0. -2.  0.  0.  0.  0.]
[ 0.  0.  1.  1.  0. -1.  0. -2. -1.  0. -2.  1.  1. -2.  1.  1.]
[-2. -2. -2. -2.  0.  0.  1. -2. -1.  0.  1. -1. -1. -1.  1. -1.]
[-2.  0.  

[ 1.  1.  0. -2. -1.  0.  1. -2.  0. -1. -1. -2.  0.  1. -1.  0.]
[-2.  1. -2. -2. -2.  0. -2. -1.  1.  1.  1.  0.  1.  1. -1. -2.]
[-1.  0.  0.  0.  1.  1. -2.  0. -2. -1.  1. -1. -2. -1.  1. -2.]
[-1.  1.  0.  0. -1.  1. -1. -1. -1. -1.  1. -1. -1.  1.  1.  1.]
[-2. -1. -1. -2.  0. -1.  1. -1.  0. -1. -2. -1.  0.  0. -2.  1.]
[ 1.  0. -1. -1.  0.  0. -2.  1. -2. -1. -2.  1.  1. -1.  1.  0.]
[ 0. -2.  0.  0.  0.  1. -2.  0. -2.  0.  1.  1. -2. -2.  0.  0.]
[-1.  1. -2.  1. -1. -2.  0.  1. -1. -1. -2. -2. -2. -2. -1.  1.]
[ 1.  0.  1.  0.  1. -1. -1.  1. -1. -2.  1.  1. -2. -2.  0. -2.]
[ 1. -1.  0.  1. -1.  0. -2.  1. -2.  1.  0. -2.  1.  1. -1.  0.]
[ 0. -2. -2.  0.  1. -2.  1. -1. -1.  1.  1. -1. -1. -2.  1.  0.]
[ 1. -2.  0. -2.  1.  1.  1.  1.  1. -1. -1.  1. -2. -2.  1. -2.]
[ 1. -2.  0.  1.  0. -2. -1. -1. -2. -2.  0.  0. -2. -2. -1. -1.]
[-1. -1.  1. -1. -2. -2.  0. -1.  1. -1.  1.  0. -2.  1. -1.  0.]
[ 1. -1. -1.  1.  1.  0. -2. -2.  1. -2. -1.  1. -2. -2. -1. -1.]
Training l

 33%|███▎      | 10/30 [14:35<28:48, 86.42s/it]

[-2. -2. -2. -2. -1.  1. -2. -2. -1. -2.  0.  1. -2. -1.  1. -2.]
Training loss (for one batch) at step 0: 0.0814942941069603
Seen so far: 16 samples
[ 1.  1. -1. -2. -2. -1.  1. -1. -1. -1.  1.  0. -1.  1. -2. -1.]
[ 0. -2.  0.  0. -1. -2.  1.  1.  1.  1.  1.  0. -2. -1. -1. -1.]
[-2. -1. -1. -1. -1. -1. -2. -2. -2. -2.  1.  0. -1. -2. -2. -1.]
[ 0. -2. -1.  1. -1. -1.  1. -1.  0.  1.  1.  1. -2. -1.  1.  0.]
[-2.  1. -1. -2.  0.  1.  1. -2.  1. -1.  0.  1.  1.  0. -2.  1.]
[ 1. -2. -2. -1. -1. -2.  1.  0. -2.  0.  0. -2. -2. -2.  1. -1.]
[ 1.  0.  1.  1.  0. -1.  0.  1.  1.  0.  0. -1. -1.  1.  0. -1.]
[ 1.  0.  1.  1.  1.  1.  1.  1.  1.  0. -2. -1.  1.  1.  0.  0.]
[ 0.  1. -1.  1. -2.  0. -2. -2. -2.  1.  1. -1. -1. -2.  0.  1.]
[-2. -1.  0.  1.  1.  0.  0.  0. -1.  0.  1. -2. -2. -1. -1.  0.]
[ 0.  1.  0. -1. -2. -1. -2.  1.  1.  0. -1. -1. -1.  0.  0. -1.]
[-1.  0.  0.  0.  0.  0.  1. -2.  1. -2.  0.  1. -2.  1. -1. -2.]
[ 0.  0.  1.  1.  1. -1. -2.  1. -2. -2. -2.  1. -2.  0.  

[-2. -2.  0.  1. -2.  1. -1. -2. -1.  1.  1.  0. -1. -2.  1. -1.]
[ 1. -2. -2. -2.  1.  0. -1.  0.  1. -1. -1.  1. -2. -1.  0.  1.]
[ 0. -1. -1. -2.  0.  1.  1.  1. -1. -2. -1.  0.  0. -1.  1.  1.]
[-2.  1.  0.  1.  0.  1.  0.  1. -1.  0.  1. -2.  1.  1.  1.  0.]
[-2.  1.  1.  0.  0.  1. -2. -2.  1. -1. -1.  0.  1.  0. -2. -1.]
[ 0.  0.  1.  1.  0. -2.  1.  1.  1. -1.  1. -2. -2. -2.  1. -2.]
[-1.  0.  1. -1.  1.  1.  1.  0. -1.  1.  1.  0.  1. -1. -1.  0.]
[ 1. -2. -2. -2. -2. -2.  0.  1.  1.  0. -2. -2.  1. -1. -1.  1.]
[ 0.  0. -2.  0.  1.  1.  0.  0.  0. -1. -1.  0. -2. -2. -2. -1.]
[-2.  0.  1.  1.  1. -2. -1.  1. -1.  1.  0. -2. -2. -1. -2. -1.]
[-1.  1.  0.  1. -1. -1.  0. -1. -1.  1.  0. -1.  0. -2. -1.  0.]
[ 0.  0. -2.  0.  1. -1.  0.  0. -1.  0.  0. -2. -2. -2. -2. -2.]
[ 1. -2.  1. -1.  0. -2. -1.  1. -2.  1.  1. -2.  1. -2. -2. -1.]
[-1. -2. -2. -1.  1.  1. -1. -2. -1. -2.  1. -2.  1. -1.  1. -2.]
[ 0.  0.  1.  1. -1. -2.  1. -2.  1. -1. -2. -1.  0. -2. -1.  0.]
[-1. -2. -

[ 0. -1. -1.  0.  0.  0.  1. -1. -2. -1. -1. -2. -1. -1. -2.  0.]
[-1. -1. -2.  1.  0. -1.  0.  1.  0.  1.  0.  0. -2. -2.  0.  1.]
[ 1.  1.  0.  0. -2.  1. -2. -1.  1. -2.  1. -2. -1.  0.  1. -2.]
[-2. -1.  0.  0. -1.  1. -2.  0. -2.  1.  0. -2. -2.  0. -1.  1.]
[ 0.  0.  0.  1. -1. -2.  0. -1. -1. -2.  1.  1. -1. -1. -2.  0.]
[-1.  0.  0. -2. -1.  1. -1. -2. -2.  1.  1. -2.  1.  0. -2.  0.]
[-1. -1.  1.  1. -1.  0. -2. -1.  0.  0. -2. -2.  0.  1. -2. -1.]
[-1. -1. -1.  0. -1.  1.  1.  0.  0. -1. -2. -2.  0. -1.  0. -2.]
[-1.  0. -1.  1. -1. -1.  1.  0.  0.  0. -2. -2.  0. -1.  1.  1.]
[-2.  0.  0. -2. -1.  0. -1. -2. -2.  0. -2.  0. -1.  0. -1.  1.]
[ 1.  1.  1.  0.  1. -2. -2. -2. -1.  1. -1. -1. -2. -1.  1. -1.]
[ 0.  1. -2.  1.  1. -1. -2.  0.  1.  0.  1.  0.  0. -2.  1. -2.]
[-1.  1. -1. -2.  0. -1.  0. -1. -1.  0. -2.  1. -1. -2.  0. -1.]
[-1.  1.  0. -2.  1.  0.  0.  0. -2. -2. -2. -1. -1. -1.  0. -2.]
[ 1. -1. -1. -2.  0.  1. -2.  1.  0.  1.  1.  0.  1. -1.  1. -2.]
[-1.  1.  

[ 0. -2. -1. -2. -1.  0. -2. -2.  1. -1.  1.  1. -2. -2. -1.  1.]
[ 0. -1. -1. -1. -1. -2.  1.  1. -2. -2.  0. -2.  1.  0. -2. -2.]
[ 0. -1. -1. -1.  0.  1. -1.  1. -2. -1. -2.  1.  1. -2. -2. -2.]
[-1.  0.  1.  0. -2. -1.  0.  1. -1.  0. -1. -2.  1.  0. -2.  1.]
[-2. -1.  1.  0.  0.  0.  1. -2.  0. -2.  1. -2.  0.  0.  0. -2.]
[-1.  0.  1. -1. -1. -2.  1. -1. -1. -1. -2.  1.  1. -2.  1. -1.]
[-2.  0.  0.  0. -2.  0. -1.  0. -1. -2. -2.  1. -1.  0.  0.  0.]
[-1.  0. -1.  0. -1. -2.  1.  0.  1. -1.  1.  0.  1. -2.  0. -2.]
[ 0.  0.  1. -1. -2.  1.  1. -1.  1. -1.  0.  0.  1.  1.  1.  0.]
[ 0.  1. -2. -2. -1.  0.  0. -2. -1. -1.  0. -2.  0.  0.  0.  0.]
[-1. -2.  1.  1.  0. -2.  1. -2. -1. -2. -2. -1. -2.  1. -1.  0.]
[ 0. -1. -1. -1.  1.  0.  0.  0. -2. -2. -1.  1.  0. -2. -1. -1.]
[ 1. -2.  1. -2. -2.  0.  0.  0. -2.  0. -2.  0. -1.  0. -2.  0.]
[-2. -1.  1. -2. -2.  0.  1.  1. -1. -2.  0.  0. -1.  0. -1. -2.]
[ 1. -1.  1. -2. -1. -1.  0. -1. -2.  1.  1. -1. -1. -1. -1.  0.]
[ 1. -1. -

[ 0.  1. -1. -2.  1. -1.  1. -2. -1. -1. -1. -2. -1.  0.  0. -1.]
[ 0. -1. -1.  1. -2. -1. -1. -1. -2. -1.  1. -2.  0.  1.  1. -1.]
[ 1.  1.  0.  0.  1.  1. -1.  1.  1. -2. -1. -2. -2. -1.  0.  0.]
[-2.  0. -1.  1.  0. -1.  1.  1. -1. -2. -1.  0.  0. -1. -1.  1.]
[ 1. -2. -1.  0. -1. -1.  0. -1. -2.  0. -1.  0.  0. -2. -2. -1.]
[ 1. -2. -2. -1.  0. -2.  1.  0.  1.  0.  1.  1. -1.  1.  0.  1.]
[-1. -2. -1. -1.  0. -2. -1. -1. -2. -2.  1. -2. -2.  1.  1. -1.]
[ 0.  0. -2. -1.  1.  0. -1.  1. -1. -2. -2.  1. -2.  1. -1.  1.]
[ 0. -1.  1.  0. -2.  0.  0.  0. -2. -2. -1. -1. -1. -1. -2.  0.]
[-2. -1.  0. -2.  1.  0. -2. -2.  1. -2. -2. -1. -1.  1.  1.  1.]
[ 0. -2. -1. -1.  1.  0. -1. -1.  1.  0. -2. -1. -1. -1. -2.  0.]
[-1. -1.  1. -2. -2. -2. -2. -2. -2.  0.  1. -1. -1. -1.  0.  0.]
[ 1.  1. -1. -1. -1. -2. -2.  0. -2.  0.  1.  1. -1.  0. -1.  1.]
[-1. -1. -2. -1.  0. -2.  1.  0. -1. -2.  0.  0. -2. -1.  1. -2.]
[-2.  0. -1. -1.  0. -1.  1.  0.  1. -1.  0. -2. -1.  0. -1. -2.]
[-1.  1.  

[ 1.  0. -2. -1.  1.  0.  1. -2. -2. -1.  1.  0.  0.  1. -2. -2.]
[ 0.  0. -2. -2.  0. -2.  1.  0.  1. -2. -2.  0. -1. -1.  0.  1.]
[-2.  1.  1.  1.  1.  1.  0. -2. -2. -2. -1. -1. -2. -1.  1.  1.]
[-2. -1. -2. -2. -2.  0.  0.  1.  1. -1.  1. -2. -1. -2. -1.  1.]
[-2.  1. -2.  1. -2.  1. -2.  0. -1. -1.  1. -2.  1.  1.  0. -1.]
[-2.  0.  1.  0. -2.  0. -2. -1. -1. -1. -2. -1. -1.  0. -2.  0.]
[ 1. -1.  0. -1.  0. -1.  1.  0. -1.  1. -1. -2. -2.  1. -2. -2.]
[ 1. -2.  0. -1. -2.  0.  1. -2. -1.  0. -2. -2.  1. -2.  1. -2.]
[-1.  0. -2. -2. -2.  1. -1. -1.  1. -2.  0. -1. -1. -2.  1. -2.]
[ 0. -1.  1.  1. -1. -2. -1.  1. -2.  0. -2. -2. -1.  0. -1.  1.]
[ 1.  1.  0. -2. -2. -2. -1.  1. -1. -1. -2. -2.  0. -2. -1.  0.]
[ 1.  1.  0.  1. -1.  0. -2.  1. -2. -2. -2. -1. -2.  0. -1.  1.]
[-2. -2. -1. -2. -1.  0.  0. -1. -2. -1. -2. -1.  1.  1.  1. -2.]
[ 0.  0.  1. -2. -1. -2.  1. -2. -1. -2.  1. -2. -1.  1. -1.  0.]
[-2.  1.  0.  1.  0. -2. -1. -2.  1.  0. -2.  0.  0.  1. -2. -2.]
[ 1.  1.  

[-2.  0. -1. -1.  1.  0. -1.  1.  0.  1.  0.  1.  1. -2.  1. -2.]
[ 0.  0.  0.  1.  0. -1.  0.  1.  0.  0. -1.  1. -2. -2.  1.  0.]
[ 1.  1.  1. -2. -1.  1. -1. -1. -2.  1.  0. -2.  1. -2.  0.  1.]
[ 1.  0. -1. -2.  1.  1. -1. -2. -2. -1. -2. -1. -2. -1. -1. -2.]
[ 0. -2.  1.  0.  1.  0.  0. -2. -1.  0. -2. -2. -2.  0. -1.  1.]
[ 1. -2. -1.  1.  1. -1. -2. -2. -1. -2. -2. -2. -1.  1. -2.  1.]
[-2.  1.  0. -1.  0.  0.  1. -1.  1. -2. -2.  0. -2.  1.  1. -2.]
[ 0.  1.  0. -1. -2.  1. -2. -2. -2.  1. -1.  0. -1.  1. -1. -2.]
[-2. -1. -1.  0.  1.  1. -1. -2. -1.  1. -1. -2.  1. -1.  0. -2.]
[ 1.  1. -1. -2.  1.  1.  1.  0.  1.  0.  0.  0. -1.  1. -1. -1.]
[ 0. -1. -2.  1.  1. -2. -2.  1. -1. -1. -1. -2.  0. -2.  1. -1.]
[-1.  1. -1. -1.  1.  0. -1. -2.  1. -2.  0. -2.  1. -1.  1.  1.]
[-1.  1. -2.  1. -2. -1.  0.  0.  1.  1. -2. -1.  1.  0. -1.  0.]
[-1. -2.  0.  0.  0.  1.  1.  1. -1.  1.  0. -1.  1. -1.  1. -2.]
[-2. -2.  0. -2.  1.  0. -1.  0.  0. -1.  0. -1.  1. -2.  1. -2.]
[-2. -1.  

[ 0. -2. -2. -1.  1. -2. -2. -2. -1.  0. -1.  0. -1. -1. -2.  0.]
[ 0.  0.  0.  1.  0.  0. -2.  0. -2. -1.  0. -2.  1.  1.  1.  0.]
[-1. -1. -2.  1. -1.  0.  1.  0.  1. -2.  0. -2. -1.  1. -1. -1.]
[-2.  1. -1.  1.  0. -2. -1. -2.  0.  1.  0. -2.  0. -2. -1.  0.]
[ 0.  0.  0. -2.  0.  1. -2.  1.  0.  0. -2.  0.  1. -2.  1.  1.]
[-2. -1. -2.  1. -2. -2. -2.  0.  1.  0. -1.  1. -2. -1.  1. -1.]
[-2.  0.  1. -1. -1.  1.  0. -1.  1. -1. -2.  0.  1. -1.  0. -1.]
[-1.  0. -2.  0. -2.  1.  1. -1.  0.  0.  0.  1. -1.  1.  0. -2.]
[-1. -2. -1. -2. -1.  0.  1.  0. -2. -2. -2.  1. -1. -1. -2.  0.]
[-1.  1. -2.  0.  0.  1. -2. -1.  0.  1.  1.  0.  0.  0.  1. -2.]
[ 0.  1.  1.  1. -1.  1.  0.  1. -2. -2.  0. -2. -1.  1.  0.  1.]
[-1.  1. -1.  1. -2. -2.  1.  0. -2.  0.  0. -2. -2. -2. -2.  1.]
[-1.  1. -2. -2.  0.  0. -2. -1.  1. -1. -2.  0. -2.  0. -1. -1.]
[ 0. -2. -2. -1. -1.  1. -1. -1. -1. -2.  1.  1. -1.  1. -2. -1.]
[-1.  1. -2. -2. -2. -2.  0. -2. -1.  1. -2. -2.  1.  1. -1.  1.]
[-1. -2.  

[ 1.  0.  0. -2.  1.  0. -1.  1. -1. -2.  0. -1. -2. -2.  1. -2.]
[-1.  0.  1. -2.  1.  1.  0.  1. -1.  1. -1. -1. -2.  1.  1. -2.]
[-2. -1.  0. -2. -1. -2. -2. -1. -1. -2. -1. -2.  0. -1.  0. -1.]
[ 0. -2. -1.  1.  0. -2. -2.  1.  0.  1. -2.  1. -1.  0.  0. -2.]
[-1.  0.  1.  0. -1. -2. -1. -2.  1. -1. -2.  1. -2.  1. -2. -1.]
[ 1.  1. -2. -2.  0. -2.  1. -1.  1. -2.  0.  1.  1. -1. -2. -2.]
[-1.  0. -1. -2. -1. -2.  0. -2.  0.  1. -1. -2.  0. -2.  1. -2.]
[ 1. -2. -2.  1.  1. -1.  1. -1.  1. -1. -2.  1. -1.  0.  0. -1.]
[-2.  0. -1. -2. -2.  0. -2. -2. -1.  1.  0. -2. -1.  1.  1. -1.]
[-1. -1. -1.  0.  0. -2.  0.  0. -1.  0. -2. -1. -1. -1. -2.  0.]
[-2.  0. -2. -1.  0.  1. -2.  0. -2. -1.  0. -2.  0.  1. -2. -2.]
[-2.  1. -1. -1. -2. -1.  0. -2. -2. -1. -2. -1.  1.  1.  0. -1.]
[ 1. -2. -1.  0.  0. -2. -2.  1.  0.  1.  1.  0. -1.  1.  1. -2.]
[ 1.  0.  0.  1. -2.  1.  0. -2. -2.  0.  1.  1. -2. -2.  1.  0.]
[ 1.  1. -2.  0.  1.  0. -2.  0. -1.  0.  1.  0.  0. -1.  1.  1.]
[ 1. -1.  

 37%|███▋      | 11/30 [16:00<27:12, 85.90s/it]

[ 0. -2. -1.  1. -2.  0.  0.  1.  1.  1. -2. -1. -1. -1.  1. -1.]
Training loss (for one batch) at step 0: 0.03645147383213043
Seen so far: 16 samples
[-1. -2. -2.  0.  0. -1.  0. -2. -2. -1.  1.  1. -1. -2.  0. -2.]
[-1.  0.  0. -1.  0. -2. -1.  0. -1.  1. -2.  1.  0.  0.  1. -1.]
[ 1.  0.  1. -2. -1.  1. -1. -1.  1.  1.  0. -2. -2. -1.  1. -2.]
[-2.  1. -1. -1.  0.  0. -2. -2. -2.  0. -2. -2.  0. -2. -1. -1.]
[ 1. -1. -1.  0. -2.  1. -2. -2.  1. -2. -1.  0.  0.  0. -1. -2.]
[-1. -2. -1. -1. -1.  0. -2. -1.  0. -1. -2. -1. -1.  1. -1.  0.]
[ 0.  0. -2.  1.  1.  0. -2. -1. -1.  1.  1. -2. -2. -2.  0.  1.]
[-2.  0.  0.  1.  1.  0.  0. -2.  0.  0.  1.  0.  0. -2.  0. -2.]
[-2.  0. -2. -2.  0. -2.  0.  1. -2.  0.  1. -1.  0.  1.  0. -1.]
[-1. -2.  0. -2.  1.  1.  1.  0. -2. -2. -2. -1.  1.  0. -2. -1.]
[ 0.  0. -1. -1.  0. -1.  1.  1.  1.  0.  1. -2. -2. -2.  1.  0.]
[ 1.  1. -2.  1.  0. -2. -2. -1.  1. -1.  1. -1.  1.  0. -2. -1.]
[ 0. -2. -2. -2. -1.  0.  1. -1.  1.  0.  1.  0. -1. -2. 

[-1. -2.  1.  1.  0. -2. -2. -2. -2.  1.  0.  0.  0.  1.  0. -1.]
[ 1. -1.  1. -2.  1.  1. -1.  0.  1.  1. -1.  0.  0. -2.  0.  0.]
[-1.  0. -2. -1.  1.  0. -1.  1.  1. -2.  1. -2. -2.  0. -2. -1.]
[ 0.  0.  0.  1. -1.  0.  0.  0. -1. -2.  1. -2.  0. -1.  1. -1.]
[ 0.  0.  0. -2.  0.  1. -1.  0.  0. -1.  0. -2. -1. -2.  1. -1.]
[ 1. -1. -2. -1. -1. -2.  0. -1.  0. -1.  0. -2. -2. -1.  0. -2.]
[-1.  0.  1. -2. -1.  0.  0.  1.  0.  0.  0. -2.  0.  0.  1.  1.]
[-2.  0.  0.  0.  1. -1.  1. -2.  1. -1.  0.  1. -1.  0. -2. -1.]
[-1. -2. -1. -2.  1. -2. -2.  1. -2. -2. -1.  0.  0. -2. -2.  1.]
[ 0. -2. -1.  0.  0. -2. -2.  0. -2.  1. -2. -1.  1.  1.  0.  0.]
[-1.  1. -1. -2. -2. -1. -1.  1. -1. -1. -1. -1.  1.  0. -2.  1.]
[-1.  1. -1.  0.  0. -1.  0.  0.  1.  1.  1.  0. -1.  1.  1.  0.]
[-1. -2.  0.  1.  1.  0. -1. -1.  0.  0.  1.  0.  1.  1. -2.  1.]
[ 0.  1.  0.  0.  1. -1.  0.  1.  0. -2. -1.  0. -2. -1. -1.  1.]
[-2.  0.  1. -2. -1. -2.  1.  1. -1. -1.  1. -2. -2. -1. -2.  1.]
[-2. -1. -

[-1. -2. -2.  1. -1.  0. -1. -1. -2. -2.  0. -1. -2. -2.  1. -2.]
[-1. -2.  0.  1. -2. -1.  0.  0. -2. -2.  1.  1. -2. -1. -1.  1.]
[-1. -1.  1. -2. -1. -1. -2.  0. -2. -2.  1. -1.  0. -1. -1.  1.]
[ 1.  0.  0.  1. -1.  0.  0.  0. -1.  1. -1.  1. -1.  1.  0. -2.]
[ 0. -2. -1. -1.  0. -2. -2. -2. -1.  0. -1.  0. -2. -2.  1.  0.]
[-1. -1.  1. -1. -1. -2.  0.  0.  1. -2.  0.  1. -1.  0.  1. -1.]
[ 1. -1.  1.  1. -2. -2.  1.  0. -1. -1.  1. -1.  1.  0.  0. -2.]
[-2.  1. -2. -2. -1.  1.  1. -2.  1. -2. -1.  1.  1. -2. -1.  0.]
[-2. -2. -2.  0. -1. -1.  1.  0. -2. -1.  1.  1. -1.  1.  1.  0.]
[ 1.  1. -2.  1.  1.  1. -2. -1.  0. -1.  1.  1.  1. -2.  1. -1.]
[-1. -1.  0.  0. -2. -2.  1. -2.  1. -1.  0.  0.  1. -1.  0. -2.]
[ 0.  1. -2.  0.  1.  1.  0.  0.  0. -2. -2. -1.  1. -1.  0. -1.]
[ 1. -1. -1. -2. -1.  0. -1.  0.  1.  0.  1. -2. -2. -1. -1. -2.]
[-2.  1.  0. -2. -1. -1. -2. -2.  0. -2. -1. -1.  1.  0.  1. -1.]
[ 0. -1.  1. -1. -2. -1. -1.  1. -1. -1. -2.  0.  1.  0.  0.  1.]
[ 0. -2.  

[-2. -1. -2.  1. -1.  0. -1. -1. -2. -1. -1.  0.  0.  1. -1.  0.]
[ 1. -1.  1. -2.  0.  1.  1.  0.  0. -2.  1.  0. -1. -2.  1. -2.]
[-1. -1.  0.  1.  1.  1.  1.  1. -2. -1. -2. -2.  0.  1. -1.  1.]
[-2.  0.  1. -1. -2.  1. -2.  0. -1. -2.  1. -2.  0.  1. -2. -2.]
[ 1.  1.  0.  1. -2.  1.  1. -1. -1. -1. -2. -1. -2. -1.  1. -2.]
[ 0. -1. -1.  1.  0. -1. -1. -2. -1. -2. -1. -2. -1. -2.  0.  1.]
[-1. -2.  0.  0. -1.  0. -1. -2.  1. -1.  1.  1.  1.  1. -2.  1.]
[-2.  0. -2. -1. -2.  1.  0. -1. -2.  1.  1.  0. -1. -1.  1.  0.]
[ 0. -1.  0.  0. -2.  0. -1.  1.  0. -1.  1.  0. -1. -1. -2.  0.]
[-1.  1. -1.  1. -1.  0. -1.  0.  1.  1.  1. -2. -2. -1. -1.  0.]
[-1. -1.  0. -1.  0.  1.  0.  0. -2. -2. -1. -1.  0.  0.  0.  0.]
[ 1. -1.  1. -1.  0.  0.  0. -1. -2. -1.  1. -1.  0.  0.  1. -1.]
[ 0. -2. -1.  0.  0. -1. -2.  0.  1.  1. -1. -2.  1. -2. -1.  1.]
[-2. -2. -1.  0. -1. -1.  0.  0.  1. -1.  1.  0.  0.  0.  1. -1.]
[ 1. -2. -1. -1.  1. -1. -2. -1. -2. -2. -1. -2.  0.  0. -1.  1.]
[ 0.  1. -

[-1.  1.  0. -1. -2. -1.  1.  0. -1. -2.  0.  1.  0.  1. -2. -2.]
[ 1. -1. -1. -1. -1. -2.  1.  1.  0.  1.  1.  1.  1. -1.  0. -1.]
[-2. -2. -2.  0.  1. -2.  1. -1.  1. -2. -1.  0.  0. -2. -1. -2.]
[-1.  1.  1.  1. -2. -2. -1.  0.  0.  0.  1.  0. -2. -2.  1. -2.]
[-2. -1. -2. -2.  0. -1.  1.  0.  0.  0.  1. -1.  0. -1. -2. -1.]
[-1. -1.  0. -1. -2. -2. -1.  0. -1.  0.  0. -2. -1.  1.  1.  0.]
[ 0.  1.  0.  1.  0.  0.  0.  1. -2.  1.  0. -2.  0.  1. -1. -2.]
[ 0. -2. -1. -2.  1.  1. -1. -1.  1. -1. -2. -1. -2. -1.  0.  0.]
[ 1. -2.  0.  0. -2. -2. -2.  1. -2. -1. -1. -2. -1. -1. -2. -1.]
[ 0.  0. -2. -1.  0.  1.  1.  0. -1.  1. -2.  1. -1. -2. -1.  0.]
[-1.  1. -1.  1. -2. -2.  1. -1.  0.  1. -1.  1. -1.  1. -1. -1.]
[-1. -1. -2. -1. -1.  1. -2. -2. -1.  0. -1.  1.  0.  1. -1. -2.]
[-1. -1.  1. -1.  1.  0.  1. -1. -1.  0. -2. -2. -1.  0. -2.  0.]
[-1. -1.  1. -2.  0.  1. -2. -2. -1.  0.  1.  1. -1.  0.  1.  1.]
[ 0. -1.  1. -1.  0.  1.  0.  0.  0.  0. -2.  0. -1. -1.  0.  0.]
[-2. -2. -

[-1.  1. -2.  0. -2.  1.  0.  1.  0.  1.  0.  1.  1. -2.  0. -1.]
[ 0.  1. -2.  0. -2. -1.  1. -1.  0.  1.  0.  0.  0.  1. -2.  1.]
[-1. -1. -1. -1. -2.  0.  1.  1. -1.  0.  0. -1.  0.  0. -2. -1.]
[-2.  1.  1. -2.  1. -1. -2.  0.  1. -2. -2.  1.  1. -1. -1. -2.]
[ 0. -1. -1.  1.  0. -2.  1.  1. -2.  1. -2. -2.  0.  0.  1.  0.]
[-1.  0.  1.  0.  0. -2. -1.  0.  0. -1.  0. -2. -1. -2. -2.  1.]
[-2.  0.  1. -1.  1. -2. -1.  0.  0.  0.  0.  0. -1. -1.  1.  1.]
[ 1. -2. -1.  1.  0.  0. -1. -1.  1. -1.  0. -2. -2. -1.  1. -2.]
[ 1.  1.  0. -2. -2. -2. -2. -1.  1.  0. -1.  0.  0.  1. -1. -1.]
[ 1. -1. -1.  1. -1. -1. -2.  0.  1. -2.  0. -2.  0.  1. -2. -1.]
[-2.  1.  1.  0.  0.  0. -2.  1.  1.  0. -1. -1. -2. -2. -2. -1.]
[ 1.  0.  1. -1. -2.  0. -1.  1.  1. -2. -1.  1.  1.  1.  1.  1.]
[ 0. -2.  0.  0. -2.  0. -2.  0. -1.  0.  1. -1.  1. -1. -1.  1.]
[ 0. -1.  1.  0. -1. -2. -1.  0.  1. -1. -2. -2.  1.  1. -1. -1.]
[-2. -1.  1.  1.  1. -1. -1.  1.  0. -2.  1.  0.  1. -1. -2.  1.]
[ 1. -2. -

[ 1. -1. -2. -2. -2.  1. -2.  0.  0.  0.  1. -1. -2. -2.  1. -2.]
[-2.  1. -1.  1. -1. -1. -2.  0.  1.  1.  1.  0. -1.  0. -1.  1.]
[-2. -1.  0.  0. -2. -2. -2. -1. -2. -1.  1.  0.  1.  1.  1. -1.]
[ 1.  1.  1.  1. -2. -2.  1.  1.  0. -2.  0.  1.  1. -2. -1.  1.]
[ 0.  1.  1.  1. -2.  0.  1. -2. -2.  0.  0. -1. -1.  1.  0. -1.]
[-2.  1.  1.  0.  0. -1.  0. -1. -1.  0. -2.  0. -1. -2.  0.  0.]
[-2.  0.  1. -1.  0.  0. -1.  0. -2.  0. -2.  0. -1.  1.  1. -1.]
[ 0.  0. -2.  1.  1.  0.  0. -1.  0. -1.  0. -1. -2. -1.  1.  0.]
[ 1.  1.  1. -2.  1.  1.  1. -2.  1. -1.  1.  0.  1. -1. -1. -1.]
[-2. -2. -1. -1. -2. -1.  0. -2.  0. -2.  0.  0.  0.  1. -2.  0.]
[ 0.  1. -1. -1.  0.  0. -1.  1.  1. -1. -2.  1.  1.  1.  0.  1.]
[-2.  1. -2. -2. -2. -1.  0.  0.  1.  0.  0. -2. -1. -1. -1. -2.]
[-2. -2.  1. -1.  0.  0.  0. -2.  0.  0. -2. -2. -2.  0.  0.  1.]
[ 0.  1. -1.  0.  1. -2.  1.  1.  1. -1. -2. -1.  0.  1.  1.  0.]
[-1. -1. -1.  1. -1.  0.  0.  0. -2. -1.  1.  0.  0. -1.  0.  1.]
[-1.  0.  

[ 0. -1.  0. -1.  1.  1.  1. -2. -1. -1. -2. -1.  1.  0.  0. -1.]
[-2. -2. -2. -1. -2. -1. -1. -2.  1. -2.  0.  1.  1. -2. -2.  1.]
[ 1.  0.  1. -1. -1. -1.  1. -1. -1.  0. -2.  1.  0. -1.  0. -1.]
[-2.  1.  0. -1.  0.  0.  1. -2.  1. -1.  0. -2.  1. -1. -1.  1.]
[ 0. -2.  0. -1. -1.  0. -2. -2.  1.  0.  1. -2. -1. -2.  1.  1.]
[-1.  0.  0. -1. -1.  0. -2.  1.  1.  0. -2. -2.  1.  1. -1.  0.]
[ 1. -1.  1. -1.  1.  1. -2.  0. -2.  0. -2. -1.  0. -1. -1. -2.]
[ 1. -2.  1.  1.  0. -1. -2. -1.  0.  0. -2. -2. -1.  1.  1. -2.]
[-2.  0.  1. -2. -1.  0.  0.  0.  1. -1. -1. -1.  0. -2. -1.  0.]
[ 0.  0.  0. -1. -1.  1. -1.  1. -2. -1. -1. -2. -1.  1.  0.  1.]
[-1. -1.  1. -2.  0. -1. -2. -2. -1. -2.  1.  1. -2.  1. -1.  0.]
[-2. -1. -2. -2. -2.  1. -2.  1.  0.  0.  1. -2.  0. -2. -2. -2.]
[ 1.  0. -1. -1. -1.  0.  0.  1. -1.  0. -1.  0.  0.  1.  0.  1.]
[ 1. -2. -2.  1. -2.  0. -1.  1. -2. -2.  1. -2.  0.  0.  0.  1.]
[-2.  1.  0. -2.  1. -1. -2. -1.  1.  1. -1.  0.  0.  0. -2.  0.]
[-1. -1.  

[-2.  1.  1.  1.  1. -1. -1. -2.  0.  0.  1. -2.  0. -2.  1. -2.]
[-2.  0.  0.  1.  1.  0.  0.  0. -2.  1. -2. -1. -2.  1.  0. -2.]
[ 1.  0.  1.  1. -1.  1. -2.  0.  0. -1. -2. -1.  1.  1. -2. -2.]
[-1.  0.  1.  1.  0.  0. -2. -2. -2.  0.  0.  1.  1. -2.  0.  1.]
[ 1. -1.  1. -1. -1.  0. -2.  1. -1.  0. -2.  0. -1.  1.  1.  1.]
[-2. -1. -1. -2.  1. -2. -1. -2.  0. -2.  0.  0. -1. -1. -1.  0.]
[ 0. -2. -2. -2. -1.  1.  1. -1.  0. -1. -1.  0. -1.  0.  0.  0.]
[ 1.  0.  0.  1. -1.  1.  1.  0.  1. -1.  0. -1. -2.  1. -2. -2.]
[-1. -2.  1. -1. -2.  1.  1. -1.  0. -1.  0.  0.  1.  1. -2.  1.]
[ 1. -2.  0. -1.  1. -2.  0. -2. -1. -2.  0. -1.  1. -2. -1.  0.]
[ 1. -1.  0.  1.  0. -1.  1. -1. -1.  0.  0.  1.  1. -2.  1.  0.]
[ 0.  0. -2.  1.  1.  1.  0. -2.  1.  1.  1. -2. -2. -1. -1. -2.]
[-1.  0. -2. -1. -2. -2. -2. -1.  1.  0. -2.  0. -2.  1. -2. -2.]
[-1.  0. -2.  1. -1. -2.  0.  1.  1.  0. -1.  1.  0. -1.  0.  0.]
[-2. -1. -1.  0. -2.  1. -1. -2.  1. -1. -2.  0.  0.  0. -1.  1.]
[-1. -1.  

 40%|████      | 12/30 [17:25<25:43, 85.75s/it]

[-2.  1. -1.  1.  0. -2. -2.  0.  1. -2. -1. -1.  1. -2. -2. -1.]
Training loss (for one batch) at step 0: 0.029198456555604935
Seen so far: 16 samples
[-1.  0.  1.  1. -1. -2.  0. -1. -2.  1.  0. -2.  1.  0. -2.  1.]
[-1. -1.  1. -1.  0.  0. -2. -1.  1.  1. -2. -2.  1.  0. -2. -2.]
[-1. -2. -1. -1.  1. -2. -2. -1. -2. -1.  0.  0.  1. -2.  0. -1.]
[ 1.  0. -2. -2.  1.  0.  1.  1. -1. -1.  0.  0.  0.  1. -1. -1.]
[-2.  1. -1. -2.  1. -2.  1.  1. -2.  1. -2.  0. -2. -2.  0.  1.]
[-2.  0.  0. -1. -1. -2.  1.  1. -1.  0. -2.  1.  0.  0.  1. -1.]
[ 1.  0. -2.  1. -1.  1. -1. -2. -1. -2.  1.  1.  1.  0.  0. -1.]
[-2.  1. -1. -2. -1.  0.  1. -2.  0.  1.  1.  1. -1. -2. -2.  1.]
[ 1. -2. -2. -2. -2. -1.  1.  1.  0. -2. -1.  1. -2.  0.  1. -2.]
[ 1. -1.  1. -2. -1. -2. -2. -2.  0. -1. -1. -1. -1. -2. -2.  1.]
[-2. -2.  1.  0. -2. -2. -1. -2. -2.  0. -1.  0.  0.  1. -1. -1.]
[ 1. -2. -2. -1.  1. -2. -1.  1.  0.  1.  0. -2. -1. -2.  0.  1.]
[ 0. -1. -2. -2. -2.  1. -1. -1.  0. -1. -1. -1.  1. -1.

[-2. -1.  1. -1. -1. -2.  1.  1. -2.  1.  1. -2. -1.  1.  0.  0.]
[-2. -1. -2.  0. -1. -1. -2.  1. -2.  0.  0.  0. -1.  0.  0. -1.]
[ 0. -2. -1.  1.  0. -1. -2. -1.  0. -2. -2. -2.  1.  0.  1.  0.]
[ 0.  1.  1. -2. -1.  1.  0.  0.  1. -1.  0.  1.  0.  0. -2.  0.]
[-2.  1. -2. -1.  1. -2.  1. -2.  0. -1. -1. -2. -2. -2. -1. -2.]
[-2.  1.  0. -1. -1.  0.  0.  0.  0. -2. -2.  1.  0. -2. -1. -2.]
[ 1.  1.  1. -1. -1.  1.  0. -1. -2. -1. -1.  0. -1.  0. -2. -2.]
[ 1.  0. -2. -1. -1.  1. -2. -2. -1.  1. -2. -1.  1.  0. -1. -1.]
[-1.  1. -1. -1. -2.  0. -1. -1. -2. -2.  0. -1.  1.  1.  0. -1.]
[-1.  0.  0.  0. -2. -2. -2. -2.  0. -2.  1.  0. -2. -2.  1.  1.]
[ 1. -2. -1. -1. -2.  0. -2. -2.  1.  0.  0.  1. -1. -2.  1. -2.]
[ 0. -2.  0. -2. -2.  1.  0. -2. -1. -2. -2.  1.  0. -2. -1.  1.]
[-1. -2. -2. -2. -1.  0. -1. -2. -1. -1. -1. -1.  0. -2.  0.  1.]
[-2.  0.  0.  0.  0.  1. -2.  1. -2.  1.  1.  1.  0.  0.  0.  0.]
[-1.  0. -1.  0. -2. -1. -1.  0.  0. -2.  1. -1.  0. -1.  1. -1.]
[ 1. -2. -

[-1. -2.  1.  1. -2. -2. -1. -2. -2.  1.  1.  1.  1. -1. -1. -1.]
[-2. -1. -1.  1.  1.  1.  1.  1. -2.  1. -2.  1.  0. -1. -1. -1.]
[-2.  1.  1. -1. -1.  0.  1. -2. -2.  1.  1. -1.  1. -1.  1.  1.]
[ 1. -2. -1.  1.  0. -2.  0. -2.  0. -2. -1.  0.  0. -1. -2. -2.]
[ 1. -2.  1. -2.  1.  1.  0. -2. -2.  0.  1.  0.  0. -2. -2. -1.]
[-1. -2. -1. -1. -2. -1. -2. -2. -1. -1.  0. -2. -1.  0.  1. -1.]
[-2. -2. -2. -2. -2. -2. -2. -2. -1.  1.  0. -2.  1. -2. -1.  1.]
[-1.  1. -1. -1. -2.  0.  0.  1. -2.  0. -2. -2. -2. -2.  0.  0.]
[-2. -1. -2.  1.  0.  1. -1.  0. -1.  0.  1. -2. -2. -1. -1. -2.]
[ 0.  1. -2. -2.  1. -2.  0. -2. -1.  0. -1.  0. -2.  1. -2.  1.]
[ 1. -2. -2. -1. -2.  1.  0.  0. -1. -2.  1.  1.  1. -2. -2.  1.]
[-1. -2.  0. -1. -1. -2.  1. -1.  0. -2.  1.  1. -1.  1.  0. -2.]
[-1. -1.  0. -2.  1.  1. -2. -2. -1.  0. -1. -2.  1. -2. -2.  0.]
[ 1.  0.  0. -2.  1. -2. -1. -2. -2.  0. -2. -2.  1.  0. -1.  1.]
[-1. -2. -2.  1.  1.  1. -1.  0. -1. -1. -2. -1. -2. -2. -1.  1.]
[ 1.  0. -

[ 1. -1. -1. -1.  0. -1. -2. -2. -1. -1.  1. -2.  1. -1. -1.  0.]
[ 1. -1.  0.  0.  1.  1. -1. -1.  0. -2.  0. -2.  1.  0.  1.  0.]
[-1.  0.  1. -2.  1. -2. -2. -2. -1.  0.  1.  1. -1.  0. -1. -2.]
[-1.  0. -2. -2.  1.  1. -2.  0.  0.  0. -2. -1.  1.  0.  0.  0.]
[ 1. -1.  0. -1.  1.  0. -1. -2.  0.  1. -2.  0. -1.  1. -2.  1.]
[ 0. -2.  1.  1. -2. -2.  0.  1.  0.  0.  0. -2.  1. -2.  0.  0.]
[ 0. -2.  0.  1. -2. -2.  1.  1.  0.  1.  1.  1. -2. -2.  0. -1.]
[ 1. -2.  1. -1.  1. -1. -2.  0. -2. -2.  0. -2.  1. -2.  1.  0.]
[-1.  0. -1. -2. -1.  0.  0.  0. -1. -2.  0.  1. -1. -2.  1.  1.]
[-1. -2.  0.  0. -2. -2.  0.  1.  0.  1.  0.  0.  0.  1.  1.  0.]
[ 1. -2. -2.  1.  1.  1.  0. -2.  0. -2. -1.  1.  1.  0.  1.  0.]
[-1. -1.  0. -1.  0.  0.  0.  1.  0. -2.  0. -2.  1. -1.  0. -2.]
[-2.  0.  1.  0.  1. -2.  0. -1. -2.  0. -1. -2. -1. -2. -1.  1.]
[ 1. -2.  1. -1.  1.  1. -2. -2. -2.  1. -2. -2. -2. -1. -2. -1.]
[-2. -2. -1.  1. -1. -1. -1. -2.  0.  0. -1.  1. -1.  0.  1. -2.]
[-1. -2. -

[-1.  1. -2. -1.  1. -1.  0. -2. -1. -1. -1. -1. -2. -2.  1.  0.]
[-1.  1.  0. -1. -2. -1.  0. -1. -2.  1.  0.  0.  1.  0.  0. -2.]
[ 0. -2. -2.  0. -1.  1.  0.  0.  0. -2. -1.  1.  0.  1. -1. -1.]
[-1.  1. -1.  0.  1. -1. -1. -1. -2. -1.  0. -1. -1. -2. -1. -2.]
[-1.  0.  0. -2.  0. -1. -1.  1. -1. -2. -1.  0. -2.  1. -1.  0.]
[-2. -1.  0.  1. -2.  1. -2. -1.  1.  0. -1.  0. -2. -1. -2.  1.]
[-2.  0.  1.  0.  0.  1.  1.  0. -2. -1.  1. -2. -2.  0.  0. -1.]
[ 0. -2. -1.  1.  0. -1. -2.  0. -2. -2. -1. -2.  0.  1. -1. -1.]
[-1. -2. -2. -1. -2.  1.  1.  0.  1. -1. -2. -1.  1.  0. -1. -1.]
[-2.  1.  1. -1.  0. -2. -1. -2. -2. -1. -2. -1. -2.  1.  0.  0.]
[-2. -2. -2. -2. -1. -2. -2. -2. -1.  0.  1.  1. -1. -1. -1.  0.]
[ 0.  1.  1.  0.  1.  1. -2. -2.  0. -1. -2.  0. -1.  1. -2.  1.]
[ 1. -1.  1.  1. -1. -1. -1.  1. -2. -1.  1.  0.  1.  0.  0. -1.]
[-1.  0.  0.  1. -2. -1. -2. -2. -1. -1.  0. -2.  1. -2.  1. -1.]
[ 0. -2.  1.  0. -2. -1. -2. -2. -2.  0. -1. -1. -1. -1. -2. -2.]
[-1.  0. -

[-2. -1. -1.  0.  1. -2. -1.  1.  0.  1. -2. -2. -1.  0.  0.  0.]
[-2.  0. -2. -2. -1. -2.  1.  1. -2.  1. -2.  0.  0. -1. -1.  1.]
[ 0.  1. -2. -1. -2. -1. -1. -1.  0.  1. -2.  0.  0.  1. -2.  1.]
[ 1.  0. -2. -1.  0.  0.  1. -1. -1.  1. -2. -1. -1. -1. -2.  0.]
[-2.  1. -1.  1. -2. -2. -2. -2.  1.  1. -2.  1.  1. -1. -1.  1.]
[ 0. -2.  1. -1. -1. -2.  1. -2. -2.  0.  1.  1. -2. -1. -1.  1.]
[ 0.  1. -1. -1.  1.  0. -1.  0.  0.  1. -1. -1.  0. -1. -1.  0.]
[-1. -2.  0. -2.  0.  0. -2.  0.  1. -2.  0. -2.  0.  1.  1. -1.]
[ 0. -1. -1.  1. -2. -1.  1. -2.  1.  0. -1. -2. -2. -1. -1. -2.]
[-2.  1.  1. -1.  1.  0. -2. -2. -2. -2. -2. -2. -1.  1. -2. -2.]
[-1.  0. -2. -2. -2.  0.  0. -2. -1.  1. -1. -1.  1. -2. -2.  0.]
[ 0.  0. -2. -2. -1.  1.  1.  0.  1.  1. -2.  0.  0. -2. -1. -1.]
[ 1.  1.  1. -2.  0. -1.  1.  0. -1. -2.  1.  0.  1.  0. -2.  0.]
[ 1.  0.  0. -2.  0.  1. -2.  1. -1. -1. -2.  1. -2.  1. -1.  0.]
[ 1.  0. -2. -2.  1. -2.  1.  0. -1.  1.  0.  1. -1. -1.  1.  1.]
[ 0.  0. -

[-2.  0. -1. -2.  0. -1.  0. -1.  0. -2. -2. -2. -1.  1.  0.  1.]
[ 0. -1. -2. -1. -1. -1.  1. -1.  0.  1. -1. -1.  0. -1.  0. -1.]
[-1. -1.  0. -2.  1.  1.  0. -1.  1. -1. -2. -1.  0.  1. -1.  0.]
[-1. -1. -2. -1.  0. -1.  0. -1. -1. -2. -1. -1. -1.  1. -2.  1.]
[ 0.  1.  1. -2. -2. -2. -2. -1. -2.  1.  1. -1.  0. -2.  0.  0.]
[ 1.  1.  1.  0.  1.  0. -2.  0. -1. -1.  1. -2.  0. -2. -2.  1.]
[-1.  1. -2.  0.  1.  0.  1.  1.  0.  1. -1. -2. -1. -2. -2. -1.]
[ 1. -1. -1. -1. -2. -2.  0. -1.  1. -1.  0. -1. -1. -1.  1. -1.]
[ 1. -1.  1. -2.  1. -1.  1.  1.  0. -2. -2. -2.  0. -2. -2. -2.]
[ 0.  1. -2.  1.  1. -1.  1. -2. -1.  1. -2. -1.  0. -2.  0. -2.]
[-1. -1.  0. -1.  0. -1.  0. -2.  1. -1.  1.  0. -2. -2.  1.  0.]
[ 0.  1.  1. -2. -1.  0.  0.  1. -2. -1. -2.  1.  1. -1. -2. -1.]
[-1. -1. -1. -1. -2. -2.  1.  0.  0.  0.  0. -1.  0.  1.  0.  1.]
[ 1. -1.  1.  1. -1. -1.  1.  0. -2.  0.  0.  1. -2.  0.  0. -2.]
[-1. -1. -2. -2. -1. -2. -2.  1.  1.  0.  0.  1.  1. -1.  0. -1.]
[-1. -2.  

[ 0.  1.  1.  1.  0.  0.  0.  1. -2. -1.  1.  0. -1.  0. -1. -2.]
[-2. -2. -1.  0. -1.  1. -1. -2.  0.  1.  1. -1. -2. -1. -2.  1.]
[ 0.  0. -2.  0.  0. -1. -2.  1. -1. -2.  1.  0.  1. -1.  1. -1.]
[ 1. -2. -1. -2. -2. -2.  0.  1.  1.  0.  1. -2.  0.  1. -1.  1.]
[-2. -1.  0.  0.  1. -1. -2.  0.  0.  0. -2.  0.  0.  1. -1. -2.]
[ 1.  0.  0.  1. -1. -1.  1. -2. -1. -2. -2. -2.  0.  1. -2.  1.]
[-1. -2. -2. -1.  0. -1. -2. -2. -1. -2. -2.  1.  0. -2.  1. -1.]
[ 0. -1.  1. -1. -1.  0. -1.  1. -1.  1.  0.  0.  1.  1. -1.  1.]
[-2.  1. -1.  1.  0. -1.  0.  1. -2.  0.  1. -1.  1. -2. -1.  1.]
[ 0. -2.  1. -2. -1. -2.  1.  0. -2. -2.  1.  1. -2. -1. -1. -2.]
[-1. -2. -2.  0.  1. -1. -2. -2. -1.  0.  1. -1.  1.  0.  1.  1.]
[ 0.  1.  0. -1. -2.  0.  0.  0.  0. -2. -1.  0.  0. -2.  1.  1.]
[-2.  1.  0. -1. -2. -1.  0.  1. -1. -1.  0. -1. -1.  1. -1. -2.]
[-1.  0. -1. -1.  0.  1. -1.  1.  1.  0. -2. -1. -1. -2.  1.  1.]
[ 0. -2. -1. -1.  0. -2.  0. -1.  1.  0.  0.  0. -1.  0.  0.  0.]
[-2.  0.  

[-2.  1. -1. -1.  1. -2. -1.  0.  1. -2.  0.  0.  0. -2. -2.  1.]
[ 1.  1.  1. -2.  1.  1. -2. -1.  1.  1. -1.  1. -1. -1. -1. -1.]
[-1.  1.  1.  1.  0.  0. -1. -2.  1. -2. -2. -2. -1.  0.  0.  0.]
[-2.  1. -1. -1. -1.  0.  1.  0. -2.  0.  0.  1.  0. -1. -2. -1.]
[ 0.  0. -2.  0.  1.  0.  0. -1.  0.  0.  0.  1. -2. -1.  0. -2.]
[-2. -1.  0.  0. -2.  0.  0. -1.  1.  1.  1.  0. -1.  0.  0.  1.]
[-2.  0. -2.  1. -2. -2.  0. -1.  0. -1.  1.  1. -1.  1.  0.  0.]
[ 0.  1. -2. -1. -2.  0.  0.  1.  1. -1. -2. -1.  1.  0. -2. -1.]
[ 0. -2.  1. -2. -1.  0. -1. -2. -1. -1.  0. -2.  1. -2.  0. -1.]
[-1.  0. -2.  0. -2.  0. -2. -2. -1. -1. -1. -1. -1. -2. -2. -2.]
[ 0. -2.  1.  1. -1.  1.  1. -1.  1.  0. -1.  1. -2.  1.  0.  1.]
[-1.  0.  1.  0.  0.  0. -2.  1. -2.  1.  1. -2. -1.  0. -2.  0.]
[-2.  0. -2.  1. -1. -2.  1.  1. -2. -1.  0. -1.  1. -1. -1.  0.]
[-2.  1. -2. -2.  0. -2.  0. -1.  1. -1. -2.  1.  0. -1. -1.  0.]
[-2. -2. -2.  0.  1.  0. -1. -1.  1. -1. -2.  1.  1. -2. -1.  1.]
[ 0.  0. -

 43%|████▎     | 13/30 [18:51<24:18, 85.82s/it]

[ 1. -1. -2.  1. -1.  1. -1.  1. -2.  0.  0. -1. -2. -2. -2.  1.]
Training loss (for one batch) at step 0: 0.02818949893116951
Seen so far: 16 samples
[-2.  1.  1.  1.  0.  1.  0. -1. -1. -2. -2.  0. -2.  0.  1. -2.]
[ 0. -2.  0.  1.  0.  1.  1. -1.  0.  0. -1. -1.  1. -1.  1.  1.]
[ 0. -2.  0.  1.  1.  0. -2. -2.  0. -1.  1.  1.  1.  0.  1.  1.]
[-2.  0.  1. -1. -2.  0.  1.  0.  1. -1. -1.  1.  0.  0.  1.  1.]
[ 1. -2.  0.  0. -2.  1. -2. -1.  0.  1. -2.  1. -2. -1.  0. -1.]
[-1. -1.  1. -2. -2. -2.  0. -1.  0.  0. -1. -1.  0. -2.  1.  0.]
[ 0.  0. -2.  1.  0.  0.  0. -1.  0. -1.  0.  0.  1. -1.  1.  0.]
[ 0. -2. -2. -1.  1. -1.  1. -2. -1.  1. -1. -1. -2. -1. -1. -1.]
[-2.  0.  1. -1.  0.  0.  1.  1. -2. -1.  1.  0.  0. -1. -2. -1.]
[ 1. -1. -1. -1. -2.  0.  0.  1.  0. -1.  0.  1. -2.  1. -1. -1.]
[ 0. -1. -2. -2.  0.  1.  0.  1. -2. -1. -2.  0.  1. -1.  0. -1.]
[ 0.  1.  0. -2. -1.  0. -1. -1.  1. -1.  0. -2. -2.  1.  1.  0.]
[ 1. -1.  1. -1. -1. -1.  1.  1.  1. -2.  1.  0.  1. -2. 

[-1. -1. -1. -1. -2.  1. -1. -1. -2. -1.  1. -2. -2.  0.  0. -2.]
[-2. -2.  1.  0. -2.  0. -2.  1.  0.  1. -2.  0.  0.  0. -2. -1.]
[-2. -2.  0. -2.  1. -1.  1.  0. -2.  0. -1.  1. -2.  0.  0.  1.]
[ 1.  0. -2.  1.  1. -2. -1. -2.  0.  1. -2.  1.  0. -2.  1.  0.]
[ 1. -2.  0.  1.  0. -1. -1.  0.  1. -1.  1.  0.  0.  0.  0.  0.]
[ 0. -2.  1. -2. -2. -2.  1.  1.  1. -1.  1. -2.  1. -2. -1. -2.]
[ 1. -2.  0.  1. -1. -1. -2. -2. -2.  1.  1. -2. -1.  1.  1.  0.]
[ 0. -1. -2. -1. -1.  1.  1. -1. -1. -2.  0. -2. -2.  0.  0. -2.]
[ 0.  0.  1.  1. -1.  1.  1. -1.  0. -2. -1.  0.  0.  0.  0. -2.]
[-2.  0. -2. -1.  1. -2. -1. -1. -2.  0.  1. -1.  1.  1.  1.  1.]
[-1. -1.  1. -2.  0. -1.  0.  1.  1.  0. -2.  0. -1. -2. -1. -2.]
[-2.  1. -2.  0.  1. -1. -2. -2. -1.  0.  1.  1. -1. -1. -1.  1.]
[-2. -1.  0.  0. -2. -2.  1. -1.  0. -2.  0.  0. -2.  1.  1. -1.]
[ 1. -2.  0.  0.  0.  1. -1.  0.  1.  1. -2. -2. -2.  0. -1.  1.]
[-2.  1.  0.  1.  0. -1. -2. -1.  1. -1. -1.  0. -1.  1.  1.  1.]
[ 0. -1. -

[ 1.  1. -2. -1. -2. -2.  0. -1. -2. -1.  0. -2.  0. -1. -1.  0.]
[-1.  0.  1.  1.  0.  0. -1.  1. -2. -2. -1. -2. -2.  1.  0.  1.]
[ 0.  1. -2. -2.  1. -1.  1.  0.  0. -1. -1.  1.  1.  1. -1.  0.]
[ 1.  1.  1.  1.  1. -2.  1.  0.  1.  0. -1.  0. -1.  0.  1.  0.]
[ 0. -2. -2.  0. -2. -2. -1.  1. -1.  1.  0. -1. -2. -1. -1.  1.]
[ 1.  0. -2.  0. -2.  0.  1.  1.  0.  0.  1.  1. -1. -2. -1. -1.]
[-2. -1.  1. -1.  1.  0. -1. -2.  1.  1. -2. -2.  0. -2. -1. -2.]
[-2. -1.  1. -2.  1.  1.  0. -1.  0. -1. -1. -1.  0.  1. -1. -1.]
[ 1. -2.  1.  1.  1.  0.  1. -2.  1.  0. -2.  0. -1.  1. -2. -1.]
[-2.  1. -2.  1. -2. -2. -2.  1. -2.  0. -1.  0. -2. -1.  1.  1.]
[-1. -1.  1. -1.  0.  0.  1. -1.  1.  1.  1. -2.  0.  1.  1. -2.]
[ 0.  1. -1. -1.  0. -1. -1.  0. -1. -1. -1. -1.  0.  0. -1. -1.]
[ 0. -2.  0.  0.  1.  1.  1.  1. -1. -2. -2.  1.  0. -2.  1.  0.]
[ 1.  0.  1.  0.  0.  1.  1. -1.  0.  0.  1. -2.  1. -1. -2. -1.]
[ 1. -2.  0. -2. -1.  0.  1. -2.  1.  1.  0.  1.  1. -1. -2.  1.]
[ 0. -1. -

[-2.  0. -1.  1.  1. -1.  0.  1.  0. -2.  0.  0. -2.  1.  1.  0.]
[ 1. -2.  1.  0.  1. -2.  0.  1. -1. -2. -1. -2. -2.  0. -1. -1.]
[-2.  0.  1.  1.  0. -2. -1.  0. -2.  1. -2. -1.  1. -1. -1.  0.]
[-1.  0.  1.  1.  1. -1. -2. -2.  0.  0. -1. -1. -1. -1.  0.  1.]
[ 1. -1.  0. -2.  0.  0.  1. -2.  0.  1. -2. -2. -2. -2.  1. -2.]
[-2.  0.  1. -1.  0. -2.  1. -1. -2. -1.  0. -2.  1. -1.  0.  0.]
[ 0.  1. -1.  0. -1.  1. -1.  1. -1.  1.  0. -1.  0.  0.  1. -1.]
[-2. -1.  1. -1.  1.  1.  0. -1.  0. -1. -2. -1. -2.  1.  0. -1.]
[-1.  1. -2. -2. -1.  0.  0. -2. -2.  0.  1. -2. -2. -2. -2. -2.]
[-1. -1.  1. -2.  0. -2. -1.  1. -2. -1. -1. -2.  1. -2. -1. -2.]
[ 1. -1. -2. -1. -1.  1. -1.  1. -2. -2. -2. -1.  0. -2.  1. -1.]
[-1.  0. -1. -1.  1. -1. -1.  1. -2. -2. -2.  1. -2. -1.  1.  1.]
[-1. -1.  1. -1. -1. -1. -1.  1.  0.  1. -1. -1.  1. -1.  1. -2.]
[-2.  1.  0. -1. -2.  0.  0. -2.  0.  1.  0.  0. -1. -1. -1.  0.]
[ 1.  1.  1.  1.  1. -2.  1.  0. -2. -1.  0.  1. -1.  0.  1. -2.]
[-2.  1. -

[-1.  0. -2.  0.  1. -2. -1. -2.  1.  0. -1. -2. -1. -2.  1. -2.]
[-2.  0. -2. -1.  0.  1. -2.  1.  0. -1. -2. -2. -2.  0. -2. -2.]
[ 1. -1. -1. -2. -1.  0. -1.  1.  1.  0. -2. -2.  0.  1.  1.  1.]
[ 0. -2.  0. -1. -1.  0. -2. -1.  0. -2.  1. -2.  0. -1. -1. -2.]
[ 0. -2. -1.  0.  0. -2.  0. -1.  0. -1.  0. -2. -2. -2.  1.  1.]
[ 1. -2. -2.  0. -1.  1. -2. -2. -2.  0. -2. -1. -1.  1. -1. -1.]
[ 1.  1. -2. -1.  0. -1. -1.  1.  0.  0.  0. -1.  0. -2. -1. -1.]
[ 0. -1.  1.  1. -1.  0.  0. -2. -1. -1.  0.  0.  0. -1.  0. -1.]
[ 1.  1.  0. -1.  0. -1.  0. -1.  0. -2. -1.  0.  0. -1. -1.  1.]
[ 0.  0. -1. -2. -2.  0. -2. -2. -1.  0.  0. -2. -1. -2.  0. -2.]
[-2.  0.  0.  1.  0. -1.  1. -1. -1.  0. -1.  0.  1. -1. -1. -2.]
[ 1. -2.  1.  1. -1. -2. -1.  1. -1.  0.  1. -2. -2.  0.  0. -1.]
[ 1.  0.  1. -1.  0.  1.  1. -1.  0.  1. -2. -2. -2. -2. -2. -2.]
[-2. -2.  0. -1.  0.  1.  0.  0.  0.  0.  1.  0. -2. -1.  1.  1.]
[-2.  0.  0. -1. -1.  0.  0.  1.  1.  0.  0. -1.  1. -2.  0. -2.]
[ 0.  1. -

[-2. -1.  0. -2.  1.  0.  1.  1.  1. -1. -2. -2.  0. -1.  0. -1.]
[-2.  1.  0.  0.  0. -2. -1.  1.  0. -1. -1. -2. -1. -1.  0. -2.]
[-1.  0. -1. -1. -1. -2.  1.  0. -2.  1.  1. -2.  0.  0.  0. -2.]
[ 0.  0. -2.  1. -2.  1. -2.  1. -2.  0. -1.  1.  0.  1.  0. -2.]
[-2. -1.  0.  1. -2.  0. -1.  0. -1. -2. -1. -2. -2.  0. -1. -1.]
[-2.  1.  0. -2. -2.  1.  0.  1. -2.  0.  1. -1. -1.  1.  0.  0.]
[-1.  1.  0. -2. -1.  0. -2.  0.  1.  1. -2. -1. -2. -1.  0.  1.]
[-2.  0.  1.  1.  0. -1. -2.  0. -2. -2. -1.  1. -2. -1.  1.  0.]
[ 1. -1.  0.  1. -2.  1. -1. -1. -1.  1. -2.  0.  1.  1.  1. -2.]
[ 0.  1.  1.  0. -1.  1.  0.  0. -2.  0.  0. -1. -1. -2.  0. -1.]
[-2. -1. -2. -2.  0.  0.  0.  1.  1. -2.  1. -1.  1.  0.  1.  0.]
[-2. -2.  0. -1. -2.  0. -1. -1. -2.  1. -2.  0. -2.  0. -1. -2.]
[-1. -2.  0. -1.  1.  1. -1.  1. -1.  1.  0. -1. -1.  0. -2.  0.]
[ 1.  1. -2. -2.  1.  1. -2.  0. -2.  0.  1.  0. -1. -1. -2.  0.]
[-2.  1. -1. -1. -1.  0.  1. -1. -1. -2. -1.  1.  1. -1.  1. -1.]
[ 0.  0.  

[ 1.  0.  0.  1. -2.  0.  0. -2.  1.  0. -2. -2.  0. -1.  0. -2.]
[-2. -1.  0.  0.  0.  1. -1. -1.  1. -2.  0.  1.  0.  1.  0.  1.]
[-2. -2. -1.  0. -1.  1.  0.  1. -2.  1. -2.  0.  0. -2. -1.  1.]
[ 1.  1.  1.  1.  1.  0.  0. -2.  0. -2. -1. -2.  1.  0.  1. -2.]
[ 1.  1.  1. -2.  0.  1. -2.  1.  1.  1.  1. -2. -1.  1.  0.  1.]
[ 0. -1. -1.  1.  1.  0. -1. -1.  1.  0.  1. -2.  0. -1.  1.  1.]
[ 0. -2. -1.  1.  1.  1. -1. -2. -1. -2.  0.  0.  0. -2. -2.  0.]
[-2.  1.  1. -1.  1.  0. -2.  0. -2.  1. -2. -2.  0. -1. -2.  0.]
[ 0. -2. -1.  1. -1. -2. -2. -1. -2. -1.  0.  1. -2. -1. -2. -2.]
[ 1.  0.  1.  0. -1.  0. -1.  1. -1. -2. -2.  0.  1.  0. -2.  1.]
[-1. -1.  0.  0. -1.  0.  1.  1.  1. -1. -2. -1.  0.  1.  0.  0.]
[ 1. -2. -1.  1. -1.  1. -2. -1. -1.  0.  0.  1.  1.  1.  0. -1.]
[-2. -1.  1. -2. -2. -2. -2.  1. -1.  0.  1. -2.  0. -1. -2.  1.]
[ 0.  0.  0.  1.  0. -1. -1. -2. -2.  1. -2. -1. -2. -2. -1. -1.]
[ 1.  1. -2.  0. -2.  0. -2. -2.  0. -1. -1.  0.  1. -1. -1. -2.]
[-1. -2. -

[-1. -1.  1.  1. -1.  0. -2. -1. -1.  1. -2. -2.  0. -2.  1.  1.]
[-1.  1. -1.  1. -2.  1.  1.  0. -2. -1.  1.  0. -1.  0. -1. -1.]
[-1.  0.  1.  1.  1.  1. -1.  0. -2. -2. -2.  1.  0.  1.  1.  0.]
[-2.  1.  1. -2. -1.  0. -1.  1. -2.  0. -1. -2. -1. -2. -1. -1.]
[-1.  1. -1. -2. -2. -1.  0. -2.  0.  0.  1.  0.  0.  0.  0. -2.]
[ 0.  1.  1.  1.  1.  1.  0. -2. -1. -1. -2.  0.  0. -2. -2.  1.]
[-2.  1. -2.  0.  1.  1.  1.  1. -1. -1. -2.  1.  1.  1.  0.  0.]
[ 0. -2.  1. -1. -2. -1. -1. -2.  0.  1.  0. -1. -2.  0.  0.  0.]
[-1. -2.  0.  0.  0. -2.  1.  0. -2.  0.  1. -1. -2.  1.  0.  0.]
[ 0. -2. -2. -1. -2.  1.  0. -2.  1. -1.  0. -2.  0.  1.  0. -1.]
[ 1.  0. -1.  1.  1. -1.  0.  1. -2. -1. -1.  1.  0.  0.  0. -2.]
[-1.  1.  1. -1.  1. -2. -1. -2.  0. -1. -1.  1. -2. -2.  0. -2.]
[ 1.  0.  1. -1.  1.  0. -1.  0. -1.  1.  1.  1. -2.  0. -1. -2.]
[-1. -1.  0. -1. -2.  1. -2.  0. -1.  0. -1. -1.  0.  1. -2. -2.]
[ 1. -2. -2. -1.  1.  0. -2. -1.  1. -2. -1.  1. -2. -2.  1. -2.]
[ 0. -2.  

[-2. -1.  0. -2. -1.  1. -2.  0. -2.  1.  0. -1. -2. -2.  1.  1.]
[-1.  0. -2.  1.  1. -2. -1. -1.  0.  0.  1.  1.  0. -1.  0. -1.]
[-2.  0. -2.  0. -1.  0. -2. -2.  0. -1.  1.  0. -1.  1. -2. -2.]
[-2. -2.  1. -1. -1. -1.  0.  1. -1.  1. -1. -1. -2.  1.  1. -2.]
[-1. -1. -2. -1.  1.  1. -2. -1.  0. -2.  0.  1.  0.  1.  0.  1.]
[ 0. -2. -1.  0. -1. -1. -1.  1.  1.  1.  0. -2.  1.  0.  1.  1.]
[ 0. -2. -1. -2. -1.  0.  1. -2.  1.  1. -1.  0. -1. -2. -2.  1.]
[-2. -2. -1. -2.  0. -1. -2. -2.  0.  0. -2.  1.  1. -1. -2.  0.]
[-1. -1.  1.  1.  0.  0. -2. -2.  0.  1. -1. -2. -2.  1. -2. -1.]
[-1. -1. -2.  0. -1. -1.  1. -1. -2.  1. -2.  0.  0.  1. -1. -2.]
[-1.  1.  1. -1.  0. -2.  0.  1.  0. -2.  1.  1. -2. -1. -2.  0.]
[-2.  1. -2. -2.  0.  1.  0. -1.  1.  0. -2.  1.  1. -1.  1. -2.]
[ 0. -2.  1.  1. -1. -2. -2. -2. -1. -1. -2. -1.  0.  1.  0.  1.]
[-2.  1. -1.  1.  0. -1.  1.  0. -1. -2. -2.  1. -1.  0. -1.  0.]
[ 1.  1.  0. -1.  1. -2.  0.  0.  0.  1. -2. -2. -1. -1.  1. -2.]
[ 1. -1. -

 47%|████▋     | 14/30 [20:14<22:39, 84.95s/it]

[ 1. -1. -2.  0. -2. -1.  1.  1. -2. -2.  1. -2.  1. -1.  1. -2.]
Training loss (for one batch) at step 0: 0.38974738121032715
Seen so far: 16 samples
[-1.  0.  0.  0.  0.  0. -1.  0. -2.  1. -2. -1. -2. -1. -2. -2.]
[ 1. -2. -1.  0. -2.  1.  0. -1. -2. -2. -2. -2.  1. -2.  0.  1.]
[-2. -1. -1. -1. -2.  0. -1. -1.  0. -1.  1. -2.  0.  1. -1. -2.]
[-2. -2. -2.  0.  0. -1.  0.  0.  1. -2.  0. -1. -2.  0.  1. -1.]
[-2. -2. -1. -2.  0.  0. -2.  0.  0.  1. -1.  0.  1. -1.  1. -1.]
[ 0.  0.  0.  1.  0.  1.  1. -2.  0.  0.  1.  0.  0. -2.  1. -1.]
[ 1. -1.  1. -2.  0.  1.  1.  0.  1. -2.  0.  0. -2. -1. -1. -1.]
[-1. -2. -2.  0. -2.  1.  0.  0.  0. -1. -1. -1.  0.  1.  0. -2.]
[-2. -2. -2.  1.  0. -2. -1.  0.  1.  0. -1.  1.  0. -1.  1.  0.]
[ 1.  1.  0.  0.  0.  0. -1. -2. -1. -1.  0. -1.  0.  1.  1. -2.]
[-2.  1.  1. -1. -1.  1.  0. -1.  0. -2. -2.  0.  0.  1.  0.  0.]
[ 1.  1.  0.  0. -2. -1.  1.  1. -2. -1.  1. -1. -2. -2.  0.  1.]
[ 0.  0.  1.  0. -2. -1.  1.  1.  0.  0.  1.  1.  1. -1. 

[ 1.  1.  1. -1.  0.  0.  1. -2. -1.  1. -2. -1.  0.  1.  1.  0.]
[-1.  1.  1.  1. -2.  0.  0. -1. -1. -1.  1.  1.  0. -2. -2. -2.]
[-1.  0. -2.  1.  0. -1. -2. -2. -2. -2. -2.  1. -2.  0.  0.  1.]
[ 1. -2.  1.  1.  0. -2.  1.  1.  0. -2.  1. -1.  0.  0.  1.  0.]
[-2.  0. -1. -2.  1.  0.  1. -2. -1.  1. -2.  1. -2.  1. -1.  0.]
[-2. -2.  1.  1. -2.  0. -1.  0.  1. -2. -1.  0. -1.  0. -1. -2.]
[ 0.  1.  1. -1. -1.  1. -1.  0. -2. -1. -1. -1.  0. -1. -1. -1.]
[-1. -2.  0.  1. -2. -2.  1. -2.  1.  1.  1. -2.  1. -1. -1.  0.]
[ 1.  1.  0. -1.  1. -1.  0. -1.  1. -1.  1.  0. -2.  1.  0.  0.]
[-1. -2.  0. -1. -2.  1.  0.  0. -2.  1.  0.  0.  0.  0.  0. -2.]
[-1.  1. -2. -1.  0. -1. -1.  0. -2. -2. -2. -1.  0. -2.  0.  0.]
[ 1. -1. -2. -2.  0.  0. -1.  1. -2.  0. -2.  1. -1. -2. -1. -1.]
[ 0. -1.  1.  1.  0. -2. -2. -2.  0. -2. -1.  1. -1. -2. -2. -1.]
[ 1.  1.  0. -1.  1.  1.  1. -2.  0.  1. -2.  1. -2. -1. -2.  0.]
[-2.  1. -1. -2. -1. -2.  1.  1. -2.  0. -1. -1.  1.  1.  1.  1.]
[-2.  0.  

[ 1.  1. -2. -2. -2. -1.  1. -1. -2.  1.  1. -2.  0.  0.  1. -2.]
[-1.  1. -2.  0.  0.  0. -2. -2.  1.  0.  0.  1.  0. -1.  0.  1.]
[-2. -1.  1.  0.  1. -2.  1.  1.  1.  1.  0.  0. -1. -1. -1. -2.]
[-1. -1. -2. -1.  1. -2. -1.  1.  1.  1.  0. -1.  1. -2. -1. -1.]
[-2. -1. -1.  0. -2. -1. -1. -2.  0.  1. -1. -1. -1.  0.  1.  0.]
[ 0. -2.  1.  1.  1.  1.  0.  0.  0.  1.  1.  1.  0. -2.  1.  1.]
[-2. -1.  0.  0.  0. -2. -2. -2. -1. -1.  1.  0.  0.  0. -2.  1.]
[-1. -2.  1. -1.  0. -2.  1.  1. -1. -1. -1.  1. -1. -1. -1. -1.]
[ 0. -1. -2.  0.  0.  1.  1. -2. -1. -1. -2. -2.  0.  1. -1.  0.]
[-1.  0. -2.  1.  0. -1. -2. -2.  1.  1. -2.  0. -1. -1. -1.  0.]
[-1. -2. -2.  0.  0. -1. -1.  0.  1. -1.  0.  1.  0.  1. -1.  0.]
[-1. -1.  0. -2.  0.  1.  1.  1.  0. -2.  1. -2.  0.  1. -2. -2.]
[ 1. -1. -1. -1. -2. -1. -1. -2. -2.  0.  1. -1.  0.  1. -1. -1.]
[ 1.  1.  1. -1. -2. -1. -1. -1.  1.  1. -1. -1.  1. -2. -1. -1.]
[ 0. -2.  0.  1. -1. -2.  1. -1.  1. -2.  0. -2. -1.  0. -2.  0.]
[ 0.  0.  

[-2. -1. -1.  0.  1. -2.  0. -2. -2. -2.  0.  0. -2. -1. -2. -1.]
[ 0.  0.  0. -2. -2. -1.  1.  1.  1.  0.  0. -1. -2. -2.  1. -1.]
[-2.  0.  0.  1.  1. -1. -1.  0.  1.  1. -1.  1. -2.  1.  0. -2.]
[ 0. -2.  1.  1. -1. -2. -2. -2. -2.  1.  1.  0. -1. -1.  1. -2.]
[ 0. -1. -2.  1. -1. -2.  1.  0. -1.  1. -2.  0.  0. -2.  0.  1.]
[-2. -2. -1.  1.  0. -1.  0.  1.  0. -2. -1.  1. -2. -2.  0. -2.]
[-1.  0.  1.  1. -1. -1.  1.  0. -2. -1.  0. -1.  1.  1. -2. -1.]
[ 0. -1.  1.  1.  0.  0. -1. -2. -2.  0.  1. -1. -1.  0. -1.  0.]
[ 0. -1.  1.  0.  0.  0. -1.  0.  1.  0. -1.  0. -1.  1. -2. -2.]
[ 1.  1.  1.  1. -2. -1. -2. -1. -1. -1.  0.  0.  0.  1. -2.  0.]
[ 1. -2. -1.  1.  0. -2. -2.  1.  0.  0.  0.  1.  0.  1.  1. -1.]
[-2.  0. -2.  0.  1. -1.  0. -2.  1. -2. -2.  1. -2.  0.  1.  0.]
[ 1. -2. -1. -1.  1.  0. -2.  1.  0. -1. -2.  0.  1. -1. -1.  0.]
[ 1. -2. -2. -1. -1. -1. -2. -2.  0. -2. -1. -2. -1.  0.  0. -2.]
[-1. -2. -1. -2.  1.  0.  0. -1.  0.  0. -2. -1. -1.  0. -1. -1.]
[ 0.  0. -

[ 0.  1. -2. -2. -2.  1. -2. -2.  1.  0. -1. -2.  1. -1. -1.  1.]
[-1.  1. -2.  0.  0. -1.  0.  1. -1.  0. -1. -1.  1. -1. -2. -2.]
[ 0. -2.  1.  1.  0.  1.  1. -2. -2.  0. -2.  0.  0.  1.  1. -2.]
[ 1. -2.  0.  0.  1. -1. -1.  0.  0.  0. -2.  0. -1. -1.  0.  0.]
[ 1. -2. -1. -1. -1. -2. -1. -2.  1. -2.  1.  0.  0.  1.  1. -1.]
[ 0. -2.  0.  0.  0. -1. -2. -2. -2. -1. -1. -1.  0. -2.  0. -1.]
[ 1.  1. -1. -1. -2.  1.  1.  1.  1.  0. -2.  1.  0.  0. -1.  0.]
[ 0. -2. -1. -2. -2.  1. -1. -1.  1. -2.  0.  1. -1. -1.  1.  1.]
[-2.  0.  1.  0. -2. -2. -1. -1. -1. -1. -2.  1.  1. -2.  0. -2.]
[ 1. -2. -1.  0.  1. -2.  1.  1.  0.  0. -2.  0.  1.  0. -1. -2.]
[-1. -1. -2.  0.  1.  1. -1. -1.  0.  0. -2. -1.  1. -2. -1.  1.]
[ 1. -2.  0.  1.  0.  0.  0.  0.  1. -2.  1. -1. -1. -1.  0. -2.]
[-1.  1. -2. -2.  0. -1. -2.  0. -1. -2. -1.  1.  0.  0.  0. -1.]
[ 1. -1. -1.  0.  1.  1. -1. -2. -2.  1.  0. -2. -1. -1.  1.  0.]
[ 1.  1.  0. -1. -1. -1.  1. -2.  1. -1. -1.  0. -1. -1. -2.  1.]
[ 1. -1.  

[ 0.  0. -1. -1. -2. -1. -1. -1. -1.  1. -1.  1. -2.  0.  0.  0.]
[-2. -2.  0.  0.  0. -1.  1. -1. -2. -1. -1.  1.  0.  0.  1.  0.]
[-2.  0. -1. -2.  1. -2. -1. -1. -1.  1. -1. -2.  0.  0.  0. -2.]
[ 0.  1. -2. -2. -1. -1. -2. -2.  0. -1.  1.  1.  1. -1.  1.  1.]
[ 1. -2.  0. -1.  0. -1.  0.  1.  1.  0. -1. -2. -2.  1.  1. -2.]
[-1.  1.  0. -2. -2. -1. -2.  0.  0. -1. -1. -2. -1. -1.  0.  0.]
[-2. -2.  1. -1. -1.  0. -2. -2. -1.  0.  0.  0. -2. -2.  1.  1.]
[ 0.  1.  1. -1.  1. -2.  0. -1.  1.  0.  1.  0.  1.  0. -1. -1.]
[ 0. -1.  1. -1. -1.  0.  1. -2.  0.  1. -2. -2. -1. -2.  1. -1.]
[ 0. -2.  1.  1.  1. -1.  0.  1.  0. -2. -1.  1.  1.  1.  0. -2.]
[-1.  0.  0.  0.  1. -2. -2.  1. -1.  1.  1. -1. -1.  1.  1.  0.]
[ 0.  0.  1.  1. -2.  0.  1. -1. -2. -1. -2.  0. -1. -2. -1.  1.]
[-1.  1. -2.  1. -2.  0.  0. -1.  0.  0. -1.  0. -1.  0.  0.  0.]
[-2. -2.  0. -1.  1.  1. -1. -1. -2. -2.  0.  1.  0.  0. -1.  0.]
[-1. -2. -2.  0. -1.  0. -2.  1.  0.  1. -1.  1. -1.  0.  1.  1.]
[-2.  1.  

[ 1.  1.  0. -2. -2. -2.  1.  1. -1.  1.  0.  1.  0.  1.  1.  0.]
[-1.  1.  1. -2. -1. -1.  1. -1.  1.  1. -2. -2.  0. -1. -2.  0.]
[ 0.  1. -2.  0.  1. -2. -1.  0. -2.  1.  0. -1.  0. -1. -1.  1.]
[-1.  0. -1. -2.  1.  0. -2. -2. -2.  1.  1. -2.  1. -1. -2. -1.]
[ 1.  1. -2.  0. -2. -1. -2. -1. -1. -2.  0.  1.  1.  0.  0.  0.]
[-2.  1.  0.  0. -1. -2. -1.  0. -1. -1. -2.  1. -1. -1. -1. -1.]
[ 0.  1. -1. -2.  0. -1.  0.  1.  1. -1. -2.  1.  0.  1. -2.  1.]
[-1. -1. -1.  0. -1. -1. -2.  1.  1. -1.  0.  0.  1. -1.  1. -2.]
[-1. -1.  1. -1.  0. -1.  0.  1. -1. -2.  1. -2.  1.  0.  0.  1.]
[-1.  0. -2. -1. -1. -2. -1.  0.  0.  1.  1.  0.  0. -2.  0. -1.]
[ 1. -2.  0.  0.  0. -1.  0.  0.  1.  0. -1. -2. -1. -1. -2. -2.]
[ 0.  1.  0.  1. -1. -1.  0. -2.  1. -1. -2.  1.  1.  1.  1.  0.]
[ 1. -2. -2.  1. -1.  0. -2. -2.  1.  0. -2. -1. -2. -1. -2. -1.]
[ 1.  0. -1. -2.  1. -1. -2.  0. -2. -2.  1. -2.  0. -2. -2.  1.]
[-1.  1.  0. -1. -1. -2.  1. -1. -1. -2.  1. -1. -2. -2. -1. -2.]
[-1.  0. -

[ 0. -2. -2. -1. -2. -1. -2.  0.  0. -2.  0.  0.  1. -1. -1. -2.]
[-2. -2. -2. -1.  1.  0. -2.  0. -2. -2. -1.  0.  0.  0.  1.  1.]
[-2. -1.  1.  0.  1. -2.  1. -1. -2. -2.  0. -2. -1.  0.  0. -1.]
[ 1. -2.  0. -2. -2.  0. -1. -1.  1.  0.  1.  1.  0.  1. -1. -2.]
[-1.  0. -2.  0. -2. -2.  0. -2.  0.  1. -1.  0.  1.  1.  0.  0.]
[ 1. -2.  1. -2. -1.  1. -2.  0.  0. -1. -2.  0. -1.  0. -2.  1.]
[ 1. -1. -1.  1.  1. -1. -2. -2. -2.  0. -1. -2. -2. -1.  0. -1.]
[ 0.  1. -2.  0.  1.  1.  0.  0. -1.  1. -2.  0.  0.  0. -1.  0.]
[-2.  0. -2.  0.  0. -2.  0. -2.  0.  0. -1.  0. -2.  0. -1. -1.]
[ 0. -2. -1. -2. -2.  1. -2.  0.  0. -2. -1. -2. -1.  1.  0.  1.]
[-2. -1.  1. -1.  0. -2.  0. -1.  0. -2.  0.  0.  0.  0.  0. -2.]
[ 1.  1. -1. -2.  1. -2.  1.  0.  1. -2. -2.  1.  0. -1. -2.  0.]
[ 1. -2. -1. -1.  0. -2. -2.  1.  1.  0.  0. -1. -2.  1. -2. -2.]
[-2. -2. -2.  1.  0. -1. -1.  1. -2. -2.  0. -1.  1.  0.  0.  0.]
[ 1. -1.  0. -1. -2. -2. -1. -1. -1. -2.  1.  0. -2.  1. -2. -1.]
[ 1.  0. -

[ 0.  0.  0. -2. -2.  1.  0.  0. -1.  0.  0.  0.  0.  1. -2. -1.]
[-1.  0. -1.  0. -1. -2. -2.  1. -2. -2.  1.  0.  0.  1.  0. -1.]
[-1. -2. -1.  0.  1. -2. -1. -2. -2.  0. -2. -2. -1. -1. -1. -2.]
[ 0.  0.  1. -2.  1. -2. -1. -2.  1.  1.  0.  0.  0.  1. -1.  1.]
[-1.  0.  1. -1.  0. -1. -2.  0.  1. -2.  1.  1. -2. -2. -1. -1.]
[ 0. -1. -2.  0. -1. -2.  1.  0.  0. -1. -2.  0. -1.  0.  0.  0.]
[ 0.  0. -1.  1. -1. -2.  0.  1.  0. -2. -1.  1.  0.  1.  0. -2.]
[ 1. -2.  0.  1. -1. -1. -1.  0.  1. -2. -1.  1.  0.  0.  1.  1.]
[ 0. -1.  0. -2. -2.  1. -1. -2.  1.  0.  0. -1. -2.  1. -2.  1.]
[ 0.  1. -2. -1.  1. -1.  0. -1.  1. -2.  1. -1.  1. -1. -1.  1.]
[-1. -1.  1.  1.  1.  0.  1. -1. -2.  1. -1.  0. -1. -1.  0.  1.]
[ 0.  0. -2. -1. -1. -2.  0.  1.  1.  1. -1.  0.  1. -1.  0.  0.]
[-2.  0.  1.  0. -1.  0.  0. -2. -2.  1. -2.  1.  1. -1. -2. -1.]
[ 1.  1.  1. -1.  0. -2. -2. -1.  0.  0. -2. -1. -2.  0.  1. -2.]
[ 1. -1.  1. -1.  1. -2.  0.  1. -1.  1.  0.  1. -1.  0. -1. -2.]
[-2. -1.  

 50%|█████     | 15/30 [21:37<21:05, 84.38s/it]

[ 0. -2.  1.  1.  1.  1.  0. -1.  1.  0. -2.  1.  1.  1.  0.  0.]
Training loss (for one batch) at step 0: 0.05102105438709259
Seen so far: 16 samples
[-1.  0.  1. -1.  0.  0.  1.  0.  1. -2. -1. -1. -2.  0. -1. -1.]
[-2. -1. -1.  1. -2. -1.  0. -2.  1.  1.  0. -1. -1. -1. -1.  1.]
[-1.  1.  1.  1.  0. -2. -1. -2. -2.  1.  1. -2. -1. -2. -1. -2.]
[ 1.  1.  1. -1.  1. -1. -1.  0.  0.  0.  1.  0. -2. -2. -1.  1.]
[ 0. -2.  1.  1.  0. -2. -1.  0.  0.  1.  1.  1. -1. -2.  1.  1.]
[-2. -1.  0.  0. -2. -2.  1.  0.  0. -1.  1.  1.  1. -2. -1.  0.]
[-1.  0. -2.  1. -1. -1.  1.  0.  1.  0. -2. -1.  0.  1. -2.  1.]
[ 1. -2.  0.  0.  1.  1. -1. -2.  1. -1.  1.  1.  1.  1. -2. -2.]
[ 1. -2. -1.  1.  1.  0.  1. -2. -2. -1. -2.  0. -1. -2.  1. -2.]
[-2.  1.  0. -1.  1.  1.  1. -2.  0. -1. -1.  0.  1.  1.  1. -2.]
[-2. -1. -2.  0.  0.  0.  0. -2.  1. -2.  0. -2. -1.  0.  1.  1.]
[-1.  1.  0.  0. -1.  1.  1.  1.  0.  0. -2. -2.  0. -1. -1. -2.]
[-2.  1.  1.  1.  1. -1.  1. -1.  0. -1.  0.  1. -1.  0. 

[ 1.  1.  0.  0. -2. -1. -1.  0. -1.  1.  0.  1. -2.  1.  0. -2.]
[ 1. -1. -1.  0.  1. -2. -2. -2. -1.  0.  0. -2. -2. -2.  1. -2.]
[ 1. -1.  0.  0.  0.  1.  1. -2. -1. -1.  1. -2. -2. -2. -1. -1.]
[-1.  1.  1.  0. -2.  0. -2.  0. -1. -1.  1. -1.  0. -1. -2. -1.]
[-1.  1.  0.  0. -2.  1.  1.  1. -1.  0. -1. -1. -2. -2. -2.  0.]
[ 0. -1. -2.  0.  1. -2.  1.  0. -2.  0. -2. -2.  0.  1.  1. -1.]
[-2.  0. -1.  0. -1. -1.  1.  1.  1.  1.  0.  1.  1.  1.  1.  0.]
[-1.  1. -2.  0.  1.  1. -1.  0. -2. -2. -1.  1.  0. -1.  0. -1.]
[-1. -1. -2.  0.  0.  1.  0. -1.  1.  1.  1. -2. -2.  0.  0. -2.]
[ 0. -2.  1.  0.  0. -2.  1. -2.  0. -2.  1.  1.  0.  0. -2.  1.]
[ 1.  1.  0. -1.  0.  1. -2. -1.  1. -1.  0.  0. -1.  0.  1. -2.]
[ 1.  1. -1. -2.  0.  0.  1.  1. -2. -2.  0. -2.  0.  0. -1. -1.]
[ 0. -1. -1.  0. -1.  1. -2. -2. -1.  0.  0.  0.  1. -1. -2.  0.]
[ 0. -1.  1.  1. -1.  0. -1. -2.  0. -2. -2.  1.  0.  1. -1.  0.]
[ 1.  1.  1. -2.  1.  1.  0.  0. -1. -2.  0.  0.  0. -1. -2. -2.]
[ 1. -2.  

[-2.  1. -1. -1. -2. -2.  1.  1.  1. -2. -1. -1. -1. -1.  0. -1.]
[-1.  0. -2. -2. -2.  1.  1. -2. -1.  0.  0. -1. -2. -2.  1. -1.]
[-1.  0.  1.  1. -1. -1. -1.  1. -2.  1.  1.  0.  0. -2. -2.  0.]
[ 1. -2. -1.  1. -1.  1.  0. -2.  1. -1.  0.  1.  0.  0. -1.  0.]
[ 1.  1.  0. -2.  1. -2.  0. -2. -2.  0.  0. -2.  1.  0.  1. -2.]
[ 0. -2.  0. -2.  1. -1.  1.  0.  1.  0. -2. -1.  1.  1. -1.  0.]
[ 1. -1. -2.  1. -1. -1. -2.  0. -2.  1.  0.  0. -2.  1.  0. -2.]
[ 0.  0. -1.  1.  0. -1.  1.  0.  0.  0. -1. -1. -1.  1.  1. -2.]
[ 0. -2.  1.  1.  0. -1. -2. -1. -2.  0.  1.  1.  1. -1.  1.  0.]
[-2. -2.  1. -1.  1.  1. -1. -2.  0.  0. -1.  0.  0.  0.  1.  0.]
[ 1.  1. -2. -1.  0. -2. -1. -2.  1. -2. -2.  1.  0. -1.  0. -1.]
[-1.  1. -2.  1.  1. -1.  0. -2. -2. -2.  0. -2. -2.  0. -2. -1.]
[ 0.  0. -1. -1.  1. -2. -1. -1.  0.  0.  1. -1.  0.  1. -1. -1.]
[-2. -2.  1. -1. -2.  1. -1.  0. -2. -2.  1. -2. -1.  0. -2.  1.]
[ 1.  1.  0. -2.  0.  0. -1. -1.  0.  1.  0.  1.  0.  1.  0.  0.]
[ 0. -1. -

[ 1. -2.  1.  0.  0. -1. -2. -2. -2. -1. -2. -1.  0. -2.  0.  1.]
[ 0.  1. -2.  0.  0.  0.  1. -2. -2.  0.  0.  0.  0. -2. -1. -2.]
[-2. -2.  0.  1.  0.  1.  0.  1. -1. -1.  1. -1. -2.  0.  1.  0.]
[-1.  0. -2. -1.  0. -2.  0.  0.  1. -2. -1. -1. -2. -2. -2.  0.]
[-1. -2. -1.  1. -1. -2.  0. -2. -1. -2. -2. -2.  1. -1.  0.  0.]
[-2. -2. -2. -1.  0. -2. -2. -1. -2.  0. -2. -2.  1. -2. -2.  1.]
[-2.  0.  1. -2. -1. -2. -1. -1.  0. -1. -2.  1. -1. -1. -1. -1.]
[-1. -1. -1. -2.  1.  0. -2. -1. -1.  0. -1. -1. -1. -1. -1.  0.]
[-2. -1.  0.  1. -1. -2. -1.  0. -2. -2. -1. -1. -1. -2.  1. -1.]
[ 1. -2.  1. -2. -1. -2.  0.  0. -1. -1.  1.  0.  1. -2. -1.  0.]
[ 0.  1. -1. -2.  0. -2. -2. -2. -1. -1.  1.  1.  1. -1.  0. -1.]
[ 1.  0.  1. -2. -1. -2. -1. -2. -2.  0. -2.  0.  0. -1. -2.  0.]
[ 1. -2. -1. -1. -1. -1. -2.  0. -2.  1.  1. -2.  0. -2. -1.  1.]
[-1.  1.  1.  0. -2. -2.  1.  1. -2. -2. -1.  0. -2. -1. -2.  0.]
[-1.  0. -1.  1. -2.  1.  0.  0.  1. -1.  1. -1.  0.  1.  0. -1.]
[-2. -1. -

[ 0.  0.  1. -2. -1.  0.  1. -1.  0. -1. -1.  1. -2.  1.  1. -2.]
[-1. -1. -1. -2. -2. -2. -2.  0.  0. -1. -1.  1. -2. -2. -1. -2.]
[ 1. -1. -2.  1. -2. -1. -2. -1.  0.  0. -2. -1.  0. -2.  0. -2.]
[ 0. -2.  0.  1. -1.  1. -1. -1.  1. -1. -2.  1. -2.  0.  0. -1.]
[-1.  0.  1.  0. -2. -2. -1.  1. -1.  0.  0. -1. -2.  1.  0.  0.]
[ 1. -2. -1. -1.  1.  0. -2. -1.  1.  0. -1.  0. -2. -2.  0. -2.]
[-1. -2. -1. -2.  1.  0.  0. -2. -2.  1.  1.  1.  0.  0. -1.  1.]
[-2.  1. -2.  0.  0. -1. -1. -2.  0. -1. -1.  0.  1. -1. -1.  0.]
[-2. -2.  1.  0.  0.  0.  0. -2.  1.  0.  0.  1. -1. -2. -2. -2.]
[ 0. -2.  1.  1. -1.  1. -2. -2.  0.  1.  0. -1. -1.  0. -1.  0.]
[ 0. -1.  1.  1. -2. -1.  0.  0.  1. -2.  1.  1. -2. -2.  0.  0.]
[-1. -1.  1.  0. -1. -2. -1.  1. -2.  0.  0. -1.  0.  0.  1. -2.]
[ 1. -2.  1.  1. -1.  0. -1. -1. -2.  0. -2. -1. -1.  1.  1. -1.]
[-2. -1. -2.  1. -2. -1.  1. -1. -2. -1. -1. -2. -2. -1. -2. -2.]
[ 0.  0.  1. -2. -2.  0.  0.  1.  1.  0. -2. -2. -1.  0. -2. -1.]
[-2.  0.  

[ 0.  0. -1. -1.  0. -1. -2.  0. -1. -1. -1. -1.  1. -2. -2. -1.]
[ 0. -2. -1.  1.  1. -2.  1. -2.  1. -2. -1.  0.  1.  0.  1. -1.]
[-1.  1.  0. -2.  0. -1. -2.  0. -1. -2.  1.  0.  1. -2.  0. -2.]
[ 1.  1. -2.  0. -2.  1. -1. -2. -1.  0. -2.  1. -1.  0.  1. -1.]
[-2.  1.  0.  0.  1. -2. -1.  0.  0. -1. -2. -2. -2. -2. -2. -2.]
[ 1. -1.  1. -1. -1. -1. -1.  0. -1. -2.  1.  1. -2. -1.  0.  0.]
[ 1.  0. -2.  0.  0.  1.  0.  0. -2. -1. -2. -1. -2. -1.  1.  0.]
[-1.  0.  1. -1.  1. -1. -1.  0. -1. -1. -2.  0. -1. -1. -1. -2.]
[ 1.  1.  1. -1. -2.  0. -2. -2. -1. -1. -1. -2. -2.  0.  1. -1.]
[ 1.  0. -2. -2. -2.  1. -1.  0.  0. -1. -1.  1.  1.  0.  1.  0.]
[ 0.  0.  0. -1.  0.  1. -1. -1.  1. -2.  0. -1.  1. -1.  1.  1.]
[ 1.  1. -2. -1. -1.  0. -1.  0. -2.  1.  0. -1. -2.  0. -2.  1.]
[ 0.  0.  0. -1. -2.  1. -2.  0.  1. -1. -1. -1. -2. -1.  0.  1.]
[ 1. -2. -1.  1.  1.  0. -1. -1.  0. -1.  0.  0.  0. -1.  0.  1.]
[-2. -1.  0. -1. -1. -1.  0.  0.  0. -1.  1. -2.  1.  1.  0. -1.]
[-1. -2.  

[-1. -2. -2.  1.  0.  1. -2.  1.  1. -1.  0. -1. -2. -2. -1.  0.]
[-1. -1. -1. -2. -2.  0.  1. -2. -1.  1. -2.  1. -1. -1. -1.  1.]
[ 1. -2. -1. -2. -2. -2.  0.  1.  0.  0.  1. -2. -2.  0.  1.  0.]
[-2. -2. -2. -1.  1. -2.  1. -2.  0.  1.  0. -1. -2. -1. -2.  0.]
[ 1.  0.  0. -2.  1. -1.  0.  0.  1. -1. -2.  1. -2. -2.  1.  1.]
[-1.  1.  0.  0. -2. -1.  0. -2. -2.  1.  1.  1. -1. -1. -2. -1.]
[ 0.  0.  1.  0. -2. -2. -2.  1.  0. -2. -1. -2. -1. -1.  1. -1.]
[ 0. -1.  1. -2.  1. -1.  0. -2. -2. -2. -2.  0. -1.  0. -1.  0.]
[ 0.  1.  0.  1. -1. -2.  0. -2.  1.  0. -1. -1.  1.  0. -2.  1.]
[ 0.  0. -2.  0.  1. -2.  0. -1.  1.  1.  1.  0.  0.  1.  1. -1.]
[ 0.  0. -1.  1.  0. -1.  0.  0. -1.  0.  0.  0.  1.  1. -2. -2.]
[-1. -1.  0.  1. -1.  0. -2. -2.  0. -1.  1. -2.  1.  0. -2. -2.]
[ 0. -2. -2. -1.  1.  0.  1.  1.  0. -2.  0.  1.  1. -1. -2. -1.]
[ 0.  1. -2.  0. -2.  0. -2.  1. -1. -1.  0. -2.  0.  1. -2. -1.]
[ 0.  1. -1. -1. -2.  0.  1.  1.  1. -1. -2.  0. -1.  0.  1. -2.]
[ 0.  0.  

[-2. -1.  0.  1.  1. -1.  0.  1. -2. -2. -2. -2.  0.  1. -2. -2.]
[-1.  0. -1.  0. -1. -1. -1.  0.  0.  0.  0. -2. -1. -2. -2.  1.]
[-2. -2.  1.  0.  0.  1. -1. -2. -2. -1.  0.  1. -2. -2. -2.  1.]
[-1.  0. -1.  1.  1.  1. -2. -2. -1. -2.  0.  0. -2. -1. -1. -2.]
[-2.  1. -2. -1.  1. -2. -1. -2.  0.  1.  0.  1.  0. -1.  0. -2.]
[ 1.  0.  1.  0. -2. -1. -1.  1. -2.  0.  0.  0.  1. -1.  0.  1.]
[ 1. -1. -1.  1.  0. -2. -2. -2. -1.  0. -2.  1.  0.  0.  0.  1.]
[-1.  0. -1. -2. -2.  1.  1.  0. -2.  0. -2. -2. -1. -1.  0. -2.]
[ 0. -2.  0. -1. -1. -2. -1.  0.  1.  0. -1.  1.  0. -1. -1. -1.]
[-1. -1. -2.  1.  0.  0. -1. -1. -2. -2. -1.  1. -1. -2.  0. -2.]
[-2. -1. -2. -1.  1. -1. -1.  0. -2. -2.  1.  0.  0. -1.  0.  0.]
[ 1.  1. -2. -2.  0. -2. -2. -1.  1. -1.  1. -2. -2.  0.  0.  0.]
[-1.  1. -2.  0.  1.  0. -2. -2. -2.  1.  1.  0.  0. -2. -2.  0.]
[ 0. -2.  0.  0. -1. -2.  0.  0.  0. -2. -1. -1. -2. -2. -1.  0.]
[-1. -1.  1. -1.  1. -1. -2.  0. -2.  1. -1.  0.  0.  1. -2.  0.]
[-2. -1.  

[ 1. -2.  1.  1.  1.  1.  1.  1. -1. -1. -2.  1. -1. -2.  0.  1.]
[ 0.  0.  1.  0.  1.  1.  0. -1.  0. -2. -1. -1.  1.  1.  1.  0.]
[-2. -1.  0.  1. -2. -2.  0. -1.  0. -1.  0.  1. -1.  1. -1. -1.]
[-2. -2.  0.  0.  0.  1. -2. -1. -1.  1. -1.  1. -1.  1.  1. -1.]
[-1. -2.  1. -1.  0.  0. -2. -2.  0.  1.  1. -1. -2.  1.  1. -2.]
[ 1. -1.  1.  1.  1.  0. -2. -1.  0.  1. -2. -2. -2.  1.  0. -2.]
[-1.  1.  1.  1.  0. -1. -2.  0. -1. -2.  0. -2. -2.  0.  0.  0.]
[-1. -1. -2. -2.  1.  0.  1.  1.  1. -1. -2.  1.  0. -1.  1.  1.]
[ 0.  0. -2.  0. -1.  1. -1.  1. -2. -1. -1.  1.  0.  1. -1.  1.]
[ 1. -2.  1.  1. -2.  0.  0. -1. -2.  0.  0. -1. -2.  0. -2. -2.]
[ 1. -2.  1.  1. -1.  0.  0.  0. -2.  1. -1.  1. -2. -2. -2.  0.]
[-2. -2. -1.  1. -2.  1. -1. -1. -1. -1.  1. -2. -1. -2. -1.  1.]
[-1. -1. -2. -2. -1.  1. -1. -1.  1. -1. -1. -1.  0. -2.  1.  1.]
[-2.  1. -2.  1. -2. -2. -1.  1.  0.  0. -2.  1.  0. -2.  0. -1.]
[-1.  1. -2. -1.  0.  1.  1.  1. -1.  0.  0. -2. -1.  1.  1.  1.]
[-2. -2.  

 53%|█████▎    | 16/30 [23:04<19:50, 85.02s/it]

[ 1.  0. -1.  0.  0.  1.  0.  1. -1.  0. -1. -1.  0.  0.  1.  1.]
Training loss (for one batch) at step 0: 0.023204654455184937
Seen so far: 16 samples
[ 0. -1.  0. -1.  0.  0.  0.  0.  0.  0. -2. -1.  1.  1.  0. -2.]
[ 1.  0. -2. -1.  1.  1. -2.  1. -2.  1.  1. -1.  0. -2. -2.  0.]
[-2.  1. -1. -2. -2.  0. -2. -2. -2. -2.  1. -1. -2. -2. -1. -2.]
[-1.  1.  0. -1.  1.  1. -1. -2.  0.  0. -2.  0.  1.  0. -1. -2.]
[ 1. -2. -2. -2. -1.  1.  1.  1. -2.  1.  0.  0. -1.  1.  0.  1.]
[ 0.  1. -1. -2. -1.  0. -2.  1.  1. -2. -2. -2. -1.  0. -1.  0.]
[ 0. -1. -1. -2. -2. -2.  1. -1.  1.  1. -2.  0. -1.  1.  1. -2.]
[-1. -2. -1. -1.  1.  1. -2. -1. -1.  1.  1.  0. -2.  1. -1.  0.]
[ 0.  1. -1.  0. -2. -1.  0.  1. -1. -1. -2.  0. -2. -2. -2.  1.]
[ 0. -2. -2. -1. -2. -1.  1.  0. -2.  1.  0.  1.  0.  1. -2. -2.]
[ 1. -1. -2. -2. -1. -2. -1.  1.  1. -1. -1.  1.  0.  0. -2.  1.]
[-2. -1.  0. -1.  1.  0. -1. -2.  1. -2. -1.  1. -1. -1.  1. -2.]
[-2. -1.  1. -1. -1. -1. -2. -2.  1.  1. -1. -1.  0.  1.

[ 0. -2.  1.  1. -1.  0.  0. -1. -2.  1. -1.  1. -1. -1.  1. -1.]
[ 0.  0. -2. -2.  1. -1.  0.  1. -2. -2.  1.  1.  1. -1.  0. -2.]
[-2. -2.  0. -2.  1.  1.  0.  1.  0. -2. -2.  0. -2. -2. -1.  1.]
[ 1.  1.  1.  0.  0. -2. -1.  1.  0.  0. -2.  0. -1. -1. -1. -2.]
[-2. -1. -2. -1. -2.  0. -2.  0. -2. -2.  0.  1.  1. -1.  1.  0.]
[-2.  0.  1.  0.  1.  1.  0. -1.  1. -1. -2. -2.  0. -1. -1.  0.]
[-1. -2. -1.  0.  1. -2.  1.  0.  0.  0.  0. -1.  1. -1.  0.  1.]
[-2.  0. -2. -1. -2. -2.  0. -1. -2. -1.  1.  1. -2.  0. -1. -1.]
[ 1.  0.  0.  0.  0. -1. -2. -1.  1. -2.  0.  0. -2. -1. -1.  0.]
[ 1. -2.  1.  0. -1.  0. -2.  1.  1.  1. -1.  0.  1.  0. -1.  0.]
[-1.  1. -2.  1. -2. -2. -1.  1. -2.  1. -1.  1. -2.  0. -1.  0.]
[-1. -2. -2. -2. -1. -2. -2.  1.  0. -1. -1. -2.  1. -2.  1.  1.]
[ 0.  0.  1. -1.  1.  0.  0.  0.  0. -2. -2. -2. -1. -1. -2.  1.]
[-1. -1. -2. -1. -1. -2. -2. -1. -1. -2. -2.  1. -2.  0.  0.  0.]
[-1. -1. -2.  0.  0.  1. -2.  1. -2.  1. -2.  1. -1. -1.  1. -1.]
[-2.  0.  

[ 0. -1.  1.  0.  0.  0.  0. -1. -2.  1.  0.  1.  1.  0.  1. -2.]
[-2. -1.  0. -2. -2.  0.  1. -2.  1.  0. -1. -1.  0. -2.  1. -2.]
[ 0.  1.  1.  0.  1.  1.  0.  1. -1. -2. -1.  1. -2.  1.  0. -1.]
[ 0.  0.  1.  1.  1. -1.  0. -2. -1. -2.  1.  1.  0. -1.  1. -2.]
[-1. -2.  1.  0.  1.  1. -1. -1.  1.  1. -1.  0.  0. -1.  1.  1.]
[ 1. -2.  0. -1.  0.  0. -1. -2. -1. -1. -1.  0.  0. -2. -2. -2.]
[-2.  0.  1.  0.  1. -1.  0. -2. -2. -1.  1. -2.  0.  0. -1. -1.]
[-1. -2. -2. -1. -2.  1. -1. -1.  0.  0. -1. -1.  1. -1. -1. -1.]
[ 1.  0.  0. -2.  0. -1. -2. -1. -1. -1. -1. -1. -1. -2.  1.  1.]
[ 0. -2. -1.  0. -1.  0.  0.  1.  1.  0.  0.  0. -2.  1.  1.  1.]
[ 1.  1. -1. -2. -1.  1.  1.  1. -2.  0.  0. -1.  1.  1. -1. -2.]
[-1. -2. -2.  1.  1. -2.  1.  1. -2. -2.  0. -1. -1. -2.  1.  0.]
[-1.  1. -1. -1.  1.  0.  1.  1.  0.  1.  1. -1. -1.  1.  0. -1.]
[-1.  0.  1. -2.  0.  1. -2. -2. -2. -1. -2.  0.  0. -2.  0. -1.]
[ 0.  0. -2. -1.  0.  1.  0.  1.  1. -2. -1. -2. -1. -1.  0. -2.]
[ 1. -2. -

[ 1.  0. -1. -1. -1.  0.  1.  0.  1.  1. -1. -1.  1.  1.  1.  0.]
[-1.  1. -2. -2.  0.  1. -2.  0.  0. -2.  1.  0. -1.  1.  1. -2.]
[ 0.  0. -1.  0.  1.  0. -1. -1. -2.  1. -2. -2. -2. -2. -2. -1.]
[-1. -1.  0.  0.  1.  0. -2. -2. -1.  1. -2. -2.  0.  1.  1. -1.]
[ 1. -2.  0. -1. -2. -1. -2.  0.  1. -1.  1. -1. -1. -2.  1. -2.]
[ 1. -2.  1. -2. -1. -2. -2.  1.  1.  0.  0.  0. -1.  0. -1.  0.]
[ 1.  0. -1. -1. -2. -2. -2.  1. -1.  0.  1. -2. -2. -1. -1.  1.]
[-1.  1. -1. -1.  0.  1. -2. -1.  0. -2. -2. -2.  1. -2.  0.  0.]
[ 1.  0.  1. -2. -1.  1. -1. -2. -2.  0. -2. -1.  0.  0.  0. -2.]
[ 0. -2. -2. -1.  1.  1. -1. -1.  1. -2.  0. -1.  1.  0. -1. -1.]
[ 0. -1. -1. -2. -1. -2.  1. -1.  0. -1.  0.  0.  1.  0. -2. -2.]
[ 0. -2. -1. -1. -2.  1.  0.  0. -2.  0. -1.  1.  1. -2. -2.  1.]
[-1. -2. -1.  0. -1. -1. -2.  0. -1.  0.  0. -1.  0.  0. -1. -2.]
[ 1.  0. -2. -2. -2. -2.  0. -2.  0.  0. -2. -1. -2. -1.  0.  0.]
[ 0.  0.  0. -2. -1. -2.  0.  1.  0.  1. -2.  0.  1. -2. -1.  1.]
[-2.  0. -

[ 0. -2. -2. -1.  0.  0. -1. -2.  0. -2. -1.  1.  0. -1. -2.  1.]
[ 1. -2. -1. -2.  0. -2.  1. -1. -2. -2.  0.  0. -1. -1. -2. -1.]
[ 1. -2.  1.  0. -1. -2.  1.  1. -1. -2.  0. -1.  0. -2. -1. -2.]
[-1. -2.  1. -1.  0.  1.  0.  0.  1. -2.  0. -2.  1. -1.  1. -2.]
[-2.  1.  1.  1. -1.  1.  1. -2.  0. -2. -1.  1.  1. -1.  1.  0.]
[-1.  1.  0. -2. -2. -1. -1.  0. -2.  1.  1. -1.  0. -1. -2. -2.]
[ 1.  0. -1. -2.  0. -1.  1.  1. -2.  1.  1. -1.  1.  0.  1.  0.]
[ 1. -1. -2. -2.  1. -1. -2. -1.  0.  0. -1. -1. -2.  1. -1. -1.]
[-1.  1.  1.  1.  1. -2.  0.  0. -2. -2. -1. -1.  0. -2. -1. -2.]
[-1. -1. -2.  1. -2.  1. -2.  1. -2. -1. -1. -2.  0.  1.  0. -1.]
[-1.  0.  0. -2. -1. -1. -1.  1.  0.  0.  0. -1.  0. -2. -1.  1.]
[-2.  0. -1.  0. -1. -1. -2.  0.  1. -2.  0.  0. -2. -1. -1.  0.]
[ 0. -2. -1.  1.  0.  1.  0.  0.  1. -2. -1. -2. -2.  1. -2.  1.]
[ 1.  0. -1.  0.  0.  0. -2. -1. -2.  0.  1.  1.  1. -2.  1.  0.]
[ 0.  0.  0. -2. -2.  1.  1.  1. -1. -1.  0. -1.  1.  0.  0. -2.]
[ 1.  0. -

[ 1.  0. -1.  1.  0. -1.  0. -2. -2. -1.  0. -1. -1.  0.  0. -2.]
[ 1. -2.  0. -1.  1. -1.  1.  1. -2. -1. -2. -2.  1.  1.  1.  0.]
[ 1.  0.  0.  0. -2. -1.  0. -1.  0.  0. -1. -2.  1. -2. -2. -1.]
[ 1.  0.  0. -1.  0.  0. -2. -1.  0.  0.  0. -1.  0.  1.  0. -2.]
[ 1. -2.  1.  0.  1. -1.  1. -2.  1. -2. -2. -1. -2.  0. -1.  0.]
[ 1. -2.  0.  0.  1.  1. -1.  1. -2.  0.  1. -2.  1.  1.  0.  0.]
[ 1. -1.  0. -2. -1.  1. -1.  1. -2. -1.  1. -2.  0. -2. -2.  0.]
[ 0.  1. -2. -1. -1. -2. -2.  1.  1.  1.  1.  0.  0.  0. -2. -2.]
[ 1. -1. -1.  0.  1.  1.  1.  0.  0. -1. -1.  1.  1.  1. -1. -1.]
[ 0.  0.  1.  1.  0.  1. -1.  0. -1.  1.  1. -1.  1. -1. -1. -2.]
[ 1. -2.  1.  0. -1.  0. -1.  0. -2. -2. -2.  0. -2. -1.  1. -1.]
[-1. -2.  0. -2.  1.  0. -1.  0. -1. -2. -1. -1.  0. -2.  0.  0.]
[-2. -1. -2. -1. -2.  0. -2.  1.  1. -2.  1.  0.  0. -2. -2.  1.]
[-1.  0. -2. -2. -1. -1.  1. -2.  1. -1. -2. -1. -1. -2. -2. -1.]
[ 0. -1.  0.  1. -2. -2. -1.  0.  0. -1.  1.  0.  1. -1. -1. -1.]
[-1.  1.  

[ 0.  0.  0.  1. -2. -2. -1. -1. -2.  0.  0. -1.  1.  1.  0.  0.]
[-2.  1. -1.  1. -1.  1.  0. -2. -2.  0. -2.  1.  0. -1. -1. -2.]
[ 0.  0. -1. -1. -2.  0. -1.  1. -2.  0. -1. -1.  1.  0.  0. -2.]
[ 0.  0.  1.  1.  1. -2. -2. -2.  1.  0. -2. -2. -2.  1.  1.  1.]
[-1. -1. -2.  1. -2.  1. -2. -1. -2.  0.  1.  1.  0.  1.  1. -1.]
[-2. -1. -2. -2.  0. -2.  0. -2.  1. -2. -1. -1. -1.  0. -2.  1.]
[-2.  0.  0.  1.  0.  0. -1.  0. -1. -1.  1.  1.  1. -1.  0. -1.]
[ 1.  1.  0.  0.  0. -1. -1.  1. -2.  0.  1. -1. -1.  1. -2.  0.]
[-2.  0. -2. -2.  0.  0. -2.  0.  1. -1.  0.  1.  1.  0.  0.  1.]
[-1.  0. -1.  1.  0.  0. -2.  1.  1.  1. -2. -2. -1.  1.  0. -2.]
[ 1. -1.  0. -1. -1.  1.  1. -1.  1.  1. -2.  1.  0.  1.  0. -1.]
[-1. -2. -2. -2.  0.  0.  0.  0.  1. -1.  0.  1. -2.  0.  0.  0.]
[ 0.  1.  1.  1. -2.  0.  1. -1.  0. -1. -2. -2. -1.  0. -1.  0.]
[-2.  1. -1.  1. -1. -2.  0. -2.  0. -1.  1. -1.  1.  1.  0. -2.]
[ 1.  1. -2. -1. -2.  1. -1. -2.  1.  1.  1. -1.  1.  0.  1.  0.]
[ 1. -2. -

[-2.  0. -1. -1. -2.  1. -1. -1.  1.  1.  1. -1. -1.  1. -2.  1.]
[ 1.  1.  1. -2. -1. -1.  0.  1.  1.  1. -1.  0. -1. -1.  0. -2.]
[-1.  1. -2.  0.  0.  1.  0.  0. -1. -2. -2.  0.  0. -2. -1.  0.]
[ 1.  0. -2. -1. -2.  1. -1. -2. -1. -1.  1.  0.  0.  0.  1.  0.]
[-1.  1.  0. -2. -2.  1. -1.  1. -1.  1.  0. -2. -2. -2.  0. -1.]
[ 0. -2.  1.  0. -1. -2.  1. -1.  1. -2.  0.  1. -2.  0.  1.  0.]
[ 1. -2. -1.  0. -2.  1. -1.  1.  1. -2.  1. -2. -2.  1. -1. -1.]
[ 0. -1. -2.  0.  1. -2.  0.  0. -1.  1.  1. -1.  0.  0.  0.  0.]
[ 1.  1. -2.  0.  1.  1.  1. -2.  0. -2. -2. -2. -2.  1. -1. -1.]
[ 0. -1. -1.  1. -2.  1.  1.  1. -1.  1.  1. -2. -2. -2. -2.  0.]
[ 0. -1. -1.  0. -1.  0. -1.  0.  1. -1. -2. -1.  0.  1.  0. -1.]
[ 0.  0. -1.  1.  0. -1. -1.  1. -2.  0.  0.  0.  1. -1. -2. -1.]
[-1. -1.  0. -1.  0. -1. -2.  1. -1. -2. -1.  0.  0. -1.  1.  0.]
[-2. -2.  1. -2.  0. -1.  1. -1. -2.  0.  0. -2.  1.  0.  0. -2.]
[ 0. -1.  1.  0. -1. -1.  1. -1.  0. -1. -1. -2.  1.  0.  0. -1.]
[ 1.  0.  

[-1.  1.  1.  0. -1.  0. -1.  1.  1.  0. -1. -2.  1. -2. -2.  0.]
[-2. -1.  1. -1. -2. -2. -2.  1. -1.  0.  0. -2.  0.  1.  1. -1.]
[-1.  0. -1.  1.  1.  0.  1. -1.  1. -1.  1.  1. -1.  1.  1.  1.]
[ 1.  1. -2. -1.  1. -2. -2. -1. -2. -1.  0. -2.  1. -2. -1. -2.]
[ 1. -1. -1. -1.  1.  1.  0. -2. -1.  1. -1. -2. -2. -2.  0. -1.]
[-2. -2. -1. -2. -2. -2. -2. -2.  1. -2. -1. -2.  1. -2.  0.  1.]
[ 0. -2. -2. -2. -1. -1. -2. -2.  0. -2. -2. -2. -1. -2. -2. -1.]
[-1.  0. -1. -1. -1. -2. -2.  1.  1.  1.  0. -2. -1. -2.  0. -2.]
[-2.  1. -1.  1. -2.  0.  1. -1. -1.  1. -2.  0. -1. -1. -2. -2.]
[-1.  0.  0. -1.  1. -2.  1. -2.  0.  0.  0.  1. -2.  1.  0. -2.]
[ 0. -2.  1. -1.  0.  1. -2. -1.  0.  1.  0.  1.  0.  1.  1.  0.]
[-2.  1.  0.  1.  1.  0.  1.  1. -2.  1.  0.  0. -2. -2. -2. -1.]
[ 1. -2.  0. -1. -1.  0.  1.  0.  1.  1. -2.  0. -2. -1. -1.  1.]
[-2.  1. -1. -2.  1.  1. -1.  1. -1. -1. -1. -1.  0. -2.  1. -1.]
[ 0. -1. -2. -2. -2. -2.  1. -2.  1.  1. -2. -2.  1. -2. -2. -1.]
[-1.  0.  

 57%|█████▋    | 17/30 [24:30<18:28, 85.29s/it]

[-2. -2.  0.  1. -1. -2. -2.  0.  0.  1. -1. -2.  0. -1. -1. -2.]
Training loss (for one batch) at step 0: 0.048129212111234665
Seen so far: 16 samples
[ 0. -1.  0.  0.  1.  0. -1. -1.  0.  0. -1. -1.  1. -1. -2. -1.]
[ 1.  1.  1.  0. -2.  0.  0. -2.  0. -1.  1.  0.  0.  0. -2.  0.]
[ 0.  1. -2. -2. -2.  0. -1. -2. -2. -1. -2. -2. -2. -1. -1.  0.]
[-2. -2. -2.  1. -1. -2.  1. -2. -2. -2. -2.  0. -1.  1. -1. -2.]
[ 0.  0. -2. -1. -2.  1. -2.  0. -2.  1.  1. -2. -2. -2.  1.  1.]
[-2. -1. -2. -2.  1. -1.  0. -2. -1.  0.  0.  1.  0.  1. -2.  1.]
[-2.  1.  1. -1.  1. -2. -1. -2.  1.  0.  1. -2. -2. -2.  0. -1.]
[-2. -2.  0.  1. -2. -1.  1.  0. -1. -2.  0.  0. -1. -2.  0.  0.]
[ 1. -1.  1. -2.  1.  1. -2.  0.  1. -2. -1.  0.  1. -1. -1.  1.]
[ 1.  0. -1. -1.  0. -1.  0. -1.  0. -2.  1. -1.  0.  1. -2. -1.]
[ 1. -2.  1. -2.  0. -2.  0.  0.  0. -1.  0. -2. -2.  1.  1.  1.]
[ 0.  0. -1. -1. -2.  1. -1.  0.  0.  1. -2. -2.  0.  0.  1. -1.]
[ 0.  0.  1.  0.  0.  1.  1. -1. -1. -1. -2. -2.  1. -2.

[ 1.  1.  1. -1.  1.  0.  0. -1. -1.  0. -1. -2. -1. -2. -1. -1.]
[-1.  0.  1. -1. -2. -1.  0. -1.  1.  1.  1. -2. -2.  0. -1.  0.]
[ 0. -1.  0.  0.  1. -2.  0.  0.  1. -1.  1. -2. -2. -1. -2.  1.]
[-1. -2. -1.  0. -1.  0.  1.  0.  1.  0.  0. -1.  0.  1. -1.  0.]
[-2. -2.  1.  1.  1.  0. -2.  1.  0. -1.  0.  1.  1. -1.  0.  1.]
[-1. -1. -2.  1. -2.  0.  0. -1.  1.  0.  0. -2. -1.  0. -2. -1.]
[-2.  0. -1.  1.  0.  1.  1.  0. -1.  1.  0. -1. -1. -1. -1.  0.]
[-2.  0.  1.  1. -2. -1. -2. -1. -1. -1. -1.  1.  0.  0.  0. -1.]
[-2.  0. -2.  0.  0.  0. -1. -1.  0.  1.  0. -2.  0. -1. -1.  1.]
[ 1.  0. -1. -2. -2.  0. -1. -2. -2.  1.  0. -1.  0.  1.  0.  0.]
[ 1. -2. -1. -2. -1.  0.  0. -2. -2. -2. -1. -2. -1. -1.  0.  0.]
[-1.  1. -2. -2. -1. -1. -2.  1. -1.  1.  1. -1.  1.  0. -1. -1.]
[-1. -1. -2. -2. -2.  1. -1. -1. -2. -1.  0. -1.  0. -1. -2. -1.]
[-1.  0. -1.  0.  1. -1. -1.  1. -1. -2. -2.  1.  0. -1. -2.  1.]
[ 0.  0. -2.  0.  0. -2.  0.  0.  1.  1. -1. -2.  0. -1.  0.  0.]
[ 0.  1. -

[-1.  0.  0.  1. -2. -1. -2.  0.  1. -1. -2. -1. -2. -2. -2.  1.]
[-2.  1.  1.  0. -2. -2. -1. -1.  0. -1. -1. -2. -2. -2.  0. -1.]
[-1.  0. -1.  1.  0. -2.  1. -2. -2.  1. -2. -1. -2. -1. -2.  0.]
[ 1. -1.  0. -1. -2.  0.  1.  0.  0.  1. -2.  0.  0.  0. -1. -2.]
[ 0. -1. -2.  0.  1.  0.  1.  0.  0. -2.  1. -1. -2. -2. -1.  1.]
[ 0.  1. -1. -2. -1. -1. -2. -1. -2. -1.  0. -2. -1. -1.  0.  1.]
[ 0.  0.  0.  0. -1.  0. -1. -2. -1.  0. -1.  0.  0.  1. -1.  1.]
[ 0. -1. -1.  0.  1.  1. -1.  0. -1.  0. -2. -2.  1. -1. -2. -1.]
[ 0.  1.  1. -2. -2.  0. -1.  0. -1. -2. -1.  0.  1. -2.  0. -1.]
[-1. -2.  1. -2. -2. -1.  0.  1. -1. -1. -2.  0.  1. -1.  1. -1.]
[-2. -2. -1. -1.  1. -1.  1.  1.  1. -2.  0. -1. -1. -1. -2. -1.]
[-1.  0. -1. -2. -2.  0.  0.  0. -1. -1.  0.  1.  1. -1.  0.  1.]
[ 0.  0. -1. -2. -1. -1. -1. -1.  1. -2.  0.  1.  1.  1. -1.  1.]
[ 1. -1. -2. -2. -2. -2. -2.  0. -1. -2. -1. -2.  1.  0. -2. -1.]
[-1. -2. -1.  1.  1. -1. -1.  0.  1. -2.  1. -2. -1.  1. -1.  0.]
[ 0. -2.  

[ 0. -2.  1. -2.  1. -1.  0. -1.  1.  1. -2. -2. -1.  1.  1. -1.]
[ 1. -1.  0.  1.  1.  1. -1.  0.  1.  0.  0.  0. -2. -1. -1. -2.]
[ 1. -1.  0.  1.  1. -2. -2. -2.  1. -2.  0.  1.  1.  1. -2. -1.]
[ 0. -1.  0.  1. -1. -1. -2. -1.  0.  1.  1. -2. -1. -1. -2.  0.]
[-2. -2. -2.  0. -1.  1.  1.  0. -1. -2.  0. -2.  0.  0.  0.  1.]
[-2. -2. -1.  1. -2.  1.  0. -1.  0.  1.  1.  1.  0.  1. -1. -1.]
[-1.  0.  0. -2. -2. -1. -1. -1.  0. -2.  1.  0. -1.  0.  1.  1.]
[-2.  0.  0.  0.  1. -2. -2. -1.  1.  0. -1. -1. -1. -2. -1. -2.]
[-1. -2.  0.  1.  0. -2. -1.  0. -2. -2.  0.  0.  0.  0. -1. -1.]
[-1. -1.  1. -2. -1. -1. -1. -2.  1. -1.  0.  1.  0.  0. -2. -2.]
[-2.  0.  1.  0. -2.  0. -2. -2.  1.  1. -2.  1.  1. -2. -1.  0.]
[-2. -1. -2.  1. -1.  1.  0.  0.  0. -2.  0.  1. -2.  1. -1.  0.]
[-2. -2. -2.  0. -2.  1. -2.  0. -1.  0.  1. -2.  1. -2.  1.  0.]
[-1. -2.  1.  1.  0.  1.  0.  1.  1.  1. -1. -2.  0. -2. -1. -2.]
[-2. -2. -2. -2. -1.  0. -2. -2. -1. -1. -2. -2.  1. -1. -1.  1.]
[ 0. -2. -

[-2. -1.  1.  0. -1.  1. -1. -1.  0.  0.  1. -1. -1. -2.  0.  1.]
[ 1. -2. -2. -1.  1.  0.  0.  0.  0.  0.  1.  1.  0.  1.  1.  1.]
[-2.  0.  0. -1.  0.  1.  1. -2.  0. -1.  0.  1.  0.  0.  1.  1.]
[-1.  1.  0. -1.  0.  0.  1.  0.  1. -1.  0.  1.  1. -1. -1. -1.]
[-1.  0. -2.  1. -1.  0. -1. -2. -1. -1.  1. -2. -1.  1. -1. -2.]
[-1. -2.  1.  1.  1.  0. -2.  1.  1.  0. -1. -1.  0.  0. -2.  0.]
[-1.  0.  0. -2. -1.  0.  1.  1.  0. -1.  0. -1.  0. -2.  1.  1.]
[ 0. -2.  0. -1.  1.  0.  0.  1. -2.  1. -2. -2.  1. -1.  0.  0.]
[-1. -1.  1.  0.  0. -1.  0.  0.  0.  1.  0. -2.  1.  0. -2. -1.]
[ 1. -2.  0. -1.  1. -2. -2.  0.  0.  1.  0. -2.  0.  1.  0.  1.]
[-2.  0.  1. -1. -2. -2.  0. -2. -2. -1. -2. -1. -2.  1. -1. -2.]
[-2. -2. -2.  1.  1. -2.  0.  0. -1. -1.  1.  0.  1.  1. -2. -2.]
[-2. -2.  1. -1.  1.  1.  1.  0.  0.  0. -1.  1.  0. -1.  1.  0.]
[-2. -2. -2.  1. -2. -1.  0. -2. -2.  0. -2. -2. -2. -2. -1. -2.]
[-1.  1.  0.  0.  0.  1. -2.  0.  1.  1. -1. -1. -1.  1. -1.  1.]
[-2.  1.  

[-1. -2.  0.  0. -2.  1.  0. -2. -2.  1. -1.  0. -1. -1.  1.  1.]
[-1.  0.  0. -2.  0.  0. -2.  0.  1. -1. -1. -2.  0.  1.  0.  1.]
[ 0.  1.  1.  0.  0.  0.  0. -2.  0. -1. -2.  0. -1.  0.  0.  0.]
[-1. -1. -1.  0.  1. -1.  0. -2.  0. -1.  1. -1. -2. -2. -1.  0.]
[-1. -2. -1.  1.  1.  0.  1.  0. -2.  1. -1.  1. -2. -1.  0.  0.]
[-1.  0. -1. -2. -2.  1. -1.  1.  1.  1. -1.  0. -2.  0. -2.  0.]
[ 1.  0.  0.  1.  0. -2.  0.  1. -2.  1. -1. -1.  0. -2. -2.  1.]
[-1.  0. -2.  0.  1. -2.  1. -1.  1. -1. -2.  1. -2.  0.  1. -1.]
[ 1. -1.  0.  0.  0.  1. -2.  1.  0. -2. -1. -1.  1.  0.  0. -1.]
[ 0. -2. -1.  0. -1.  1.  0. -2.  0.  0. -2. -2. -2.  0.  1.  0.]
[-1. -2. -1. -1. -1.  0.  0. -1. -1.  1. -2. -2.  1.  1.  1.  1.]
[-2.  0.  0. -1. -1.  1.  0. -2. -1. -2.  0.  0. -2.  0.  0. -2.]
[-2. -1. -1. -1.  0.  1.  0.  1.  0.  0. -1.  0.  0.  0. -2.  0.]
[ 1.  1.  1. -2.  1. -2.  0.  0.  0. -2.  0. -1. -1.  1. -2. -2.]
[-2. -1. -2. -1.  0. -2. -2. -2. -2. -1.  1. -2.  1.  0. -2.  1.]
[ 0. -1.  

[ 1.  1. -2. -2. -2. -1. -2. -1.  1. -1. -1. -1.  0. -2.  0.  1.]
[ 1.  1. -1. -1. -2. -1.  1.  1.  0. -1. -1.  1.  1. -2.  1. -2.]
[-1.  1.  1. -2.  0.  0. -1. -1. -2. -2.  1.  1. -1. -1. -1.  0.]
[ 0.  1. -1.  1. -1. -2.  1.  1. -2. -1. -1. -2. -1.  1.  0.  0.]
[-1. -2.  0.  0. -1. -1.  1.  0.  1.  1.  1. -1. -1. -1.  0. -1.]
[-1. -1.  1. -2.  1.  1.  1. -2.  0. -1.  1.  0. -2. -1.  1.  1.]
[ 0.  0.  1. -2.  1. -1. -1. -1.  1.  1. -1. -1. -2. -1. -1.  0.]
[ 0. -2.  0.  1.  0.  1.  0. -2.  0. -1.  0. -1.  0.  0.  0. -1.]
[-1. -2. -2.  1. -2.  1. -1.  1.  1. -1. -1.  0.  1.  0.  0.  0.]
[ 1. -2.  0.  1. -1.  0.  0. -2.  1. -2. -2. -2. -2.  1.  1.  0.]
[ 1.  0.  0.  0.  1. -1. -2. -1. -1.  0. -1.  1. -2.  1.  1.  0.]
[-2.  0. -1.  1.  1.  1. -1. -1. -1. -1.  0. -2. -1.  0.  0.  1.]
[-2.  0. -1. -2.  1.  0.  1. -2. -1.  0. -1. -2.  0.  1.  1.  1.]
[-1.  1.  0. -1.  1. -2.  0. -2. -1. -1. -1.  0.  0.  0. -2.  1.]
[ 0. -1.  1. -2. -2. -2.  0.  1. -2. -1. -1.  1.  0. -2. -1. -1.]
[ 1.  1.  

[ 0. -2. -1. -2.  0.  1.  1. -2. -1.  0. -1. -2.  0. -2.  0. -1.]
[ 1.  1. -1.  0.  1.  1. -1.  1. -1. -1. -1. -2. -2.  0.  0. -2.]
[-1. -1. -1. -2.  1. -2.  1. -1. -1. -1. -2.  1. -1.  0. -1.  0.]
[ 0.  0.  0.  0. -1.  1.  1. -1.  0.  0. -1. -1.  1.  1. -2.  0.]
[ 1.  0.  1.  0.  0. -1. -1.  0. -2. -1. -1.  0.  0. -1. -2. -2.]
[ 0.  1. -1.  0.  1. -1. -2.  0. -1.  0.  1.  0.  0.  0.  1. -1.]
[ 0. -1.  1.  0. -2.  1.  1. -2.  0.  1.  0. -2.  0.  0.  0. -1.]
[-2.  0.  0.  1.  1. -2. -1.  1.  1. -2. -2. -2.  1.  1.  1.  1.]
[-1.  1. -2.  1. -1.  0. -2. -1. -2. -2.  0. -1.  0.  1. -1.  0.]
[-2. -1. -2. -2. -1.  1. -2.  0. -1. -2.  1. -1. -2.  0.  1.  0.]
[-1. -1. -1.  0.  0.  0. -1. -1. -1. -2.  1.  1.  0.  0.  1. -1.]
[ 1.  1.  1.  1.  0.  0.  0.  0.  1.  1.  0. -1.  1. -2. -2.  0.]
[ 0. -2.  0.  0. -1.  0.  0.  1. -2.  0.  0.  1. -2.  0.  1. -2.]
[ 1. -1.  0.  0. -2. -2. -2.  0.  0.  1. -2.  1.  0. -1. -2.  0.]
[ 1.  0. -1.  1.  0.  1.  1.  1.  0.  0. -2. -1.  0. -1.  1. -2.]
[-2.  1.  

[ 1.  0. -2.  0. -2. -1. -1. -1.  0. -2. -1.  0.  1. -1. -2. -2.]
[-2. -2.  1.  0.  0. -2.  1.  0.  1. -2. -2.  0.  1. -1.  0. -1.]
[-1.  1.  0. -1. -1.  1. -2. -2.  0. -1.  1.  1. -1.  0. -2.  0.]
[ 0.  1.  1. -1.  0. -1. -1. -1.  0.  1.  0. -2.  1.  1.  1.  1.]
[ 0. -1.  0.  1. -1.  1. -1.  1. -2.  0. -1.  1.  0.  0. -1.  0.]
[-2. -1.  1.  0.  1. -1.  1. -1. -2. -1.  0.  1. -2.  0. -1.  0.]
Training loss (for one batch) at step 1000: 0.2015136480331421
Seen so far: 16016 samples
[-2.  1. -2. -2. -2. -2. -1.  0.  0.  0.  0. -2.  1. -2. -2. -2.]
[-1.  0.  1. -2. -2. -1. -1.  1.  0.  0. -2. -1.  0. -1.  1. -1.]
[ 0. -1.  0.  0.  1.  0. -2.  0. -1. -2. -1.  1.  1. -1. -1. -2.]
[-2.  0.  1.  0. -2.  0. -2. -2.  1. -2.  0.  1. -2. -1.  1. -2.]
[-2.  0.  0.  1.  1.  0.  1.  1. -1. -2. -2.  1.  0. -2.  1.  1.]
[ 0. -2. -1.  1. -1. -2. -1. -1.  0. -1.  1.  0.  0. -1. -1.  1.]
[ 0. -1. -2.  0. -1. -1.  1.  0.  1. -1.  1.  1. -2.  1.  0.  1.]
[ 1.  1. -1. -1.  0.  1. -1. -2. -2.  1. -1. -1.  0.

 60%|██████    | 18/30 [25:55<17:05, 85.46s/it]

[ 1.  0.  0.  1. -2.  0. -2.  0. -2. -2. -2. -1. -1. -2. -2. -2.]
Training loss (for one batch) at step 0: 0.02192147821187973
Seen so far: 16 samples
[ 1.  1. -2. -2.  0.  0. -2. -2. -2. -1. -1. -2. -2. -2.  0.  0.]
[-1.  1.  0. -2.  1. -2. -2.  0. -2. -1.  1. -1. -2.  0. -2. -2.]
[-2. -1.  1. -1.  1.  0.  0.  1. -1.  0. -2. -1.  0. -1.  0. -1.]
[-2. -2.  1. -2. -2.  0. -1.  1. -1. -1. -1.  1.  1.  1. -1. -1.]
[ 1. -1. -1. -2. -2.  1. -2. -1.  0. -1.  0.  0.  1.  0. -1.  0.]
[-2. -1.  1. -2.  1.  0. -2. -2.  0. -2.  1.  1.  1. -1.  0. -1.]
[-2.  0.  1. -2. -2.  0.  0.  0. -2.  1. -2. -2.  1.  1. -1. -1.]
[-1. -1.  1.  0.  1.  0.  0. -1. -1.  1. -2. -1. -1.  0. -2.  0.]
[ 1. -1. -2. -2. -2. -2.  0.  1.  1.  1.  1.  1. -2.  1. -2.  1.]
[-1.  0.  1. -2.  0.  0.  0. -1.  1.  0. -2.  0.  0. -1.  0. -2.]
[-2. -1. -1. -2.  1.  0. -1.  0.  0.  1.  1.  1.  1. -2. -1.  0.]
[ 1.  1.  1.  0.  0. -1.  0. -2.  1. -1.  1.  1. -1.  1. -1. -1.]
[ 0. -2. -1.  1.  1. -1.  0. -2. -1. -2.  1. -2. -2.  0. 

[ 0. -1.  1.  0.  0. -2.  1. -2. -1.  0.  0.  1. -1. -1.  1. -1.]
[-2.  0.  0.  0. -2.  1.  1. -2.  0.  0.  1. -2. -1.  1. -2.  0.]
[-2. -1. -1. -2.  0. -2.  1.  0. -2.  1. -1.  1.  1. -2. -1.  0.]
[ 1.  0. -1.  0. -1. -1. -2.  0.  1. -1. -1.  1. -2. -2.  1.  1.]
[ 1. -1.  0.  0.  0.  1.  0.  1. -1.  1.  1. -2. -1. -2.  1. -2.]
[ 1. -2.  0.  1. -1.  0.  1.  1. -1. -1. -2.  1. -1.  0.  0. -1.]
[-1.  0. -1. -2. -2. -2.  0.  0. -1.  1.  0.  0.  0. -1. -2. -1.]
[ 0.  0. -1.  1.  0.  0.  1. -2. -1.  1.  0.  0.  0.  0.  0. -1.]
[-1. -2. -1. -1. -2. -2.  1.  1. -1. -2.  0. -1.  1.  1. -1.  1.]
[ 0. -1.  1.  1.  1. -1.  1.  0. -1. -2. -2. -2. -2. -1.  1. -2.]
[-2.  0.  1.  1. -2.  0.  1.  1.  0. -1.  1. -1.  0. -1. -2. -2.]
[ 1.  0. -2.  1. -1.  1. -2. -2. -1.  0.  0.  0. -2. -2.  0. -1.]
[ 1.  0. -2. -1.  0. -1.  0.  1.  0. -1. -2. -2. -1. -2.  0.  1.]
[-1.  1. -2.  1.  0. -2.  0. -2.  0. -1.  1. -2. -1.  0. -2.  1.]
[-1.  1.  1. -1.  1.  0.  0. -2. -1.  0.  0. -1.  0. -1. -2.  0.]
[ 1. -1.  

[ 1. -1. -1.  1.  0. -1.  1. -2.  0.  0. -2. -1. -1.  1. -2. -2.]
[-2. -1.  1. -2. -1. -2. -2.  1.  0. -1. -1.  0.  0.  1.  0. -1.]
[-2. -2.  1.  0.  1. -1. -1.  0. -1.  0. -2. -2.  1.  0. -2.  0.]
[ 0. -1.  1.  0.  0.  0.  1. -1. -1.  1.  0.  0. -2.  1. -2. -1.]
[ 1.  0. -1. -1. -1. -1.  0.  0. -2. -1.  0.  0. -2. -2. -1. -2.]
[ 0. -1.  1.  0.  1. -2. -2.  1. -2. -1.  0.  1. -2.  0.  0. -1.]
[ 1. -2. -2. -2. -1.  0. -2.  0.  1. -1. -2.  0. -1. -2. -2. -1.]
[-2.  1. -2.  1. -2.  1.  1.  1.  1.  1. -1.  1.  1.  0.  1.  0.]
[ 0.  0. -1. -2. -1. -2. -2.  1. -1. -1.  1.  0. -1.  0. -2. -2.]
[ 1. -1.  0.  1.  1.  1. -2. -1.  1. -2. -2.  0. -1.  1.  0. -2.]
[-1.  0. -1.  0.  1.  1.  1. -1.  1.  0.  0.  1.  1.  1. -2.  0.]
[ 0.  1. -2. -2.  1. -1.  0.  1. -1. -1. -1.  1.  1.  0. -2. -1.]
[-1.  1.  0. -1. -2. -1. -1. -1.  1. -2.  1. -2.  1.  0.  0. -1.]
[ 0.  0.  1. -2. -1.  1. -2.  0.  0. -1.  1.  0.  1. -2.  1.  0.]
[ 0. -2. -2.  0. -1. -2.  0. -2. -2.  1.  0. -1.  0. -2. -1.  0.]
[-2. -1. -

[ 1. -2.  1. -1.  1. -2.  1.  0. -2. -2. -1. -1. -2. -2.  0.  1.]
[-1. -2.  1.  0. -2.  1. -1. -1.  1. -2.  0.  0. -2. -2.  1.  0.]
[ 1.  0. -2.  0.  0. -1.  0. -2. -2. -2. -2. -2. -2. -1.  0.  1.]
[-2.  0.  0. -2.  1.  0. -2. -1. -2. -2. -2.  0. -2.  1. -2.  1.]
[ 0. -1. -1.  1.  0. -1. -2. -2.  1. -1.  1. -1.  0. -1.  0. -1.]
[-1.  1. -1.  0. -2.  0.  1.  0. -2.  1.  1.  1. -1. -2.  0. -1.]
[-1. -2. -2. -1. -2.  0. -1.  1. -2.  1. -1.  1. -2.  0. -2.  1.]
[-2.  0.  1. -1. -2.  1. -1. -1.  1. -2.  0.  1. -1.  1.  1.  1.]
[ 0. -1. -2.  0.  1. -1.  1.  1.  0. -1.  1.  0.  1.  1.  0.  1.]
[ 1.  0. -1.  1. -2.  0.  0.  0. -1. -1. -2. -2. -2. -2.  1. -1.]
[ 0.  0.  1.  0.  1. -1. -2. -2.  0. -1.  0.  0. -1.  1. -2.  0.]
[ 0.  0.  0.  0. -1.  1.  0.  1.  0.  0. -2.  1.  0. -1.  0.  1.]
[ 0. -1.  1.  1.  0. -2. -1.  0.  1. -2. -2.  0. -2. -1.  1. -2.]
[ 0.  0.  0. -2. -1. -1. -2.  0. -2. -2. -1. -1. -2.  1. -1.  0.]
[-2. -2. -2.  0. -2. -1.  1.  0. -2.  0.  1.  1.  1.  1.  1. -2.]
[-2. -2.  

[-1.  0.  1. -2. -1.  1.  1.  0.  0.  1.  0. -2. -2.  0.  0. -1.]
[ 1. -1.  0.  1. -2. -2. -2.  0.  0.  1. -1. -2. -1.  0.  0. -1.]
[ 0. -2. -1.  1. -2. -1. -1.  0. -2. -2.  1. -2.  0. -2.  1.  1.]
[-1.  1. -1.  1. -1. -1. -1.  0. -1.  0.  1.  1.  0. -2. -2. -2.]
[-2. -1. -1. -2.  0.  1.  1.  0. -1. -1.  1.  0.  1.  0.  1. -2.]
[ 0. -1.  1. -1.  0. -2.  0. -1.  1.  0.  1.  1.  0.  0. -1.  1.]
[-1. -1. -1. -1. -2.  0. -2. -2. -2.  0. -2. -1. -2.  1.  1.  0.]
[ 1.  1. -2. -1.  0.  0.  0.  1. -2.  0. -2.  0.  0. -2. -1.  0.]
[ 0.  1. -1. -2. -2. -2.  1. -2.  1. -2. -1.  1.  1. -2.  1. -2.]
[-1.  0. -2.  1. -2.  1.  1. -2. -1.  0.  1. -2.  0. -1. -2.  1.]
[-2. -2.  1. -2. -2. -2. -1.  0.  1. -1.  1.  0. -1. -1. -2. -1.]
[-1.  0.  1. -1.  1. -2. -2.  1. -2.  1. -1.  1. -2. -1. -2. -2.]
[-1.  0.  1. -1.  1.  0.  0.  1. -1.  0. -2. -2.  1. -1. -1.  1.]
[-2.  0.  1. -2. -1.  0.  0.  1. -2. -2. -1. -2. -2. -2.  0. -2.]
[ 1. -2.  1.  0. -1.  1.  0.  1.  1.  1.  0. -2. -2.  1.  1. -1.]
[ 0. -2. -

[-2. -2.  1.  1. -1.  1.  0. -1. -2. -1. -1. -2. -2.  1. -2.  0.]
[-2. -2.  1.  1. -1.  0. -1.  0. -2. -1.  0.  0. -1. -2.  0. -2.]
[ 1.  0.  1. -2.  0.  1.  0. -1. -1.  1.  1. -1. -2.  1. -1. -1.]
[ 0. -2. -1. -1. -2. -2.  1. -2. -1. -2.  1. -2. -1. -1. -1. -1.]
[ 1.  1. -2. -2. -1. -2. -2.  1. -1.  0. -1.  0.  1. -1.  1.  1.]
[-1. -2.  0. -1.  1.  1.  1. -2. -1.  0. -1. -1.  1.  1.  1.  0.]
[ 0.  0.  0. -1.  0.  0. -2.  0.  1. -2. -1. -1.  1.  1.  1. -2.]
[ 1.  1. -1. -1.  0. -1. -2.  0. -1. -2. -1. -2. -2.  0. -1.  0.]
[ 1.  0. -2. -2.  0. -2. -1.  1.  0. -1.  1.  1. -2. -2.  1.  1.]
[-2.  0.  0. -2.  0.  1.  0. -1.  1.  0. -1. -2. -2. -1.  0. -2.]
[ 0. -1.  0. -2. -2.  0.  0. -1.  0.  1.  0. -2.  0. -1.  0. -1.]
[ 1.  1. -2.  1. -1.  1. -1. -2. -1. -1.  1. -1.  1. -2.  0. -2.]
[ 0.  0.  1. -1. -1.  1.  0.  0.  1. -1.  0.  1.  0. -1.  0.  0.]
[-1. -1. -1.  0.  0.  1. -1.  1.  1. -2. -1.  1.  1.  1.  0. -1.]
[ 0. -1. -2.  0.  0.  0.  1. -2. -2.  1. -2.  0.  1. -1.  0.  1.]
[ 0.  0.  

[-2.  1. -2.  0.  1.  1.  1. -1.  0.  1. -2.  1.  1. -1.  0. -1.]
[ 1. -2. -2.  0.  1.  1.  0. -1. -1. -2. -2.  0. -2. -1.  0.  1.]
[ 0. -1.  1.  1.  1.  1.  0.  0.  1.  1. -2. -1.  0.  1. -2.  1.]
[ 1.  1. -2. -2.  1. -1. -1.  1.  1. -2.  0. -1.  1.  0.  1.  0.]
[-1. -2.  1.  0.  0. -2.  0. -2. -2.  0. -2. -2.  0. -1.  1.  1.]
[-1. -2. -1. -2.  0. -1.  0.  1.  1. -2.  0. -2. -2.  1.  0.  1.]
[-2.  1.  1.  0. -2. -1. -2.  1.  0. -1. -2. -2. -1. -1.  1.  0.]
[ 1. -2.  0.  0. -2.  0. -2. -1. -1. -2. -2.  0. -1. -2.  0.  1.]
[ 1. -1. -1. -1.  1.  1.  0.  1. -1.  1. -1.  0.  0. -2. -1.  1.]
[-2.  1.  0.  0.  0. -1.  0.  0.  0.  1. -1.  1.  1.  1.  0.  1.]
[ 0. -1. -2.  1.  1.  1.  1.  0. -1. -2. -2. -2. -2.  1.  1.  1.]
[-2. -1.  1. -2. -2. -2.  0.  1. -2. -1. -2. -1. -1. -1. -1. -2.]
[ 1. -2.  1.  1.  1. -1. -2. -1.  0.  1. -1. -1.  1.  1.  1.  0.]
[-1.  0. -2.  0.  0.  1.  0. -2. -2.  0.  1.  0.  1.  1. -1.  1.]
[-1. -1.  0. -2.  1. -1. -2. -2. -2.  1. -1. -1. -1. -1.  1. -2.]
[-1.  1.  

[-1. -1.  1. -1. -2. -1. -2.  0.  1.  0.  0. -1. -2.  1. -1.  1.]
[ 1. -2. -2.  0. -1.  1.  1.  1.  0. -2. -2. -2. -2. -2. -2.  1.]
[-2.  1. -1.  1. -2. -1.  0. -1. -1. -2. -2.  0. -1. -2.  0.  1.]
[ 1. -2. -2.  1.  1. -2. -1. -2.  0. -2.  0. -2. -2. -2.  1.  0.]
[-2.  1.  1. -1. -2. -2. -2. -1. -1.  0. -1.  0. -2. -1.  1. -1.]
[-2. -2.  1.  0.  1.  0.  0.  1.  0.  0.  0.  1. -2.  0.  1.  1.]
[ 1.  0.  1.  1.  0. -1.  1.  0. -2.  1.  1.  0.  0. -2.  1.  0.]
[-2. -1. -1. -2. -1. -2.  1.  1.  0. -1. -2. -2. -1.  1.  1.  1.]
[-2. -1.  0. -1. -1.  1. -2. -2. -1.  0. -2. -1. -1.  1. -2. -1.]
[ 1.  1. -2.  0. -2. -1. -2. -1.  1. -1. -2.  0.  0.  1.  0. -1.]
[-2. -2. -2. -1. -1. -1.  0.  1. -2. -2. -1. -2.  0.  0.  1.  1.]
[-2. -1.  1.  0. -2.  0. -1.  0. -2. -1. -2. -1.  1.  0. -2. -1.]
[-1.  1. -2. -1.  1. -1. -1. -1.  1.  1.  0. -1.  0.  1. -2.  1.]
[-1.  0. -1. -1. -2.  0. -2.  0.  1.  1.  0. -1.  1. -1. -1.  0.]
[-1. -1.  1.  1. -2.  1.  0.  0.  1.  0. -2.  0. -2. -1. -1. -1.]
[ 1. -1.  

[-1. -2.  1. -2.  0. -2.  1.  0. -2. -1.  1. -1.  1.  1.  1.  1.]
[ 1. -2.  0.  1.  0. -1.  0.  1.  0.  0. -1. -2. -2. -2. -1. -1.]
[-1.  0. -2. -2. -1.  1. -1. -2.  0. -2. -2. -1.  0. -1. -2.  1.]
[-2. -1.  1. -2.  1. -1. -1.  0. -1. -1. -2.  1. -1. -1. -2.  0.]
[-2. -2. -2. -2. -2. -1.  0.  1.  1.  1.  0.  0. -1.  0. -1. -1.]
[ 0.  0.  1.  1. -2.  0.  0. -2. -1.  0. -2. -2.  1.  0. -2. -1.]
[-1.  1.  1. -2.  1. -1.  0. -2.  0.  0. -2. -2. -2.  0. -1.  1.]
[-2. -2.  1. -2.  1.  0. -1.  1.  1.  0. -1.  1.  0. -2. -2. -2.]
[-2. -2.  0.  1. -2.  1.  1. -1. -1.  1.  1. -1. -2.  1.  0.  1.]
[-2. -1.  0. -2.  0.  1. -1.  1. -1.  1.  0.  1. -1.  1.  0.  1.]
[ 0. -1. -2. -1.  0. -1.  0.  0. -1.  1. -2.  1.  0.  1.  0. -1.]
[-1. -1.  1. -2.  0. -1.  1.  0.  1. -2.  1.  0. -1. -2.  0. -2.]
[ 1.  0.  0. -2.  1. -1.  0.  0. -2.  1. -2. -1. -1. -2. -1.  1.]
[-2. -1.  0.  0.  1. -2. -1. -1.  0.  1. -2. -1.  0. -1.  1. -2.]
[ 0. -2.  1. -1.  0.  1. -2.  1.  1. -2. -2. -1. -1.  0.  0.  0.]
[-1. -1. -

 63%|██████▎   | 19/30 [27:19<15:34, 84.93s/it]

[-1.  1. -2. -2.  0. -1.  1. -2.  0.  0.  0. -2.  1.  0. -2.  1.]
Training loss (for one batch) at step 0: 0.023659277707338333
Seen so far: 16 samples
[ 1. -2. -1. -1. -1. -1.  1. -1.  0.  1. -2. -1.  1. -2.  1. -1.]
[-1. -1.  0.  0. -2.  1.  1.  1.  1. -2. -1.  0.  0.  1.  1. -2.]
[-2. -2.  0.  0.  0. -2. -2.  1.  0.  1. -1.  0.  1.  0.  1.  1.]
[ 0.  1.  1. -2.  0.  0. -1. -2.  0.  0. -1.  0.  0.  1. -2. -2.]
[-1.  0.  1.  1. -2. -2. -1.  0. -1.  1. -1. -1. -1. -2. -1.  0.]
[ 1. -1. -2.  1. -1. -1.  0. -1.  0.  1.  0. -2.  1. -2. -1. -1.]
[ 0.  1. -1. -2.  0. -2.  0. -2. -2.  1.  1.  1. -2.  1.  1.  0.]
[-2.  1.  0.  0.  1. -1. -1.  1. -2. -1. -2.  0.  0.  0.  0. -1.]
[ 1. -2.  0.  0.  0. -2. -2.  0. -1. -1.  0. -1.  1. -2. -1.  1.]
[-2.  1. -2.  0. -2. -2.  1. -2. -2. -1.  0.  0. -1. -2.  0. -2.]
[-2.  0. -2. -2.  0. -1.  1.  1.  0.  1.  0.  0. -2.  1. -1.  0.]
[ 0.  0.  0. -2.  1. -1.  0. -2. -2. -1.  0. -2. -2.  0. -2. -1.]
[ 1. -1. -1. -1.  1. -1.  0.  1.  0.  1.  1.  0. -1. -2.

[ 0. -2.  1. -1.  0. -1. -1.  1. -1. -1. -2. -1. -2.  1. -2.  0.]
[-1. -2. -2.  0.  1.  1. -2. -2.  1. -2.  0.  1.  0.  1. -2. -2.]
[ 1.  1. -2. -2.  0.  1. -1.  0. -1. -1. -2. -2.  1. -2.  0. -2.]
[-2.  0.  0.  0. -2.  1.  0.  0.  1.  0. -2. -1.  0.  1.  1.  1.]
[-1. -2.  0. -1. -1. -2.  0. -2.  1. -1. -2.  0. -1. -1.  1.  1.]
[ 1.  1. -2. -1. -2. -2. -2.  1. -2. -1. -2.  0.  1. -2.  1. -2.]
[-2.  0. -1. -2.  1.  1. -1.  0.  1.  1. -1. -2.  1.  0. -1. -1.]
[-1. -1. -2.  1.  1.  0. -1. -2.  0. -2. -1.  0.  1.  0.  1. -2.]
[ 0. -2.  1. -2. -1.  0.  0. -2.  0.  0. -2. -1.  1.  0.  1. -1.]
[-2.  1. -1.  1. -2. -2.  1.  0.  1. -2.  1. -2. -1.  1.  0.  1.]
[-2.  0.  1. -2.  1. -1. -1.  1.  1. -2.  0.  0. -2.  0. -2.  0.]
[-2.  1.  1.  1.  0.  0.  1.  0. -2.  0.  0.  0. -2. -2.  0. -2.]
[ 0. -2.  1. -1.  0.  1. -1.  1. -2.  0. -2. -2. -1.  0.  1.  1.]
[-2. -2.  1. -1. -1. -1.  1. -2. -2. -2.  0. -2.  0. -2. -1. -2.]
[-1. -2. -1. -1.  1. -1.  1.  0.  1.  1. -1. -1.  1. -2.  1.  0.]
[-1.  1.  

[ 0. -2. -1. -1. -2. -2.  0. -2. -1. -2. -1.  0. -2. -1.  0.  1.]
[-1.  0. -2.  1. -2. -2. -1. -1.  1. -2.  1. -2.  1. -1. -1. -1.]
[ 1.  0.  1. -1. -2. -2. -1.  1. -2.  1. -2. -1.  0.  1. -2. -1.]
[-1.  1. -2.  0. -2.  0.  0.  1.  1. -2. -1. -1.  1.  0. -1. -2.]
[ 1. -1.  1. -2.  0.  0. -1. -2. -1.  0. -2. -2.  0.  1.  1.  1.]
[ 1. -1.  0. -2.  1. -2. -2.  1.  1. -2. -2. -2.  0.  0. -2. -2.]
[-2. -1.  1.  0.  0. -1.  1.  1.  1.  0. -2.  0. -2.  0.  1.  0.]
[ 0. -1. -1.  0.  0.  0. -1.  0. -1. -2. -1. -1. -1. -1.  0.  1.]
[-2.  1.  1.  1.  1.  1. -1.  1. -2.  0. -1.  1.  0. -2. -2. -1.]
[ 1. -1. -1.  1. -2.  0.  1.  1.  0. -2.  0. -1.  0.  0. -2. -1.]
[-2.  1.  0.  1. -2. -1. -1.  1.  1.  0. -1. -2.  1. -1. -1.  0.]
[-1.  1. -2. -1.  1. -2.  1. -2.  1. -1. -1.  1. -1.  0. -2.  0.]
[ 1.  0. -1.  1.  1.  1. -1.  1.  1.  1.  0.  1.  1. -1.  1. -2.]
[-1. -2. -1.  0. -2. -2.  1.  1.  0. -2. -1. -2.  1.  1.  0.  0.]
[-2. -1. -2.  0.  1.  1. -1. -2. -1.  1.  1.  1.  0.  0.  1.  1.]
[ 1. -1. -

[ 0.  0.  1.  1.  1.  1. -1. -1.  1. -1.  0.  0.  0.  1.  1.  1.]
[-1. -2. -2.  0. -2.  1. -1. -2. -1.  0.  1.  1. -2. -1.  0.  0.]
[-2.  0.  0.  1.  1. -1.  1. -1.  0.  0. -1.  1.  0. -1. -2. -2.]
[-1.  0. -2. -1. -1.  1. -1.  0.  1.  1.  0. -1. -1. -1. -2.  1.]
[ 1.  1. -1.  1.  1.  0.  1.  0.  1.  0. -2.  1.  1.  0. -2.  0.]
[-2.  1.  1.  1. -1.  0. -1.  0.  1. -1.  1. -1.  0. -2. -2. -2.]
[ 1.  0.  0.  0. -1. -1.  0. -1. -2. -1. -2.  1.  1. -2.  0.  1.]
[-1.  1.  0. -2.  0. -2. -1. -1.  0. -1.  0.  1.  1.  1.  1. -2.]
[-2.  0.  1. -2. -1.  1.  0.  0.  0. -1. -1. -2. -1. -2. -2. -1.]
[-2. -1. -1.  0. -2. -2. -2. -1.  1.  1. -2. -2. -1. -1. -2. -1.]
[ 1.  1.  0.  1.  0. -1. -2. -2.  0.  1.  0.  0. -2.  0.  0.  1.]
[-2.  1. -1. -1. -2. -2. -2.  1.  0.  1. -2. -1.  0. -2. -1.  1.]
[-1.  0. -1. -1.  1. -2.  1.  0. -1.  1.  1.  0. -1.  0. -1. -2.]
[ 0.  1.  1.  1.  1.  0.  0. -1.  0. -2.  1. -1.  0.  1. -2. -1.]
[ 1.  0. -2. -2. -2. -2. -2. -2.  1. -2.  0.  1. -2. -2.  0.  0.]
[-2.  0.  

[ 0. -2. -1. -1. -2.  1. -1. -2. -1.  1.  1. -1. -1. -2. -1. -1.]
[-2. -1. -2. -1. -1. -2. -1.  0.  1.  0. -2. -1.  0.  0.  1. -1.]
[ 0.  0.  1. -1.  1.  1. -1. -1.  1. -2.  1. -2. -2. -2.  1. -2.]
[ 0.  0. -1.  0. -1. -2.  0.  0.  1.  0.  1. -1.  0.  1. -1. -1.]
[-2.  1.  0. -2.  1. -2.  1.  1.  1.  0.  1. -2. -1. -1.  1. -2.]
[-2.  0. -2.  0.  1.  0.  0. -2. -1.  0. -1.  0. -1. -1.  0.  1.]
[-2. -1.  1.  0. -1.  0.  1. -1.  0.  1.  0. -2.  0. -1. -1.  0.]
[-1. -2.  0.  0.  0. -2. -1.  1. -2.  0. -2. -1.  1. -1. -2. -2.]
[ 0. -1. -1.  1. -2. -1. -1. -2.  0.  0. -1.  0.  0. -1.  0.  0.]
[ 0. -1.  0.  1.  1. -1.  0. -1.  0.  0. -2. -1. -1. -2.  1.  0.]
[-1. -1. -2. -2. -2.  0. -1.  0.  0. -2.  0.  0.  0.  1.  1.  1.]
[-2. -1. -2. -2. -2. -2.  0.  0. -2. -1.  0.  0.  1. -2. -2. -2.]
[ 0.  1.  0.  1.  1. -1.  0. -2. -1. -1.  1.  0.  0.  0.  0.  0.]
[ 1. -2. -2.  1. -2.  1.  0.  1.  0.  0.  0. -2. -1. -1. -2. -1.]
[ 0.  0. -1. -2. -1.  0.  1. -1.  1.  1. -1.  0. -2. -2. -2.  0.]
[ 1. -2. -

[ 0.  0.  0.  1.  0.  1. -1. -2. -1.  1.  0.  0. -1.  1. -2.  1.]
[-2. -1.  1.  1. -1.  1. -1.  0. -2. -1.  1. -1.  1. -1.  1. -2.]
[ 1.  1. -2. -1.  1. -1.  0. -1. -2.  0.  0. -2.  1. -2.  0.  1.]
[-1.  1. -1.  1.  1. -2. -1.  0.  1.  1.  0.  0.  0.  0.  1. -2.]
[-2.  0. -2.  1. -2. -1. -1.  0.  1. -1. -2. -2. -2. -1.  1. -1.]
[-1.  0. -2. -1. -2. -2.  0.  0.  0. -2.  0. -2. -1.  0.  1.  1.]
[-1.  0.  0. -2. -1.  0.  0.  1.  1.  1. -1.  0.  0. -1.  0. -2.]
[ 1. -2.  1.  1. -1.  1. -1.  0.  1. -1. -2.  1.  0.  0. -1.  1.]
[ 1.  0.  1.  1.  0.  0.  1.  1. -2. -2. -2. -1.  0. -1.  1.  0.]
[ 1. -2. -1. -2.  1.  0. -1.  1. -1.  0.  1.  0.  0. -2. -2.  1.]
[-2.  0.  1. -2. -2. -1. -2. -2. -2. -2. -1.  1.  1.  1. -1. -2.]
[ 1.  0. -2.  0.  1.  1. -1. -2. -2.  0. -1.  0.  0. -1.  1.  1.]
[ 1. -1.  0.  1. -1. -1. -1.  1. -2.  1.  1.  0. -1. -2. -1. -2.]
[ 0.  0.  1.  0.  0.  1. -2. -2. -2.  1. -1. -1. -1. -1. -1.  1.]
[-1. -2.  1.  0.  0. -1. -2. -2.  0. -1.  1.  0.  0.  0.  0.  0.]
[-2.  1. -

[ 1.  1.  1. -1.  1.  0.  1.  1.  0.  0.  1.  0.  0. -2. -2.  0.]
[ 1. -1.  1. -2. -2. -1. -1. -1.  0. -2. -1. -1. -2. -2. -2. -1.]
[-1. -1. -2.  1.  1. -2.  0.  1. -2.  1. -2.  1. -2.  0.  0.  1.]
[ 0. -1. -1. -1. -1. -2. -1.  0.  0. -2. -1. -2.  0. -2. -1.  0.]
[-2.  0. -2. -1.  1. -2.  1. -1.  1.  0.  1. -1. -2. -2. -2.  0.]
[-1. -2. -1. -2.  0.  1.  1. -1. -1. -2.  0.  1. -2. -1.  1. -2.]
[ 0.  1. -2.  0.  1. -1. -1.  1. -1.  1. -2. -1. -1.  0. -2.  0.]
[ 0.  1. -1. -1.  1. -2. -1. -2.  0.  1. -2. -2.  0. -1. -1.  1.]
[-2. -1.  1. -2. -1. -1. -1. -2. -2. -2.  0. -1. -1.  0.  1. -2.]
[-1.  1.  0. -2.  1.  1. -1.  1. -2.  1.  1.  1.  0. -2. -1. -2.]
[-2. -1.  1. -1. -1. -1.  1.  0.  0. -1.  1.  0.  1. -1.  1.  1.]
[ 1. -2. -2. -1. -2.  0.  0. -1.  1. -1.  1.  1.  1. -2.  0. -2.]
[-1.  1.  0. -2.  1.  0. -1.  1.  0. -1.  0. -2. -1. -1. -1. -1.]
[-1.  0. -1. -1.  1.  1.  0.  1.  0.  1. -2.  0.  1.  0. -1. -1.]
[ 0. -2. -2.  1.  1. -2.  0. -1.  0. -1. -2.  0.  0. -2. -1. -1.]
[ 1.  1.  

[-1. -2.  1. -2. -2. -1. -2. -2.  0. -2. -1. -2. -1.  0.  1.  0.]
[ 0. -1.  1.  0.  0.  0. -2.  1. -2.  0.  0. -1. -2.  0. -2.  0.]
[ 1.  1. -2. -1. -1.  1. -2.  0. -2.  1.  1. -1.  1.  1.  1. -1.]
[-1.  1. -1.  1. -1. -1.  1. -2.  0.  0.  1. -1.  0.  1.  1.  1.]
[ 1. -1.  1.  1.  0. -1. -1. -1. -1.  1.  1. -1.  1.  0.  0. -1.]
[ 1. -2.  0. -1. -1.  1. -1. -1. -2.  1. -2. -2.  0.  1. -2. -2.]
[ 0. -1. -2.  1.  1.  1.  1. -2. -2. -2. -1. -2.  1.  0.  1. -2.]
[ 1.  1. -1. -2.  1. -2.  1. -1. -1.  1.  1.  0. -2. -1. -1. -1.]
[-1.  1. -1. -1.  0.  1.  1. -2.  0.  1.  1.  1. -2. -2. -2. -2.]
[-2. -2. -1.  1. -2. -1.  1.  0.  0. -1.  0.  1.  0.  1. -2.  0.]
[-1. -2. -2.  1.  0.  0. -2. -1. -1. -2. -1.  0.  0.  1.  1.  1.]
[ 0. -2.  0. -1.  1. -1. -1. -2.  1. -1.  1. -1. -2. -2.  0. -2.]
[ 1.  0.  1. -2.  0. -1.  0.  0. -2. -2.  0.  1. -1. -1.  1.  0.]
[-2.  1.  1.  1. -1. -1. -2.  0.  0.  0. -1. -2.  0. -1.  0. -2.]
[ 1.  0. -1. -2.  0. -2.  0.  0. -1. -1.  1. -2.  1.  0.  0. -1.]
[ 0. -1.  

[ 0. -2.  1. -1.  0. -1. -1. -2. -2. -1.  0. -2. -1. -1. -2. -1.]
[-2.  1. -2.  1. -2. -1. -1.  0.  1. -2. -2.  1.  1.  1.  1. -1.]
[ 0.  0.  0. -2. -1.  1.  0. -2. -1. -2.  1. -2.  1.  1. -2.  0.]
[-1. -1. -1. -1.  1. -1.  1. -1. -1.  1. -2. -2.  0. -2. -1. -1.]
[-2. -1. -2.  1.  0.  0. -2. -1. -2.  0.  1. -2. -1. -2. -2.  1.]
[ 0.  1. -2.  0. -2. -2.  1. -1. -1.  0.  0.  0. -2.  0.  0.  0.]
[-2. -2. -1. -2.  1. -1.  0.  0.  1.  1.  0.  1.  1.  1.  1.  1.]
[-1.  0.  0.  1. -1. -1. -2.  1. -2. -2. -2.  0. -1. -2.  0.  0.]
[ 0. -2.  0.  1. -2. -1.  1.  0.  1.  0. -2. -1. -1.  0. -1.  0.]
[ 0.  1. -1.  1. -1. -1.  1.  0. -2. -1.  0. -2. -1. -2. -1. -2.]
[-2. -1. -2.  1. -2. -1.  0. -2. -2. -1.  1. -2.  1. -1. -1.  0.]
[ 0.  1. -2. -2.  1.  1.  1.  1.  0.  1.  0.  0.  1. -1. -2. -1.]
[ 0. -2. -1.  0. -2. -2. -2. -2. -2.  1.  0. -1.  0. -2. -1.  1.]
[-1.  0.  0. -2. -1. -1. -1.  1.  1. -1.  0. -1. -1. -1. -1.  0.]
[-2.  1.  0. -2. -2.  0.  0. -1. -2.  1. -2. -2.  0. -1. -2. -1.]
[ 0. -2.  

 67%|██████▋   | 20/30 [28:43<14:06, 84.60s/it]

[-1.  0.  1. -1. -1.  1. -1.  1.  0. -2. -2. -1. -2. -1. -2.  0.]
Training loss (for one batch) at step 0: 0.03239058330655098
Seen so far: 16 samples
[ 0. -1.  1.  0. -1.  1. -2.  1.  1. -1. -1.  1. -2. -1.  1.  0.]
[ 0.  0. -1.  1.  1.  0.  1. -2.  0. -2.  1. -2. -1.  0. -1.  0.]
[-1.  0.  1.  0.  0.  0. -2.  0.  1. -2.  1. -1. -2.  0.  0.  0.]
[-2.  1. -2.  0. -1.  1. -1. -1.  0.  1. -1. -2.  1. -2.  1. -2.]
[ 0.  0. -2.  0. -2. -2.  0.  1. -1. -1. -1. -1.  0.  1. -1. -1.]
[ 0. -1. -1.  0.  0.  1. -2.  1. -1. -1.  0.  0.  0. -1. -2.  1.]
[ 0.  0. -2.  1. -2. -2.  0.  0.  1.  1. -1. -2.  0. -1.  1.  1.]
[-1. -1. -2.  0.  1. -1.  1. -1. -1.  1. -1. -2. -1. -2. -2. -2.]
[-1. -2. -1.  1. -2. -2.  0. -1.  0.  0.  1.  1.  1. -1.  1. -2.]
[-1.  0.  0.  1. -2.  0.  1.  1.  0. -2.  0.  0.  1. -2. -1. -1.]
[ 1.  1. -2. -2. -1.  1.  0.  1.  1.  0. -2. -1.  1. -2. -1. -2.]
[ 1. -2. -1. -2.  0. -2.  1. -2. -2.  0. -1. -1.  1.  1. -2.  1.]
[ 1. -2.  1.  1. -2. -1. -1. -1. -1.  0. -1.  0.  0. -2. 

[-1. -2.  1. -2.  1. -2. -2.  1. -1.  0. -2. -2.  0.  1. -2.  1.]
[ 1. -2. -1. -2. -1.  1.  0. -2. -2.  0.  1.  0.  1. -2. -1. -2.]
[-1. -1. -2. -1. -2.  1.  1.  1.  0.  1.  0. -2. -1.  0. -2. -1.]
[ 0.  0. -1. -2. -2. -1. -2.  1.  1. -2.  1.  1. -2.  1.  0.  0.]
[ 1. -1. -2. -2. -2. -1. -2. -1.  1.  1. -2.  0. -2. -1. -2. -1.]
[ 1.  0. -2.  0. -2. -1. -1. -1. -2. -1.  1.  1. -1. -2.  0. -1.]
[-1.  1.  1. -2. -1. -1. -2. -1.  1. -2.  0. -2.  0.  0.  1.  1.]
[ 0. -2. -2. -1. -2. -2. -1. -2.  1. -2. -1.  0.  0. -1.  1.  0.]
[ 0.  1. -2. -2.  1.  0.  1.  1. -1. -1. -2. -1.  0. -1.  1.  1.]
[-2.  1. -2. -2.  0. -1.  0.  0. -2.  0.  0.  1.  0. -2. -2.  1.]
[ 0. -2.  1. -2.  0.  1. -1. -1. -2.  0.  1. -2. -2. -2. -1. -1.]
[-2. -1.  0. -2. -2. -1. -2.  0. -2.  0. -2.  0.  0.  1.  1. -1.]
[ 1.  1.  1.  0. -1.  0. -2.  0.  1.  0.  1. -1.  1.  0.  0.  1.]
[ 0.  0. -1.  0. -2. -2.  0.  1. -1. -2. -1.  1.  1.  0.  1.  1.]
[-2.  0.  0.  0. -1.  0. -1.  1.  0.  1. -2. -1. -2.  0. -2. -2.]
[ 0. -1.  

[ 0.  1. -2. -1. -1. -1.  1.  0.  1.  1.  0.  1. -2. -1.  0. -2.]
[-2.  1. -1. -1. -2.  1. -1.  1. -2.  1. -2.  0. -1. -2. -2. -1.]
[-2. -1.  0.  0. -2. -1.  1.  0.  1.  1. -2. -2.  1.  1.  1. -2.]
[ 0. -2.  0.  0. -2.  0.  1. -2. -2.  0. -1.  0. -1. -2.  0.  0.]
[-1. -1. -1. -1. -2. -1.  1. -1.  1.  1. -2. -1.  0.  1.  1. -1.]
[ 1. -2.  1.  1.  0.  1. -1.  0.  0. -2. -2.  0. -2.  0. -1. -2.]
[ 0.  0. -1.  1.  0.  0. -1. -2.  1.  1. -1. -1. -1.  0. -2. -1.]
[-2.  0. -2. -2. -2.  0.  1. -2.  1.  0. -1. -1.  1. -2.  0.  1.]
[-1. -2. -1.  1. -2.  1.  1.  0. -1. -1.  0. -1. -1. -2.  1.  1.]
[ 0.  1. -2.  1.  1.  0. -1. -2. -1.  0.  1. -2. -1. -2.  1. -1.]
[-1.  1. -2. -1.  1.  1.  0. -2.  0. -1.  1.  1. -2.  1.  0.  0.]
[-2.  1.  0. -1.  0. -2.  0. -1. -2.  0. -1.  1.  0.  0. -2.  1.]
[-2.  0. -2. -2. -1.  0.  0.  0.  0. -1. -2. -2. -1.  0.  0. -1.]
[ 0.  0. -1.  1. -2. -1. -1. -2.  0.  1.  1.  1.  1.  1. -1.  1.]
[ 1.  0. -2.  0. -2.  0. -1. -1. -1.  1. -1.  1.  0.  1. -1.  0.]
[ 0. -2. -

[ 1.  1. -1.  1. -2.  1.  1.  1. -2.  0. -2.  0. -2.  1.  0. -2.]
[ 1. -2.  0.  0.  1.  0. -2. -1.  1.  0.  1.  0. -2. -1.  0. -1.]
[-2. -1.  1. -1. -1. -2. -2.  1.  0.  0.  0. -2. -1. -1. -1.  1.]
[ 1. -1.  1.  1. -2. -1.  1. -1.  0.  0.  1. -2.  0. -2. -1.  1.]
[ 1. -2.  0.  0.  0. -2. -1.  1.  1.  0. -1. -1. -1. -1. -2.  0.]
[-2.  1. -2.  1. -2.  0.  1. -2.  0.  1. -1. -1.  1. -1. -1. -2.]
[ 1. -2. -1.  0.  1. -2. -1. -1. -1.  0. -2. -1. -1. -1.  1. -1.]
[ 1. -1.  1. -1.  1.  0.  0. -1.  0.  1. -2.  0.  1.  1.  0.  0.]
[ 0. -1.  1. -2.  0. -1.  0.  0. -1. -2. -1. -2. -2. -2. -2.  1.]
[-2. -2.  0. -2.  0.  1.  0. -1.  1.  1.  1.  0.  0. -2.  0.  0.]
[-1. -2.  0.  1.  0.  0.  1.  1.  0. -1.  1.  1. -1. -2. -2.  0.]
[ 1. -2.  0. -1.  0.  0. -2. -1. -1.  0. -1.  0. -1. -1.  1.  1.]
[ 1. -2. -1. -1. -2. -1.  0. -2. -1. -1.  0.  1.  1.  0. -1. -1.]
[-2.  0.  0.  0. -1.  1.  0. -1.  0. -2.  1. -2.  0.  0.  0. -2.]
[ 0.  1.  0. -2. -2. -2. -1. -2. -2. -1. -2.  0.  1.  0.  1.  1.]
[-2. -2.  

[ 0. -1.  1. -1.  0. -1.  1.  0.  0.  0. -1.  0.  0. -1.  0. -1.]
[-2.  0.  0.  1. -2. -1.  1. -1. -1. -1.  1.  1. -1.  0. -2.  1.]
[-2. -2.  1.  1. -1. -1. -1. -2.  1.  1. -2. -1.  0. -2. -1. -2.]
[-1.  0.  1. -2. -1.  0. -2. -1.  1.  1.  0.  0.  0.  1.  1.  1.]
[ 0.  1. -2. -1.  0. -1.  1. -2.  0.  1.  0. -2. -2.  0.  1.  0.]
[-2.  0.  1.  0.  1. -2.  1.  0.  0. -1.  1. -2. -1. -2.  0.  1.]
[ 1.  1. -2.  0.  1. -2. -1.  0. -1. -2. -2.  0. -2. -1. -2. -1.]
[-1.  1.  0.  0. -2.  1. -2. -1.  1.  1.  1.  1.  1. -2. -2. -1.]
[ 0. -1. -1.  0. -2. -1.  0.  1.  1. -1.  1. -2. -2. -1. -1.  0.]
[-2.  0.  0.  1.  1.  0.  0. -2. -2.  0.  0.  1.  0.  0.  1.  1.]
[-1. -1.  1. -1. -1.  1.  1.  0. -2.  1.  0. -1. -1.  0. -2.  1.]
[-2. -2. -2. -2.  0. -2. -1. -1. -2.  1. -1.  1. -1.  1. -2. -1.]
[-1.  1.  1. -2.  0.  1.  1.  0.  1. -1.  1. -2. -2. -2.  0.  0.]
[ 1.  1. -1. -1.  1.  0.  1.  0. -1.  0. -1. -1.  0.  1.  1. -2.]
[ 0.  0.  1. -2.  1.  1. -2. -1.  1. -1. -2. -2. -2. -2.  1.  0.]
[-1. -1.  

[-2.  1.  1. -1. -1.  0. -1. -1.  0.  0.  0.  0.  0.  0.  1.  1.]
[ 1.  1.  1. -1.  0. -2. -2. -1.  0.  1. -2. -1. -2. -2. -2. -2.]
[-2. -2. -2. -1.  0.  1.  1. -1. -1. -2.  1.  0.  0. -2. -1.  0.]
[-1.  0. -2.  0. -1. -1.  1.  0. -1. -1.  0.  1. -1.  0. -1.  1.]
[-1. -1. -2.  1.  0. -1. -1. -1. -1.  0.  0. -2. -2. -2.  1. -2.]
[ 1.  1. -1.  0. -2.  0. -1.  1. -1.  1. -1.  0.  0.  0.  1. -1.]
[-1. -1. -1.  0.  0. -2.  1. -1. -2. -1. -1. -1.  0. -1. -1.  1.]
[ 1. -1. -2.  0.  0. -2. -2.  0. -2. -1. -2. -2. -2.  0.  0. -2.]
[ 0.  0. -1. -2.  1.  0. -1.  0.  1.  1. -1. -1.  0. -2. -2.  1.]
[ 0.  1.  0.  1.  0.  1.  1. -1. -1. -1. -1.  1.  1. -2. -1. -2.]
[ 1.  1.  0. -1. -2. -1. -1. -1. -1. -1. -2. -2.  1. -1. -1.  0.]
[ 1. -1. -2. -1. -1. -2.  0.  1.  0. -1.  0. -1. -1. -2.  0. -2.]
[ 1.  1. -1.  0.  1.  1.  1.  0.  0. -2. -1. -2. -1. -1. -2. -2.]
[ 1. -1.  1.  0.  0.  1.  1. -1. -1. -1. -2. -1. -2.  1. -1.  0.]
[-1. -1. -2. -1. -2.  1. -1.  0. -2. -1.  1. -1. -2.  1. -2.  1.]
[-2.  1.  

[-1.  1.  0.  1. -2.  1. -2.  1.  0. -1. -2.  1. -1.  0.  0. -2.]
[-1. -2. -1. -1. -2. -2.  0.  1.  1.  0.  0. -1.  1.  1. -2.  0.]
[-1.  0. -2.  1. -1.  1. -2. -2. -2.  0. -2.  0. -2.  0. -1.  1.]
[ 0. -1. -2.  0. -1. -1. -2.  0. -1.  1.  0.  1.  0. -2.  1. -2.]
[-2. -2.  1.  0. -1. -1. -2.  0.  0. -1. -2.  1.  0. -1. -2.  1.]
[ 0.  1.  0.  0. -1.  0. -1. -1.  0. -1. -1.  1. -1.  0.  1.  1.]
[ 0. -2.  1.  0.  1.  0. -1. -2. -2.  1.  1. -2.  1.  0.  0. -2.]
[ 1.  1.  0.  0.  0.  0.  1.  1.  1. -2.  0. -2. -2.  0. -1. -2.]
[ 0. -1. -1.  1.  0.  0.  1. -2.  1. -1.  0.  0.  0. -1.  1.  1.]
[-1. -1. -1.  0. -2.  0. -1. -1. -1.  1. -1. -1. -2.  0.  1. -2.]
[ 1.  0.  1.  0.  0. -1. -2. -1.  0. -1.  1. -1.  0. -1. -2. -1.]
[-1. -2.  0.  1. -1.  1. -1. -2. -2. -2.  0.  0. -1.  1. -2.  1.]
[ 0.  0.  1.  0.  0.  1. -2.  0.  1. -2.  1.  1. -1. -1.  1. -1.]
[-2. -2.  0. -1. -1. -1.  1. -2. -2.  1.  1.  0.  1. -1.  1.  1.]
[ 0.  0.  0. -1.  0. -1. -1.  0. -2.  1.  0.  0. -2. -1.  0. -2.]
[ 0. -1.  

[-2. -1.  0. -2.  0.  0.  1. -2.  0. -2.  1.  1. -2.  1.  0. -1.]
[ 0.  0.  1.  1.  0. -1.  0. -1. -1.  0.  0.  1. -2. -1.  1. -2.]
[-1. -1. -2.  1.  0. -1.  0. -1.  0. -2. -1.  1.  0.  1.  0.  0.]
[-2. -1.  0. -1.  1. -2. -1.  1. -1.  1.  0.  1. -2.  1. -1. -1.]
[ 0. -2. -1. -2. -2.  0.  1.  1.  0. -1.  1. -2. -1.  1. -2.  0.]
[-1.  1. -2.  0.  0. -1. -1.  1.  0.  0.  1.  1. -2.  0. -1.  0.]
[ 1.  1. -2. -1. -2.  1.  0.  0.  1.  0.  1. -1.  1.  0.  1.  0.]
[ 0.  0.  0.  1. -2. -2.  1. -2. -1.  1.  0. -1. -2.  0. -1.  0.]
[-1.  1. -1.  0. -2.  1. -1. -1.  1.  0.  1. -2. -1.  0. -1.  0.]
[ 1. -2. -2. -1.  1. -2. -2.  1. -2. -1.  0.  0.  1. -1. -1.  0.]
[ 0.  0. -1.  0.  1. -1. -1.  1. -2.  0. -2.  1. -2. -2. -1.  1.]
[ 1.  1. -1. -2. -1.  1. -1. -2.  0. -2.  0. -2.  1.  0. -1.  0.]
[-1.  1.  0. -2.  1. -2.  1. -2.  1.  1.  1. -1. -1.  1.  1.  1.]
[-2. -1. -1.  1.  1. -1.  0. -2.  1. -1. -1.  0. -1. -1. -2.  0.]
[-1.  0. -1.  0.  0.  1.  0. -2. -2. -1. -1. -1. -1. -2. -2.  0.]
[ 1.  1. -

[ 1.  0.  1. -1.  1. -2. -1.  0.  0.  1. -1.  0.  1.  0.  0.  1.]
[-2.  0.  0.  1. -1.  1. -2. -2. -1.  0. -1. -1. -1.  1.  0. -1.]
[ 1.  1.  1. -2.  1.  1.  0. -1.  1. -2. -1.  1.  0. -2. -2.  1.]
[-2.  1.  0.  1.  1.  1.  0. -1.  1.  1.  1. -1. -1. -1. -2.  1.]
[-2. -2.  0. -2. -2. -1. -1. -1.  1.  1.  0. -1.  1. -1. -1. -1.]
[ 1. -2.  1. -2.  1. -1. -2. -2. -1. -2.  1. -2. -2. -2. -1.  0.]
[ 0.  0.  1. -1. -1. -1.  0. -1. -1. -2. -2.  1. -1.  1. -2.  1.]
[-2. -1. -2.  1.  0.  0.  0. -1. -1. -1.  1.  0.  1. -2. -1.  0.]
[ 0.  0.  0. -1.  0. -2. -2. -2.  1. -1. -1.  1. -2.  1. -2.  0.]
[-2. -2. -2.  1. -2.  0.  0. -2.  0.  1.  0.  1.  1.  0.  0.  0.]
[-2.  0. -2.  1. -1. -1. -2. -2. -1. -2. -2.  0.  0. -1. -1. -2.]
[-1.  1.  1. -2. -1. -2.  1. -2.  0. -1.  0.  1.  1. -1.  0.  0.]
[ 1.  0. -2. -2.  1. -1.  1. -1. -2.  0. -2. -1.  1.  0.  1.  1.]
[ 1. -2. -1.  0.  0.  1. -2. -2. -1.  1.  0. -1. -1. -1.  0.  0.]
[ 1.  1.  0.  0. -2. -2.  1. -1. -2. -2.  1.  1.  0. -1.  0.  1.]
[ 1. -2.  

 70%|███████   | 21/30 [30:07<12:39, 84.35s/it]

[ 0. -2.  0.  0.  1. -2. -2.  1.  1.  1.  0. -1. -2. -2. -1.  1.]
Training loss (for one batch) at step 0: 0.04794438183307648
Seen so far: 16 samples
[-2. -2.  0.  1.  0. -2.  1.  1. -2.  1. -2. -2.  0. -2. -1.  0.]
[-1.  0.  0. -1.  1. -1.  0.  0.  0. -1. -1.  0. -2. -1.  0. -2.]
[-1. -1. -1.  0.  1.  1. -2.  1. -1.  1. -2.  1.  1. -1.  1.  0.]
[ 0. -2. -1.  1. -1.  1.  1. -1. -2. -2.  1. -1. -2. -1.  0. -2.]
[ 1.  1.  0. -2. -1.  1.  1. -1.  0.  0.  0. -2.  0. -1.  0. -1.]
[ 1.  0. -1. -1. -1. -1. -2. -1.  0.  0.  1.  0.  0. -2.  0.  1.]
[ 1.  0.  1. -2. -1.  0.  0. -2.  0. -2.  0.  1.  1. -2.  1. -1.]
[ 0. -1. -2.  1.  1. -2. -2. -1. -2. -2.  1.  0.  1. -2.  1. -2.]
[-2. -2.  1. -2.  1.  1. -2. -1.  0. -1.  1. -1. -2. -2.  0.  1.]
[-1.  1. -2. -1.  1. -2. -1. -2. -2. -1.  0.  0. -2.  0. -2. -2.]
[ 0.  1.  1. -1.  0.  1.  1.  0. -2. -1.  0.  0.  1.  1. -2. -2.]
[ 1.  1.  1. -1.  1. -2.  1. -2.  1.  0.  0. -1. -2.  1.  0. -1.]
[-1.  0.  1. -2. -2. -2.  1.  0. -2.  1.  1. -1.  0. -1. 

[-2. -2.  0.  1. -2.  1. -2.  0. -1.  1.  1. -1. -2. -2.  0. -2.]
[ 0.  0.  1.  0.  0. -1. -1. -1. -1.  1.  1.  0.  1. -1. -2.  1.]
[ 0.  1.  1. -1. -2.  0. -1.  0. -1. -2.  0.  1.  1.  0.  0.  0.]
[-2. -1.  1.  0.  1. -1. -1.  0. -1. -1. -1. -2. -2. -1.  1. -1.]
[ 1.  0.  0.  0.  1. -1.  1.  1. -2.  0. -2. -1.  0.  0.  0. -1.]
[ 0. -2.  0. -2. -2.  0.  1.  1.  0.  1.  1. -2. -2. -1.  0. -1.]
[-2. -2. -2. -2.  1. -2.  1. -2.  1.  0. -2. -1. -2. -1.  0. -1.]
[ 0. -1.  0.  1.  0. -1.  1. -1.  1.  1.  0.  1. -1. -1.  1.  0.]
[-2.  1. -1.  1.  1. -1.  1. -2.  1.  0.  1. -2. -2. -2.  0.  0.]
[-1.  1. -2.  1. -2.  0.  1.  1.  0. -2. -1.  1. -2. -1. -1. -2.]
[ 1.  1. -1. -2.  1. -2.  0. -2. -1. -2. -1. -1. -1. -2. -1.  0.]
[ 0. -1.  0. -1.  1. -2.  0. -2.  1. -1. -2.  1.  1.  0.  1.  0.]
[-2.  0. -2.  1.  0.  1.  0.  0.  0. -2.  1. -2. -2.  1. -2. -1.]
[-2.  1.  0.  1. -2. -2. -1.  1.  1.  1.  0.  1.  0. -1.  0. -1.]
[-2.  1. -1.  1. -2.  0. -1. -1.  0.  0.  1.  1. -2.  1. -1. -1.]
[-2. -1.  

[-1. -2. -1.  0.  1. -2. -2.  0. -1. -2. -1.  1. -1.  1.  0. -2.]
[ 1.  0. -2.  1.  1. -1. -2. -1. -1.  0. -1.  0. -2.  0. -2. -2.]
[ 0.  1.  1.  1.  1. -1.  0. -1. -1. -1.  0.  1.  1. -2. -1. -2.]
[-2.  1. -1.  0.  1. -1. -2. -1.  0. -1. -2.  1. -2.  1. -2. -1.]
[-2.  0. -2. -1. -2. -2.  0.  0.  1. -2.  1. -2. -2.  1. -2. -2.]
[-1. -1. -2.  0.  0.  1. -2.  1. -1.  1.  0.  0.  1.  1.  1. -1.]
[ 1. -1.  1.  1.  0. -1. -1.  1. -2. -1. -1. -1. -1.  1. -1. -2.]
[ 1.  0. -1.  0.  0. -2. -1. -2. -2. -2. -1.  0.  1. -1. -1. -2.]
[ 1. -1. -1.  1.  0.  0. -2. -1.  0. -2. -1.  0.  1.  0. -1.  1.]
[-2. -2. -2.  1.  0. -1.  0. -2. -1.  1. -2. -2.  1. -1.  1.  1.]
[ 0. -1. -1.  1. -2. -1.  1. -1.  1.  0. -2. -2. -1.  0. -1. -1.]
[ 1. -1.  1.  0. -1. -1.  0.  1.  0.  0.  1.  1.  1. -2.  0.  0.]
[ 1.  1.  0.  1. -1. -1. -2. -2.  0.  1.  1. -1. -2. -2.  0. -1.]
[-1. -2.  0. -1.  1.  0. -1. -2. -2.  0. -1.  1.  1.  1.  1.  0.]
[-1.  1.  0.  1.  0. -1.  1.  1.  0. -1.  1. -1. -2.  0. -1. -2.]
[ 1. -1. -

[ 1.  0. -1.  0.  0. -2. -1. -1.  0.  1. -1. -2.  1.  0. -2.  0.]
[-1. -2. -1. -1.  1.  0. -1. -2. -2. -2. -1. -1. -1. -2. -1.  1.]
[-1.  0.  0. -1.  0. -1.  1.  0.  0.  1.  1.  0. -1.  0.  1.  1.]
[-2.  1. -1. -1.  0.  1.  1.  0. -1.  1. -1.  1. -2. -1.  1.  0.]
[-1.  0. -1.  0. -1.  1.  0.  1.  0.  1.  0.  0.  1.  1.  0.  0.]
[ 1.  0. -1. -2.  1. -2. -1.  0. -1. -1.  1.  0.  0. -2. -2.  1.]
[-1. -1. -2.  1. -1.  0.  1.  1. -1.  0.  0.  1. -1. -2. -1. -2.]
[-1.  0.  0. -1.  0.  1. -2. -2. -2. -2. -2. -1. -2. -1.  0. -2.]
[-1. -1. -1.  1. -1.  1.  0. -2.  1. -2. -2. -2.  0.  1.  1. -1.]
[ 1. -1.  0.  0. -2. -2.  0. -1.  1. -1. -1. -2.  1.  1.  0. -2.]
[-1.  0.  1. -1.  0. -1.  0.  0.  1. -1.  0.  0.  0.  0.  1. -1.]
[-1.  0.  1. -1. -2. -1. -1.  1.  1.  1.  1.  1.  0.  1. -1.  0.]
[ 1. -1.  0. -2.  0. -1.  0.  0. -1.  0. -1. -2.  0.  1. -1. -1.]
[-2. -2. -2. -1. -1.  0.  0.  0.  0. -2.  0. -1. -2. -1. -2.  0.]
[-1.  0.  0.  0.  1.  1. -2.  0.  1.  0. -2.  0. -2. -1. -2. -1.]
[ 0. -2.  

[-2. -1.  1. -2.  0.  0. -1. -1. -1. -1.  0.  0. -2.  0.  0.  0.]
[ 0.  0.  1. -2. -1. -1. -1. -2.  0. -2. -1.  0. -2.  0.  1.  1.]
[-2. -2. -1.  0. -1. -2. -1.  0.  0.  1.  1. -2.  0.  0.  1.  1.]
[ 1.  0.  1. -2.  1.  0. -2.  0.  1. -1.  0. -2.  1. -2.  0.  0.]
[-2.  1. -2.  0.  1. -1.  1.  0.  0. -2. -2.  1.  1.  0.  1.  1.]
[ 0.  0.  0. -1. -2. -2. -1.  1.  0.  1.  1.  1.  1.  0. -1.  1.]
[ 0. -1.  0. -2.  1. -2. -1. -1.  0.  0.  1. -1. -1. -2.  0.  0.]
[-1.  1. -2. -2. -1.  1.  1.  1.  0. -2. -1. -1. -2. -1.  1.  0.]
[-2. -2.  0.  1. -1.  0.  1.  1.  0.  0.  1.  1. -2. -2.  0. -2.]
[ 0. -2. -2.  0.  0. -2.  0. -1. -1. -1. -2. -2.  1. -1.  0. -1.]
[ 0.  0.  1. -2.  0. -1. -1.  0. -1.  0.  1.  1. -1.  1. -1. -2.]
[ 1.  1. -1.  0. -1.  0.  0. -1.  0. -1.  1. -1. -2.  0.  0.  0.]
[-2.  1.  0.  0.  0. -1. -1.  0. -2.  1.  1.  1.  0. -2. -1. -1.]
[-1. -1. -2. -1. -1. -2.  0. -1.  1.  1. -1. -2. -2.  1.  0.  1.]
[-1. -2.  0. -1.  1. -1. -1.  1. -2. -2.  0. -1. -1. -1. -2.  0.]
[-2.  1. -

[ 1. -1. -1. -2.  1.  0. -2.  1. -2.  0. -2. -2.  0. -1. -1. -2.]
[-2.  0. -1.  1.  1. -1.  0. -2. -1. -1. -2.  1.  1.  1.  0. -1.]
[-2. -2.  0.  1.  1. -2.  0. -1. -1. -1.  1. -1.  1. -2.  1. -2.]
[-1.  1.  1. -1.  0. -1. -2.  1. -1. -2.  1. -2. -2.  1. -2.  0.]
[-2. -1.  1.  1. -2. -1. -2.  0.  1.  1.  0. -1. -1.  0. -1.  0.]
[-2.  1.  0.  0.  1. -2.  1.  0. -1. -1.  0.  1.  0. -1.  1.  0.]
[-2.  0. -2.  0. -2. -1. -1. -1.  0.  1. -1.  0. -1.  1.  0. -2.]
[-1. -1.  0. -2.  0.  1.  1.  0.  0.  1. -1. -2.  0. -1.  1.  0.]
[ 1. -2.  0.  0.  0. -1.  0.  1. -1.  1.  0.  1.  1. -1. -1.  1.]
[-1.  1.  1.  1. -2.  0. -2.  1.  1. -1.  0. -2. -1. -2. -1.  1.]
[-2. -1. -2.  1.  1. -2. -1. -1.  1.  0.  1. -2.  0.  0.  1. -1.]
[ 1.  1.  1. -1.  0.  0. -2.  1.  1. -2.  1.  1.  0. -1.  1. -1.]
[-1. -1. -1. -2. -2. -2. -2. -2.  0. -2.  0.  0. -2.  1.  0. -1.]
[ 0. -1.  1. -2. -1. -1. -1. -1. -1. -2.  1.  0. -2.  1. -1.  1.]
[ 1. -1.  0. -2.  0. -2. -2. -1. -2.  0.  0.  1. -2. -1.  0.  1.]
[ 1. -2.  

[ 0.  0.  0. -1. -1. -1. -1. -1. -1. -1.  1.  0.  1. -1. -1. -1.]
[-1.  0.  1.  1.  1. -2.  1. -2. -1.  1.  0.  1. -2.  0.  1.  0.]
[ 0.  0. -1.  1. -2.  1.  1. -1.  0.  0. -1.  0. -1.  0. -2.  1.]
[ 1. -2.  1.  1. -2. -1.  1.  0.  1. -2.  1. -1. -1. -1.  1.  0.]
[ 1.  1. -1. -1.  1.  1.  1. -1.  0.  1.  1. -2.  0. -2. -1. -1.]
[ 0. -1. -2.  0.  1.  0.  0.  0.  1. -1. -2.  0.  1. -2.  0.  0.]
[ 1. -1.  1. -1.  1. -2.  0.  1.  1. -2.  0. -1. -1. -2. -1.  0.]
[ 1.  0. -1. -1. -2. -2. -2.  1. -1. -1.  0.  0. -2.  0. -2.  1.]
[-1. -2.  0. -2. -2. -2. -1. -1.  1.  1.  1.  1.  0.  0.  0.  1.]
[ 1.  1. -1.  0.  0. -1.  0. -2.  1.  0.  1.  0.  0.  0.  1. -2.]
[-1. -1. -1. -2. -1.  1. -1.  1.  1.  1.  1.  0.  0.  1.  1. -1.]
[-2.  1. -1.  0.  1.  1. -1.  0.  1.  0.  1.  0. -1. -2.  0. -2.]
[ 0. -2.  0.  1. -1. -1.  1.  0. -1.  0. -2. -1.  0.  1. -1.  0.]
[ 0.  1. -2.  0. -2.  1.  0. -1.  1.  1. -2. -2. -1. -1. -1.  1.]
[-1.  1. -2.  1. -2. -2. -1.  0. -1.  1. -1. -2.  0.  1. -1. -1.]
[ 0.  0.  

[-2. -2.  0.  0. -1.  1.  0.  1. -2. -2. -1. -2. -2.  1.  1.  1.]
[ 0.  0. -2.  1. -1. -2. -1.  1.  0. -2. -2. -1. -2.  0. -1.  0.]
[-2. -2. -1.  1. -1. -2. -2.  0. -1.  1. -2. -2.  1. -1. -2. -1.]
[-1.  1. -1.  0. -1.  1.  1.  1. -1.  1. -1.  1.  0.  0.  0. -2.]
[-2.  1. -2. -1. -2.  1. -1.  0. -2.  0.  1. -1. -2.  1. -2.  0.]
[-2. -1.  0. -2.  0.  0. -2.  0. -2.  1.  0. -2.  1. -1.  0. -2.]
[ 0.  1. -1.  1.  1.  1.  0.  0.  0. -2. -1. -1. -1. -1. -2.  0.]
[ 0.  0. -2.  0. -1. -2. -1. -1. -2. -2.  1. -2. -1.  1.  1. -2.]
[ 0. -1.  0.  1.  1.  1. -2.  0.  1. -1.  1. -2.  0.  0. -1. -1.]
[ 1. -1. -1.  0. -2. -1.  1. -1. -2. -1. -1.  1.  1.  0.  1. -1.]
[ 0. -2. -2. -2. -1.  1.  1. -1.  1. -1. -2. -1.  0. -2. -1.  1.]
[ 1. -1.  0.  1. -1. -1. -1.  1.  0. -2.  1.  0.  0. -2.  1. -2.]
[ 0.  0. -2.  0.  1.  0. -1.  1. -1. -2.  1.  0. -2. -1. -1.  1.]
[-2. -1. -1. -2.  1.  0. -1.  0. -1. -1.  1. -1. -1. -2. -1.  1.]
[ 0. -2. -1.  1.  0.  1. -1.  1. -1. -2. -1.  1.  1. -1.  0.  1.]
[-1. -1. -

[ 0. -1.  1. -2.  0.  1.  1.  1. -2. -2.  1. -1.  0.  0. -1. -2.]
[ 1.  1.  0. -1. -2.  0. -1.  0.  0. -2. -2. -2.  1. -2.  1. -2.]
[ 0.  0. -1.  0.  1. -1. -1. -2.  1.  0. -1. -1. -1. -1.  1.  0.]
[-2. -1. -2.  0.  0.  0.  1.  1.  0. -1.  1. -2. -2. -2. -2. -1.]
[-1.  1.  1. -1. -1. -2.  0. -1.  1. -1.  1.  1.  1.  0. -1.  1.]
[ 1. -2.  1. -1. -1. -2. -1.  1.  0.  1. -1.  0.  1.  1. -1. -2.]
[-2.  0.  1. -2. -1.  1.  0.  1.  1. -2. -1. -1.  0.  0. -1. -2.]
[-2.  0. -1. -1.  0.  1. -2. -2.  0. -2. -2.  1.  1.  0. -1.  1.]
[ 0. -1.  1.  1.  1.  0.  1. -1.  1.  0. -2.  1. -1. -1.  0. -2.]
[-2. -2.  0. -2.  0.  1. -2. -2.  0.  0. -2. -2.  1.  1.  0.  1.]
[ 0.  1. -2. -1. -2. -1.  0. -1. -1.  1.  1.  1.  1.  1.  0.  0.]
[-2. -2. -1. -2. -1. -2.  0. -1.  1.  1.  1.  1. -1.  0.  0. -2.]
[-2. -2. -1. -2. -2. -2. -2.  1.  1.  0. -2.  1. -2. -1. -2. -1.]
[ 1.  1.  0. -1.  1.  0.  1.  1.  0.  1.  1.  1. -2.  0.  0. -1.]
[-2. -1.  1. -1. -1.  1.  1.  1. -2. -2. -2.  0. -2. -1. -1. -1.]
[-1.  0.  

 73%|███████▎  | 22/30 [31:30<11:12, 84.09s/it]

[ 0.  1. -2. -2. -2. -2. -2.  1. -2. -2. -2.  1.  1. -1.  0. -2.]
Training loss (for one batch) at step 0: 0.625321626663208
Seen so far: 16 samples
[ 1. -1.  1.  1.  0. -2. -1.  0. -1. -1. -2.  1. -2. -1.  0.  0.]
[ 1. -1. -2.  1.  1.  1. -1. -1. -2. -2. -2. -2. -2.  0. -2.  1.]
[-2.  0.  0.  1.  0. -1. -1.  0. -2.  1. -1.  1. -2.  1. -2. -1.]
[ 0. -1. -1. -1. -1.  0. -2.  1. -1.  0. -2.  0. -2.  0. -2. -2.]
[-1.  0. -1.  1.  0.  0.  1.  0.  0.  1. -2. -2.  0. -1. -1. -1.]
[-2.  1.  0.  1.  0. -2.  1. -1. -2.  1.  0. -1. -1. -2.  1. -1.]
[ 1. -2.  0.  1.  1.  1.  0.  1. -1.  1.  0. -1. -1.  1. -2.  1.]
[-1.  1.  0. -1. -1. -2.  0.  1. -1. -2. -2.  0. -2. -2.  1. -1.]
[ 0.  0.  0. -1.  1.  1. -1. -2.  1.  0. -1.  0.  1. -2. -1. -1.]
[ 0.  1. -1. -2.  1. -1. -2.  1.  1.  1.  0. -1.  0.  1. -2.  1.]
[ 0. -2. -2. -1. -1.  1. -2.  1.  1. -1.  1. -2. -2.  0. -2.  1.]
[-1.  1.  1.  1.  1. -2.  1.  1.  1. -2.  1.  0.  1.  1.  0. -2.]
[ 0.  0.  0. -1.  0. -2. -1.  1.  1.  0.  1.  0.  1.  0. -1

[-1. -1. -2. -2. -2. -2.  1. -2. -2.  1.  1.  1.  1. -2.  1. -2.]
[-1. -1. -1.  1. -1.  1.  0.  1.  0.  0.  0.  0.  1. -1. -2. -2.]
[ 1. -2.  1. -2. -1.  0.  1.  1.  1.  0.  0. -2.  0. -2. -2.  0.]
[-1.  1.  1. -2. -2.  0.  1. -2. -2.  1.  0. -2. -2.  1.  1.  0.]
[ 1. -1. -2.  0. -2.  1.  0.  0.  0.  1.  0. -2. -2.  1.  1. -1.]
[-1.  1. -2. -2.  1. -1. -1.  0. -2.  1.  0.  0.  0.  1.  0. -2.]
[-1. -1.  1.  1. -1. -2. -1. -1. -1.  0. -1.  0.  1. -2. -2. -1.]
[ 0.  1.  0.  0.  1. -2. -2.  0.  1.  0. -2. -2.  1.  0. -2. -1.]
[ 0. -2.  1.  1.  0.  1.  1.  0. -1. -1. -1.  0. -2. -1. -2.  0.]
[ 1.  0.  1. -2.  1. -1. -1.  0. -2.  1.  0.  1. -2. -2. -2.  0.]
[-1. -2.  0.  1.  1. -2.  1.  0. -2.  0. -2. -2. -1.  0. -2. -2.]
[ 0.  1.  1. -1.  0.  0.  0.  0.  1. -1.  1. -2.  0. -2.  1.  0.]
[-1.  0. -1.  1.  1. -1. -2. -2. -2.  1.  1.  0.  1. -1. -1.  0.]
[ 0. -1. -1.  1.  1. -1.  1. -2.  1. -2.  1. -2. -1.  0. -2. -2.]
[-1. -2.  0. -1.  1.  1. -2. -2.  1.  0. -2.  0.  0.  0. -1.  0.]
[-1.  0.  

[-2.  1.  0. -1. -2. -1. -1.  0. -2. -1. -1. -1.  1. -2. -2.  0.]
[-1. -2. -1.  0.  0. -1. -1.  1. -1. -1.  0. -1.  1.  0. -2. -1.]
[ 1.  0. -1.  1.  0. -2. -2.  0. -1. -2.  1. -1.  1. -1. -1.  1.]
[ 1. -1.  1.  0. -1.  0. -2.  1. -1. -1. -1.  0.  1. -1. -1. -2.]
[ 0. -2.  0.  0. -1. -1. -2. -1.  1. -2.  0. -2.  1.  0.  0. -2.]
[ 1.  0.  0. -1.  0.  0.  0. -1. -1. -1. -1. -2.  0.  1.  1.  1.]
[ 0. -2. -1. -1. -2.  0. -1. -1.  1.  1.  1.  0.  1.  1. -2. -2.]
[ 1.  1.  1. -1.  0. -2.  0.  1. -2.  1.  1.  1.  0.  0. -2. -2.]
[-1.  0. -2.  0. -1.  0. -2.  1.  1. -2.  1.  1. -2. -1.  0. -2.]
[ 1.  1. -1.  1. -1. -2.  0.  1. -1.  1.  1. -1. -2.  0. -2. -2.]
[ 1. -1. -1.  0.  0.  0.  1.  0. -1.  1. -2.  0.  1.  1. -2.  1.]
[ 1.  0.  1. -1. -1. -1.  1. -2. -1. -1.  1. -1.  0.  0. -1. -1.]
[ 0. -1.  0.  0. -2. -1. -1.  1.  1. -2. -2.  1.  1.  1.  1. -2.]
[ 1.  1.  0. -1.  1.  1.  0. -2.  1.  0. -2. -2.  1. -2. -2. -1.]
[-2.  0.  1. -1.  0. -2. -1. -2.  1. -1.  1. -2.  1. -2.  1.  1.]
[-1.  0. -

[ 1. -2. -1.  0. -2. -1.  1. -2. -1.  1.  0. -2. -1. -1. -1. -1.]
[ 0. -2. -2. -2.  1. -2.  0.  0.  1.  0. -2.  0.  1.  1.  0. -2.]
[-1.  1. -2.  1.  1. -2.  1. -1. -2. -1.  0.  0.  0. -2.  0.  0.]
[-1.  0. -2. -2. -2.  0.  0. -1.  0. -2. -1.  0.  0. -2.  0. -2.]
[ 0.  1.  1.  1. -2. -2.  1.  1. -1. -2. -1. -1.  1.  1. -2.  0.]
[ 1.  0.  1.  0.  1. -2. -1.  0.  0. -2. -2. -1.  0.  1.  0.  0.]
[-1. -1. -2.  0.  1. -2. -1. -1. -2. -2. -1. -2.  0.  0.  1. -1.]
[ 1. -2. -1.  0. -2. -1. -2. -1. -1. -2.  0.  0. -2.  0.  0.  0.]
[ 1. -2.  0. -2.  0.  0. -1.  1. -1.  1. -2.  0.  1. -2.  1. -2.]
[-1. -2. -2.  1. -1. -2. -1. -2. -1.  0.  0. -1.  0. -2. -1. -1.]
[-1. -2. -1. -2. -1. -1. -2.  1. -2. -1.  0. -1. -1.  1. -2.  0.]
[-1. -2.  1. -1. -2. -2. -1. -2. -1.  1.  1. -1. -1.  1. -2.  0.]
[ 0. -2. -1.  1.  1.  0. -2.  1. -2.  1. -2. -2. -2. -2. -1.  1.]
[ 0.  0.  0. -2. -1.  1. -1.  1.  1. -1.  0.  1. -1.  1. -1.  0.]
[ 1. -2.  0.  1.  0.  1.  0. -1. -1. -2. -2.  1.  1.  1.  0.  1.]
[ 0. -2. -

[ 0. -1.  1. -1. -2.  0.  1.  0. -2.  0. -2. -1.  0.  1.  0.  0.]
[-2.  0. -1.  0. -1.  0.  0. -1. -2.  1. -2. -1. -1. -2.  1. -2.]
[ 1.  1. -1. -1.  0. -2.  1. -2. -1. -1. -1. -1.  1.  1.  1. -2.]
[ 1.  1. -1.  0. -2. -2. -2.  1.  1. -2.  1. -1. -1.  1.  1.  0.]
[ 0. -2. -2. -2. -2. -2. -1.  1. -1.  1. -1. -2. -1. -2.  1. -2.]
[-1.  0.  0.  1.  1.  1. -1.  0.  0.  0.  0. -2.  1.  0.  0. -2.]
[ 1. -2.  0.  1.  1. -1.  0.  1.  0. -1. -1.  0.  1.  0. -1. -2.]
[-1.  0.  1. -1. -1. -2. -2.  0.  0. -1. -2.  1.  1. -1. -2. -1.]
[ 1. -1.  1. -1.  1.  0. -2. -2.  0. -1.  1.  0.  1. -2. -1.  0.]
[ 1. -1.  1. -2. -1.  1.  1.  1. -1. -2.  1. -1.  1.  0.  0. -1.]
[-2.  0. -1.  0.  0. -2.  0.  0. -1. -1. -1.  1. -1.  1.  1.  1.]
[ 1. -2. -2.  1.  1.  0. -1.  0. -1. -2.  0.  0. -1. -1.  0.  1.]
[-1. -1. -1. -1. -1.  0.  0.  1.  0. -2.  0. -2. -1. -2.  1.  0.]
[ 0.  0. -2.  1. -1. -2.  1.  1.  0. -2.  1. -1. -1. -1.  1. -2.]
[ 1. -2. -1. -1. -1. -2.  1. -2.  1.  1. -1. -2. -1.  1.  0.  0.]
[-1. -2.  

[ 1. -1. -2.  1. -1. -1. -2. -1. -2. -2.  0. -1.  1.  1. -1.  0.]
[-2.  1.  0.  1.  0.  0.  0. -2.  1. -1. -2.  1.  0.  1.  1.  1.]
[-2. -1.  0.  1. -1. -2.  0.  1. -1. -1.  1. -1.  0. -2.  0.  0.]
[ 0. -2.  1. -2.  1.  1. -2. -2.  1. -2. -2.  0. -1. -2.  1. -2.]
[ 0.  1. -1.  0. -1.  0. -1. -2.  0.  1.  0.  0. -2.  0.  1. -2.]
[-2.  0. -2.  0. -2.  1. -1. -1.  0.  0. -2. -2.  1. -2.  1. -2.]
[ 0. -1.  0. -1.  0.  0.  0.  0.  0. -1.  1.  1.  1. -1. -2.  0.]
[ 0.  1. -1. -2.  1.  1.  1.  1.  1.  1.  0.  0. -2.  1. -2. -2.]
[-2.  1. -1. -2.  0. -2.  1. -2. -2.  1. -2.  0.  1. -1.  0. -2.]
[-2.  0.  1.  1. -2.  1.  0. -1. -1.  1. -2. -1. -2. -2.  0.  0.]
[-2.  1. -2.  0.  0. -2. -2.  1. -1. -1.  0. -1.  1. -1.  0. -1.]
[-1. -1. -1.  0.  1.  1.  1. -1. -2. -1. -2. -2.  0. -2.  0.  0.]
[-1. -1. -2.  1. -2. -1.  0.  0. -2.  0. -2.  0. -2.  0. -1. -1.]
[-1. -1.  1.  0.  0. -1.  1. -2.  0.  1. -1.  1.  1. -1.  0.  1.]
[-1.  1.  1. -2.  1.  0.  1. -2. -2. -2. -1.  1.  0. -2. -1.  1.]
[-2. -2. -

[ 1.  1. -2.  0.  1. -1. -2.  0. -1.  1.  0. -2. -1.  1. -1.  0.]
[-1. -1. -2. -2. -2.  1. -1. -2.  1. -2.  0.  1. -1.  0.  0. -2.]
[ 0. -2. -1.  1. -1.  1. -2. -2. -2. -2.  0.  1.  1. -2. -2.  1.]
[-1.  1.  1. -1.  1.  1. -2. -2.  1. -1. -1.  0. -1.  0.  0.  1.]
[-2. -2. -1. -2. -2. -1. -1. -2. -2. -2. -2.  1. -1.  0. -2.  1.]
[-1. -1.  0.  0. -2. -1.  1.  0. -1.  0. -1.  1. -1. -2. -2. -1.]
[ 1.  1.  1.  0. -2.  1.  0.  1. -2.  0.  1.  0.  0. -2.  1. -1.]
[-2.  0.  0.  0. -1. -1. -1.  0. -1.  0.  1.  1. -2. -2.  0. -1.]
[ 0. -1. -1. -1.  1.  0.  0. -1. -1. -2. -2.  1.  1. -1. -1.  0.]
[-2. -2. -2. -1. -1.  1.  0.  1. -2.  1. -2.  0. -1. -2. -1. -1.]
[-1. -2. -1. -1. -2.  1. -2. -2.  0. -2.  0. -2. -1.  1. -1. -2.]
[ 0. -1.  1. -1.  0. -1. -1. -1. -1.  1.  1.  0.  0. -1.  1. -1.]
[ 1.  1.  1.  1.  1. -2. -2.  1.  1. -2.  1.  0. -2.  0. -1. -1.]
[-1.  1. -1. -1. -2. -1. -1.  1.  1.  1. -1.  0. -2. -2. -1. -2.]
[ 0.  1.  0.  1. -2. -2.  0.  0.  1.  0.  1. -1.  1.  1.  0.  1.]
[ 1.  1. -

[ 1. -1.  0. -1. -1. -1. -2. -1. -1. -2.  0. -1.  0. -1. -2. -1.]
[ 1. -2. -1. -2. -2. -2.  0.  0.  1. -1.  1.  0.  1. -2. -2. -1.]
[-1.  0.  0.  0.  0.  0.  1. -1.  1. -1.  0. -1.  1.  0. -2. -1.]
[-1.  1. -2. -1. -1.  1.  0.  1.  0.  0.  0. -2. -2. -2.  1.  0.]
[ 0.  1. -2. -2. -2. -2. -1.  0.  0. -2. -2. -1.  1. -1.  0.  1.]
[ 0.  0. -1.  1.  0. -2. -2.  1. -1. -2.  1. -1.  0. -1.  0. -1.]
[-1. -2.  1. -2. -2.  0. -1. -1. -2.  1.  0.  1. -1. -1. -2.  0.]
[ 0. -2. -1.  0.  1. -1.  1. -1.  0.  0. -2.  0. -2. -1. -1.  0.]
[ 0. -1.  0. -2.  0. -1.  0.  1. -1.  0.  1. -1.  0. -1.  1.  1.]
[-2.  1.  0. -1. -2.  1.  1. -2.  1. -1. -1. -1. -2. -1. -1.  1.]
[ 1. -1. -1.  1.  1. -2. -2. -2.  0.  0. -1. -2. -1. -1.  0.  1.]
[-2. -1.  1.  0. -1.  0.  0.  0.  1. -1. -1. -1. -2.  0. -1.  1.]
[ 0.  1. -2.  1.  0.  0.  0. -1. -2. -2. -1.  0.  0. -2.  0.  1.]
[-2. -1.  1. -1.  1. -1.  0. -1. -1.  0. -1. -1.  1.  1.  1. -2.]
[ 0.  0.  1. -2.  0.  1. -1. -2. -2.  1.  0.  0.  0. -2.  1. -2.]
[ 0.  1. -

[-1. -2. -2.  0.  0. -2.  1.  0.  1.  0. -2.  1. -2.  1. -2.  1.]
[ 1.  0.  0.  0.  1.  0.  0.  1. -2. -1.  1.  0.  1. -1.  1.  1.]
[-1. -2.  0.  1.  1. -1.  1.  0.  1. -1.  1. -2.  1.  1.  0. -2.]
[ 1.  0. -1. -1. -1.  0. -2.  0.  0.  0.  1.  0.  0. -2.  1.  0.]
[-1. -1. -2.  1. -2.  1.  1.  0.  1. -1. -2. -1. -1.  1.  1.  0.]
[ 1.  1. -2. -1.  1. -1. -2.  1. -2. -2. -1. -2. -1. -2. -2. -2.]
[ 1. -1.  1.  0. -2. -2. -2. -2. -2. -1.  0. -2. -1.  0. -1.  1.]
[ 1. -1.  1.  1.  0.  1.  0.  1. -1. -2. -2.  1.  0.  0. -2. -1.]
[ 0. -2. -1. -1.  0.  1. -1.  0.  0.  1. -1. -2. -2. -2. -1.  0.]
[ 1.  1.  0.  0.  1. -1. -1. -1. -2. -1.  1.  1. -1.  1. -1.  0.]
[-2. -2. -2. -2.  1. -1.  1.  0.  0. -2. -1.  1. -1. -1.  0.  1.]
[-1. -1.  0.  0. -1.  0. -1.  1. -1.  1. -1.  0. -1. -2. -2.  1.]
[-1. -1. -2. -2. -2. -2.  0.  1. -1.  1.  1. -1.  1.  0.  0.  1.]
[ 1.  1.  1.  1.  0. -1.  1.  1.  0. -2. -2.  0.  0. -2.  1. -1.]
[-1. -2. -2. -2.  0. -2. -1. -1.  0. -2.  1. -1. -2.  0. -1. -2.]
[ 1. -1. -

 77%|███████▋  | 23/30 [32:54<09:47, 83.97s/it]

[-1.  0.  0.  0. -2.  1. -2.  0. -1. -2. -1.  1.  0.  0.  1. -1.]
Training loss (for one batch) at step 0: 0.017688538879156113
Seen so far: 16 samples
[-2.  1.  0.  1. -2. -2.  0. -1. -1. -2.  1. -1.  0.  0.  1. -1.]
[ 1. -2. -1. -1. -1.  1.  1. -2.  1.  1.  1. -2.  1.  0. -1.  0.]
[ 1. -1. -2.  0.  0. -2.  1.  0. -2. -2.  1. -1.  1.  1. -1.  1.]
[-2.  0.  0.  1.  0.  1. -2.  0.  0.  0.  0. -1. -2. -1. -2. -2.]
[ 0.  1. -2.  1. -2.  0. -2. -2. -2. -1.  0. -1. -1.  0. -2. -2.]
[-2.  0.  0.  0.  1. -2.  0. -2. -2.  1.  1. -1.  0. -2.  0. -1.]
[-2. -1. -1. -2. -1. -2.  0. -1.  0. -2. -2.  0.  1.  1. -2. -1.]
[ 1. -2.  1.  0.  1.  0.  0. -2.  0.  1. -2.  1.  1.  0. -2. -1.]
[ 1.  0.  0.  0. -2. -2.  1. -1.  0. -1.  1. -2. -2.  1. -1.  1.]
[ 0. -2. -1.  1. -2. -2.  1.  0.  0. -1.  0.  0. -1.  1.  1. -2.]
[-1. -1.  0. -1.  0. -1.  0.  1.  1.  0. -1. -1.  0. -1.  1.  0.]
[-1.  1. -2. -1. -2. -2. -1.  0.  1. -2.  0.  0. -2.  1.  1. -2.]
[-1. -1.  1.  1.  1. -1. -1.  0.  0.  0.  1. -1.  0. -2.

[ 1. -1. -1. -2.  1.  1.  1. -1.  1. -2. -1. -2. -2. -1.  0.  0.]
[-1.  1.  0. -1. -1. -1. -1.  1. -2.  1. -1.  0. -2.  1. -2.  0.]
[ 0.  1. -2. -2.  0.  1.  1.  1. -1.  0. -1. -2.  0.  1.  1.  0.]
[ 1.  0. -2. -2.  1. -2. -2. -1.  0.  1. -2.  1. -2. -1.  0.  0.]
[-1.  0.  1. -1.  1. -2. -1. -2. -1. -2.  0. -2. -2. -2.  1.  1.]
[ 1. -2.  1.  1. -1. -2. -2.  1.  1.  0. -1.  0. -2. -2. -1.  1.]
[ 0.  1.  0.  1. -2. -1. -1. -1. -1. -1. -2.  1.  1.  1.  1.  1.]
[-2.  1. -1.  0.  1.  1.  0. -2. -1.  0. -1. -1. -2. -2. -1. -1.]
[-1. -2.  0. -1.  0. -2. -2.  0.  1. -1. -1.  0. -1.  1.  0.  0.]
[-2.  1.  0.  1. -2. -1. -1. -2.  1.  1. -1.  0.  1. -2. -1.  0.]
[-1.  0.  0. -2. -2.  1. -2.  0. -2. -1.  1. -1. -1.  0.  1. -1.]
[-2. -1.  1. -2.  0.  1. -2. -1.  0.  1. -2.  0. -2. -1. -1. -2.]
[-1.  1.  1. -1.  1. -2. -1. -2.  0.  1. -2.  1.  0.  1.  0. -2.]
[-2.  0. -2. -2.  1.  1.  1.  1. -1.  1. -2.  0.  1.  1.  0. -2.]
[-2.  0. -2.  1.  0.  1.  1. -1.  0. -1. -1. -1. -1.  1. -1. -1.]
[ 1. -2.  

[-1. -2.  0. -2. -1.  1.  1.  1. -1.  0.  1.  0.  0. -2. -1. -2.]
[-2.  1.  1.  1.  1. -2.  1. -2. -2.  1. -2.  1. -1. -2. -2. -1.]
[-2.  0. -1. -1.  1.  0.  0. -2.  0.  1.  1.  0. -1. -2. -2. -2.]
[-1. -1.  1. -2.  1. -2. -2. -1.  0.  1.  1.  1. -1.  1. -2.  1.]
[-1.  1. -2.  0. -2.  0. -1. -1.  0.  1. -2. -2. -1.  0.  1. -2.]
[-1. -1. -1.  1.  1.  1. -2. -1. -1. -1.  1.  1. -1. -1.  1. -1.]
[-1.  0. -2.  0. -2.  0.  1.  1. -2.  0.  0.  0. -1. -1.  1. -2.]
[ 1. -2.  0.  0. -2.  1. -2. -1. -1. -2. -2.  0.  1. -1. -1.  1.]
[ 1.  0. -1.  0. -1.  1.  0. -1. -1. -1. -2.  1.  1.  0. -1.  0.]
[ 0.  0. -2. -1.  1.  0. -2. -2.  0.  0. -1.  1. -2.  0.  1. -1.]
[ 0. -1.  0.  0. -2.  1. -1.  1. -2.  0.  0.  1.  0. -1.  0.  0.]
[-1. -2. -2.  0. -2.  0.  1. -2.  0. -1.  0. -2. -1.  1.  1.  0.]
[ 0.  0.  1.  1.  0. -2. -1. -2.  1. -2.  1.  0.  0. -2. -2.  0.]
[-1. -1.  1.  1. -2.  0. -1. -1. -1.  1.  1.  0.  1. -2. -1.  1.]
[-2.  1.  0.  1.  0.  1.  1. -1.  0.  1.  0. -1. -2. -1. -2. -1.]
[-2.  1. -

[-1.  0.  0.  0. -2. -2. -2.  0. -1. -2. -2.  1. -1.  0. -1. -1.]
[ 1. -1. -2.  1. -2.  0.  1. -1. -1. -1.  1.  0. -2.  1. -2. -2.]
[-2.  1. -1.  0. -2.  0.  0.  1. -1. -1. -1. -2.  0.  1.  0. -2.]
[-2. -1. -1. -1.  0. -2.  1.  0. -1.  1.  1.  1. -1.  1. -1.  0.]
[-1. -1.  1. -1.  1.  1. -1. -1.  0.  0. -1.  1.  0.  0. -1.  1.]
[-2. -2. -2. -1.  1. -2. -2.  0.  1.  0. -2.  1. -2.  0.  1.  1.]
[-2.  1. -1. -2. -1. -2. -2. -2. -1. -2. -2.  1. -1. -2.  1. -2.]
[-1.  1. -2.  1. -1.  0.  1. -2. -1. -1.  0. -2. -1. -2. -2.  0.]
[ 0. -2. -2. -2.  1.  0. -2. -1. -1.  1. -1.  0. -2. -1.  0.  1.]
[-1. -1.  0.  0.  0.  1.  1.  1. -2.  1. -2. -2.  0.  0. -1. -2.]
[ 0. -1. -1. -2.  0.  0. -2. -1. -1. -2. -1. -1. -2.  1. -2.  1.]
[-2.  0. -2. -1.  0. -1.  1.  0. -1. -1. -1. -1.  1.  1.  0. -2.]
[ 1.  1. -1. -1.  1.  1. -2. -2.  1. -1.  1.  0.  1. -1.  1. -1.]
[ 0.  1.  0.  1. -1. -2.  0. -2.  0.  0.  0.  1. -2.  0. -2. -1.]
[ 1. -2.  1.  0.  0.  0.  0.  0.  0. -2. -1.  1. -2.  1. -2.  1.]
[-1. -2. -

[ 0.  0.  0.  0.  0. -2. -2. -1.  0.  1.  0. -1. -2. -1. -2. -2.]
[ 1. -2. -2.  0.  0.  0. -2. -1. -2. -1.  0. -2.  1.  1. -2. -1.]
[-1.  0.  0.  1. -1. -1.  0.  1. -1. -2. -1.  1.  1.  1.  1. -2.]
[-1. -2.  1.  0. -2.  1.  0. -1. -2.  1. -1. -2.  1. -1. -1. -2.]
[-1. -2. -1.  1. -2. -2. -2. -2. -1.  1.  0. -2. -1.  1.  0.  1.]
[ 1.  0. -2. -1.  0. -1.  0. -2.  1.  0.  1. -1.  0.  0.  0. -1.]
[ 0. -2.  1.  1. -1.  1.  1. -2. -2. -1. -2. -1. -2. -2. -1.  1.]
[ 1. -2. -2.  1. -1. -2.  0.  0. -2.  0. -1.  0. -1. -1.  1.  1.]
[-2.  1.  0. -2.  1. -1. -1. -1.  0. -1. -1. -1. -1.  1.  0.  0.]
[-1.  0.  1. -2. -2.  1. -1. -2. -2.  0. -2. -2.  0. -1. -1. -2.]
[ 0.  0. -1. -1. -2.  0.  1.  0. -1. -2. -2.  0. -2. -1. -1. -2.]
[-1. -2.  0. -1.  1. -2. -1.  0.  1.  1.  0.  0.  1.  0.  0.  0.]
[ 1.  0. -2.  1.  0. -2.  0.  1. -1. -1.  1. -1.  0.  0.  0. -2.]
[ 0.  1.  1.  1.  0.  0.  0.  1.  0. -1.  1. -2. -2. -1.  1. -1.]
[ 1.  1. -1.  1. -2.  0.  1.  0. -2.  1.  0.  0.  0. -1. -2.  0.]
[-1. -2. -

[-1.  1. -2. -2.  0. -1.  0. -1.  1.  1.  0.  1.  0.  0.  1. -1.]
[-1.  0. -1. -1.  1. -1.  1.  0. -1.  1.  0.  1.  0. -2. -1. -1.]
[-1. -1.  1. -1.  1. -1. -2. -1.  0.  1. -1. -2. -1. -2. -2. -1.]
[ 0.  0.  0. -2. -1.  0. -2. -1.  1.  0. -2.  1.  0.  1.  1.  1.]
[ 1.  0.  1. -2.  0.  0.  1. -2.  0. -1.  1. -2. -2. -2.  1. -1.]
[ 1. -1. -1. -1.  1.  1. -1.  1.  0.  0.  1. -1.  1.  0.  0. -1.]
[-1.  0. -2. -1. -1. -2.  0. -1.  0. -1.  1. -1.  0. -2. -1.  0.]
[ 0.  0.  0. -2. -1.  0.  0.  0. -2.  0. -2.  1. -2. -1. -2.  0.]
[ 1. -2.  0. -1. -2. -2. -2. -1.  1.  0.  1.  0.  0.  1.  1. -2.]
[-2.  1.  0. -1.  0.  1.  1. -2.  1. -1.  1. -1.  1. -1. -1. -2.]
[ 1. -1.  1.  1.  1. -1.  0.  0.  0.  1. -2.  0. -2.  1.  0. -1.]
[-1. -2. -2. -1. -2. -1. -2.  0. -1.  1.  0. -2.  1. -2. -2.  1.]
[-2. -2.  0. -1. -2. -1.  0. -2. -1. -2.  0. -1. -2. -2.  0.  1.]
[-2. -2. -1.  1. -1.  1.  1.  1. -1.  1. -1.  1. -2. -1.  1.  1.]
[-1. -2.  1. -1. -1. -2.  1.  0. -1.  1.  0.  0. -2.  0. -2. -1.]
[-1.  0.  

[ 0. -1. -2.  1. -1.  0.  1.  0.  1.  0. -1. -2.  1. -2.  1.  0.]
[ 0.  1.  1. -2.  1. -1.  0. -2. -2. -1.  1. -1.  0.  1.  0. -1.]
[ 0.  1. -1. -2. -1.  1. -1.  0. -2.  1. -2. -1.  1. -1.  1.  1.]
[ 0. -2. -1. -1. -2. -1.  0. -2. -2. -2.  1. -1. -2.  1.  1.  0.]
[ 0.  1. -2.  1. -2.  1. -1. -2. -1. -1. -1.  1.  1.  0.  1.  1.]
[ 1. -2. -2. -2.  0. -1.  1. -2. -1. -2.  1.  1.  0.  1.  0.  0.]
[ 0. -2. -1.  1. -1.  0.  1.  0.  0.  0. -2. -1.  0. -2.  1. -1.]
[-2.  1. -2. -2. -2. -2. -1. -2.  0. -2. -1.  1. -2. -1. -2.  1.]
[-2.  0. -1.  0.  1.  0. -2.  1.  1.  1.  1. -2.  0. -1.  1. -2.]
[ 1.  1.  0. -1.  0. -1.  0. -1. -1.  1. -2.  1. -1. -1. -2.  0.]
[-1. -2. -1.  0. -1.  1.  1. -2. -2.  0.  1.  0. -1.  0.  0. -2.]
[ 0. -1. -1. -1. -1.  1.  1.  1.  0.  0. -1.  1. -1. -2. -2.  0.]
[-1. -2.  1.  0.  1. -2.  1.  1.  1. -1.  0.  0.  1. -1. -2.  1.]
[-2. -1.  0.  0.  1.  0. -1.  0.  0.  1.  0. -1.  1. -2.  0.  1.]
[ 1. -1.  1. -2. -2. -1.  0.  1. -1.  1.  0. -1.  0. -1.  1. -2.]
[-1. -1.  

[-2. -2.  0.  1.  0.  1. -1. -1. -2. -1. -2.  0.  1. -2. -2. -1.]
[-2.  0. -2. -2. -1.  0.  0.  0.  0. -1.  0.  1. -1.  0.  0.  0.]
[ 0. -1.  0. -1. -1. -1.  1. -1. -1.  0. -1.  0.  1. -1.  0.  0.]
[ 1.  0. -1.  1. -2.  0.  1.  1.  0.  0.  1. -2.  0.  0.  1. -2.]
[-2. -1.  0. -1.  1. -1.  1. -1. -1. -2.  1.  1.  1.  1. -1.  1.]
[-1. -2.  1.  0. -1. -2.  0.  0. -2.  0.  1. -1. -1. -1.  0. -2.]
[ 0. -1.  1.  1. -2.  1. -2. -1.  0. -1.  1. -2. -2. -1. -1.  0.]
[ 1.  0.  0.  1. -2. -1.  1.  1.  0. -2.  0. -1.  0.  1. -1.  0.]
[ 1. -1.  1.  0. -1.  0. -2. -1. -1. -2.  1. -1.  0. -1.  1. -2.]
[ 0.  0.  1.  0. -1.  0. -1. -1. -1. -2. -2. -2. -1.  0. -1.  0.]
[ 1. -1. -2. -2.  0. -1. -1.  1.  0. -2.  1. -2.  0.  0.  1. -1.]
[ 0.  1.  1.  1.  1.  1.  0. -1. -1. -2.  0. -1. -2.  0.  0.  1.]
[-2. -2. -2.  0. -1.  1. -1. -2. -1.  0.  0. -2.  1. -1.  1. -2.]
[ 1. -2.  1.  0.  0.  0.  1. -2. -1.  1. -2. -2. -2.  1.  0. -1.]
[-2. -2.  0. -1. -2.  1.  0. -1. -1.  0.  1. -2. -2.  0. -2.  0.]
[-2.  1.  

[ 1. -2. -2. -2.  0.  1. -1.  0.  1.  0.  0. -1.  0. -1. -2.  1.]
[ 0.  1.  0.  0.  1. -1. -1.  1. -1. -2.  1. -1. -2.  1. -2. -1.]
[-1.  0.  1. -1.  0. -2.  1.  1. -2. -2.  1. -2. -2. -1.  0.  1.]
[-1.  0.  0.  0.  1. -2.  1.  0.  0. -1. -2.  1. -2.  1. -2.  1.]
[ 1.  1. -1.  1. -2. -1. -2. -2. -2. -1.  0.  1. -2. -2. -1.  0.]
[ 1. -1.  1. -1.  1. -1.  1. -2. -2.  1.  0. -1. -1.  1. -2. -1.]
[-1.  1. -1.  0.  1. -2. -1.  0.  0. -2.  1. -2. -1. -2.  1.  0.]
[ 0.  1.  1.  1. -2. -1. -2. -1. -1. -1. -1. -2. -2.  1.  0.  0.]
[ 0.  1. -2.  1.  1. -2. -2.  0.  1.  0.  1. -2.  0. -1. -1.  1.]
[ 0.  0. -1.  1. -1.  1.  1. -1.  0.  0. -2. -1. -1.  1.  1.  0.]
[ 1.  1. -2. -1.  1.  0. -1.  0.  0. -1. -2.  1.  0. -1.  0.  1.]
[-2.  1.  1.  0.  1.  1.  0.  0. -1.  0. -2. -1. -2. -2. -2. -1.]
[-1. -1.  0. -2. -2. -2.  1. -1.  1.  0. -1.  0. -1. -2. -1.  0.]
[-1. -2. -2.  1.  1.  1.  1. -2.  1. -2.  0.  1. -2.  0. -1. -2.]
[-1. -1.  1. -1.  0. -1. -2. -2. -1.  1. -2. -2.  0.  1.  0.  1.]
[-1. -2. -

 80%|████████  | 24/30 [34:20<08:27, 84.50s/it]

[ 0.  0.  1. -1. -1. -2. -2.  1. -1.  0. -2.  1. -1.  0. -2.  0.]
Training loss (for one batch) at step 0: 0.06717658042907715
Seen so far: 16 samples
[-2.  0. -1.  0.  0. -2.  1.  0. -1.  1.  1. -1. -1.  1.  0.  0.]
[ 1.  1. -2. -1.  1. -2. -2.  0.  0.  1.  0.  1. -1. -1.  1.  0.]
[-2. -2. -1. -1.  0. -1. -1.  0. -1.  1. -2.  0.  0.  1. -2. -2.]
[-2.  0. -2.  0. -2.  1.  0. -1.  0. -2. -1. -1. -2.  1.  1. -2.]
[ 0.  1. -1.  1. -2. -2.  1.  1.  0.  0.  0.  1. -1.  0.  1. -2.]
[-2.  1. -1.  1. -2. -2. -1.  1.  1. -2. -1. -2.  1. -2. -1. -1.]
[-1.  1.  0.  1. -2. -2. -2. -1. -2. -2. -1.  0. -2.  1. -1. -2.]
[ 1.  1.  1.  0. -2.  1.  1. -2. -2.  0.  0. -2.  1.  0.  0. -2.]
[-2. -1.  1. -1. -2.  1. -2. -2.  0.  0. -2. -1.  1. -1.  1. -1.]
[ 1.  0.  0.  0. -1.  0.  0.  0.  1.  1. -1.  1.  0.  1. -2.  0.]
[-2.  1. -2. -2.  1. -2.  0. -1. -1. -2.  0.  0.  1. -2. -1.  1.]
[ 1. -2.  1.  0.  0. -2.  0.  0.  0. -1.  0. -1. -2.  1.  0.  0.]
[ 1. -2. -1.  1.  1.  1. -2. -1.  1.  1.  1.  0. -2.  0. 

[ 0.  0.  1.  0. -1.  0.  0.  0.  0. -2.  0.  0.  1. -1. -1. -1.]
[ 1.  1.  0.  0.  0. -2.  1. -1. -2.  0. -2.  1. -1.  0.  0.  0.]
[-1. -2.  0. -1. -2. -2.  0.  0.  0.  0.  0. -2.  1. -1.  0. -2.]
[-2. -1.  1.  1.  1. -1.  0.  0. -2. -1.  1.  0.  0. -1. -2.  0.]
[ 1.  1.  1. -1. -1.  0. -1. -1. -1. -2. -1.  0. -2. -2. -2.  1.]
[ 1.  1.  1. -1.  1.  1.  1. -1.  0.  1.  1. -1.  1.  0.  0.  0.]
[-1. -1.  1. -1. -1.  1. -1.  0. -1. -2.  1. -2. -1.  1. -1.  0.]
[-2. -2. -2. -2. -1.  1.  1.  0. -2.  0.  0. -1. -2.  1.  0. -1.]
[ 1. -1. -1. -1. -1.  1.  0. -1. -1.  1. -2. -2.  1.  1. -1. -1.]
[ 0. -1. -1. -1. -1. -2. -2.  1.  1.  1. -2.  1.  1.  0.  1. -1.]
[ 0.  1.  0.  0. -2. -2. -2. -1.  0. -1.  1. -1. -1.  0. -1. -1.]
[-2.  0.  0. -1.  1.  1. -2. -2.  0.  1.  1. -1.  1. -1. -1. -1.]
[ 1.  0.  0. -2. -1. -1.  0.  0.  1. -2.  0. -2. -2.  1.  0. -2.]
[-2. -2.  0. -1. -2. -1.  0. -2. -1.  0. -1. -2.  1.  1.  1.  1.]
[ 1. -1.  0.  1. -2. -2.  1.  0. -2. -2. -2. -1. -2.  0.  0. -2.]
[ 1. -2.  

[-1.  0. -1. -2.  1. -1. -1. -2.  1.  0. -1. -2.  0. -1. -2.  0.]
[ 0.  0. -1.  0.  1.  1. -2. -1.  0. -1.  0. -2. -2.  1.  0.  1.]
[ 0.  1. -2. -2.  1.  0.  1.  0.  0.  0.  1. -2. -1. -1.  0. -2.]
[-1. -2. -1. -1.  0. -1. -1.  0. -1. -2. -1. -2. -2. -2. -2.  0.]
[-2. -2. -2.  1. -1. -1.  0.  0.  1.  1. -1. -1. -1. -2.  0. -2.]
[ 1. -1.  1.  1. -2.  1. -1. -2.  0.  1. -1.  0.  1. -1.  1.  1.]
[-2.  1. -1.  1.  1.  1. -2. -1.  0.  1. -1.  0.  1. -1. -1.  1.]
[-2.  0.  0. -2.  1. -1.  1. -1.  0.  0.  0.  1.  1.  1.  0. -2.]
[-2. -1. -1. -2. -2. -1.  0. -2.  0. -2.  0. -1. -2. -1. -2. -1.]
[ 1.  0. -2.  0.  1. -2.  0. -2. -2. -1. -1. -2. -2.  1.  1.  1.]
[ 0. -1.  0. -1.  0.  1. -1. -2. -2.  0.  1. -1. -2. -1.  0. -1.]
[-1. -2. -2. -1.  1.  1.  1.  0.  1.  1. -2. -2. -2. -1. -1.  0.]
[-2.  1. -2.  0.  1. -1.  0. -1.  0. -2.  1.  1.  0. -2.  1. -1.]
[-1.  0. -1.  0. -1. -2.  0.  0. -2. -1.  1. -2. -2.  0. -1. -2.]
[ 1. -2. -2. -2. -2.  1.  0.  1.  0. -2. -1.  1. -1.  1. -1. -2.]
[ 0.  0.  

[ 0. -2.  1.  0.  1. -2. -2. -1.  0.  1. -2.  0. -2. -1. -1. -1.]
[-2. -2.  0.  1.  1. -2. -1.  1.  1. -1. -2. -1. -1. -2. -1. -2.]
[-1.  1. -1.  0.  0. -1. -2.  1.  0. -2. -2. -1.  0.  0.  0. -1.]
[ 1. -2. -1.  1.  1. -1. -2. -1. -1.  1. -1. -2. -2.  0. -1. -2.]
[-2.  0. -2. -1. -2.  1. -1.  1.  1.  1. -2. -2.  0. -1.  1.  0.]
[ 0.  0.  0. -2. -2. -2. -2. -2. -2. -1.  1. -1. -1.  1.  0.  0.]
[ 0.  0.  0. -2.  1. -2.  0. -2. -1. -1. -1. -2.  1. -1. -2. -1.]
[-1. -2. -2.  1.  0.  1.  1.  1.  0.  0.  1. -1.  0. -1. -2. -1.]
[ 1.  0. -1. -1.  0. -2.  1.  1.  1.  1. -1. -2.  1.  0. -1. -1.]
[-1.  0.  1. -1. -2.  0.  1.  1. -2.  0. -2.  0. -2. -2. -2. -1.]
[ 1.  1. -2.  1. -2.  1. -1.  0. -1. -2.  1. -1.  0. -2. -1. -1.]
[ 1.  0. -1.  1. -1.  0.  1.  0. -2. -2. -2.  1. -1.  0.  1. -1.]
[-2.  1.  0.  1.  1. -2.  0. -2.  0.  0.  1. -1. -1.  0. -2. -2.]
[-1. -2.  0.  1. -1. -2. -1.  0. -1.  1.  1.  0. -2. -2.  1.  1.]
[ 1. -1. -2.  0.  0. -1. -1.  0.  1.  0.  0. -1. -2. -1. -2.  0.]
[-1. -1. -

[-1.  0.  1.  0.  1. -2. -1. -1.  1. -1. -2. -1. -2. -1. -2.  0.]
[ 1. -2.  1.  1.  0. -1. -2.  1.  0. -1.  1.  0.  1. -1. -2.  0.]
[-2. -2. -1.  0.  1.  1.  0.  0.  0.  0. -1.  1.  1. -2. -2. -1.]
[ 0. -1. -2.  0.  0. -2. -1.  1.  0. -2. -2. -2. -2.  0.  0.  0.]
[ 0.  1. -2. -1.  1. -1. -2.  1. -2.  0. -1.  0. -2.  0. -2.  0.]
[ 1. -2. -2. -1.  1. -1. -1. -2. -1.  0.  1. -2. -2.  0.  0. -2.]
[ 0.  0.  0.  1.  1.  1.  0.  1.  1. -2.  0.  1.  1.  0. -1.  1.]
[-1. -1. -2.  1. -2. -1. -1. -2. -1.  1.  0. -1. -2.  0.  0.  0.]
[-2. -1. -2.  1.  1. -2.  1.  0.  1.  1.  0. -2. -2.  1. -2. -1.]
[ 1.  1. -1. -2. -2.  0. -1. -2. -2. -1. -2.  0. -2.  0.  1.  1.]
[-1.  1.  0. -2.  1.  1.  0. -2. -1. -2.  0.  0. -1.  0.  1. -1.]
[-1. -2. -1.  0. -1. -2.  1. -2.  1.  1.  0.  0. -2. -2. -1.  0.]
[ 1. -1.  1.  1.  1.  0.  0. -2.  0.  0.  1. -2.  0.  0.  0.  0.]
[-2. -2. -1. -2.  1.  1. -1.  1.  0.  0.  0. -2.  0.  1.  1. -1.]
[ 1.  0. -1.  0. -1.  1. -2. -2. -2. -2.  0. -1.  0. -2. -2.  0.]
[-1. -2.  

[ 0. -1.  0.  1.  1. -1. -1. -2.  0. -2.  0.  1. -1. -1.  0. -2.]
[-2. -2. -2. -1.  0.  1. -2.  0. -2.  0. -2. -2. -2. -1. -2. -1.]
[-1. -1. -1.  1. -1.  1. -2.  1. -2. -2.  1.  0.  0. -1. -2. -1.]
[-2.  0.  0. -2. -1.  1. -1.  0.  0.  0.  1. -2. -1.  1.  0.  1.]
[-2.  1.  0.  0. -2. -1.  1. -2. -1. -2. -2.  0.  1.  1.  0. -2.]
[-1. -2.  0.  1. -2.  1. -1.  1.  0.  1.  0.  0. -2.  1.  0.  0.]
[-2.  1. -2. -2.  0.  1. -1.  1.  0.  0.  0.  1.  0. -1. -1.  0.]
[-2.  0. -2. -2. -1.  0.  1.  1.  0.  0. -2.  1.  0.  0. -1.  1.]
[-1. -2.  0.  1. -2.  0. -1. -1. -1. -1.  1.  1. -1. -2.  0. -1.]
[ 0. -2. -1. -1.  0. -2.  1. -1. -2.  0.  1.  0.  0. -1.  0.  0.]
[ 0.  1.  0. -1.  0. -1. -2. -2. -2.  1.  1. -2. -1.  1. -2.  1.]
[ 0. -2.  0.  1. -1.  1.  1.  0.  0. -2. -2. -2. -2.  0. -2.  1.]
[-2. -1. -2.  1.  0.  0. -1.  1.  1.  0.  0.  0. -2.  1.  1. -1.]
[-2. -1. -1. -2. -2. -2.  1. -1. -1.  1. -1.  0. -1. -2.  1.  1.]
[ 0.  1. -1. -1.  1. -2.  0. -1.  0.  0.  1.  0. -1. -1. -2.  1.]
[-1.  1.  

[ 1. -2.  0.  1. -1.  1. -1.  1.  0. -2.  0. -1. -2. -2. -1. -2.]
[ 0.  1.  0.  1.  0.  0.  1. -1. -2.  1. -1. -2. -2. -1. -1.  0.]
[-1.  0.  0. -1. -1.  0.  1.  0.  0.  0.  0.  0. -1.  1. -1. -2.]
[-1.  1.  0. -1.  0.  0.  1.  1.  0. -2. -2.  0. -2.  0.  0. -1.]
[ 1. -1.  0.  1.  1.  1.  0. -2.  0. -1.  0.  0.  1. -2. -2.  0.]
[-1. -2.  1. -2. -1.  1.  0. -2.  1. -2. -1.  1.  0. -1.  0. -2.]
[-1.  1.  1.  0. -1.  0. -1. -1.  0. -2.  1. -1.  1.  0.  1. -2.]
[-2.  1.  1.  1.  0.  0. -2. -2.  0.  0. -1.  1. -2. -1.  0. -2.]
[ 0. -2. -2. -2. -1. -2.  1. -1.  1. -1.  0.  0.  0. -2.  1. -1.]
[-1.  1.  0.  0. -2. -1. -2. -2.  1.  0. -2. -2.  0. -2. -1.  0.]
[-2.  1.  1.  1. -2.  0. -2. -1.  0. -1. -2. -1.  1.  0. -2.  1.]
[-1. -1. -2. -2. -2. -1. -2.  0. -1. -1.  1.  1. -2.  0. -2.  1.]
[ 1.  0.  1.  0. -1.  1. -1. -2.  1. -2. -1. -1.  0.  0. -1. -2.]
[-1.  1.  1.  1.  1.  0.  1.  1. -1.  0. -1.  1. -2.  1.  0.  0.]
[-1.  0. -2. -2.  1. -1. -2. -2. -2. -1. -1. -1.  0.  0.  0. -2.]
[-2.  0. -

[ 1.  0. -1. -1.  1.  1. -2.  0. -2.  1.  0. -2.  1.  1.  1. -2.]
[-2.  1.  1.  0. -1. -1. -2.  1. -2. -2.  1. -2. -1.  1.  1.  1.]
[-2.  0. -2. -2. -2.  0.  0. -1. -1.  1. -2. -1. -1.  0. -2. -2.]
[-1.  1.  0.  0.  1. -1.  1. -2.  1.  1.  0. -2. -2. -2.  1.  1.]
[-2.  1.  0. -1. -2. -2. -2. -2.  1.  0.  0.  0.  0. -1.  1. -2.]
[ 0.  1.  0. -1.  0.  1.  1. -1. -2.  1. -1.  1.  1.  0. -1.  1.]
[-1.  0. -1. -2. -1.  1. -1. -2.  0. -1. -2.  0. -1. -1. -2.  0.]
[-1.  0.  0. -2.  0. -2.  1. -2. -1.  1.  0.  0. -2. -1.  1.  0.]
[-2.  0. -1. -2. -1. -2.  1. -2. -2. -2. -2. -1. -2.  1. -1. -2.]
[-1. -2.  1.  0. -2. -2. -1. -1.  0. -1. -2. -2. -1.  1.  0.  0.]
[-1. -1. -2.  0. -1.  1.  0. -1.  1. -1.  1.  1. -1.  0.  0.  0.]
[-2. -1.  0. -2. -2. -2. -2. -1.  1. -2.  1. -1.  0.  0.  0.  1.]
[ 1.  0. -1.  0. -2.  0. -1. -1.  0.  1.  1. -1. -2.  0. -1.  1.]
[-2. -1. -2.  1. -2.  1.  1. -2.  1.  0.  1. -2.  0.  0.  1. -2.]
[ 0. -2.  1. -1.  1. -2. -1. -2. -2. -2.  0. -1.  1.  1.  0. -1.]
[-1.  1. -

[ 0.  0.  0.  1. -2.  1.  1.  1.  1.  1. -2. -1. -2. -2.  0. -2.]
[-2.  0. -1. -1.  1.  0. -1. -1.  1.  1.  0. -1.  1. -1.  0.  1.]
[-2. -2. -1. -1.  0. -2. -2.  1. -2.  1.  1.  0. -1.  1.  1.  0.]
[-1.  0. -2. -1.  1. -1. -1.  1. -2. -1. -2. -1. -1.  0.  1. -1.]
[ 1. -1. -2.  1. -1. -1. -1. -1. -2. -1.  1. -2.  1. -2. -2.  0.]
[ 1.  0. -1.  1.  1. -2. -2.  0. -1. -2. -1. -2.  1.  1. -1. -1.]
[ 1. -2.  0. -2.  1.  0.  1.  1. -2.  0. -1. -1. -2. -1. -2.  0.]
[-1. -2. -2. -2. -1. -1.  1. -1.  1. -1.  1. -2.  0. -1. -2.  0.]
[-1.  1.  1. -1. -2.  1.  0. -1. -2. -2.  0. -1.  0. -1. -1.  1.]
[ 0. -1. -2.  1.  1.  0.  0.  1.  1. -2.  1. -2. -1. -1.  1. -2.]
[ 1. -2.  1. -1. -1. -1.  0.  0. -2. -2.  1. -1.  0. -1. -1. -2.]
[-2.  1.  0. -2.  1.  1. -2.  0.  0.  0. -2. -1. -2. -2. -1.  1.]
[ 1. -1.  1.  0.  0. -2. -2. -1. -2.  1.  1.  0.  1.  0.  1.  1.]
[-1. -2.  0. -1.  0.  0.  0.  1. -2.  0. -1.  1.  1. -2. -2. -1.]
[ 0. -2.  1. -1. -1. -1. -2.  0.  0. -1. -1. -2. -1. -1.  1.  0.]
Training l

 83%|████████▎ | 25/30 [35:43<07:01, 84.25s/it]

[ 1. -1.  0.  1. -2.  0.  1.  1.  0. -2. -1. -2.  1. -1. -2. -1.]
Training loss (for one batch) at step 0: 0.04690399765968323
Seen so far: 16 samples
[ 0. -2. -1. -1.  1.  1. -1. -2. -1. -2.  0. -2.  0. -1. -2. -2.]
[-2.  0.  1.  1. -2. -2.  1.  0. -2.  0.  1.  1.  1. -2.  0. -1.]
[-1.  0. -2. -2. -1.  1. -2.  1. -2. -1. -2.  1. -2. -1.  1. -2.]
[-2.  1.  1.  0. -1.  0. -2. -1. -1. -1. -1. -1.  0.  0. -2. -1.]
[-1.  1. -1. -2.  1.  1. -2.  1.  0.  0. -2.  0. -1.  0. -1.  0.]
[-1.  1. -2. -2. -1. -2.  0. -1. -1.  0. -1.  0. -2.  1. -2.  1.]
[ 1. -1.  1.  1.  1.  1.  0. -1. -2. -1.  1. -2.  1. -1. -2. -2.]
[-2.  1.  1. -2.  0.  1.  1.  1. -1.  0.  1. -2. -1.  1. -1.  0.]
[ 1. -1. -2.  0.  0.  0.  1. -1.  0.  0. -1.  1.  0.  1.  1.  1.]
[ 0. -1.  0. -2. -2.  0.  1. -2.  1. -1.  1.  0.  0. -1. -2.  0.]
[ 1. -2.  1. -2.  1.  0. -2. -2. -1.  1.  0. -1. -1.  1. -1.  1.]
[-1.  0. -2. -1.  1.  1. -1. -2.  1.  0. -1. -2. -1.  1.  1. -1.]
[-2.  1.  0. -1. -1. -2.  1. -2.  0. -2.  1. -2. -1.  1. 

[-1.  1. -2. -1. -2. -2. -2.  1. -1. -2. -1. -2.  1. -2.  0.  0.]
[-2. -2. -2.  0.  1.  0. -2.  0. -1.  1.  1.  0.  1. -2. -2. -1.]
[-2. -1.  0.  0. -1.  1.  0. -1.  1. -1.  0. -2. -2.  1.  0. -1.]
[ 1.  1.  1. -2. -1. -2.  0.  0.  0. -1.  1. -1.  0. -2.  1. -1.]
[ 1.  0.  1. -2.  0.  1.  0. -1.  1. -2. -2.  1.  1. -2.  0. -2.]
[ 0.  1.  1.  0. -1. -1.  0. -2. -2.  0.  1. -1.  1. -2. -2.  0.]
[-2.  0. -2. -1.  1.  1. -2. -2.  1. -2.  0.  1.  1.  1. -2. -1.]
[ 0.  0. -2.  0.  0.  0. -1.  0. -2. -1. -2.  1.  0.  1. -1. -2.]
[ 0. -2.  1. -2. -1.  0.  1. -1.  0.  0.  0. -1.  1.  1. -1. -1.]
[-1.  1. -1.  0.  1.  0. -1. -2. -1. -1. -1. -1.  1. -1.  0. -2.]
[ 1.  1. -2. -2. -2. -2.  1. -1.  0.  1.  1. -2. -1. -1. -2. -2.]
[-1.  0.  1.  1.  1. -2.  1. -2.  1.  1.  0.  1.  1. -2.  1.  1.]
[ 1.  1.  0.  0. -1. -2.  0. -2. -1. -1. -2. -2.  1. -1. -1. -2.]
[ 0.  0. -2. -2.  1.  1. -2.  0.  0. -1. -1. -1.  0. -1.  1.  1.]
[-2. -2. -1. -2.  0. -1.  0.  1. -2. -2.  1.  1.  0.  1. -2.  0.]
[ 1. -1. -

[ 1.  1. -2. -1.  1.  1.  0.  1. -1. -2.  1. -2. -1.  0.  1.  0.]
[ 1.  0. -1. -2.  0.  0.  0.  1.  1. -2.  1.  1.  1.  0.  1. -2.]
[-1. -1. -2.  0.  0.  0.  0.  0. -1. -2. -2.  0.  1. -1. -2.  0.]
[ 0. -1. -1. -2. -1. -1. -1.  1. -1.  1. -2.  0.  1. -1.  1.  1.]
[ 1.  1.  0. -1.  1.  0.  0.  0.  0.  0.  0. -1.  1. -1.  1. -2.]
[-2. -1. -2.  1. -1. -1.  1.  0. -2.  0. -2. -2.  0. -2. -2.  1.]
[ 0. -2.  1.  1. -2.  1. -1.  1. -2.  0.  1.  1.  1. -1.  0.  0.]
[-1. -1.  0.  1.  0.  1. -2.  1. -1.  1.  0.  1.  1. -1.  0.  1.]
[ 0.  0. -1.  1. -2.  0.  1.  1.  1. -2.  1. -2. -2.  0.  0. -2.]
[ 1.  1. -2.  1.  1. -2. -1.  0.  0. -1. -2.  1.  1. -2.  1.  1.]
[-1. -2.  0. -2.  0. -2.  0.  1.  1. -2. -1. -2.  0. -2.  1.  1.]
[-1. -2. -2. -1.  0. -2.  0. -2.  1. -1.  1.  1.  0.  1.  0.  1.]
[ 1. -1.  0. -1. -1.  0. -1.  0.  0. -1. -2. -1. -2. -2.  0.  0.]
[ 0. -2.  0.  1. -1.  0. -2. -2. -1.  0. -1.  0. -1. -2. -2. -1.]
[-2. -2. -1.  0. -1. -1.  0.  1. -1. -2. -2. -2.  1. -1.  1. -2.]
[-1. -1.  

[ 0. -2. -2. -2. -1.  0. -2.  0.  0.  0. -1.  1.  0.  0.  0. -1.]
[-1.  0. -1.  1. -2.  0. -2. -2.  0. -1. -1. -1. -1. -2. -2.  0.]
[-1. -2. -1.  0.  1.  1.  0. -1. -1.  1.  1.  1.  0. -2.  1.  1.]
[ 0.  1. -1. -1.  0. -1.  1.  1. -2. -2.  1.  1.  1. -2.  0.  1.]
[-2. -2. -2.  0. -2.  1.  1.  1. -1.  1.  1.  0.  1.  0.  0. -1.]
[ 1. -1. -2. -2. -2. -2. -2. -1. -1. -1. -2. -1.  1.  0. -1. -2.]
[-2.  1. -2. -2.  0.  0.  1.  0.  1.  1.  1. -1. -1. -2. -1. -1.]
[-2.  0. -2.  1. -2. -2. -1. -2.  0. -2.  1.  1.  0. -2. -1.  1.]
[-2. -1.  1. -1. -2.  0.  1. -1. -1.  0. -1.  1.  0.  1.  1.  0.]
[-2. -2.  0. -1.  1. -2.  0. -2. -1. -1. -1.  0.  1.  1. -2. -2.]
[-1. -2. -1.  1.  1.  0. -2. -1.  1. -2.  0. -1. -2.  1.  0. -2.]
[-1. -1. -1.  1. -1.  1. -1. -2.  1. -2. -1.  1. -2.  1.  1. -1.]
[ 1. -1. -2. -2.  0.  1. -1. -2. -1.  1.  1.  1. -1.  0.  1.  0.]
[ 0. -1.  1.  0. -2. -1. -2. -1.  1.  1. -2. -1. -2. -2.  0. -1.]
[ 0.  1.  1.  0. -1. -2.  0.  1.  0.  1. -1.  1.  0. -2. -2.  1.]
[-2.  1. -

[ 1. -2. -2. -1. -2.  1. -2.  1.  0.  0.  1. -1.  0. -2.  1.  0.]
[ 1. -1.  0. -1.  1. -2. -1.  1. -1.  0.  1.  0. -1. -2.  1.  0.]
[-1. -1.  1.  1. -1. -1.  1.  1.  0.  0. -1.  0.  1. -2.  0. -1.]
[-1. -1. -2. -2. -2.  1.  0. -2. -1.  0. -2.  1. -2.  0. -2. -2.]
[ 0. -2. -1. -1. -2. -1.  0.  0. -1.  1.  1.  1.  0.  0. -1.  1.]
[ 0. -1.  1.  0. -2.  1. -1.  0.  1. -1.  0. -2. -1.  0. -2. -2.]
[-2. -2.  0.  0.  0.  0. -1.  1.  0.  1. -2. -1. -2. -2.  0.  0.]
[ 1. -2. -2.  1.  0.  0.  0. -2. -1.  1. -1. -1.  0.  1.  1. -1.]
[-1.  0. -2. -1. -1.  0. -1.  0. -2.  1.  1. -2.  1.  1. -2. -1.]
[-2.  1.  0. -1.  1.  1. -2.  0. -1. -2.  1. -2.  1.  1.  0. -1.]
[-1. -1.  1. -2. -1.  1. -2. -2. -2. -2. -1.  0.  1. -1.  0.  1.]
[-1.  1. -2. -2.  1. -1. -1.  0.  0.  0. -1.  0. -2. -2. -2. -1.]
[ 0.  1. -2. -1.  0.  0. -2. -1.  1.  0.  0. -2. -1. -1.  0.  0.]
[-2. -2.  0. -1. -2.  0. -2. -2. -1. -1.  0. -2. -1.  0. -2.  1.]
[ 0.  1.  0.  0. -1. -1. -1. -1. -2.  0.  1.  1. -2.  1. -1. -2.]
[ 0.  0. -

[ 1.  0. -2.  1. -1. -1.  1. -2. -1. -1.  0. -2. -1. -1.  1. -2.]
[-2. -1. -1. -1.  0.  0.  0. -2. -2.  1. -2. -2. -1.  1. -2. -2.]
[-1. -2.  0.  1.  0. -2. -2. -1. -2. -2.  0. -1. -1. -1.  1. -2.]
[-1. -1. -1. -1.  0. -1.  1. -1. -1. -1. -1.  0. -2. -1.  1.  0.]
[-2. -2.  0. -1.  1.  1.  0. -2. -1. -2.  0. -2. -2. -1. -2. -2.]
[ 1. -2.  0. -2.  1. -2. -1.  0.  1. -1.  1. -2. -2. -2. -2.  1.]
[-1. -1. -2.  0.  1. -1. -2.  0. -2. -1. -1.  1.  1.  0. -1.  1.]
[ 1.  0.  0. -1.  1. -2.  0.  1.  1.  1.  0.  1. -2.  1.  1. -1.]
[-1.  1. -2.  0.  1. -1.  1. -1. -2.  1.  1.  0. -1. -1.  0.  0.]
[-2.  0.  0. -1. -1. -1. -2. -1.  0.  1. -2. -2.  0. -2. -2.  1.]
[ 1.  1.  1.  0.  1. -1.  0.  1.  0.  0.  0.  0. -1. -1.  0. -1.]
[ 0. -1. -1. -2. -2.  0. -2.  1. -2. -1.  1.  1. -1. -1. -2. -1.]
[-1.  1. -2.  0. -1. -1.  1. -2. -2. -1.  1.  0.  1.  1. -1.  1.]
[ 1.  0.  0.  0. -2.  1. -1.  0.  0.  0. -1.  1.  1. -2. -2. -1.]
[-1. -1. -1. -1. -2.  1.  1.  1.  0. -2. -1.  0. -1. -2.  1. -1.]
[-2. -2. -

[-1. -1. -1.  0. -1. -1. -1.  0. -2. -1. -1.  0.  1.  0.  1. -2.]
[ 0.  1.  0. -2.  1. -1.  1. -1. -2.  0.  0. -1. -2. -2. -2. -2.]
[-1. -2. -1. -1.  0. -2.  1. -1.  1.  0.  1.  1. -1. -2. -2. -1.]
[-1. -1. -2.  0. -1. -1.  0.  0.  1. -1.  0. -1. -1. -2. -2. -1.]
[ 0.  0.  0.  1. -2.  0.  0. -2. -2. -1.  1.  0.  0.  1. -2. -2.]
[-1. -1.  0.  1.  1.  0. -1. -2.  1.  0.  0.  0.  1.  1.  0.  0.]
[ 0.  0. -1.  0.  1. -1.  1. -1.  0. -1. -2. -1. -2.  1.  1.  0.]
[ 1.  0.  0. -1. -2. -2.  1.  1.  1. -1. -2. -1.  1.  1. -2.  0.]
[-2.  1. -1.  1.  1.  0.  1.  0.  0.  0.  1. -1. -2. -1.  1. -2.]
[ 1. -2.  1.  0.  0.  1. -1. -2.  1.  0. -2. -2.  1.  0. -1.  0.]
[ 0. -2.  1. -2. -1. -2.  0.  1. -1.  0.  1. -1.  1.  0.  1. -1.]
[ 0.  0. -2.  1. -2. -1. -1.  1.  1.  1. -1.  1.  1. -2. -1.  1.]
[-1. -1.  1.  1.  1. -1.  1. -2. -1. -2. -1. -2.  0. -2.  1.  0.]
[ 0. -2.  0. -2.  1.  0.  0. -1. -1.  1. -1. -2. -1.  0. -2.  1.]
[-1.  0. -1. -2.  0.  0. -1. -2.  1. -2.  1. -1.  1. -2. -1.  0.]
[ 1. -2.  

[ 1. -1.  0.  0.  1. -1.  1. -2. -1. -2.  1. -1. -1. -2.  1.  0.]
[ 1. -1.  1. -1.  1. -2.  0.  0. -1. -2.  0. -1.  0. -2.  0. -1.]
[-1. -2. -1. -1.  1.  0. -2.  0.  0. -1.  1. -1.  0.  0.  1. -1.]
[ 1. -1. -2.  1.  0.  1.  0.  0.  1. -2.  0.  1.  1. -2.  0.  0.]
[ 1.  0.  1. -2.  1.  1.  1. -2.  0.  0.  0. -1. -1. -2. -1. -1.]
[-1.  1. -1. -1.  1. -1. -1.  0.  0. -1. -1. -1.  0. -2.  0.  1.]
[-1. -1.  0.  0. -2.  0. -2.  0. -2. -1.  0. -1. -2.  1. -2.  0.]
[ 1. -2. -2. -1.  0. -1. -2. -2. -1.  0.  0. -1.  0.  0.  1.  1.]
[ 1.  0. -1. -2.  1.  0. -1. -2.  0.  0. -2. -2.  0.  1.  1.  1.]
[ 0.  1. -1. -2. -1.  1.  1.  1. -2.  0.  0.  0. -2. -1. -1. -1.]
[-2.  1.  0.  0. -1. -1. -1.  1. -2. -2. -1.  0.  0. -2.  0.  0.]
[-1.  0.  1.  1. -1. -1. -1.  0.  0.  1.  0. -1. -2.  0. -2.  0.]
[-2. -2.  1.  1. -1. -2. -2. -2.  1. -1. -1.  0.  1. -2. -1.  0.]
[ 0. -2.  1. -2.  1.  0. -1. -2.  1.  0. -1.  0. -1.  1.  1.  0.]
[ 0. -2.  0. -2. -2. -1.  1.  1. -1. -2. -2.  0.  1.  1. -2. -1.]
[ 1. -2. -

[-1.  1. -2.  1.  1. -2.  0. -2.  0.  0. -2.  1. -1. -2.  1.  0.]
[-1. -1.  1.  1. -1.  0.  0. -2.  1. -1.  0.  0. -2.  0. -1.  1.]
[ 0. -1.  1.  0.  1. -1. -2. -1. -1. -1. -1.  1.  1. -2. -2.  1.]
[-2. -1.  1.  1.  1.  1. -2. -2. -1. -2. -1.  0. -1.  0.  1. -2.]
[ 1.  1.  1.  1. -1. -2.  0.  0. -2.  0.  1.  1.  0. -2. -2. -1.]
[-2. -1. -1.  1.  0.  0. -2. -1. -1.  0. -2.  1. -2. -1.  1.  0.]
[-1.  1.  1. -2.  0.  0. -2. -1.  1.  0.  1. -2. -1.  0.  0.  1.]
[-1. -2.  1.  0. -2. -2. -1. -2. -2.  0.  1.  0. -1. -2.  1. -2.]
[ 1. -1.  0. -2.  0. -1.  1.  0. -2.  0.  0.  1.  1. -2.  0. -2.]
Training loss (for one batch) at step 1000: 0.024006173014640808
Seen so far: 16016 samples
[ 1.  0.  1.  0.  0. -1. -2.  1. -1. -1.  1.  0.  1. -2.  0.  1.]
[-2. -1. -2.  1.  0. -2. -1.  1. -2. -2. -1. -2.  0. -1. -2. -2.]
[-2. -2.  0. -2.  0.  0. -2. -2.  0. -2.  0. -1.  0.  1. -2.  1.]
[ 0.  1. -2.  1. -1.  0.  0. -1. -2.  0. -1.  1. -1. -2.  1.  0.]
[ 1.  1. -2.  0. -1. -1.  0.  1. -1. -2.  1. -2. -

 87%|████████▋ | 26/30 [37:07<05:36, 84.09s/it]

[ 1.  1.  1. -2.  1.  1.  1.  0. -1. -1.  1. -1. -1.  0.  0.  0.]
Training loss (for one batch) at step 0: 0.01641809195280075
Seen so far: 16 samples
[-1. -2.  0. -1. -2. -1. -2.  0. -1.  1. -2. -2. -1. -2.  1. -1.]
[-2. -2. -1.  1. -2.  0.  0. -2. -2.  1.  1. -1.  1. -1.  0. -1.]
[ 0. -2.  1. -2.  0. -1.  0. -1.  1.  0.  1.  1.  0. -1. -1.  1.]
[ 0.  1.  0. -2. -2. -2. -1.  1.  0.  1. -2. -2. -2.  0. -2.  1.]
[ 0. -2. -1. -1.  1.  0.  1. -1. -1.  1. -2. -2.  1. -2.  0.  0.]
[ 1.  1. -1.  1. -2.  1. -1.  0. -1.  0.  0. -1. -2. -2.  0.  1.]
[ 1. -2.  0.  1.  0.  1.  0. -2.  1. -2. -2.  1. -1.  1. -1.  1.]
[-1.  1. -1. -2.  1. -2.  0.  0.  1.  1.  0. -2.  1.  0. -2. -1.]
[ 1.  0. -1. -1. -1. -2. -1.  0.  1.  1.  0.  0.  0. -1. -2. -2.]
[ 0. -1.  0. -2. -1.  0. -1. -2.  1. -2. -2.  0. -1. -2. -2. -1.]
[-1.  0.  0. -2. -1.  1. -2.  1.  0.  0. -2.  0.  0. -2.  0. -1.]
[ 1.  0.  0.  1. -1.  1.  1.  1.  0. -2. -1. -1. -1. -1.  0.  1.]
[-2.  0. -1. -1.  1. -2.  0.  1.  1.  0.  1.  0.  0.  0. 

[ 1. -2.  1. -2.  1.  0.  0.  0.  1. -1. -2. -1.  1.  1. -2. -2.]
[ 1. -1. -1. -1. -2.  1. -1. -2. -1.  1.  0.  0. -1. -1.  0.  1.]
[-2. -1. -2. -1.  0. -1.  1.  0.  1.  0. -2.  1. -2.  1.  0. -2.]
[-2. -1. -2.  1.  1.  0.  0. -1.  0.  1.  1.  1.  1. -2.  0.  1.]
[ 0. -1.  0.  0. -1. -1. -1. -1.  0. -2. -1. -2. -2.  0. -1.  0.]
[-1.  0.  1.  1.  0.  0.  1. -2. -2.  1.  1. -2. -1.  1. -2. -2.]
[-1.  1. -2. -1. -2.  1. -1. -2.  0.  1.  1.  1. -1.  0.  1. -1.]
[ 1. -2. -2. -2.  0. -2. -2.  1. -2. -1.  1. -2.  1.  1. -1.  1.]
[-1. -2.  1.  0.  0.  1. -2. -2.  1.  1.  1.  0.  0.  1. -1. -1.]
[ 1.  1.  1.  1.  0. -1. -2.  0.  0. -1. -2. -2. -2. -1.  0.  0.]
[ 1.  0.  0.  1. -1.  0.  1. -1. -2. -2.  0. -1.  0.  0. -1. -1.]
[ 1. -1. -2.  1.  0. -2.  0. -1.  0.  0.  0.  1.  0.  1. -2.  1.]
[-2. -1. -2.  0.  1.  1. -2.  0. -1.  0.  1. -2. -2. -1.  1.  0.]
[-1.  0. -1.  1.  0.  1. -2.  1. -1. -1.  0.  0. -1. -1. -2.  0.]
[ 0.  0.  0.  0. -1.  1. -2. -1. -1. -2.  0. -2. -2. -2. -2.  0.]
[ 0.  1. -

[-2.  0.  1. -1. -1.  1.  0. -2.  1.  1.  1. -2.  1. -1. -2. -1.]
[ 0.  0.  0.  1. -1. -1.  0. -2. -1. -2. -1.  0.  0. -2.  1.  1.]
[ 1. -2. -1. -1.  0.  1. -2.  0. -2.  1. -1.  1. -1. -1. -2. -2.]
[-2.  0.  0. -1.  1. -1. -1.  1.  1. -2. -1.  1. -2. -1.  1. -1.]
[ 1. -2.  0. -2. -1. -2.  0.  0.  0.  1. -1.  0. -2.  1. -1.  0.]
[ 1. -2.  0. -1.  0. -2. -1. -1. -2.  1.  1.  0. -1. -1. -1.  0.]
[ 0.  0.  0.  1. -1.  1. -1. -1.  1. -2.  1. -1.  1. -1.  1.  1.]
[ 0.  1.  0. -1.  1.  1. -1. -1.  0. -2.  1.  1.  0.  0. -2. -2.]
[-1. -2. -1. -2. -2.  0.  1. -2.  0. -2.  0.  0. -2. -2. -2. -1.]
[ 1.  0. -1.  1.  1. -2.  1.  0. -2.  1. -1.  1.  0.  1. -2. -1.]
[-1.  1. -2. -2. -2.  1. -2.  0. -1.  0. -2. -1. -1.  1. -2.  0.]
[-1.  1.  1. -2. -1. -1. -1.  0. -2.  1.  1. -1. -2.  1.  0. -1.]
[-1.  0. -2. -2. -2. -1.  0. -2.  1. -2.  1. -2.  1.  0.  1. -2.]
[-2. -1. -1.  1. -1.  0. -1. -2. -1.  0.  0.  0. -2.  1. -2. -1.]
[ 1.  1.  1. -1. -1. -2.  1.  1.  1.  1. -2.  1. -2.  0.  0.  0.]
[-2.  1. -

[-1.  1. -1.  0. -2. -1. -1.  1.  1. -1. -2.  1.  1.  1. -2.  1.]
[ 1. -2.  0.  0.  0.  0. -2.  0.  1.  1.  1. -1. -1.  1.  0.  1.]
[ 1. -2. -2.  1.  0.  0.  1.  1.  0.  0. -2. -2.  1.  0. -2.  1.]
[-2.  0. -1. -1.  0. -2. -2. -1.  1. -1.  1. -1. -1.  0. -2. -1.]
[ 0.  0.  0. -1.  1.  1. -1.  0.  0. -1. -1.  1. -2.  0.  0.  0.]
[ 0.  0.  1.  0.  1.  1.  0. -2.  0. -1.  0.  0. -2.  1. -2.  1.]
[-1.  1. -1. -2. -1. -1. -1. -2. -1. -1. -2.  0. -2. -2.  1.  1.]
[-1.  1. -1. -1.  0.  0. -2. -2. -1.  0. -1. -2. -2. -1.  0.  1.]
[ 1.  1. -2.  0.  0.  0.  0.  0. -1.  0.  1. -1.  1.  0. -1. -2.]
[ 1.  1. -2. -1.  1.  1.  0.  1.  1. -1. -1. -2. -1. -1.  1. -2.]
[-1.  1. -1. -1. -2. -2. -2. -1. -1.  0. -1.  0.  1.  1. -1.  1.]
[ 1.  0.  0.  0. -1.  1. -1. -2. -2.  1. -2. -2. -2. -1.  0. -1.]
[ 0.  1.  0. -1. -2.  0. -2. -1.  0.  0.  1.  1.  1. -1. -2.  1.]
[ 0. -1.  1.  0.  1.  0. -2.  0.  1. -2. -1. -2. -2.  0. -1.  1.]
[-1.  0. -2. -1. -1.  1.  0.  0.  1. -1.  0. -1. -1.  0.  1. -1.]
[-2. -2. -

[-2. -2.  1. -1.  1. -1.  0. -1.  1.  1.  0.  1.  0. -2. -1.  1.]
[-2.  0.  0.  1. -1.  0.  1. -1. -1.  1. -2. -2.  0.  0. -1. -1.]
[-1. -1.  0. -2.  1.  0. -1.  0. -1. -1. -1. -1. -2.  1.  0. -1.]
[-1. -1.  1. -1. -2. -2.  1.  1. -1.  0.  1. -2.  1.  1.  1.  0.]
[ 0.  1. -2.  0.  1.  1.  0. -2. -1. -1. -1. -2.  0. -2. -2.  0.]
[-1. -2.  1.  0. -1. -1.  1. -2.  1.  0.  0. -1.  1. -1. -1. -2.]
[ 1. -1.  0.  1. -2. -1.  0.  0.  0.  1.  1.  0. -2.  1. -2.  0.]
[-1.  0. -2. -1.  0. -2.  0. -2. -2. -1. -1. -1. -2. -2.  0.  0.]
[-1.  0.  0.  1.  1.  1. -2. -2.  1. -2. -2. -1. -2.  0.  1. -1.]
[-1.  0.  0. -1.  1. -1. -2.  1.  0. -1. -2.  0.  0.  1. -2.  0.]
[ 1.  0.  0.  0.  0.  1.  0.  1.  1.  1.  1. -2.  1.  1.  0. -1.]
[ 1. -2.  0.  0.  0.  0. -1.  1.  1.  1.  1. -1.  1.  0. -1.  0.]
[ 1.  1.  0. -1.  0. -2.  0.  0. -1.  1.  0. -1.  1.  0.  1.  1.]
[-1.  1.  0.  0.  0. -1.  1. -1.  0. -2. -2.  0. -2.  0.  0.  1.]
[ 0.  0.  0. -2.  1.  0.  0.  1. -2.  1.  0.  1.  0. -1.  0. -1.]
[-1.  1.  

[-2. -2.  0.  0. -2. -1.  1. -2. -1. -2. -1. -2.  1. -2.  1. -2.]
[ 1. -2. -2. -2.  1.  0.  1.  1. -2. -1.  1.  1.  1.  0.  0. -1.]
[ 1. -2.  0. -2. -1.  0.  0.  1.  0.  1.  0. -1. -2. -2.  1.  0.]
[ 0. -2. -2. -1.  0.  1.  1. -2. -2.  0.  1. -2.  0. -1.  1. -1.]
[-2.  1.  0. -2. -1. -2.  0. -2.  0.  0.  1. -1.  1.  0.  1.  0.]
[-1.  1.  1.  0.  0. -1.  1. -2.  0.  1. -1. -1. -2. -1. -1.  0.]
[ 1.  0. -2.  1.  0. -1. -2. -1.  0.  0.  0.  0.  1.  0.  0. -1.]
[-2. -1.  0.  0.  1. -1.  1. -2.  1. -1.  0. -2.  0. -2.  0. -2.]
[-2.  0. -1.  0.  1.  0.  0. -1. -1.  1. -2.  0. -2.  0. -1. -1.]
[-2. -1.  1. -2.  0.  0. -2.  1.  0.  1.  0.  0.  0. -2.  1. -1.]
[ 1. -2. -1. -1.  0. -2.  1. -1.  0. -2. -2. -1.  0. -2.  0.  1.]
[ 1.  1. -2. -2.  0. -1.  1.  1.  0.  0.  0. -2. -2.  0. -1. -2.]
[-1.  1. -2. -2.  1.  0. -1.  1. -2.  0.  1.  1. -1. -2.  1.  1.]
[-1. -1. -1.  0. -2. -2.  0. -1.  1. -2. -1. -1.  1. -2.  1.  0.]
[ 0.  1. -1. -2. -1. -2.  0. -1. -2.  0. -2.  0.  1.  1. -1. -1.]
[-1.  0.  

[-1. -1. -1. -1. -2.  0.  1.  0.  0.  0. -1. -2.  1.  0.  1.  1.]
[ 1. -1.  0.  0.  0.  0.  1.  0.  1. -2. -2. -2. -2.  0. -2. -2.]
[-1.  1.  1. -2. -1. -2.  0.  0.  1.  0. -2.  0.  1.  1.  0. -1.]
[ 0. -1. -2.  0.  1. -1. -2. -2.  1. -2. -1.  1. -2.  0.  0.  0.]
[-1. -1. -2.  1. -1. -1.  0.  1.  0. -1. -1. -2.  0.  1.  0. -2.]
[ 1.  0. -1. -1. -1. -2.  1. -1. -1.  0. -1.  0.  1. -2.  1.  0.]
[ 1. -2.  1. -2. -2.  1. -1.  1. -2. -1. -1.  1. -2. -1.  0.  0.]
[-2.  1.  0. -1. -2. -2. -1. -1. -1.  1.  1.  0.  0.  0.  1.  1.]
[ 1.  0. -2.  1.  0.  1.  1. -2.  0. -2. -2.  0.  0. -1. -2. -2.]
[-2.  0. -2. -2. -1.  1.  1. -1.  0.  1.  1.  0. -1. -1.  0. -2.]
[ 0. -1. -2.  1.  0.  1. -2.  1.  1.  1.  0.  1. -2. -2. -2.  1.]
[-1.  0.  1.  0.  1.  0. -1. -1.  1. -1.  1.  0. -1.  1. -1.  1.]
[ 0.  1.  0. -2. -2.  1. -1.  0. -1.  1.  1. -1. -1. -2.  0.  1.]
[-2.  0. -2. -2. -1.  1.  0. -1. -2. -1. -2.  1. -1.  0.  0.  0.]
[ 1.  1. -1.  1.  1. -1.  1. -2.  0.  1. -2.  1. -1. -1. -1.  1.]
[-1.  0.  

[ 1. -1.  1.  0.  0.  0. -1. -2. -1. -2.  0.  0. -1.  1.  0. -2.]
[-1. -1.  0.  1.  0. -1. -2. -1.  0.  1.  1. -2. -1. -2.  0.  0.]
[ 0.  1. -1.  0. -1. -1. -2.  0.  0. -1.  1.  1.  1.  0.  1.  1.]
[-2. -1. -1.  1.  0.  1. -1.  0. -1.  1. -2. -2.  0. -2. -2.  0.]
[-1.  1.  1. -2. -2.  1. -2. -2.  1.  1.  0. -1.  0. -1. -1.  1.]
[-2. -1. -2.  1.  1.  0. -1. -1. -2. -2.  1.  0. -2. -2.  1. -2.]
[ 0. -2.  1.  0.  1. -1. -2. -2. -1.  0.  0. -2. -2. -2.  1. -1.]
[-1. -1.  0. -1.  1. -2. -2.  1.  1.  0.  0. -2.  1.  1.  1.  0.]
[ 0.  1.  0.  1.  0.  0.  0.  1. -2. -2. -1. -2.  0.  1.  0.  0.]
[ 1. -1.  0. -1. -2.  1.  1. -1. -1. -2. -1. -1. -2.  0. -2. -2.]
[-1.  0.  0.  1. -1. -2.  0.  0. -2. -1.  0. -2. -2. -2. -2. -2.]
[-1. -2.  0.  0.  1.  0. -2.  1.  1.  0.  0. -1. -2.  0.  0.  1.]
[-2.  1. -1.  1.  0.  0.  1.  0. -1.  0. -2.  0. -1. -2.  0. -2.]
[ 0. -1. -1.  1.  1. -2. -1. -2. -1.  1.  1. -1. -2. -1. -1.  1.]
[ 1. -2.  0. -2. -2. -1. -2.  0. -1.  0.  0. -1.  1.  1. -1.  1.]
[-2. -1.  

[-2.  0.  1.  0.  1.  0. -1.  0. -2.  1. -1.  1. -1. -2. -2.  0.]
[-2. -2.  1. -2.  0.  0.  0. -2. -2. -1. -1.  0.  1. -1.  1. -2.]
[ 0. -1.  1.  0. -2. -2.  1.  0.  0. -1. -1.  0. -2.  1.  0.  1.]
[-1. -2.  0. -2.  1.  1.  0. -1. -1. -2.  1.  0.  0.  0. -1. -1.]
[ 0. -1. -1.  0.  0.  0.  0. -2. -1. -1. -1.  1.  1.  0. -1. -2.]
[ 1.  0.  0.  0.  0. -2. -1.  0. -2. -2.  1. -1. -2.  0. -2. -2.]
[-1. -1. -2.  1. -2. -2.  0. -1.  1. -1. -1.  0. -1.  0. -2.  1.]
[-2. -1.  1. -2. -2. -1.  0. -1. -1. -2. -2. -2.  1. -1. -1.  0.]
[ 1.  0. -2.  0. -1. -2. -1.  0.  0.  0.  1. -2.  0. -1. -1. -1.]
[ 1.  1. -2.  0. -2. -1.  0. -1.  1.  0. -1.  0.  0.  0. -2. -2.]
[ 1. -2. -2.  1. -2.  1.  1.  0. -1.  0. -2.  1. -1. -1. -2. -1.]
[ 1.  1.  0.  1. -1. -1. -1. -2. -2. -2. -2.  0.  0. -1.  1. -2.]
[-1.  1.  0.  1.  0. -1.  0. -1.  1. -1.  0. -1. -1. -1.  0.  1.]
[ 0. -2. -2. -2. -1.  1.  1. -2. -1. -2. -1. -1. -2.  0.  1.  1.]
[ 0. -1.  1.  1. -1.  0.  1. -1. -2.  1. -1. -1.  0.  0. -2.  1.]
[ 0. -1. -

 90%|█████████ | 27/30 [38:31<04:12, 84.19s/it]

[-1.  0.  0. -2.  1.  0. -1. -2. -1. -2.  1. -2.  1.  0.  1.  0.]
Training loss (for one batch) at step 0: 0.029777245596051216
Seen so far: 16 samples
[ 1.  1. -1. -2.  0. -1. -2.  0. -1. -1.  0.  0.  1. -1. -2.  0.]
[-1. -1. -1. -1. -2.  1. -2. -2. -1. -2.  0.  1.  1. -2.  0.  0.]
[-2.  1. -1. -1.  0.  0. -2.  0. -1. -1. -1.  1. -2. -1.  1.  0.]
[-1. -2.  0.  0. -2.  0.  1. -1. -2.  1. -2. -2.  0. -2.  0. -1.]
[ 1. -2.  1. -2.  0.  1.  0. -1.  1.  1. -2.  1. -1. -1.  0.  1.]
[ 1.  1. -2. -1. -1. -2.  1.  1.  0. -2.  0. -2.  1. -2.  1.  0.]
[-2.  1. -1. -2. -2.  1.  0. -1.  0.  1. -2.  1.  0.  1.  0.  1.]
[-1. -2. -2. -2.  0. -1. -2.  0. -1. -2.  1. -2.  1. -1. -2.  0.]
[ 1. -2. -1. -2.  0.  1.  1.  1. -2. -1. -1.  0. -2. -1. -1. -2.]
[ 1.  0. -2. -1. -1. -1.  0. -1.  0.  0.  1. -1. -1.  1. -2.  0.]
[-2. -1. -1.  1.  0.  1.  0.  1.  1. -1. -1.  1. -2.  0. -1. -2.]
[-2.  1. -1.  0. -2.  0.  1.  0.  0.  1. -2.  0.  1.  1.  1.  1.]
[ 1.  1. -2.  0. -1. -1.  0. -1.  1. -1.  0. -2. -2. -2.

[-1. -1.  0. -1.  0. -1. -1.  0.  1. -1.  0. -2.  0. -2.  0. -1.]
[-2. -1.  0. -2. -2. -2.  0.  0.  0.  1. -1.  0. -1.  1. -2.  1.]
[ 1. -2.  0. -2.  1.  0. -2.  1. -1. -1.  0.  0.  0.  0. -2. -1.]
[ 0. -1.  1.  0.  0.  1.  0.  0. -2.  1.  1. -2. -2. -2. -2.  0.]
[ 0.  1. -2.  1. -1. -2.  1. -1.  0. -1.  1. -1. -2. -1. -2.  1.]
[-1.  0. -1.  0. -2. -2. -1. -2. -2.  0. -2.  1.  1.  0.  0.  1.]
[ 0.  1.  0.  0.  1. -1.  1. -1. -1.  1. -2.  0. -2.  0. -1.  0.]
[-2. -1. -2.  0. -1. -2.  0. -1.  1.  0. -2.  0.  0.  1.  1. -1.]
[-1. -2. -2.  0.  1. -1. -2. -2.  0.  1. -2. -1.  1. -2. -2.  0.]
[ 0. -2. -1. -1.  1.  1. -2.  0.  1.  0.  0. -2.  1.  1.  1.  1.]
[-2.  1. -1.  0.  0. -1.  0.  1. -2.  0. -1. -1.  1.  0. -2. -2.]
[-2.  1.  1. -2. -2. -1.  1. -2.  1.  1. -2. -2. -1.  1.  0.  0.]
[ 1. -2.  0. -2.  1. -1.  1.  1. -2. -1.  1. -2. -2. -1. -1.  1.]
[ 1. -1.  0.  0.  1. -1.  0. -1.  0.  0.  0.  1.  0. -2.  0.  1.]
[-2. -1.  1. -2. -2.  1. -2.  1.  1. -1.  1. -1.  0.  0.  0. -1.]
[ 1.  0. -

[-1. -1.  1.  1. -2. -2. -1.  1.  0.  1. -1. -1. -1. -1.  0. -2.]
[-2. -2.  0. -2.  0. -1. -2. -2. -2. -2. -1.  0.  1. -1.  1.  0.]
[-1.  0.  1.  0.  1. -1.  0. -1.  0. -1.  1.  0.  1.  1. -1. -1.]
[-2.  1.  1.  1.  1.  1. -1. -2. -1. -2.  0.  0.  1. -2. -2.  0.]
[ 0. -2. -1. -2. -1.  1. -2.  1. -2.  0.  1.  0.  0. -1.  1. -2.]
[ 0. -2. -2.  0.  1. -1. -1.  0. -1. -2.  1. -2.  0.  0.  0. -2.]
[ 1. -1.  1.  1. -1. -1. -1. -1.  0.  1. -1.  1. -1. -2. -1. -2.]
[-2. -1.  0. -2. -1. -2. -2. -2.  1.  0.  1. -1.  1. -2. -1.  1.]
[ 0. -1.  1. -1.  1. -2.  1.  1.  0. -2.  0. -1. -1.  0.  0. -1.]
[ 0.  1. -2.  1. -1.  0. -2.  0.  1. -1.  0.  1.  1. -1.  1. -2.]
[ 0. -2.  0.  1.  1. -2. -1. -2.  0. -2. -2.  1.  1. -1. -1. -2.]
[ 1. -2.  0.  0. -2. -2. -1.  1.  1.  0. -1. -1. -2. -1.  1.  0.]
[-1.  1. -1.  1.  1.  1.  0. -1.  1. -2. -2.  1. -1. -1. -1. -2.]
[ 0.  1.  0.  0.  0. -1.  1.  0. -1. -1. -2.  1. -1. -2. -1.  0.]
[-1.  0. -2.  0. -1.  0. -1. -2. -2. -1. -1.  1. -1. -1. -2. -2.]
[-1.  0.  

[-2.  0. -2.  1. -2. -1. -1.  1. -1.  0.  1. -1. -1.  0.  1. -1.]
[-2. -2. -2.  0.  0. -1.  1.  0.  0.  0.  0. -2. -2.  0. -1. -2.]
[ 1. -1. -1. -1.  0.  1.  0.  1.  0.  1.  0. -2. -1. -2.  0. -1.]
[ 0. -2. -2.  0.  1.  1. -2.  0.  0.  0. -2.  0.  1.  1.  1. -1.]
[-2.  0. -1. -2. -2.  1. -1. -2.  0. -2. -2. -1. -1. -1.  0.  0.]
[ 0.  0. -1.  0.  1. -1. -1. -2.  1. -1.  1.  0. -2.  1.  1. -1.]
[ 0. -1.  1.  1.  0.  0. -2.  1. -2. -1.  0. -2. -2. -2. -1.  0.]
[-2.  0.  0.  1.  0.  1. -1.  0.  1. -2.  0.  1.  0. -2. -1.  0.]
[ 1.  1.  1. -2. -1.  0. -1. -1. -1.  1.  0.  1.  1.  0.  1. -2.]
[-1.  0.  0. -2.  1. -2. -2. -1. -2.  1.  0. -2.  0.  0. -1. -1.]
[ 0.  0.  1. -1.  0.  0. -2.  1.  1.  0. -2.  0. -1. -1. -1. -2.]
[ 1. -1. -1.  1.  0.  0. -2. -2. -1.  1. -1. -2.  1.  1.  1.  0.]
[ 0. -2.  1. -2. -1. -1.  1. -2.  0.  0. -2.  1. -2.  1.  0. -2.]
[ 1.  1. -2. -1. -1. -2. -2.  1.  1.  1.  1.  1. -1. -1.  1.  1.]
[-1.  0. -1.  0. -2.  0.  1. -1. -2.  1. -1. -1.  1. -2. -2. -2.]
[ 0. -1. -

[ 0.  0. -2.  0.  0.  0. -1. -2.  0. -2.  0.  1. -2. -2.  1. -1.]
[-1.  0.  0. -2.  1.  1. -2. -1.  0.  1. -2. -2.  1. -2.  0. -2.]
[-2.  0. -1. -2.  0. -2. -2. -2.  1.  0. -2.  1. -2. -2. -2.  0.]
[ 1. -2.  0. -1. -1.  0.  0. -2. -1. -2.  1.  0. -1.  1. -1.  1.]
[ 1. -1.  1.  1.  1. -1.  0. -1.  0. -2. -1.  0. -2. -2. -1. -1.]
[ 0. -1.  0.  0. -2.  0.  0. -2. -2. -2.  1. -2. -2.  1. -2.  0.]
[ 0.  0. -1. -1.  0. -2. -1. -1. -1. -2.  1. -1.  0.  1. -1. -1.]
[-2. -2. -1. -2.  0. -1.  1. -1. -1.  0. -2.  0.  0.  0.  1. -1.]
[-1. -2.  0. -1. -1.  0.  1. -2.  0. -1.  0.  0. -2.  0.  1. -2.]
[-2.  1.  1. -1.  0.  1.  1. -1.  1. -2.  1. -1.  0.  1. -2. -2.]
[-2.  1. -2.  1.  1. -2.  0. -1. -1. -1. -2. -1. -1. -1. -1.  1.]
[ 0. -2.  0.  0.  0.  0.  0. -2.  1. -1.  0. -1.  1.  0. -1.  1.]
[-2. -1.  0. -1.  1.  0. -2. -1.  0. -1. -1. -1.  0.  0.  0. -2.]
[ 0.  0.  1.  0.  0.  0. -1. -2. -1.  1.  1. -2.  0.  1.  0. -1.]
[ 1.  1. -2. -2.  1.  0.  0.  1.  0.  0. -2.  0. -2. -1. -2. -1.]
[ 1.  0.  

[-1. -2. -2.  0. -2.  0.  0. -2.  1. -1. -2.  1. -2.  1.  0.  1.]
[-1. -2.  1.  1.  1. -1. -2. -2.  0.  1. -2. -1.  1.  0.  1.  0.]
[-2.  0. -2. -1.  0. -1. -1. -1.  0.  1. -2.  1.  1.  1.  0.  1.]
[ 0. -1.  0.  1. -2.  0. -2.  0.  0. -2. -2.  1. -1. -2. -2.  0.]
[-1. -1. -1. -2.  1. -1. -1. -2.  0. -1. -1. -2. -2.  0. -2. -1.]
[ 1. -2.  1. -2.  1. -2.  0. -1. -2.  1. -2. -1. -2.  1. -2.  0.]
[-1. -2.  1. -2. -1. -1. -2.  1.  0.  0. -1.  1.  0.  1. -2. -2.]
[ 1. -1. -1.  0.  1.  1. -2.  0. -1. -2. -2.  1. -1. -2.  0. -1.]
[-2.  0. -1. -2.  1.  0.  1.  1. -1. -2. -2. -2.  1.  1. -2.  0.]
[ 1.  0.  0. -2. -1.  1.  1.  0.  1. -1.  0.  1. -1.  1. -2.  0.]
[ 1.  0. -1. -1.  0.  1. -1. -2.  1.  0.  0. -2. -1. -2. -1. -2.]
[ 0.  0. -2. -2.  1.  0.  1. -2.  1. -2. -2. -1. -2.  0. -1. -2.]
[ 0. -2. -1.  1.  0. -2.  0. -1.  0. -1.  1. -1.  0.  0.  1. -2.]
[ 1. -1. -2. -2. -2.  0.  1. -1. -1. -2. -2. -1.  0.  1. -1. -1.]
[ 0. -1.  0. -2.  0.  1.  0. -1. -2. -1. -1.  0. -1. -1. -2.  0.]
[ 0.  1.  

[ 0.  0.  0.  0. -1. -2. -2.  1.  1. -1.  1.  1. -2.  1. -1. -2.]
[ 0. -2. -2.  1. -1. -2. -1.  0.  0.  1. -1. -2. -1. -1. -2. -2.]
[-1.  1. -1. -2.  0. -1.  0.  1.  1. -1. -1.  1. -1.  1.  1.  0.]
[-1.  1.  1.  1. -2. -2.  0.  0.  1.  1.  1. -1. -1. -2.  1.  0.]
[ 1. -1.  0. -1. -2. -1. -2. -2.  0. -1.  1. -2.  0.  0. -1. -2.]
[-2. -1.  0.  0. -2.  0. -2.  0.  1. -2. -2. -2. -1.  1. -1. -2.]
[-2. -2. -2. -1.  1. -2.  0.  0. -1.  1. -1.  0.  0. -2. -1.  1.]
[-2. -1.  0. -1. -2.  0. -1.  0.  0. -1. -2. -1.  1. -2. -1. -2.]
[-2. -2. -1.  0.  0.  0.  1.  1. -1.  1.  1.  0.  1. -1. -1. -1.]
[-1.  1. -1.  1.  0.  0.  0.  1. -2.  1. -1.  0.  0. -2. -2. -2.]
[-2.  1.  1. -2. -1. -2. -2. -1. -2. -2.  1.  0. -2.  1.  1.  0.]
[ 1.  1.  1.  1.  1.  0. -2.  0.  1. -1.  1. -2.  1.  1. -2.  1.]
[ 1. -1. -2.  0. -2. -2.  1.  1.  1.  1. -2.  1. -2.  0.  1.  0.]
[ 0.  1.  1.  1. -1.  0. -1. -2.  0.  1.  1. -2. -1. -2. -1. -1.]
[-1. -2. -1. -1. -2. -2.  0. -2.  1. -2.  1. -1. -2. -1. -1.  0.]
[-1. -1. -

[ 0. -2. -1. -2. -2.  0.  1.  1.  1.  0.  0. -1. -2.  0. -2. -1.]
[ 0. -1. -2.  0.  0.  1.  0.  0.  0. -2. -1.  1.  1. -2.  1. -2.]
[ 0.  0. -1.  0.  0. -2.  1.  1. -2. -1.  1. -1. -1.  0. -2.  0.]
[-2. -1.  0.  0.  0. -1.  1. -1. -2.  1.  0.  0.  1. -2. -1.  0.]
[-1.  0. -2.  0.  1.  1.  1. -1.  1.  1.  1. -2.  0.  0. -1. -1.]
[-1.  1.  0.  1. -2. -1. -1.  1. -1.  0.  1. -2. -2.  1.  1.  0.]
[-2. -1.  0.  0. -2. -2. -2.  0.  0. -2.  1.  0.  0. -2. -2. -2.]
[-2.  1. -2. -1.  0. -1. -1. -2. -2. -2. -1. -1.  1. -1.  0.  1.]
[-1. -2. -2. -1. -2.  1.  0. -2.  1.  1. -1. -1. -1.  1.  1. -2.]
[-2.  0.  1. -1. -2.  1. -1. -1. -1.  0. -1. -1.  0.  1. -2.  0.]
[ 1. -2.  1. -2.  0. -1. -2. -2. -2. -1.  1.  1. -1.  0.  0. -2.]
[ 1.  1.  1. -2. -1. -2.  1. -2. -2. -2.  1. -2. -1. -2.  0.  0.]
[-2.  0.  1.  1. -1.  0.  1.  1.  1.  1.  1.  1.  0.  0. -2.  0.]
[-1. -1.  1. -2. -1.  0.  1.  1.  1. -2. -2. -2.  1. -1.  1.  1.]
[ 1. -1. -2.  1.  1.  1.  1. -1. -1.  0.  1.  1.  0.  0. -2.  0.]
[ 0.  0.  

[-1.  1.  0.  1. -1. -2.  0. -2. -1. -2. -1. -1.  1.  0.  1.  0.]
[ 1.  1.  0.  0. -1.  0. -1.  0. -2.  0. -2.  1.  1.  1. -2.  1.]
[ 0.  1.  1.  1.  1.  0.  1. -2. -1.  0.  0.  0. -2. -1. -1.  0.]
[ 1.  1. -2. -2. -2. -1.  1.  0.  1.  0. -2. -2.  1. -2. -2.  1.]
[-1.  0.  1.  1. -1.  0. -2. -2.  1. -1. -2. -2.  1. -2. -1. -1.]
[-1. -1. -2.  1. -1. -1. -1. -2. -1.  1.  1. -2.  0.  1.  1.  1.]
[-1. -2.  0.  0.  0.  1.  1. -1. -2. -1. -1.  0. -2. -2.  0.  0.]
[ 1.  0. -1.  0.  1.  1. -1.  1. -1. -1.  0.  0. -2. -1. -2.  0.]
[-2. -1.  1. -2.  1.  0.  1.  1.  1. -1.  1. -1. -1.  0.  0. -1.]
[ 0. -1. -2.  0.  0.  0.  0.  0. -1.  0.  0. -2. -1. -1. -2.  0.]
[ 0. -2.  0. -2.  1.  0. -1.  1. -1. -2. -1. -1.  0.  1.  0.  1.]
[ 0. -1. -1.  0.  1. -2.  0.  0.  0. -1. -2. -2. -2.  1.  1.  0.]
[-2. -1. -2. -1. -2. -1. -2.  0. -1.  1. -2.  0. -1.  0.  1.  0.]
[-2.  0.  1. -2.  0.  1.  0. -1. -1. -1.  0.  1. -2.  1. -1. -2.]
[-2.  1. -1.  1. -1. -2.  1.  0.  1. -2. -1.  1.  1. -1. -1.  1.]
[ 0.  1. -

 93%|█████████▎| 28/30 [40:01<02:51, 85.83s/it]

[ 1. -1. -1. -2. -1.  0. -1. -1.  0. -1. -1.  1.  1. -2.  1.  0.]
Training loss (for one batch) at step 0: 0.02797970175743103
Seen so far: 16 samples
[-1. -2. -2.  0.  0. -1. -2. -2.  1.  1. -2. -2. -2.  0.  0.  0.]
[-1. -1. -2.  0. -2. -1.  1.  0.  0. -2.  0. -2. -2.  0. -1. -1.]
[ 0.  1. -2.  1.  1. -2.  0.  1. -2.  0. -2. -2.  1.  0. -2.  0.]
[-2. -1. -2. -1.  1. -1.  0. -1. -2. -2. -1. -2.  1.  1.  1. -2.]
[-1.  0. -2. -2. -2.  1. -2.  1. -2. -2. -2.  0.  1. -2. -1.  1.]
[ 0.  1. -1.  0. -2. -1.  0. -2. -1. -1.  0.  0. -2.  1.  0.  0.]
[ 0.  0.  0. -1.  1.  0.  1.  0.  1. -1.  1. -2. -1. -2. -1. -2.]
[ 1.  0.  0. -1. -2. -1. -1.  0. -2. -1. -1.  1. -1.  0. -1. -1.]
[ 1.  1.  0.  0.  0.  1.  1. -1. -2.  0.  1. -1.  1.  1.  0. -1.]
[-2.  1.  0.  1. -1.  0.  1. -1. -2.  0. -1. -1.  0.  0. -2.  1.]
[ 1.  1.  0.  1. -2. -1.  0.  0.  1. -1. -1.  0.  0. -1. -1. -1.]
[ 1. -1.  0. -2. -1. -2. -1. -2.  0. -2. -2. -2. -2.  1.  0.  0.]
[-2. -1.  1.  1. -1.  1. -1. -1. -1. -1. -2.  1. -1.  1. 

[ 1. -1.  1.  0.  1.  1. -2. -1.  1. -1.  1. -1.  1. -1. -2. -2.]
[ 1.  0. -1.  1.  0.  1.  0.  1.  1. -2. -2. -2. -1.  1.  0. -2.]
[-1.  1.  0. -1.  0.  1. -2. -2. -2. -2.  0. -1. -2. -2.  0.  0.]
[ 1. -1.  0. -1. -2. -1.  0.  0.  0.  1.  0. -1.  1. -2.  0. -1.]
[ 0.  1.  0.  1. -1.  1.  0.  0. -1.  1.  0.  1.  1. -2.  1.  0.]
[ 0.  1. -2.  1.  0. -2. -2.  0.  0.  0.  0.  1. -1. -1.  0. -1.]
[ 0.  0.  1. -2. -2. -1. -1. -2.  0. -2.  1. -2. -1. -1. -2.  0.]
[-2.  1.  1.  1. -1.  1.  0. -1.  1.  1.  0.  0.  0.  1.  1. -2.]
[-2. -2.  1.  1. -2.  0. -2. -2. -1.  0.  1.  0.  1.  0.  0.  0.]
[ 1.  0.  0.  1.  0. -2.  0.  1. -2.  0.  0.  1.  0. -2. -2.  1.]
[-1.  0.  1. -2. -2. -1. -1. -2.  0. -1. -1.  1.  0. -1.  1. -2.]
[ 1. -1.  0.  0. -1. -1. -2. -1. -2.  1.  1.  0. -2. -1.  0.  0.]
[-2. -2. -1.  0.  1.  1.  0. -1.  0.  0.  0.  0. -2.  1.  0. -2.]
[-2.  1.  1.  1. -1.  0. -2.  0.  0.  0.  1.  0. -1. -2.  1. -2.]
[ 1. -2.  0. -1.  0.  1.  1.  0.  0.  1.  0. -2. -2.  0.  0.  0.]
[-2.  0.  

[-2. -1. -1. -1.  1.  0.  1. -2.  1. -2.  1. -2.  0.  0.  1.  1.]
[-2.  1.  0.  1. -1. -2.  1.  1. -2.  1.  0. -1. -1. -2. -2.  1.]
[ 1. -2. -2. -2.  0. -2.  1. -1.  0.  1. -1.  1.  0. -2.  1.  1.]
[-2.  1. -1.  1. -1. -1.  1.  0.  0.  0. -2. -2.  1. -1.  1. -1.]
[ 0.  1. -2.  1.  1.  1.  1. -2. -2. -2.  0. -1.  0. -1.  1. -1.]
[-2.  0.  0.  1.  0. -2.  1.  0. -2. -2. -1. -1.  0.  0.  0. -1.]
[ 1.  1. -1.  0. -2. -1.  1. -1.  1.  1. -2.  1.  1.  0. -1.  1.]
[-2. -1. -2.  0.  1. -2. -2. -1.  1. -1.  1.  1. -1.  0. -1. -2.]
[ 0.  0.  1.  1.  1. -2.  1.  0. -2. -1.  1.  0.  1.  0.  1.  0.]
[ 1. -2.  0.  0. -2.  1. -2.  1. -1.  0.  0.  0. -2.  1. -2. -2.]
[-2. -2. -1. -1. -2. -2. -1. -2. -1.  1.  0.  1.  1. -1.  1.  1.]
[-1. -2.  1. -1.  1.  0. -2.  1.  1.  1.  0.  1.  1. -2.  0. -1.]
[ 0. -2. -2.  0.  0. -2.  0.  1.  1. -2.  0. -1.  1. -1. -2. -1.]
[ 1.  1.  1.  1.  0.  1. -1.  0. -2. -2.  0. -2.  1. -2. -1.  0.]
[-2.  0.  1. -1.  0.  0. -2.  0.  0. -1.  1.  1.  0. -2.  0. -2.]
[ 1. -1.  

[-2.  0. -2.  0.  1.  1. -1.  1. -2. -2. -2.  1. -1. -2.  1.  1.]
[-1. -2. -1.  0.  0. -1. -2. -2. -2. -1. -2.  1.  1. -1.  1.  1.]
[ 1. -2.  1. -2.  1.  1. -1.  1. -1. -1.  0.  1. -1.  0. -2. -1.]
[-2.  1. -2.  0. -1. -1. -1. -2.  1. -2. -2.  0.  0. -2. -1.  0.]
[-1. -1.  1. -1. -2.  0. -1.  0.  0.  1.  1. -2.  1. -2. -1. -2.]
[ 0. -1. -1.  1. -2.  1.  1. -1. -1. -2.  1.  0.  0. -1. -1.  0.]
[ 0.  0. -1. -1.  0. -2. -1. -2.  0.  0.  0.  0.  1. -2.  1. -2.]
[-1.  1.  1. -2. -2.  1.  0.  0.  1.  1.  0.  1. -1.  0.  1.  0.]
[-1.  1.  0. -1. -2.  0.  0.  0. -1.  0.  1. -2. -1. -1. -1. -1.]
[ 1.  0.  0. -2. -2. -1. -2.  1. -2.  0.  0. -2. -2.  1. -2. -2.]
[ 0. -2.  0.  0.  1. -1.  0. -2.  1. -1. -2. -1.  1. -2.  1.  0.]
[ 0. -1. -2. -2. -2.  0. -1. -1.  1.  1.  1.  0.  0.  0. -1. -2.]
[-1. -2. -2.  1.  0. -2.  1.  0. -2. -2. -1. -2.  0. -1. -2.  1.]
[-2.  1.  0.  0. -2.  1. -1. -1. -1. -1.  1.  0. -2.  0. -2.  1.]
[-2.  0. -1.  1.  0. -1. -1.  1. -1. -1.  1.  0. -1.  0.  1.  1.]
[ 1. -1.  

[ 1. -2.  0.  0.  1. -1.  1. -1. -2.  1. -2.  1. -2. -2. -1. -2.]
[-1. -2.  1.  0.  0. -1. -1. -1. -1.  1.  0.  1. -1. -2.  0.  0.]
[ 0.  1.  1.  0. -1.  1.  0.  1. -2.  0.  1. -2. -1.  0.  1.  1.]
[ 0.  0.  0. -1.  1.  0. -2.  0. -1.  0.  0. -2. -1. -1. -2. -1.]
[ 0.  1. -1. -1. -2.  1. -2. -1.  1.  1. -2. -1.  0. -1.  1. -2.]
[ 1. -2. -1. -2.  1. -2.  0.  1.  0.  1. -1.  1.  0. -1.  0. -1.]
[-1. -1.  1. -2.  1.  0.  0. -1.  1. -1.  1. -1.  1. -1.  1.  0.]
[ 0.  0.  0.  0.  1.  1. -2. -2. -2.  1.  0.  0.  0. -2.  0. -1.]
[ 1.  1.  0. -2. -1. -2. -2. -2. -2. -2.  0. -1.  1.  0.  0. -2.]
[ 0.  1. -2. -1. -2.  1. -2.  1.  0. -2.  0. -1.  1. -2. -2. -2.]
[ 1.  1.  0. -1.  0.  1. -1.  1. -2.  0.  0.  1. -2. -1. -2. -2.]
[-2.  1.  0. -2. -1. -1.  1. -1. -1.  0. -1. -1. -2. -2.  0. -1.]
[ 0.  0.  1. -1. -2. -1. -2.  0. -1.  0.  1.  1.  0. -1. -2.  0.]
[ 0. -2. -1. -1.  1.  1. -2. -2.  0. -1. -1.  0.  1. -2.  1. -1.]
[ 0. -1.  1.  1.  0. -2.  1.  1. -2. -2. -1. -1.  0.  0.  0.  0.]
[-1. -1. -

[-1. -2. -1. -1. -1. -1.  1. -1. -2. -1. -1. -2.  1. -2.  0. -2.]
[ 0. -2. -2. -2. -2.  0. -1. -1. -1. -1.  1.  0. -1. -1.  0.  1.]
[-2. -2.  0.  1.  1.  1.  1. -2.  1. -1. -1. -2.  0.  1.  0. -1.]
[-1. -2. -1.  0.  1. -2. -1.  1. -1. -1.  1.  0.  0.  0.  1.  0.]
[-1. -1.  0. -1. -1. -1. -2. -1. -2.  1.  0.  0. -1.  0.  1. -2.]
[-2. -1. -2.  0. -1.  1. -2.  1.  1. -2.  1.  0. -2. -2. -2.  0.]
[ 1. -2. -1. -1. -1. -2.  1.  0. -2.  0.  0. -1.  1.  0.  0.  1.]
[-1. -2.  0. -1.  1. -2. -1.  1.  0.  1. -1.  1.  1.  1.  0.  0.]
[-1. -1. -1. -2. -2.  0. -2.  0. -2. -1. -2. -1. -2. -1. -2.  0.]
[ 0. -2.  0. -1. -2. -2. -2. -2.  1.  1. -1. -1. -2.  0. -1.  1.]
[-1. -1.  1. -1.  0. -1. -1. -2. -1.  0.  1. -1.  1. -1.  1. -2.]
[ 0.  0. -2. -1.  1.  0.  1.  1. -2. -2. -1.  0. -1. -2. -2. -2.]
[-1. -1. -1.  0. -2.  0.  1.  1. -1. -1.  1.  0. -2.  1. -2.  0.]
[-2.  0.  1.  0. -1.  0.  1. -1.  0. -2.  0.  1.  1.  0.  1.  0.]
[ 0. -2. -1. -1. -1.  1.  1. -2.  1.  1. -2. -2.  1.  0. -1. -2.]
[ 0. -1.  

[ 0.  0.  0. -2. -1. -1. -1. -2. -2. -1. -1. -2. -2.  1.  1.  1.]
[-1.  1. -1.  1.  0.  1.  0.  1. -2. -1.  1.  0.  0. -1.  1. -2.]
[-2.  0. -1. -2.  0. -2.  0.  0.  1. -2.  1.  1.  0.  1. -1. -1.]
[ 0.  0.  0. -2. -2. -2.  0.  0. -2.  1. -1.  1.  0. -1. -2. -2.]
[ 0.  1. -1.  1.  1. -1.  0.  1.  0.  0.  1. -1. -2.  1. -1.  1.]
[-2. -2.  0.  0.  0.  1. -1.  0. -1. -1.  1. -2.  1. -2. -1.  1.]
[-1.  1.  1.  1. -2.  1.  1. -2.  0. -2. -2.  1. -1. -2. -1. -1.]
[ 0. -2. -1.  1. -1.  1.  1. -2. -2.  1. -1. -1.  1.  1.  0. -2.]
[ 0.  1.  0.  0.  1. -2.  1. -2. -1. -1. -1. -1.  1. -1.  0. -1.]
[ 1.  1. -2.  0.  1.  0.  1.  0. -1.  1.  0.  0.  1.  1.  0. -1.]
[ 1. -2.  0. -1.  1. -1.  0. -1.  1.  0. -1.  1. -1. -1.  0.  0.]
[-1. -2.  1. -1. -2. -2. -2. -1.  0. -2.  1.  1.  0.  1.  1. -2.]
[ 0. -1. -1.  1.  1.  0. -2. -1.  0.  0. -2.  0. -2.  0.  1. -2.]
[ 0.  1.  1.  1.  0. -1.  0. -2.  1.  1.  0.  1.  1.  1.  0.  0.]
[ 0. -2. -1. -1.  1. -2.  0. -1. -2. -1.  0. -1.  0.  1.  0. -1.]
[ 0.  1.  

[-2. -1.  1.  1.  0.  0. -2.  0.  0. -1.  0.  1. -1.  0.  0.  0.]
[ 1. -2.  1. -2. -2.  0.  0. -1.  1.  1. -2. -1.  0. -1. -2. -2.]
[ 1.  1.  0.  1. -1.  0.  0.  0. -2.  0. -1.  1. -2. -2. -2. -2.]
[-1. -2. -1. -2.  1.  1.  0.  1.  1. -2. -2. -2.  0.  1. -2. -1.]
[-1.  0. -1. -1. -2. -2.  0. -2.  1.  0.  1.  1.  0.  0.  0. -1.]
[-1. -2. -1.  1.  0.  1. -1. -2. -2.  0. -2.  1.  1.  0. -1. -1.]
[ 0.  1.  0.  1. -1.  1.  1.  1.  1.  0.  1.  0. -1.  1. -2. -2.]
[ 1.  0. -2.  0.  0.  0.  1.  1. -2. -1.  0.  0. -2.  1. -2. -1.]
[-2. -1.  1. -2.  0. -1. -2.  0.  1.  0. -2. -2. -2.  1. -1.  1.]
[-1. -1. -2. -2.  1.  0. -2.  0.  1. -2.  1. -2. -1. -1. -1.  1.]
[ 1. -2.  0. -2. -1.  0.  1. -1.  1. -1.  1. -1.  0. -1. -2.  0.]
[ 1. -2.  1. -2.  0. -2.  1. -1. -1.  0. -2. -2. -2.  1.  1.  0.]
[-2.  1. -2. -1.  0. -2. -2. -1. -1.  1. -2. -2. -2.  1. -1. -1.]
[-1.  1. -1. -1.  1. -2. -2.  0. -2.  1. -2. -1. -2.  1. -2. -2.]
[ 0. -1. -1. -2. -2.  1.  1.  1. -2.  0. -2.  0. -1.  0.  1.  0.]
[-2. -2. -

[-1.  0. -1.  0. -2.  0.  1.  0. -2.  1.  0. -2.  1. -2. -1. -1.]
[ 1.  1.  1. -1. -1. -2. -1. -2.  1.  0.  1.  1. -2.  1.  0. -2.]
[-2. -2.  0.  1. -2. -1. -2. -2. -1.  1.  0.  1. -2. -2. -1. -2.]
[ 0. -2.  0.  0. -1.  0. -1.  1. -2. -2.  1.  1. -1. -1. -1.  0.]
[-2. -2.  0. -2. -1.  0. -1. -2.  1.  0.  1.  1.  0. -1.  1. -2.]
[-2.  1.  1.  1. -2.  1. -1.  1. -1.  1. -1.  1.  0. -1. -1.  0.]
[-1.  1.  0.  0. -1.  1.  0.  0.  0. -2. -1. -1. -2. -2.  1.  1.]
[-2. -2. -1. -2.  1.  1. -1.  1. -2.  0.  0. -1.  1. -1.  1.  1.]
[-1. -1.  1.  1.  0. -2. -2. -2.  0.  0.  1.  0.  1. -2. -2.  0.]
[-2. -2.  1. -2.  1.  0.  0. -2. -1. -1. -2.  1. -1. -2.  1. -1.]
[-2.  0. -1.  0. -2. -1. -2.  1.  1.  0.  0. -2. -2.  0.  0.  0.]
[ 0. -2. -2. -1. -1. -2.  0.  0. -1.  1.  1.  1.  1.  1.  1.  1.]
[ 1. -1. -1. -1. -1.  0. -1.  0.  0.  0.  1. -2. -1. -1.  0.  0.]
[-1. -2. -2.  0. -1. -1. -2. -1. -1. -2. -2. -2. -2. -2.  0. -2.]
[-1.  1. -1.  0. -2. -1.  1.  1.  1. -1.  0.  0. -1. -2. -1.  1.]
[-2. -1. -

 97%|█████████▋| 29/30 [41:27<01:26, 86.00s/it]

[ 1. -2.  0. -1. -2. -1.  1.  1.  0.  1. -2. -2. -1.  0. -1. -2.]
Training loss (for one batch) at step 0: 0.03415684029459953
Seen so far: 16 samples
[ 1.  1. -2.  1. -1.  0.  0.  1.  1. -2. -2. -2.  1. -2. -1. -2.]
[-1.  1.  1. -1. -2.  1. -2.  1.  0.  0.  1. -2.  0.  0.  1.  0.]
[-1.  1.  0.  1. -1.  0.  0.  0.  0.  1. -2. -1.  0. -1. -2.  0.]
[-2.  1. -2. -1.  1.  0. -2.  0.  0. -2.  0. -1. -1. -1. -1.  1.]
[ 0.  0.  0.  1. -2. -1. -2. -1.  0. -1.  1.  1. -2. -1.  0. -1.]
[-2. -2. -2.  1.  1. -1.  0.  0. -1. -1. -2. -2.  1. -2.  1.  1.]
[ 0.  1.  0.  0.  1. -1.  1.  0. -2. -2.  1. -1.  0. -1. -2. -2.]
[ 0.  1.  1. -1.  0.  1.  1. -1.  0.  1.  1.  1. -1.  0.  0. -2.]
[ 0. -1.  1.  0. -2. -2. -2.  0. -2.  0. -2.  0. -2.  1.  0.  0.]
[-2.  0.  0.  0.  1.  0. -1.  1. -1.  1. -2.  0. -1. -1.  0. -1.]
[ 0. -1. -2. -1.  1.  0.  1.  0.  1.  1.  0.  0.  1.  1.  1. -1.]
[-1.  1. -1.  0. -1. -1. -1.  1. -1.  0.  1. -2. -1. -2. -1.  0.]
[-2. -2. -1. -2.  0.  1.  1. -1.  0.  0.  1.  0. -2. -2. 

[-1. -1.  0.  1. -1. -1. -1. -2. -1.  1. -1.  0. -2.  1.  0.  0.]
[ 1.  1. -1. -1.  0.  0.  0.  1. -1. -1.  1. -1.  1.  0. -1.  1.]
[-2. -1. -1. -2. -1.  0. -2. -2.  0.  1.  1.  0.  1.  0.  1. -2.]
[-2. -1.  1. -1. -1. -2. -1.  0.  1. -1. -2.  0.  1. -1.  1. -2.]
[ 0. -2. -1. -1. -1. -2. -2. -1.  0.  1. -1. -2.  1.  1.  0. -2.]
[-1. -2.  0.  1. -1. -2. -2.  1. -1. -1.  0. -2.  0.  1. -2.  1.]
[ 0. -1.  0.  1. -2.  1.  1. -2. -1. -1. -2. -2. -2.  0.  0. -1.]
[-2. -2. -1. -1.  0. -2.  0.  0.  1. -2.  1. -1. -1.  1. -1. -1.]
[-1. -1. -2. -2.  1. -1. -2.  1.  1. -1.  1. -1.  1.  1.  1. -2.]
[-2.  1.  0. -2.  1. -1.  0. -2. -1. -2.  0.  0. -1.  1.  0. -1.]
[ 0. -1. -1. -1. -2. -1.  1.  0. -1.  0.  1.  1. -2. -1. -2.  0.]
[ 1.  1. -2.  1.  1. -2. -2.  0. -2. -1. -1.  0.  0.  0.  1. -2.]
[-2.  0.  1.  0.  1. -2.  0. -2. -2. -1. -2.  1.  0. -1. -2.  1.]
[-1.  0.  0. -2.  0. -2. -2.  0.  0.  0. -1. -2. -1. -2. -2.  1.]
[ 1. -2.  1. -2.  0.  1. -1. -1. -2. -2.  0. -2. -1. -1. -1.  1.]
[ 1.  1.  

[ 1.  0. -1. -2.  1. -2. -2. -1. -1.  1.  1. -2.  1. -2. -1. -2.]
[ 0. -2.  1.  1.  1. -2.  1. -2.  1.  1.  1.  1. -2.  0.  1. -2.]
[ 0.  1. -2.  1.  1. -2.  1. -2. -2.  1.  1.  1.  0. -1. -2. -1.]
[ 1.  0.  1. -2.  1. -2. -1.  0. -2.  1. -2. -2.  0.  1. -2. -2.]
[-2.  1.  1.  1.  1. -1.  0.  0.  1.  1.  0.  0. -1.  0.  1.  1.]
[ 0. -1. -2. -2. -1.  1. -2. -1. -1.  0. -1. -2. -2. -2.  1.  0.]
[ 0.  0. -1. -2. -2.  1. -1. -1. -2. -1.  0.  1. -1. -1. -2. -1.]
[ 1. -2. -1.  0. -2.  1.  1. -2.  0. -2.  1.  0. -1.  0.  0. -2.]
[-1.  0.  1. -2. -1.  0.  1. -2. -2. -1.  1. -2. -1. -2. -2.  1.]
[-1. -1. -1.  1. -1.  0.  1.  1.  1. -2.  1.  1.  0.  0.  1. -1.]
[ 1. -1. -2.  0.  1. -1. -2. -1.  0.  0. -2.  1. -2.  1. -2. -1.]
[-1.  0. -1. -2. -2.  0. -2.  0. -2.  0.  1.  1. -1. -2.  1.  1.]
[ 1.  0.  1.  0. -1.  0. -2.  1. -2.  0.  0.  0.  1.  0. -1. -2.]
[-2. -2. -1.  1.  1.  1. -2. -1.  1.  1.  0.  1.  0.  0. -2.  0.]
[-1.  1. -2.  1. -2. -1. -1.  1.  0. -2.  1.  1. -2.  0.  0. -2.]
[-2.  0. -

[ 1.  0.  0. -2. -2. -1. -1.  0. -1. -1. -1.  1.  0. -2.  0.  0.]
[ 0. -1. -1. -1. -1.  1. -2.  1. -1.  0. -2.  0.  1.  1. -2.  1.]
[-2.  0.  0. -2.  1.  1. -1. -2. -1.  0. -2. -2. -1. -2. -1.  1.]
[ 0. -2.  0. -1.  0.  0. -1. -1. -1.  0.  0.  0.  1.  0.  0.  1.]
[ 0. -2. -1.  1. -1. -1.  0. -2.  1. -1.  1.  1.  1.  0. -2.  0.]
[-2.  0. -1. -2. -1.  1.  1.  0.  1. -1.  1. -2. -1.  1.  0.  1.]
[ 0. -2. -2. -1. -1. -2. -1. -2. -1. -2. -2.  1. -2.  1. -2.  1.]
[-1.  0. -1. -2.  1.  0.  1. -1. -1.  1.  0.  1. -2.  1. -1.  0.]
[ 1.  1. -1.  0. -2.  1. -1. -1. -1.  1.  1.  1.  0. -2.  1.  0.]
[-1.  1.  0. -2.  0.  1. -1.  0.  0.  1. -1. -2. -1.  1.  1. -1.]
[-1. -1. -2.  0.  0.  1.  1. -2.  1.  0.  0.  1.  0. -2. -2. -1.]
[ 0. -1. -2.  0. -1. -1.  1.  1.  0.  1. -1. -2.  0. -2. -2.  1.]
[-2. -2. -2. -2.  0. -2. -1.  1. -2.  0.  1. -2. -2. -2.  1. -2.]
[ 1. -1. -1.  0. -2.  0. -1. -2. -1.  1.  1.  1. -1.  1.  0. -2.]
[ 1. -1. -2.  1. -1. -2.  1. -2. -1.  0.  1. -2. -2. -1.  1. -2.]
[ 1. -2.  

[ 1. -2. -1.  1. -1.  1. -1. -2.  0.  1. -2.  0.  1. -1.  1. -1.]
[-1.  0. -1. -1.  1. -1. -1.  0. -2.  0. -2. -1. -2. -2. -1.  0.]
[-2.  1.  0.  0. -1. -2.  1. -1.  1.  1. -2.  1. -2.  0. -2. -1.]
[ 0. -1.  0.  0.  0.  1.  1.  1. -2.  0. -2. -1.  0. -2.  0. -2.]
[ 1.  0. -1.  0. -1. -2.  1.  1.  0. -2.  0.  0.  0. -2.  1. -2.]
[ 0. -1. -1. -2. -2. -1. -1. -2. -2.  0. -1.  0.  0.  1.  1.  0.]
[-2. -1. -2.  1.  0.  0.  1. -2. -2.  0.  1.  1.  1.  0.  0. -1.]
[ 0.  1. -2.  0. -2. -1. -1.  0. -2. -1.  1.  0.  1. -1.  1. -2.]
[ 0.  1. -1. -1.  0. -2.  0.  0.  0. -1. -1.  0.  1. -2. -2. -2.]
[ 0. -1.  0. -1.  1. -1.  0. -2. -2.  0. -2. -2. -2. -1. -2.  1.]
[ 1. -2. -2.  1.  0. -1.  1. -2. -1.  1.  1. -2.  1.  0.  0.  1.]
[ 0. -1. -1.  0.  0.  1. -1. -2.  0. -1.  0. -2.  1.  0.  1. -2.]
[ 0. -1. -2.  1.  1. -2. -1. -2.  0. -1.  1.  0.  0. -2. -2. -2.]
[-1.  1.  0. -1. -1.  1.  1. -1. -2. -1.  0. -1. -2. -1.  1. -1.]
[-1. -1.  0.  0.  1. -1.  1. -2. -1.  0.  0. -2.  0.  0. -2.  0.]
[-1. -2.  

[ 1. -1.  0.  1. -1.  1.  0. -2.  1. -1.  1. -1. -1.  0. -2. -2.]
[-2. -2. -2. -1.  0.  0. -2. -2. -1. -1.  0. -2.  0.  0.  0.  0.]
[ 1. -2. -1. -1.  1.  0.  1. -2.  1. -2.  0.  0.  1.  0. -1.  0.]
[-2. -1.  1.  1. -2. -2. -2. -2.  1. -2.  1.  0. -2. -1.  0.  1.]
[ 1. -2.  1.  0. -2. -1. -1.  0.  0. -1. -2. -1.  0. -2. -2. -1.]
[-2. -1. -1. -1. -2. -1.  0.  1.  1.  1. -2.  0. -1.  1. -1.  0.]
[-2.  0.  1.  0.  0.  1. -2. -2.  0.  0.  0. -2.  0. -2. -1. -1.]
[ 0.  0. -2. -1.  1.  1.  0.  1.  0. -2.  0. -1.  1.  1.  1. -1.]
[-2.  0.  0.  1. -2.  0.  1.  0.  1.  0.  0. -1.  1.  1.  1. -1.]
[-1. -1.  0. -1.  0. -1.  1. -1.  0. -2.  0. -1. -2. -1.  0.  1.]
[ 1.  1. -1. -2. -2.  1.  1.  0.  0. -1. -2.  1.  1. -2.  1.  0.]
[ 1.  0.  0.  0. -2. -1. -2.  1. -1.  1. -2. -1.  0.  1. -1. -1.]
[ 0. -1.  1.  0. -1.  0.  1. -2. -2.  1. -2. -2. -1.  1. -1. -2.]
[-1.  1.  0. -1. -1. -2.  0. -1. -2.  1.  1.  1.  0. -1.  1. -2.]
[-2.  1.  1. -1.  0. -2.  1.  1. -1. -2.  0. -1.  0.  1. -2.  0.]
[-2. -1.  

[ 0. -1.  1.  1.  0.  1. -2.  0.  0. -2.  0. -2. -1.  1. -2. -2.]
[-1. -2. -2. -2. -1.  0. -1.  1. -2.  0.  1. -1. -2.  1.  1. -1.]
[ 1. -2. -2. -2. -1.  0.  1. -1.  1. -2. -1. -1. -1. -2.  1.  1.]
[-2.  0. -1. -1.  0. -1. -2. -1. -2.  0.  0.  1. -1. -2. -2. -1.]
[ 1.  0. -2. -1. -1. -1. -2. -1.  0.  0. -1. -2. -1. -1. -2.  0.]
[-2.  1.  1. -2. -1.  0.  0.  0. -2. -1.  0.  1.  1. -2. -1.  1.]
[ 0. -1. -1. -2. -1. -1.  1.  1. -2.  1.  0.  0.  1.  0.  1.  0.]
[ 1.  0.  0. -2.  0. -1. -2.  0.  0. -2. -2. -2.  0. -1.  1. -1.]
[-2. -1.  0. -1. -2.  1.  0.  1.  1. -2.  0.  0.  0. -2. -2.  1.]
[ 0. -1. -1.  1. -1. -2.  1. -1. -1.  1. -2. -1.  1. -1.  1. -1.]
[ 0.  0.  1.  0. -2.  1.  0.  1.  1.  0.  1.  1.  0. -1. -2. -1.]
[-1.  1. -2.  0. -1. -2. -1.  1. -1. -1. -2.  0. -1. -2. -1.  1.]
[-1. -1.  0.  1. -2. -2.  0.  0.  0. -1. -1.  0.  0.  0. -2. -2.]
[ 1. -2. -1.  1.  1.  1. -2. -2.  1.  1.  1. -2.  1. -1.  1.  0.]
[ 1. -1. -2. -2. -1.  0.  1.  1.  0. -1. -2.  0. -1. -2. -1.  1.]
[-1.  0. -

[-1.  0. -1.  0.  1.  1.  1.  0. -2.  0. -2. -2. -2. -2. -1. -1.]
[-2.  0. -2. -1. -1. -2.  0. -1.  1. -2. -1. -1. -2. -2.  0.  1.]
[-2.  0. -1.  1. -2.  0.  0.  1. -2. -1. -2. -2.  0.  1. -2.  0.]
[-1. -1.  1.  1. -1.  1.  0.  0. -1.  1.  0. -1.  0. -2. -1.  0.]
[-2. -1. -2. -2.  1.  1.  1.  1.  0. -2.  0. -2.  1. -2.  0.  0.]
[-2. -1.  1. -2.  0.  1.  0. -2.  1. -2.  1. -2. -2. -2. -1.  0.]
[-2. -1.  0.  1.  1.  1.  0.  0.  0. -1. -2.  1. -1.  1.  1. -1.]
[-2. -1.  1.  0. -2.  0.  1. -1. -1.  0. -1. -1. -2. -2. -1.  0.]
[ 1.  0.  0.  1.  0. -2.  0.  0.  1.  0. -1.  1. -1.  1.  0. -1.]
[-2. -1. -2. -2. -1.  1.  1. -1. -2. -2.  1.  1. -1. -2. -1.  0.]
[ 0.  0.  0. -1.  0. -2.  0. -2.  0. -1. -2. -1.  0. -2.  0.  1.]
[-1. -1. -2. -1. -2.  1.  1.  0. -2.  1. -1. -2.  1.  1. -1. -2.]
[ 1.  1.  1. -1.  1.  1.  0.  0. -1.  1. -1. -1. -2. -2. -2.  0.]
[-1. -2. -2. -2. -2. -1. -1. -2.  1. -1.  0.  1.  1. -1.  0. -1.]
[-2.  0.  1.  1.  0. -1.  1.  1.  1. -2.  1. -1. -1.  1. -2.  0.]
[ 0. -2. -

[ 1.  1.  1.  1. -1. -1. -1.  1. -2. -1.  0.  1.  1.  1.  1.  0.]
[ 0. -1.  1.  0.  0.  0.  1.  1. -2.  1.  1.  1.  0. -2.  0.  0.]
[ 1.  0.  0.  1. -1.  1. -2.  0. -1.  0. -2.  0.  1.  1.  1. -2.]
[ 0.  1. -2. -2. -1.  1.  0.  1.  1. -1.  1. -1. -1. -1.  0.  1.]
[ 0. -2. -2.  0. -2.  1. -2. -2. -2.  0. -1. -1.  0. -1.  1.  0.]
[-1. -1.  1.  0.  1.  1.  0.  0. -2.  1.  1. -2.  1.  1.  1.  0.]
[-1.  1.  0.  0.  1. -2.  1.  1.  1. -1. -2.  1.  1. -2. -1.  1.]
[-1.  1.  1. -1. -2.  1. -2. -2. -1. -1. -1. -1. -1.  0. -2. -2.]
[-2. -1. -1.  1.  1. -2. -2.  0. -2.  1. -1. -2. -1.  0.  1.  1.]
[ 0. -2. -2. -2. -1. -2. -2. -2. -1. -2. -2.  0. -1.  1.  0. -1.]
[ 1. -2. -1.  0.  1. -2. -1. -2. -2. -1.  1.  0.  0. -1. -2. -2.]
[ 0.  1.  1. -1. -2.  0. -2.  0.  0.  0. -1.  1.  1. -2.  1.  1.]
[-1.  0. -1. -2. -1.  0.  0. -2.  1. -1. -1. -2. -1. -2.  0.  1.]
[-2. -1.  0. -2. -1. -2. -1. -2. -1. -1.  1.  0. -1.  1.  1.  1.]
[ 1.  0.  1.  1.  1.  0. -2. -1.  0. -2.  1. -2.  1. -1. -2. -2.]
[ 0. -1. -

100%|██████████| 30/30 [42:52<00:00, 85.76s/it]
