In [37]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import torch  

In [38]:
print(torch.__version__)

1.9.1


In [39]:
data = pd.read_csv('triplets_all.csv')
N = 878
J = torch.zeros((N, N))
for i in range(data.shape[0]):
    a, b = map(int, data.ids[i].split('_'))
    c = int(data.intersize[i])
    if a != b:
        J[a][b] = c
        J[b][a] = c
print(J)

tensor([[0., 5., 2.,  ..., 0., 0., 0.],
        [5., 0., 8.,  ..., 0., 0., 0.],
        [2., 8., 0.,  ..., 0., 0., 0.],
        ...,
        [0., 0., 0.,  ..., 0., 0., 0.],
        [0., 0., 0.,  ..., 0., 0., 3.],
        [0., 0., 0.,  ..., 0., 3., 0.]])


In [40]:
p = torch.zeros((N, N))
for i in range(N):
    for j in range(N):
        if i != j:
            p[i][j] = 1

In [42]:
import torch
from torch.nn import Module, Linear
from torch.nn.functional import linear


def Binarize(tensor,quant_mode='det'):
    if quant_mode=='det':
        return tensor.sign()
    if quant_mode=='bin':
        return (tensor>=0).type(type(tensor))*2-1
    else:
        return tensor.add_(1).div_(2).add_(torch.rand(tensor.size()).add(-0.5)).clamp_(0,1).round().mul_(2).add_(-1)


class BNNLinear(Linear):
    def __init__(self, *kargs, **kwargs):
        super(BNNLinear, self).__init__(*kargs, **kwargs)
        self.register_buffer('weight_org', self.weight.data.clone())

    def forward(self, input):
        input.data=Binarize(input.data)
            
        self.weight.data=Binarize(self.weight_org)
        out = linear(input, self.weight)

        out[out == -1] = 0

        # if not self.bias is None:
        #     self.bias.org=self.bias.data.clone()
        #     out += self.bias.view(1, -1).expand_as(out.reshape(1, 16)).reshape(16)

        return out

In [44]:
import torch.nn as nn
import torch

class BNNCaffenet(nn.Module):

    def __init__(self):
        super(BNNCaffenet, self).__init__()
 
        self.features = nn.Sequential(
            # nn.BatchNorm1d(1),
            # nn.Hardtanh(inplace=True),
            BNNLinear(1, 878 * 100),
        )

    def forward(self, x):
        return self.features(x)


    def init_w(self):
        # weight initialization
        for m in self.modules():
            if isinstance(m, nn.BatchNorm2d):
                nn.init.ones_(m.weight)
                nn.init.zeros_(m.bias)
            elif isinstance(m, nn.Linear):
                nn.init.normal_(m.weight, 0, 0.01)
                nn.init.zeros_(m.bias)
        return

def bnn_caffenet():
    return BNNCaffenet()

In [45]:
import os
import numpy as np
from torch import save, no_grad
from torch import tensor
import torch
from tqdm import tqdm
import shutil


class BnnClassifier():
    def __init__(self, model, device=None):
        super().__init__()
        self.model = model
        self.device = device

    def train_step(self, criterion, optimizer):
        losses = []
        data = torch.ones(1)
        target = J.type(torch.LongTensor)
        mn = 100000000
        for i in tqdm(range(100000), total=100000):
            output = self.model(data)
            loss = criterion(output, target)
            if loss < mn:
                print(loss)
#                 print(output)
            mn = min(mn, loss)
            losses.append(loss.item())
            optimizer.zero_grad()
            loss.backward()
            for p in self.model.modules():
                if hasattr(p, 'weight_org'):
                    p.weight.data.copy_(p.weight_org)
            optimizer.step()
            for p in self.model.modules():
                if hasattr(p, 'weight_org'):
                    p.weight_org.data.copy_(p.weight.data.clamp_(-1,1))
        return losses

    def train(self, criterion, optimizer, epochs, scheduler):

        best_accuracy = 0.

        losses = []
        accuracies = []

        self.model.train()
        epoch_losses = self.train_step(criterion, optimizer)
        losses += epoch_losses
        epoch_losses = np.array(epoch_losses)
        lr = optimizer.param_groups[0]['lr']  
        if scheduler:     
            scheduler.step()
        

        return

In [48]:
import torch
import importlib

def myCustomLoss(my_outputs, my_labels):
    a = torch.reshape(my_outputs, (878, 100))
    tmp = (a @ a.T - my_labels) * p
    return abs(tmp).sum()

device = torch.device('cpu')
torch.manual_seed(0)

model = BNNCaffenet()
model.to(device)

classification = BnnClassifier(model, device)

criterion = myCustomLoss

if hasattr(model, 'init_w'):
    model.init_w()

optimizer = torch.optim.Adam(model.parameters(), lr=100, weight_decay=0.0001)

scheduler = torch.optim.lr_scheduler.MultiStepLR(optimizer, [80, 150],
        gamma=0.1)

classification.train(criterion, optimizer, 300, scheduler)

  0%|          | 8/100000 [00:00<22:22, 74.48it/s]

tensor(15407682., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15403536., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15393540., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15390762., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15384174., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15380234., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15370934., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15359160., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15350410., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15346156., g

  0%|          | 26/100000 [00:00<22:24, 74.38it/s]

tensor(15280830., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15270216., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15266652., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15252368., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15245032., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15241226., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15228860., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15220180., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15218746., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15217382., g

  0%|          | 43/100000 [00:00<21:59, 75.75it/s]

tensor(15178504., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15174084., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15167380., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15161952., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15147184., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15141372., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15131072., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15127952., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15119600., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15115504., g

  0%|          | 51/100000 [00:00<25:34, 65.12it/s]

tensor(15063458., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15054654., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15049544., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15047286., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15038428., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15029530., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15023996., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(15008874., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14996024., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14985894., g

  0%|          | 66/100000 [00:00<24:42, 67.41it/s]

tensor(14958274., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14947782., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14942428., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14938090., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14924828., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14916436., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14901388., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14892024., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14887598., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14877692., g

  0%|          | 82/100000 [00:01<24:15, 68.63it/s]

tensor(14835702., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14825860., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14817596., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14811044., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14806204., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14796226., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14792564., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14784934., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14775300., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14768150., g

  0%|          | 97/100000 [00:01<23:34, 70.65it/s]

tensor(14720906., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14715604., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14711840., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14701206., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14692294., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14687924., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14674674., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14665916., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14656460., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14649746., g

  0%|          | 113/100000 [00:01<23:44, 70.13it/s]

tensor(14599464., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14595464., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14590778., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14581606., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14572298., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14562028., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14558764., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14555726., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14543146., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14538230., g

  0%|          | 129/100000 [00:01<23:54, 69.64it/s]

tensor(14502648., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14499566., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14496490., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14481820., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14478810., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14466952., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14457204., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14446700., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14444396., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14437422., g

  0%|          | 144/100000 [00:02<25:50, 64.40it/s]

tensor(14418248., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14411178., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14406192., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14405680., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14399630., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14393034., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14384166., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14381082., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14372888., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14370410., g

  0%|          | 160/100000 [00:02<24:14, 68.63it/s]

tensor(14337542., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14332516., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14331284., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14322838., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14315910., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14308018., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14304080., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14302302., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14292238., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14290008., g

  0%|          | 167/100000 [00:02<25:41, 64.77it/s]

tensor(14251366., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14243312., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14237060., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14235010., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14226598., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14220464., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14214322., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14206002., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14195546., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14189230., g

  0%|          | 183/100000 [00:02<23:57, 69.44it/s]

tensor(14166744., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14155202., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14142928., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14136270., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14131652., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14119608., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14117266., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14111534., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14108558., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14101164., g

  0%|          | 198/100000 [00:02<24:57, 66.66it/s]

tensor(14023356., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14017874., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14009968., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14008188., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(14003572., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13994476., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13985662., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13979674., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13973926., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13959880., g

  0%|          | 213/100000 [00:03<26:09, 63.58it/s]

tensor(13933202., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13926920., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13918004., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13912510., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13908634., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13898402., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13890242., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13885470., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13877804., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13869238., g

  0%|          | 220/100000 [00:03<27:16, 60.96it/s]

tensor(13853856., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13848060., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13842016., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13836220., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13827724., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13817202., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13808354., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13800324., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13793460., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13788024., g

  0%|          | 234/100000 [00:03<28:06, 59.17it/s]

tensor(13754548., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13749070., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13742602., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13738844., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13730294., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13727140., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13721142., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13714480., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13706092., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13700528., g

  0%|          | 248/100000 [00:03<27:46, 59.86it/s]

tensor(13683010., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13676348., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13671506., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13662290., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13655780., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13652532., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13642586., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13638306., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13635952., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13627138., g

  0%|          | 263/100000 [00:03<26:16, 63.27it/s]

tensor(13609584., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13604702., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13591282., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13589054., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13580942., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13573978., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13569360., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13564038., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13555318., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13546656., g

  0%|          | 278/100000 [00:04<25:50, 64.32it/s]

tensor(13515530., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13512300., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13503836., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13500628., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13496212., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13486836., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13478588., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13473050., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13467396., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13463906., g

  0%|          | 294/100000 [00:04<24:06, 68.93it/s]

tensor(13429764., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13421552., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13415152., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13409470., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13404638., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13396970., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13389660., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13384362., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13380622., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13378200., g

  0%|          | 302/100000 [00:04<23:13, 71.56it/s]

tensor(13339398., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13333234., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13327274., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13322324., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13319234., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13312056., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13302098., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13299114., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13294042., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13289450., g

  0%|          | 319/100000 [00:04<23:30, 70.67it/s]

tensor(13243756., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13238486., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13233608., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13229372., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13220648., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13211614., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13207782., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13201824., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13193924., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13191818., g

  0%|          | 336/100000 [00:04<22:01, 75.40it/s]

tensor(13161638., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13159114., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13153478., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13144432., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13135706., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13129752., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13123914., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13113826., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13098996., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13093508., g

  0%|          | 352/100000 [00:05<22:08, 75.02it/s]

tensor(13041844., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13030708., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13025224., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13020034., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13013672., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13012154., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13008572., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(13005388., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12995514., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12989622., g

  0%|          | 369/100000 [00:05<21:41, 76.55it/s]

tensor(12960158., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12954558., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12950148., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12943218., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12936840., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12931486., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12923322., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12920124., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12914932., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12910636., g

  0%|          | 386/100000 [00:05<21:49, 76.09it/s]

tensor(12871788., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12868042., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12862658., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12857254., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12848564., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12841714., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12835610., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12832432., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12825582., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12818504., g

  0%|          | 403/100000 [00:05<21:11, 78.33it/s]

tensor(12778724., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12775014., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12764890., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12754610., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12750400., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12747248., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12743176., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12736988., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12733282., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12727366., g

  0%|          | 421/100000 [00:06<20:11, 82.19it/s]

tensor(12670644., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12663772., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12660180., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12652296., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12650582., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12642972., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12635250., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12633034., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12625330., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12621400., g

  0%|          | 430/100000 [00:06<20:48, 79.72it/s]

tensor(12573404., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12567070., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12562032., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12555910., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12551308., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12546144., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12541712., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12532956., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12525378., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12524412., g

  0%|          | 447/100000 [00:06<23:03, 71.95it/s]

tensor(12487984., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12483534., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12473658., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12468830., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12461794., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12455518., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12447712., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12437296., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12427398., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12419836., g

  0%|          | 465/100000 [00:06<21:37, 76.69it/s]

tensor(12390212., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12385776., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12378462., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12374604., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12368880., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12362982., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12358514., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12350412., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12346596., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12340340., g

  0%|          | 481/100000 [00:06<23:04, 71.89it/s]

tensor(12305682., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12301882., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12299670., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12293710., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12288574., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12282312., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12279056., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12274878., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12272910., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12260800., g

  0%|          | 497/100000 [00:07<23:10, 71.57it/s]

tensor(12244266., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12239486., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12234080., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12223990., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12220852., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12213436., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12202006., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12199880., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12192610., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12186050., g

  1%|          | 514/100000 [00:07<21:59, 75.38it/s]

tensor(12156850., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12155030., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12152176., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12145548., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12140748., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12133464., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12127196., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12118838., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12115942., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12111816., g

  1%|          | 522/100000 [00:07<22:09, 74.81it/s]

tensor(12082520., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12076184., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12070138., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12062692., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12059088., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12054924., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12047514., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12045284., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12043164., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(12041902., g

  1%|          | 538/100000 [00:07<23:03, 71.88it/s]

tensor(12004468., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11997848., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11994888., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11990818., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11982034., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11976218., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11973134., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11970896., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11961188., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11955370., g

  1%|          | 554/100000 [00:07<22:42, 72.97it/s]

tensor(11924396., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11917398., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11917088., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11910256., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11901450., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11892754., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11885756., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11879902., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11874662., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11868790., g

  1%|          | 570/100000 [00:08<22:31, 73.57it/s]

tensor(11839724., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11835464., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11825340., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11819516., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11814278., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11811952., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11801608., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11796598., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11788360., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11783998., g

  1%|          | 586/100000 [00:08<25:19, 65.43it/s]

tensor(11745762., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11739882., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11736864., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11730128., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11725226., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11722246., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11717384., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11712912., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11704782., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11698020., g

  1%|          | 593/100000 [00:08<25:24, 65.21it/s]

tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11675808., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11670154., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11663080., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11657946., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11652918., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11645024., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11641358., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11638434., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11628098., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,

  1%|          | 608/100000 [00:08<24:43, 67.02it/s]

tensor(11595758., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11590762., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11586728., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11582984., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11576970., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11573576., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11570808., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11567924., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11560488., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11554588., g

  1%|          | 625/100000 [00:08<23:08, 71.56it/s]

tensor(11520548., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11514606., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11508200., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11506840., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11500512., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11498904., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11492480., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11486242., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11480930., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11473412., g

  1%|          | 641/100000 [00:09<23:06, 71.68it/s]

tensor(11425416., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11420254., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11414378., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11412620., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11404702., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11400888., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11395880., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11388086., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11383066., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11378668., g

  1%|          | 657/100000 [00:09<23:25, 70.70it/s]

tensor(11346406., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11342060., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11335276., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11328230., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11326676., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11320210., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11314234., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11305992., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11300260., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11293490., g

  1%|          | 673/100000 [00:09<22:44, 72.78it/s]

tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11262902., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11256874., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11249440., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11242190., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11236956., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11233336., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11224324., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11217868., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11210904., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,

  1%|          | 690/100000 [00:09<21:29, 77.03it/s]

tensor(11173122., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11165588., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11162020., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11159214., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11154200., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11149570., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11145358., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11140046., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11133250., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11127962., g

  1%|          | 698/100000 [00:09<23:37, 70.07it/s]

tensor(11079596., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11072306., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11063324., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11062560., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11057892., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11053372., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11049340., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11044536., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11034226., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(11025870., g

  1%|          | 714/100000 [00:10<22:40, 72.99it/s]

tensor(11001090., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10995198., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10988666., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10985330., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10978454., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10976228., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10972906., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10970958., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10966366., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10960742., g

  1%|          | 731/100000 [00:10<25:09, 65.76it/s]

tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10918214., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10912668., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10907688., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10906456., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10902130., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10897290., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10891578., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10885584., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10880504., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,

  1%|          | 747/100000 [00:10<23:18, 70.96it/s]

tensor(10868860., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10865646., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10861390., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10857632., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10853864., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10850214., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10846694., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10843494., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10837666., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10830850., g

  1%|          | 755/100000 [00:10<25:05, 65.94it/s]

tensor(10788048., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10783184., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10776012., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10769766., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10767370., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10763220., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10756108., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10749686., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10742234., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10738580., g

  1%|          | 770/100000 [00:10<25:44, 64.24it/s]

tensor(10719418., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10715996., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10708530., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10702948., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10698328., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10694026., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10687772., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10684188., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10679432., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10675476., g

  1%|          | 786/100000 [00:11<24:25, 67.70it/s]

tensor(10661058., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10658152., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10648344., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10643586., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10632686., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10626478., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10621288., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10616678., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10611094., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10608840., g

  1%|          | 800/100000 [00:11<25:52, 63.91it/s]

tensor(10578728., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10574498., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10574440., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10569916., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10566728., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10561166., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10555802., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10549900., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10541744., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10538186., g

  1%|          | 808/100000 [00:11<24:25, 67.68it/s]

tensor(10527388., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10521906., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10515074., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10509244., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10501606., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10498904., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10494322., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10488654., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10481890., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10476822., g

  1%|          | 825/100000 [00:11<22:38, 73.00it/s]

tensor(10438794., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10434626., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10428556., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10418664., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10411016., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10406078., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10400874., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10395730., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10386356., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10379040., g

  1%|          | 841/100000 [00:11<22:28, 73.54it/s]

tensor(10345124., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10341172., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10334528., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10326892., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10321538., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10316718., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10311194., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10303540., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10300036., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10293042., g

  1%|          | 857/100000 [00:12<22:11, 74.47it/s]

tensor(10257210., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10253438., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10248966., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10241586., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10230838., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10228068., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10220330., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10215548., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10212070., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10205892., g

  1%|          | 874/100000 [00:12<21:38, 76.34it/s]

tensor(10168558., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10165556., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10160210., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10158830., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10153130., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10147576., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10140632., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10132208., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10127466., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10123828., g

  1%|          | 890/100000 [00:12<22:35, 73.14it/s]

tensor(10099782., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10094172., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10089278., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10082466., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10079642., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10074330., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10068642., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10062316., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10055948., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10051032., g

  1%|          | 907/100000 [00:12<21:28, 76.93it/s]

tensor(10020396., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10014442., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10007784., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(10003818., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9999504., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9997174., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9992480., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9988334., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9980714., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9977194., grad_fn

  1%|          | 923/100000 [00:13<24:03, 68.63it/s]

tensor(9949712., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9945206., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9940572., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9933286., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9929742., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9922658., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9914194., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9910470., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9907150., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9900600., grad_fn=<Su

  1%|          | 939/100000 [00:13<23:05, 71.51it/s]

tensor(9878388., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9876910., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9871460., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9862416., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9857884., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9849356., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9846384., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9840142., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9836768., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9830360., grad_fn=<Su

  1%|          | 955/100000 [00:13<22:31, 73.30it/s]

tensor(9796598., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9793380., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9785686., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9779302., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9775050., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9767596., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9762030., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9758148., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9753900., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9748408., grad_fn=<Su

  1%|          | 971/100000 [00:13<22:08, 74.55it/s]

tensor(9717620., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9714224., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9712998., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9704814., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9700146., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9693104., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9688702., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9683972., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9679598., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9675884., grad_fn=<Su

  1%|          | 979/100000 [00:13<23:18, 70.80it/s]

tensor(9639462., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9629314., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9624904., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9623672., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9614824., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9611144., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9604390., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9599420., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9594756., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9590098., grad_fn=<Su

  1%|          | 995/100000 [00:14<22:48, 72.33it/s]

tensor(9558902., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9555558., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9546222., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9545002., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9537512., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9534734., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9529408., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9523762., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9520528., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9518956., grad_fn=<Su

  1%|          | 1011/100000 [00:14<22:44, 72.53it/s]

tensor(9485752., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9481532., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9478832., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9475680., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9467334., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9464396., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9462346., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9455406., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9449944., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9445640., grad_fn=<Su

  1%|          | 1027/100000 [00:14<22:44, 72.54it/s]

tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9409570., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9404022., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9396888., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9394592., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9390738., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9386142., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9381284., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9377136., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9375188., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1.

  1%|          | 1034/100000 [00:14<23:23, 70.52it/s]

tensor(9349596., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9345214., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)
tensor(9340034., grad_fn=<SumBackward0>)
tensor([0., 1., 0.,  ..., 1., 0., 1.], grad_fn=<IndexPutBackward>)





KeyboardInterrupt: 