In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import numpy as np
import copy

In [2]:
class Board():
    

    def __init__(self,n):
        self.n = n 
        self.directions = np.array([[a,b] for a in [-1,0,1] for b in [-1,0,1] if (a!=0 or b!=0)])
        self.pieces = np.zeros((self.n,self.n))
        
        self.pieces[self.n//2 - 1,self.n//2] = 1
        self.pieces[self.n//2,self.n//2 -1] = 1
        self.pieces[self.n//2 - 1,self.n//2 -1] = -1
        self.pieces[self.n//2,self.n//2] = -1
        
    
    def count_diff(self):
        count=0
        for square in [[a,b] for a in range(self.n) for b in range(self.n)]:
            count+= self.pieces[square[0],square[1]]            
        return count
    
    def next_square(self,square,direction):
        next_square = np.array(square) + np.array(direction)

        if (next_square[0] >= self.n or next_square[1] >= self.n) or (next_square[0] < 0 or next_square[1] < 0):
            return None
        else: return list(next_square)
            
    def get_directional_flips(self,square,direction,do_flip,color):
        flips = []

        square = self.next_square(square,direction)

        while (square!=None) and (self.pieces[square[0],square[1]] == -color):
            flips.append(square)
            square = self.next_square(square,direction)
            
        if square == None:
            flips = []
               
        if (square == None or self.pieces[square[0],square[1]] != color):
                return None
        
        if (square[0] >= self.n or square[1] >= self.n) or (square[0] < 0 or square[1] < 0):
            return None
        else:
            if flips:
                if do_flip:
                    for f in flips:
                        self.pieces[f[0],f[1]] = color
                return flips
            else: return None
     
    def can_play_square(self,square,color):
        [x,y] = square
        
        if self.pieces[x,y] != 0:
            return False

        for d in self.directions:
            b = self.get_directional_flips(square,d,False,color)
            if b:
                return True

        return False
                 
    def execute_move(self,move,color):
        s = copy.deepcopy(self)
        if s.can_play_square(move,color):
            s.pieces[move[0],move[1]] = color
            for d in self.directions:
                s.get_directional_flips(move,d,True,color)
        return s

    def get_legal_moves(self,color):
        moves = []
        for x in range(self.n):
            for y in range(self.n):
                if(self.can_play_square([x,y],color)):
                    move = [x,y]
                    moves.append(move)
        return moves
        
    def get_game_ended(self):
        
        if (len(self.get_legal_moves(1)) == 0) and (len(self.get_legal_moves(-1)) == 0):
            
            if self.count_diff() != 0:
                return np.sign(self.count_diff())
            else: return 1e-6
            
        else:
            return 0
        

                
            

In [3]:
def minimax(position,depth,player,alpha,beta):
    
    game_over = len(position.get_legal_moves(1)) == 0 and len(position.get_legal_moves(-1)) == 0
    if depth == 0 or game_over:
        return float(position.count_diff())

    if player == 1:

        max_val = -float(np.inf)
        legal_moves = position.get_legal_moves(player)
        print(player)
        print(legal_moves)
        
        children = [position.execute_move(move,player) for move in legal_moves]
        
        for child in children:
            position = child
            print(child.pieces)
            val = minimax(position,depth-1,-player,alpha,beta)
            max_val = np.max([val,max_val])
            if beta <= val:
                print('Pruned')
                break
                
            if val>alpha:
                alpha = val

        return max_val
    
    else:

        min_val = float(np.inf)
        legal_moves = position.get_legal_moves(player)
        print(player)

        print(legal_moves)
        
        children = [position.execute_move(move,player) for move in legal_moves]
        for child in children:
            position = child  
            print(position.pieces)
            val = minimax(position,depth-1,-player,alpha,beta)
            min_val = np.min([val,min_val])
            if val <= alpha:
                print('Pruned')
                break

            if val < beta:
                beta = val
                
            print(val)

        return min_val
        

In [106]:
EPS = 1e-8

class MCTS():
    def __init__(self,nnet,num_sims,board_size):
        self.board_size = board_size
        self.boards = []
        self.squares = [[a,b] for a in range(board_size) for b in range(board_size)]
        self.nnet = nnet
        self.Qsa = {} #q-values
        self.Nsa = {} # visits to s,a
        self.Ns = {} # visits to state s
        self.Ps = {} # initial policy output from nnet
        
        self.Es = {} # games ended from state s
        self.Vs = {} # valid moves for state s
        
        self.num_sims = num_sims

        
        
        
    def search(self,s,player):
            self.boards.append(s)
            if s not in self.Es:
                self.Es[s] = s.get_game_ended()
            
            if self.Es[s] != 0:
                return self.Es[s]
        
            if s not in self.Ps:
                
                self.Ps[s], v = self.nnet.predict(s,player)
        
                valid_moves = s.get_legal_moves(player)
                
                if not valid_moves:
                    valid_moves = s.get_legal_moves(-player)
                    player = -player
                    self.Ps[s], v = self.nnet.predict(s,player)

                valids = [(x in valid_moves) for x in self.squares]
                
                self.Ps[s] = self.Ps[s] * valids
                self.Ps[s] = valids/np.sum(valids)
     
            
                self.Vs[s] = valids
                self.Ns[s] = 0
                return v

                        

            valids = self.Vs[s]
            cur_best = -np.inf
            best_act = None
            
            valid_moves = s.get_legal_moves(player)
            
            if not valid_moves:
                valid_moves = s.get_legal_moves(-player)

            valids = [(x in valid_moves) for x in self.squares]
        
            for a in range(len(self.squares)):
                if valids[a]:
                    if (s,a) in self.Qsa:
                        u = self.Qsa[(s,a)] + self.Ps[s][a] * np.sqrt(self.Ns[s])/(1+self.Nsa[(s,a)])
                    
                    else:
                        u = self.Ps[s][a] * np.sqrt(self.Ns[s] + EPS)
                    
                    if u > cur_best:
                        cur_best = u
                        best_act = a
               
            a = best_act
            
            if a == None:
                print(valid_moves)
            

            move = self.squares[a]
            next_s = s.execute_move(move,player)
            next_player = -player
#             print(move,next_s.pieces)     
           
            v = self.search(next_s,next_player)
        

            if (s,a) in self.Qsa:
                self.Qsa[(s,a)] = (self.Nsa[(s,a)] * self.Qsa[(s,a)] + v)/(self.Nsa[(s,a)] + 1)
                self.Nsa[(s,a)] += 1
            
            else:
                self.Qsa[(s,a)] = v
                self.Nsa[(s,a)] = 1
            
            self.Ns[s] += 1

            return v
        
        
    def get_action_probs(self,position,player):
        
        for i in range(self.num_sims):
            self.search(position,player)
            
        s = position
       
        try:
            counts = [self.Nsa[(s,a)] if (s,a) in self.Nsa else 0 for a in range(64)]
            
        except: print(s.pieces)
        
        probs = [x/np.sum(counts) for x in counts]   
          
        return probs  
        

In [224]:
class NNet(nn.Module):
    
    def __init__(self,size):
        
        super().__init__()
 
        self.size = size
        self.conv1 = nn.Conv2d(1, 512, 3, stride=1, padding=1)
        self.conv2 = nn.Conv2d(512, 512, 3, stride=1, padding=1)
        self.conv3 = nn.Conv2d(512, 512, 3, stride=1)
        self.conv4 = nn.Conv2d(512, 512, 3, stride=1)

        self.bn1 = nn.BatchNorm2d(512)
        self.bn2 = nn.BatchNorm2d(512)
        self.bn3 = nn.BatchNorm2d(512)
        self.bn4 = nn.BatchNorm2d(512)

        self.fc1 = nn.Linear(512*(self.size-4)*(self.size-4), 1024)
        self.fc_bn1 = nn.LayerNorm(1024)

        self.fc2 = nn.Linear(1024, 512)
        self.fc_bn2 = nn.LayerNorm(512)

        self.fc3 = nn.Linear(512, self.size**2)

        self.fc4 = nn.Linear(512, 1)

    def forward(self, s,player):
        #                                                           s: batch_size x board_x x board_y
        s = s.view(-1, 1, self.size, self.size)                # batch_size x 1 x board_x x board_y
        s = F.relu(self.bn1(self.conv1(s)))                          # batch_size x num_channels x board_x x board_y
        s = F.relu(self.bn2(self.conv2(s)))                          # batch_size x num_channels x board_x x board_y
        s = F.relu(self.bn3(self.conv3(s)))                          # batch_size x num_channels x (board_x-2) x (board_y-2)
        s = F.relu(self.bn4(self.conv4(s)))                          # batch_size x num_channels x (board_x-4) x (board_y-4)
        s = s.view(-1, 512*(self.size-4)*(self.size-4))

        s = F.dropout(F.relu(self.fc_bn1(self.fc1(s))), p=0.3)  # batch_size x 1024
        s = F.dropout(F.relu(self.fc_bn2(self.fc2(s))), p=0.3)  # batch_size x 512

        pi = self.fc3(s)                                                                         # batch_size x action_size
        v = self.fc4(s)                                                                          # batch_size x 1

        return F.softmax(pi, dim=1), player * torch.tanh(v)
    
    
    def predict(self,position,player):
        position = torch.FloatTensor(position.pieces)
        with torch.no_grad():
            pi,v = self(position,player)
        return pi.data.cpu().numpy()[0], v.data.cpu().numpy()[0]

In [225]:
nnet = NNet(8)

In [338]:

training_examples = []
board = Board(8)
player = 1


def execute_episode(player):
    mcts = MCTS(nnet,15,8)
    training_examples = []
    board = Board(8)
    player = 1
    board = Board(8)
    squares = [[a,b] for a in range(8) for b in range(8)]
    episode_step = 0
    while True:
    
        episode_step += 1
    
        if board.get_legal_moves(player):
            pi = mcts.get_action_probs(board,player)
            action = np.random.choice(len(pi),p=pi)
            move = squares[action]
            board = board.execute_move(move,player)
            training_examples.append([board,player,pi])
        elif board.get_legal_moves(-player):
            pi = mcts.get_action_probs(board,-player)
            action = np.random.choice(len(pi),p=pi)
            move = squares[action]
            board = board.execute_move(move,-player)
            training_examples.append([board,-player,pi])
        else: 
            r = board.get_game_ended()
            if r != 0:
                print(episode_step)
                return [[x[0],x[2],x[1], r] for x in training_examples]
            
       
        player = -player


    

In [383]:
import time

In [335]:
board = Board(8)

In [363]:
%%time
train_ex = execute_episode(1)

61
CPU times: total: 36.3 s
Wall time: 13 s


In [362]:
train_ex[59][0].pieces

array([[ 1.,  1.,  1.,  1.,  1.,  1.,  1., -1.],
       [ 1.,  1.,  1., -1.,  1.,  1.,  1., -1.],
       [ 1.,  1.,  1.,  1., -1., -1.,  1., -1.],
       [ 1.,  1.,  1.,  1., -1.,  1.,  1., -1.],
       [ 1.,  1.,  1.,  1.,  1., -1.,  1., -1.],
       [-1.,  1.,  1.,  1.,  1.,  1., -1., -1.],
       [-1., -1.,  1., -1., -1., -1., -1., -1.],
       [-1., -1., -1., -1., -1., -1.,  1.,  1.]])

In [364]:
train_examples = []

for _ in tqdm(range(100),desc='Self Play'):
        train_examples.extend(execute_episode(1))
        

Self Play:   1%|▋                                                                      | 1/100 [00:12<21:16, 12.89s/it]

61


Self Play:   2%|█▍                                                                     | 2/100 [00:25<20:49, 12.75s/it]

61


Self Play:   3%|██▏                                                                    | 3/100 [00:37<20:21, 12.60s/it]

61


Self Play:   4%|██▊                                                                    | 4/100 [00:50<20:02, 12.52s/it]

61


Self Play:   5%|███▌                                                                   | 5/100 [01:02<19:51, 12.54s/it]

61


Self Play:   6%|████▎                                                                  | 6/100 [01:15<19:32, 12.47s/it]

61


Self Play:   7%|████▉                                                                  | 7/100 [01:27<19:19, 12.46s/it]

61


Self Play:   8%|█████▋                                                                 | 8/100 [01:41<19:50, 12.94s/it]

60


Self Play:   9%|██████▍                                                                | 9/100 [01:55<20:10, 13.30s/it]

61


Self Play:  10%|███████                                                               | 10/100 [02:09<20:22, 13.58s/it]

61


Self Play:  11%|███████▋                                                              | 11/100 [02:24<20:22, 13.73s/it]

61


Self Play:  12%|████████▍                                                             | 12/100 [02:37<19:48, 13.50s/it]

61


Self Play:  13%|█████████                                                             | 13/100 [02:50<19:22, 13.36s/it]

61


Self Play:  14%|█████████▊                                                            | 14/100 [03:03<19:01, 13.28s/it]

61


Self Play:  15%|██████████▌                                                           | 15/100 [03:16<18:42, 13.20s/it]

61


Self Play:  16%|███████████▏                                                          | 16/100 [03:29<18:31, 13.23s/it]

61


Self Play:  17%|███████████▉                                                          | 17/100 [03:44<19:06, 13.81s/it]

61


Self Play:  18%|████████████▌                                                         | 18/100 [04:00<19:32, 14.30s/it]

61


Self Play:  19%|█████████████▎                                                        | 19/100 [04:16<20:12, 14.97s/it]

61


Self Play:  20%|██████████████                                                        | 20/100 [04:32<20:07, 15.10s/it]

61


Self Play:  21%|██████████████▋                                                       | 21/100 [04:46<19:30, 14.82s/it]

61


Self Play:  22%|███████████████▍                                                      | 22/100 [05:00<19:01, 14.63s/it]

61


Self Play:  23%|████████████████                                                      | 23/100 [05:14<18:36, 14.49s/it]

61


Self Play:  24%|████████████████▊                                                     | 24/100 [05:29<18:32, 14.64s/it]

61


Self Play:  25%|█████████████████▌                                                    | 25/100 [05:46<19:11, 15.36s/it]

61


Self Play:  26%|██████████████████▏                                                   | 26/100 [06:03<19:32, 15.85s/it]

61


Self Play:  27%|██████████████████▉                                                   | 27/100 [06:20<19:33, 16.08s/it]

61


Self Play:  28%|███████████████████▌                                                  | 28/100 [06:36<19:30, 16.25s/it]

61


Self Play:  29%|████████████████████▎                                                 | 29/100 [06:51<18:41, 15.79s/it]

61


Self Play:  30%|█████████████████████                                                 | 30/100 [07:06<18:08, 15.55s/it]

61


Self Play:  31%|█████████████████████▋                                                | 31/100 [07:21<17:33, 15.27s/it]

61


Self Play:  32%|██████████████████████▍                                               | 32/100 [07:36<17:18, 15.27s/it]

61


Self Play:  33%|███████████████████████                                               | 33/100 [07:52<17:28, 15.65s/it]

61


Self Play:  34%|███████████████████████▊                                              | 34/100 [08:09<17:37, 16.02s/it]

61


Self Play:  35%|████████████████████████▌                                             | 35/100 [08:26<17:37, 16.27s/it]

61


Self Play:  36%|█████████████████████████▏                                            | 36/100 [08:42<17:11, 16.11s/it]

61


Self Play:  37%|█████████████████████████▉                                            | 37/100 [08:57<16:27, 15.68s/it]

61


Self Play:  38%|██████████████████████████▌                                           | 38/100 [09:11<15:55, 15.40s/it]

61


Self Play:  39%|███████████████████████████▎                                          | 39/100 [09:26<15:28, 15.22s/it]

61


Self Play:  40%|████████████████████████████                                          | 40/100 [09:43<15:38, 15.63s/it]

61


Self Play:  41%|████████████████████████████▋                                         | 41/100 [10:00<15:46, 16.04s/it]

61


Self Play:  42%|█████████████████████████████▍                                        | 42/100 [10:18<16:03, 16.61s/it]

61


Self Play:  43%|██████████████████████████████                                        | 43/100 [10:34<15:45, 16.60s/it]

61


Self Play:  44%|██████████████████████████████▊                                       | 44/100 [10:49<14:59, 16.06s/it]

61


Self Play:  45%|███████████████████████████████▌                                      | 45/100 [11:03<14:10, 15.46s/it]

61


Self Play:  46%|████████████████████████████████▏                                     | 46/100 [11:18<13:40, 15.20s/it]

61


Self Play:  47%|████████████████████████████████▉                                     | 47/100 [11:33<13:23, 15.15s/it]

61


Self Play:  48%|█████████████████████████████████▌                                    | 48/100 [11:49<13:24, 15.47s/it]

61


Self Play:  49%|██████████████████████████████████▎                                   | 49/100 [12:05<13:15, 15.60s/it]

61


Self Play:  50%|███████████████████████████████████                                   | 50/100 [12:21<13:01, 15.62s/it]

61


Self Play:  51%|███████████████████████████████████▋                                  | 51/100 [12:36<12:41, 15.54s/it]

61


Self Play:  52%|████████████████████████████████████▍                                 | 52/100 [12:50<12:02, 15.05s/it]

61


Self Play:  53%|█████████████████████████████████████                                 | 53/100 [13:04<11:33, 14.75s/it]

61


Self Play:  54%|█████████████████████████████████████▊                                | 54/100 [13:17<11:01, 14.38s/it]

61


Self Play:  55%|██████████████████████████████████████▌                               | 55/100 [13:31<10:38, 14.20s/it]

61


Self Play:  56%|███████████████████████████████████████▏                              | 56/100 [13:47<10:45, 14.67s/it]

61


Self Play:  57%|███████████████████████████████████████▉                              | 57/100 [14:02<10:42, 14.94s/it]

61


Self Play:  58%|████████████████████████████████████████▌                             | 58/100 [14:18<10:31, 15.03s/it]

61


Self Play:  59%|█████████████████████████████████████████▎                            | 59/100 [14:33<10:17, 15.06s/it]

61


Self Play:  60%|██████████████████████████████████████████                            | 60/100 [14:46<09:43, 14.60s/it]

61


Self Play:  61%|██████████████████████████████████████████▋                           | 61/100 [15:00<09:17, 14.31s/it]

61


Self Play:  62%|███████████████████████████████████████████▍                          | 62/100 [15:14<08:55, 14.09s/it]

61


Self Play:  63%|████████████████████████████████████████████                          | 63/100 [15:27<08:34, 13.91s/it]

61


Self Play:  64%|████████████████████████████████████████████▊                         | 64/100 [15:42<08:35, 14.32s/it]

60


Self Play:  65%|█████████████████████████████████████████████▌                        | 65/100 [16:01<09:08, 15.68s/it]

61


Self Play:  66%|██████████████████████████████████████████████▏                       | 66/100 [16:18<09:05, 16.03s/it]

61


Self Play:  67%|██████████████████████████████████████████████▉                       | 67/100 [16:35<08:55, 16.24s/it]

61


Self Play:  68%|███████████████████████████████████████████████▌                      | 68/100 [16:50<08:32, 16.00s/it]

61


Self Play:  69%|████████████████████████████████████████████████▎                     | 69/100 [17:06<08:13, 15.91s/it]

61


Self Play:  70%|█████████████████████████████████████████████████                     | 70/100 [17:22<07:54, 15.82s/it]

61


Self Play:  71%|█████████████████████████████████████████████████▋                    | 71/100 [17:38<07:41, 15.92s/it]

61


Self Play:  72%|██████████████████████████████████████████████████▍                   | 72/100 [17:55<07:33, 16.19s/it]

61


Self Play:  73%|███████████████████████████████████████████████████                   | 73/100 [18:10<07:15, 16.12s/it]

61


Self Play:  74%|███████████████████████████████████████████████████▊                  | 74/100 [18:26<06:57, 16.04s/it]

61


Self Play:  75%|████████████████████████████████████████████████████▌                 | 75/100 [18:42<06:41, 16.08s/it]

61


Self Play:  76%|█████████████████████████████████████████████████████▏                | 76/100 [18:57<06:15, 15.66s/it]

61


Self Play:  77%|█████████████████████████████████████████████████████▉                | 77/100 [19:12<05:51, 15.30s/it]

61


Self Play:  78%|██████████████████████████████████████████████████████▌               | 78/100 [19:26<05:32, 15.12s/it]

61


Self Play:  79%|███████████████████████████████████████████████████████▎              | 79/100 [19:43<05:24, 15.47s/it]

61


Self Play:  80%|████████████████████████████████████████████████████████              | 80/100 [19:59<05:17, 15.86s/it]

61


Self Play:  81%|████████████████████████████████████████████████████████▋             | 81/100 [20:17<05:09, 16.29s/it]

61


Self Play:  82%|█████████████████████████████████████████████████████████▍            | 82/100 [20:34<04:57, 16.51s/it]

61


Self Play:  83%|██████████████████████████████████████████████████████████            | 83/100 [20:49<04:32, 16.00s/it]

61


Self Play:  84%|██████████████████████████████████████████████████████████▊           | 84/100 [21:03<04:06, 15.42s/it]

61


Self Play:  85%|███████████████████████████████████████████████████████████▌          | 85/100 [21:17<03:46, 15.12s/it]

61


Self Play:  86%|████████████████████████████████████████████████████████████▏         | 86/100 [21:32<03:30, 15.01s/it]

61


Self Play:  87%|████████████████████████████████████████████████████████████▉         | 87/100 [21:48<03:20, 15.45s/it]

61


Self Play:  88%|█████████████████████████████████████████████████████████████▌        | 88/100 [22:05<03:10, 15.91s/it]

61


Self Play:  89%|██████████████████████████████████████████████████████████████▎       | 89/100 [22:21<02:56, 16.00s/it]

61


Self Play:  90%|███████████████████████████████████████████████████████████████       | 90/100 [22:38<02:40, 16.05s/it]

61


Self Play:  91%|███████████████████████████████████████████████████████████████▋      | 91/100 [22:52<02:20, 15.62s/it]

61


Self Play:  92%|████████████████████████████████████████████████████████████████▍     | 92/100 [23:07<02:02, 15.31s/it]

61


Self Play:  93%|█████████████████████████████████████████████████████████████████     | 93/100 [23:21<01:44, 14.98s/it]

61


Self Play:  94%|█████████████████████████████████████████████████████████████████▊    | 94/100 [23:38<01:33, 15.61s/it]

61


Self Play:  95%|██████████████████████████████████████████████████████████████████▌   | 95/100 [23:56<01:21, 16.22s/it]

61


Self Play:  96%|███████████████████████████████████████████████████████████████████▏  | 96/100 [24:14<01:07, 16.87s/it]

61


Self Play:  97%|███████████████████████████████████████████████████████████████████▉  | 97/100 [24:32<00:51, 17.13s/it]

61


Self Play:  98%|████████████████████████████████████████████████████████████████████▌ | 98/100 [24:49<00:34, 17.07s/it]

61


Self Play:  99%|█████████████████████████████████████████████████████████████████████▎| 99/100 [25:04<00:16, 16.61s/it]

61


Self Play: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [25:20<00:00, 15.21s/it]

61





In [376]:
samples = [[b[0].pieces,b[1],b[2],b[3]] for b in train_examples]

In [377]:
len(samples)

5998

In [128]:
pnet = copy.deepcopy(nnet)

In [382]:
nnet = NNet(8)

In [384]:
def train(nnet,samples,epochs,batch_size):
    optimizer = optim.Adam(nnet.parameters())
    loss_pi_fn = nn.CrossEntropyLoss()
    loss_v_fn = nn.MSELoss()
    
    for epoch in range(epochs):
        pi_losses = 0.0
        v_losses = 0.0
        
        batch_count = int(len(samples)/batch_size)
        
        t = tqdm(range(batch_count),desc='Training Net')
        for _ in t:
            sample_ids = np.random.randint(len(samples),size=batch_size)
            boards,pis,players,vs = list(zip(*[samples[i] for i in sample_ids]))
            target_pis = torch.FloatTensor(np.array(pis))
            boards = torch.FloatTensor(np.array(boards))
            target_vs = torch.FloatTensor(np.array(vs))
            players = torch.FloatTensor(players).unsqueeze(1)
            
            
            out_pi, out_v = nnet(boards,players)

            
            loss_pi = loss_pi_fn(target_pis,out_pi)
            loss_v = loss_v_fn(target_vs,out_v)
            
            total_loss = loss_pi + loss_v
            
            optimizer.zero_grad()
            total_loss.backward()
            optimizer.step()
            
            print(total_loss)

In [385]:
train(nnet,samples,3,16)

Training Net:   0%|▏                                                                   | 1/374 [00:00<01:29,  4.15it/s]

tensor(5.4157, grad_fn=<AddBackward0>)


Training Net:   1%|▎                                                                   | 2/374 [00:00<01:30,  4.10it/s]

tensor(6.2236, grad_fn=<AddBackward0>)


Training Net:   1%|▌                                                                   | 3/374 [00:00<01:33,  3.95it/s]

tensor(6.0303, grad_fn=<AddBackward0>)


Training Net:   1%|▋                                                                   | 4/374 [00:01<01:34,  3.90it/s]

tensor(6.0581, grad_fn=<AddBackward0>)


Training Net:   1%|▉                                                                   | 5/374 [00:01<01:33,  3.93it/s]

tensor(5.7402, grad_fn=<AddBackward0>)


Training Net:   2%|█                                                                   | 6/374 [00:01<01:32,  3.97it/s]

tensor(5.2637, grad_fn=<AddBackward0>)


Training Net:   2%|█▎                                                                  | 7/374 [00:01<01:33,  3.92it/s]

tensor(5.2694, grad_fn=<AddBackward0>)


Training Net:   2%|█▍                                                                  | 8/374 [00:02<01:37,  3.74it/s]

tensor(5.2934, grad_fn=<AddBackward0>)


Training Net:   2%|█▋                                                                  | 9/374 [00:02<01:38,  3.69it/s]

tensor(5.1127, grad_fn=<AddBackward0>)


Training Net:   3%|█▊                                                                 | 10/374 [00:02<01:38,  3.70it/s]

tensor(5.2389, grad_fn=<AddBackward0>)


Training Net:   3%|█▉                                                                 | 11/374 [00:02<01:36,  3.75it/s]

tensor(5.2012, grad_fn=<AddBackward0>)


Training Net:   3%|██▏                                                                | 12/374 [00:03<01:37,  3.73it/s]

tensor(5.2122, grad_fn=<AddBackward0>)


Training Net:   3%|██▎                                                                | 13/374 [00:03<01:36,  3.73it/s]

tensor(5.2443, grad_fn=<AddBackward0>)


Training Net:   4%|██▌                                                                | 14/374 [00:03<01:31,  3.94it/s]

tensor(5.4262, grad_fn=<AddBackward0>)


Training Net:   4%|██▋                                                                | 15/374 [00:03<01:31,  3.91it/s]

tensor(5.2668, grad_fn=<AddBackward0>)


Training Net:   4%|██▊                                                                | 16/374 [00:04<01:36,  3.70it/s]

tensor(5.1817, grad_fn=<AddBackward0>)


Training Net:   5%|███                                                                | 17/374 [00:04<01:36,  3.69it/s]

tensor(5.2524, grad_fn=<AddBackward0>)


Training Net:   5%|███▏                                                               | 18/374 [00:04<01:35,  3.71it/s]

tensor(5.2257, grad_fn=<AddBackward0>)


Training Net:   5%|███▍                                                               | 19/374 [00:05<01:36,  3.69it/s]

tensor(5.1452, grad_fn=<AddBackward0>)


Training Net:   5%|███▌                                                               | 20/374 [00:05<01:36,  3.66it/s]

tensor(5.1947, grad_fn=<AddBackward0>)


Training Net:   6%|███▊                                                               | 21/374 [00:05<01:37,  3.63it/s]

tensor(5.1874, grad_fn=<AddBackward0>)


Training Net:   6%|███▉                                                               | 22/374 [00:05<01:38,  3.56it/s]

tensor(5.2341, grad_fn=<AddBackward0>)


Training Net:   6%|████                                                               | 23/374 [00:06<01:38,  3.56it/s]

tensor(5.2403, grad_fn=<AddBackward0>)


Training Net:   6%|████▎                                                              | 24/374 [00:06<01:34,  3.71it/s]

tensor(5.1538, grad_fn=<AddBackward0>)


Training Net:   7%|████▍                                                              | 25/374 [00:06<01:34,  3.69it/s]

tensor(5.1549, grad_fn=<AddBackward0>)


Training Net:   7%|████▋                                                              | 26/374 [00:06<01:34,  3.70it/s]

tensor(5.1863, grad_fn=<AddBackward0>)


Training Net:   7%|████▊                                                              | 27/374 [00:07<01:32,  3.74it/s]

tensor(5.1818, grad_fn=<AddBackward0>)


Training Net:   7%|█████                                                              | 28/374 [00:07<01:31,  3.78it/s]

tensor(5.1392, grad_fn=<AddBackward0>)


Training Net:   8%|█████▏                                                             | 29/374 [00:07<01:31,  3.76it/s]

tensor(5.1063, grad_fn=<AddBackward0>)


Training Net:   8%|█████▎                                                             | 30/374 [00:07<01:31,  3.75it/s]

tensor(5.0958, grad_fn=<AddBackward0>)


Training Net:   8%|█████▌                                                             | 31/374 [00:08<01:31,  3.76it/s]

tensor(5.1056, grad_fn=<AddBackward0>)


Training Net:   9%|█████▋                                                             | 32/374 [00:08<01:29,  3.81it/s]

tensor(5.1828, grad_fn=<AddBackward0>)


Training Net:   9%|█████▉                                                             | 33/374 [00:08<01:29,  3.81it/s]

tensor(5.1894, grad_fn=<AddBackward0>)


Training Net:   9%|██████                                                             | 34/374 [00:09<01:29,  3.78it/s]

tensor(5.1873, grad_fn=<AddBackward0>)


Training Net:   9%|██████▎                                                            | 35/374 [00:09<01:29,  3.78it/s]

tensor(5.0941, grad_fn=<AddBackward0>)


Training Net:  10%|██████▍                                                            | 36/374 [00:09<01:29,  3.79it/s]

tensor(5.1278, grad_fn=<AddBackward0>)


Training Net:  10%|██████▋                                                            | 37/374 [00:09<01:30,  3.73it/s]

tensor(5.1760, grad_fn=<AddBackward0>)


Training Net:  10%|██████▊                                                            | 38/374 [00:10<01:30,  3.72it/s]

tensor(5.1831, grad_fn=<AddBackward0>)


Training Net:  10%|██████▉                                                            | 39/374 [00:10<01:30,  3.69it/s]

tensor(5.1962, grad_fn=<AddBackward0>)


Training Net:  11%|███████▏                                                           | 40/374 [00:10<01:30,  3.71it/s]

tensor(5.1707, grad_fn=<AddBackward0>)


Training Net:  11%|███████▎                                                           | 41/374 [00:10<01:28,  3.76it/s]

tensor(5.1722, grad_fn=<AddBackward0>)


Training Net:  11%|███████▌                                                           | 42/374 [00:11<01:29,  3.70it/s]

tensor(5.0956, grad_fn=<AddBackward0>)


Training Net:  11%|███████▋                                                           | 43/374 [00:11<01:26,  3.84it/s]

tensor(5.1870, grad_fn=<AddBackward0>)


Training Net:  12%|███████▉                                                           | 44/374 [00:11<01:24,  3.93it/s]

tensor(5.1617, grad_fn=<AddBackward0>)


Training Net:  12%|████████                                                           | 45/374 [00:11<01:21,  4.02it/s]

tensor(5.1796, grad_fn=<AddBackward0>)


Training Net:  12%|████████▏                                                          | 46/374 [00:12<01:18,  4.18it/s]

tensor(5.1860, grad_fn=<AddBackward0>)


Training Net:  13%|████████▍                                                          | 47/374 [00:12<01:22,  3.97it/s]

tensor(5.0660, grad_fn=<AddBackward0>)


Training Net:  13%|████████▌                                                          | 48/374 [00:12<01:23,  3.89it/s]

tensor(5.1765, grad_fn=<AddBackward0>)


Training Net:  13%|████████▊                                                          | 49/374 [00:12<01:24,  3.84it/s]

tensor(5.2035, grad_fn=<AddBackward0>)


Training Net:  13%|████████▉                                                          | 50/374 [00:13<01:24,  3.85it/s]

tensor(5.1716, grad_fn=<AddBackward0>)


Training Net:  14%|█████████▏                                                         | 51/374 [00:13<01:23,  3.87it/s]

tensor(5.1778, grad_fn=<AddBackward0>)


Training Net:  14%|█████████▎                                                         | 52/374 [00:13<01:22,  3.89it/s]

tensor(5.1772, grad_fn=<AddBackward0>)


Training Net:  14%|█████████▍                                                         | 53/374 [00:13<01:21,  3.92it/s]

tensor(5.1725, grad_fn=<AddBackward0>)


Training Net:  14%|█████████▋                                                         | 54/374 [00:14<01:21,  3.95it/s]

tensor(5.1732, grad_fn=<AddBackward0>)


Training Net:  15%|█████████▊                                                         | 55/374 [00:14<01:19,  4.02it/s]

tensor(5.1081, grad_fn=<AddBackward0>)


Training Net:  15%|██████████                                                         | 56/374 [00:14<01:16,  4.14it/s]

tensor(5.1792, grad_fn=<AddBackward0>)


Training Net:  15%|██████████▏                                                        | 57/374 [00:14<01:18,  4.03it/s]

tensor(5.1780, grad_fn=<AddBackward0>)


Training Net:  16%|██████████▍                                                        | 58/374 [00:15<01:20,  3.94it/s]

tensor(5.0978, grad_fn=<AddBackward0>)


Training Net:  16%|██████████▌                                                        | 59/374 [00:15<01:20,  3.90it/s]

tensor(5.0996, grad_fn=<AddBackward0>)


Training Net:  16%|██████████▋                                                        | 60/374 [00:15<01:21,  3.85it/s]

tensor(5.1505, grad_fn=<AddBackward0>)


Training Net:  16%|██████████▉                                                        | 61/374 [00:15<01:20,  3.91it/s]

tensor(5.1288, grad_fn=<AddBackward0>)


Training Net:  17%|███████████                                                        | 62/374 [00:16<01:20,  3.88it/s]

tensor(5.1743, grad_fn=<AddBackward0>)


Training Net:  17%|███████████▎                                                       | 63/374 [00:16<01:18,  3.96it/s]

tensor(5.1684, grad_fn=<AddBackward0>)


Training Net:  17%|███████████▍                                                       | 64/374 [00:16<01:17,  3.99it/s]

tensor(5.1596, grad_fn=<AddBackward0>)


Training Net:  17%|███████████▋                                                       | 65/374 [00:16<01:16,  4.05it/s]

tensor(5.1777, grad_fn=<AddBackward0>)


Training Net:  18%|███████████▊                                                       | 66/374 [00:17<01:17,  3.96it/s]

tensor(5.1682, grad_fn=<AddBackward0>)


Training Net:  18%|████████████                                                       | 67/374 [00:17<01:17,  3.94it/s]

tensor(5.1938, grad_fn=<AddBackward0>)


Training Net:  18%|████████████▏                                                      | 68/374 [00:17<01:19,  3.83it/s]

tensor(5.1018, grad_fn=<AddBackward0>)


Training Net:  18%|████████████▎                                                      | 69/374 [00:18<01:19,  3.86it/s]

tensor(5.2015, grad_fn=<AddBackward0>)


Training Net:  19%|████████████▌                                                      | 70/374 [00:18<01:17,  3.93it/s]

tensor(5.1247, grad_fn=<AddBackward0>)


Training Net:  19%|████████████▋                                                      | 71/374 [00:18<01:20,  3.78it/s]

tensor(5.1690, grad_fn=<AddBackward0>)


Training Net:  19%|████████████▉                                                      | 72/374 [00:18<01:21,  3.70it/s]

tensor(5.1467, grad_fn=<AddBackward0>)


Training Net:  20%|█████████████                                                      | 73/374 [00:19<01:21,  3.68it/s]

tensor(5.1797, grad_fn=<AddBackward0>)


Training Net:  20%|█████████████▎                                                     | 74/374 [00:19<01:20,  3.73it/s]

tensor(5.1882, grad_fn=<AddBackward0>)


Training Net:  20%|█████████████▍                                                     | 75/374 [00:19<01:20,  3.71it/s]

tensor(5.1871, grad_fn=<AddBackward0>)


Training Net:  20%|█████████████▌                                                     | 76/374 [00:19<01:19,  3.75it/s]

tensor(5.1946, grad_fn=<AddBackward0>)


Training Net:  21%|█████████████▊                                                     | 77/374 [00:20<01:19,  3.74it/s]

tensor(5.2114, grad_fn=<AddBackward0>)


Training Net:  21%|█████████████▉                                                     | 78/374 [00:20<01:19,  3.71it/s]

tensor(5.1843, grad_fn=<AddBackward0>)


Training Net:  21%|██████████████▏                                                    | 79/374 [00:20<01:18,  3.74it/s]

tensor(5.1216, grad_fn=<AddBackward0>)


Training Net:  21%|██████████████▎                                                    | 80/374 [00:20<01:16,  3.86it/s]

tensor(5.1856, grad_fn=<AddBackward0>)


Training Net:  22%|██████████████▌                                                    | 81/374 [00:21<01:16,  3.85it/s]

tensor(5.0964, grad_fn=<AddBackward0>)


Training Net:  22%|██████████████▋                                                    | 82/374 [00:21<01:15,  3.85it/s]

tensor(5.1723, grad_fn=<AddBackward0>)


Training Net:  22%|██████████████▊                                                    | 83/374 [00:21<01:17,  3.77it/s]

tensor(5.1327, grad_fn=<AddBackward0>)


Training Net:  22%|███████████████                                                    | 84/374 [00:21<01:15,  3.85it/s]

tensor(5.1729, grad_fn=<AddBackward0>)


Training Net:  23%|███████████████▏                                                   | 85/374 [00:22<01:14,  3.87it/s]

tensor(5.1438, grad_fn=<AddBackward0>)


Training Net:  23%|███████████████▍                                                   | 86/374 [00:22<01:15,  3.79it/s]

tensor(5.0894, grad_fn=<AddBackward0>)


Training Net:  23%|███████████████▌                                                   | 87/374 [00:22<01:14,  3.83it/s]

tensor(5.1507, grad_fn=<AddBackward0>)


Training Net:  24%|███████████████▊                                                   | 88/374 [00:23<01:14,  3.83it/s]

tensor(5.1730, grad_fn=<AddBackward0>)


Training Net:  24%|███████████████▉                                                   | 89/374 [00:23<01:14,  3.83it/s]

tensor(5.0982, grad_fn=<AddBackward0>)


Training Net:  24%|████████████████                                                   | 90/374 [00:23<01:13,  3.85it/s]

tensor(5.0972, grad_fn=<AddBackward0>)


Training Net:  24%|████████████████▎                                                  | 91/374 [00:23<01:14,  3.80it/s]

tensor(5.1737, grad_fn=<AddBackward0>)


Training Net:  25%|████████████████▍                                                  | 92/374 [00:24<01:13,  3.84it/s]

tensor(5.0381, grad_fn=<AddBackward0>)


Training Net:  25%|████████████████▋                                                  | 93/374 [00:24<01:13,  3.80it/s]

tensor(5.1751, grad_fn=<AddBackward0>)


Training Net:  25%|████████████████▊                                                  | 94/374 [00:24<01:13,  3.79it/s]

tensor(5.1918, grad_fn=<AddBackward0>)


Training Net:  25%|█████████████████                                                  | 95/374 [00:24<01:15,  3.68it/s]

tensor(5.1860, grad_fn=<AddBackward0>)


Training Net:  26%|█████████████████▏                                                 | 96/374 [00:25<01:17,  3.60it/s]

tensor(5.1687, grad_fn=<AddBackward0>)


Training Net:  26%|█████████████████▍                                                 | 97/374 [00:25<01:17,  3.57it/s]

tensor(5.1784, grad_fn=<AddBackward0>)


Training Net:  26%|█████████████████▌                                                 | 98/374 [00:25<01:16,  3.59it/s]

tensor(5.1784, grad_fn=<AddBackward0>)


Training Net:  26%|█████████████████▋                                                 | 99/374 [00:26<01:17,  3.57it/s]

tensor(5.1664, grad_fn=<AddBackward0>)


Training Net:  27%|█████████████████▋                                                | 100/374 [00:26<01:17,  3.54it/s]

tensor(5.1715, grad_fn=<AddBackward0>)


Training Net:  27%|█████████████████▊                                                | 101/374 [00:26<01:17,  3.52it/s]

tensor(5.1709, grad_fn=<AddBackward0>)


Training Net:  27%|██████████████████                                                | 102/374 [00:26<01:18,  3.48it/s]

tensor(5.1763, grad_fn=<AddBackward0>)


Training Net:  28%|██████████████████▏                                               | 103/374 [00:27<01:16,  3.54it/s]

tensor(5.1674, grad_fn=<AddBackward0>)


Training Net:  28%|██████████████████▎                                               | 104/374 [00:27<01:16,  3.51it/s]

tensor(5.1687, grad_fn=<AddBackward0>)


Training Net:  28%|██████████████████▌                                               | 105/374 [00:27<01:16,  3.52it/s]

tensor(5.1609, grad_fn=<AddBackward0>)


Training Net:  28%|██████████████████▋                                               | 106/374 [00:28<01:15,  3.57it/s]

tensor(5.1420, grad_fn=<AddBackward0>)


Training Net:  29%|██████████████████▉                                               | 107/374 [00:28<01:14,  3.58it/s]

tensor(5.1803, grad_fn=<AddBackward0>)


Training Net:  29%|███████████████████                                               | 108/374 [00:28<01:14,  3.58it/s]

tensor(5.1659, grad_fn=<AddBackward0>)


Training Net:  29%|███████████████████▏                                              | 109/374 [00:28<01:14,  3.57it/s]

tensor(5.0509, grad_fn=<AddBackward0>)


Training Net:  29%|███████████████████▍                                              | 110/374 [00:29<01:14,  3.55it/s]

tensor(5.1060, grad_fn=<AddBackward0>)


Training Net:  30%|███████████████████▌                                              | 111/374 [00:29<01:13,  3.57it/s]

tensor(5.0603, grad_fn=<AddBackward0>)


Training Net:  30%|███████████████████▊                                              | 112/374 [00:29<01:13,  3.56it/s]

tensor(5.1562, grad_fn=<AddBackward0>)


Training Net:  30%|███████████████████▉                                              | 113/374 [00:29<01:12,  3.60it/s]

tensor(5.1627, grad_fn=<AddBackward0>)


Training Net:  30%|████████████████████                                              | 114/374 [00:30<01:10,  3.67it/s]

tensor(5.0908, grad_fn=<AddBackward0>)


Training Net:  31%|████████████████████▎                                             | 115/374 [00:30<01:09,  3.71it/s]

tensor(5.1894, grad_fn=<AddBackward0>)


Training Net:  31%|████████████████████▍                                             | 116/374 [00:30<01:09,  3.71it/s]

tensor(5.1953, grad_fn=<AddBackward0>)


Training Net:  31%|████████████████████▋                                             | 117/374 [00:31<01:11,  3.62it/s]

tensor(5.1421, grad_fn=<AddBackward0>)


Training Net:  32%|████████████████████▊                                             | 118/374 [00:31<01:10,  3.61it/s]

tensor(5.0845, grad_fn=<AddBackward0>)


Training Net:  32%|█████████████████████                                             | 119/374 [00:31<01:10,  3.62it/s]

tensor(5.1768, grad_fn=<AddBackward0>)


Training Net:  32%|█████████████████████▏                                            | 120/374 [00:31<01:10,  3.62it/s]

tensor(5.0974, grad_fn=<AddBackward0>)


Training Net:  32%|█████████████████████▎                                            | 121/374 [00:32<01:09,  3.66it/s]

tensor(5.0778, grad_fn=<AddBackward0>)


Training Net:  33%|█████████████████████▌                                            | 122/374 [00:32<01:07,  3.71it/s]

tensor(5.1539, grad_fn=<AddBackward0>)


Training Net:  33%|█████████████████████▋                                            | 123/374 [00:32<01:07,  3.73it/s]

tensor(5.0872, grad_fn=<AddBackward0>)


Training Net:  33%|█████████████████████▉                                            | 124/374 [00:32<01:08,  3.63it/s]

tensor(5.1698, grad_fn=<AddBackward0>)


Training Net:  33%|██████████████████████                                            | 125/374 [00:33<01:08,  3.63it/s]

tensor(5.1175, grad_fn=<AddBackward0>)


Training Net:  34%|██████████████████████▏                                           | 126/374 [00:33<01:08,  3.64it/s]

tensor(5.1701, grad_fn=<AddBackward0>)


Training Net:  34%|██████████████████████▍                                           | 127/374 [00:33<01:07,  3.67it/s]

tensor(5.0442, grad_fn=<AddBackward0>)


Training Net:  34%|██████████████████████▌                                           | 128/374 [00:34<01:07,  3.66it/s]

tensor(5.0874, grad_fn=<AddBackward0>)


Training Net:  34%|██████████████████████▊                                           | 129/374 [00:34<01:06,  3.66it/s]

tensor(5.1839, grad_fn=<AddBackward0>)


Training Net:  35%|██████████████████████▉                                           | 130/374 [00:34<01:07,  3.64it/s]

tensor(5.1793, grad_fn=<AddBackward0>)


Training Net:  35%|███████████████████████                                           | 131/374 [00:34<01:06,  3.65it/s]

tensor(5.0999, grad_fn=<AddBackward0>)


Training Net:  35%|███████████████████████▎                                          | 132/374 [00:35<01:07,  3.60it/s]

tensor(5.1218, grad_fn=<AddBackward0>)


Training Net:  36%|███████████████████████▍                                          | 133/374 [00:35<01:07,  3.58it/s]

tensor(5.1799, grad_fn=<AddBackward0>)


Training Net:  36%|███████████████████████▋                                          | 134/374 [00:35<01:06,  3.61it/s]

tensor(5.1530, grad_fn=<AddBackward0>)


Training Net:  36%|███████████████████████▊                                          | 135/374 [00:36<01:06,  3.60it/s]

tensor(5.1046, grad_fn=<AddBackward0>)


Training Net:  36%|████████████████████████                                          | 136/374 [00:36<01:07,  3.52it/s]

tensor(5.1458, grad_fn=<AddBackward0>)


Training Net:  37%|████████████████████████▏                                         | 137/374 [00:36<01:05,  3.64it/s]

tensor(5.1730, grad_fn=<AddBackward0>)


Training Net:  37%|████████████████████████▎                                         | 138/374 [00:36<01:04,  3.64it/s]

tensor(4.9869, grad_fn=<AddBackward0>)


Training Net:  37%|████████████████████████▌                                         | 139/374 [00:37<01:03,  3.71it/s]

tensor(5.1382, grad_fn=<AddBackward0>)


Training Net:  37%|████████████████████████▋                                         | 140/374 [00:37<01:02,  3.74it/s]

tensor(5.1634, grad_fn=<AddBackward0>)


Training Net:  38%|████████████████████████▉                                         | 141/374 [00:37<01:01,  3.81it/s]

tensor(5.1841, grad_fn=<AddBackward0>)


Training Net:  38%|█████████████████████████                                         | 142/374 [00:37<01:00,  3.83it/s]

tensor(5.1786, grad_fn=<AddBackward0>)


Training Net:  38%|█████████████████████████▏                                        | 143/374 [00:38<01:00,  3.82it/s]

tensor(5.0655, grad_fn=<AddBackward0>)


Training Net:  39%|█████████████████████████▍                                        | 144/374 [00:38<01:01,  3.71it/s]

tensor(5.1750, grad_fn=<AddBackward0>)


Training Net:  39%|█████████████████████████▌                                        | 145/374 [00:38<01:02,  3.65it/s]

tensor(5.1886, grad_fn=<AddBackward0>)


Training Net:  39%|█████████████████████████▊                                        | 146/374 [00:39<01:03,  3.58it/s]

tensor(5.0708, grad_fn=<AddBackward0>)


Training Net:  39%|█████████████████████████▉                                        | 147/374 [00:39<01:03,  3.58it/s]

tensor(5.1272, grad_fn=<AddBackward0>)


Training Net:  40%|██████████████████████████                                        | 148/374 [00:39<01:03,  3.58it/s]

tensor(5.1254, grad_fn=<AddBackward0>)


Training Net:  40%|██████████████████████████▎                                       | 149/374 [00:39<01:02,  3.58it/s]

tensor(5.1757, grad_fn=<AddBackward0>)


Training Net:  40%|██████████████████████████▍                                       | 150/374 [00:40<01:02,  3.61it/s]

tensor(5.1217, grad_fn=<AddBackward0>)


Training Net:  40%|██████████████████████████▋                                       | 151/374 [00:40<01:01,  3.65it/s]

tensor(5.2083, grad_fn=<AddBackward0>)


Training Net:  41%|██████████████████████████▊                                       | 152/374 [00:40<01:00,  3.68it/s]

tensor(5.1508, grad_fn=<AddBackward0>)


Training Net:  41%|███████████████████████████                                       | 153/374 [00:40<01:00,  3.68it/s]

tensor(5.1758, grad_fn=<AddBackward0>)


Training Net:  41%|███████████████████████████▏                                      | 154/374 [00:41<00:58,  3.75it/s]

tensor(5.1757, grad_fn=<AddBackward0>)


Training Net:  41%|███████████████████████████▎                                      | 155/374 [00:41<00:58,  3.72it/s]

tensor(5.1342, grad_fn=<AddBackward0>)


Training Net:  42%|███████████████████████████▌                                      | 156/374 [00:41<00:58,  3.72it/s]

tensor(5.0524, grad_fn=<AddBackward0>)


Training Net:  42%|███████████████████████████▋                                      | 157/374 [00:41<00:56,  3.84it/s]

tensor(5.1830, grad_fn=<AddBackward0>)


Training Net:  42%|███████████████████████████▉                                      | 158/374 [00:42<00:56,  3.83it/s]

tensor(5.1533, grad_fn=<AddBackward0>)


Training Net:  43%|████████████████████████████                                      | 159/374 [00:42<00:57,  3.75it/s]

tensor(5.0649, grad_fn=<AddBackward0>)


Training Net:  43%|████████████████████████████▏                                     | 160/374 [00:42<00:58,  3.66it/s]

tensor(5.2088, grad_fn=<AddBackward0>)


Training Net:  43%|████████████████████████████▍                                     | 161/374 [00:43<00:56,  3.74it/s]

tensor(5.0583, grad_fn=<AddBackward0>)


Training Net:  43%|████████████████████████████▌                                     | 162/374 [00:43<00:57,  3.69it/s]

tensor(5.1617, grad_fn=<AddBackward0>)


Training Net:  44%|████████████████████████████▊                                     | 163/374 [00:43<00:57,  3.68it/s]

tensor(5.1924, grad_fn=<AddBackward0>)


Training Net:  44%|████████████████████████████▉                                     | 164/374 [00:43<00:57,  3.66it/s]

tensor(5.1725, grad_fn=<AddBackward0>)


Training Net:  44%|█████████████████████████████                                     | 165/374 [00:44<00:56,  3.71it/s]

tensor(5.1775, grad_fn=<AddBackward0>)


Training Net:  44%|█████████████████████████████▎                                    | 166/374 [00:44<00:56,  3.69it/s]

tensor(5.1703, grad_fn=<AddBackward0>)


Training Net:  45%|█████████████████████████████▍                                    | 167/374 [00:44<00:57,  3.61it/s]

tensor(5.1738, grad_fn=<AddBackward0>)


Training Net:  45%|█████████████████████████████▋                                    | 168/374 [00:44<00:56,  3.62it/s]

tensor(5.1971, grad_fn=<AddBackward0>)


Training Net:  45%|█████████████████████████████▊                                    | 169/374 [00:45<00:57,  3.60it/s]

tensor(5.1713, grad_fn=<AddBackward0>)


Training Net:  45%|██████████████████████████████                                    | 170/374 [00:45<00:56,  3.60it/s]

tensor(5.0860, grad_fn=<AddBackward0>)


Training Net:  46%|██████████████████████████████▏                                   | 171/374 [00:45<00:57,  3.55it/s]

tensor(5.1318, grad_fn=<AddBackward0>)


Training Net:  46%|██████████████████████████████▎                                   | 172/374 [00:46<00:56,  3.59it/s]

tensor(5.1238, grad_fn=<AddBackward0>)


Training Net:  46%|██████████████████████████████▌                                   | 173/374 [00:46<00:55,  3.61it/s]

tensor(5.1339, grad_fn=<AddBackward0>)


Training Net:  47%|██████████████████████████████▋                                   | 174/374 [00:46<00:55,  3.62it/s]

tensor(5.1073, grad_fn=<AddBackward0>)


Training Net:  47%|██████████████████████████████▉                                   | 175/374 [00:46<00:55,  3.59it/s]

tensor(5.1843, grad_fn=<AddBackward0>)


Training Net:  47%|███████████████████████████████                                   | 176/374 [00:47<00:55,  3.57it/s]

tensor(5.1836, grad_fn=<AddBackward0>)


Training Net:  47%|███████████████████████████████▏                                  | 177/374 [00:47<00:54,  3.60it/s]

tensor(5.1135, grad_fn=<AddBackward0>)


Training Net:  48%|███████████████████████████████▍                                  | 178/374 [00:47<00:54,  3.57it/s]

tensor(5.1834, grad_fn=<AddBackward0>)


Training Net:  48%|███████████████████████████████▌                                  | 179/374 [00:48<00:54,  3.55it/s]

tensor(5.1519, grad_fn=<AddBackward0>)


Training Net:  48%|███████████████████████████████▊                                  | 180/374 [00:48<00:54,  3.58it/s]

tensor(5.1840, grad_fn=<AddBackward0>)


Training Net:  48%|███████████████████████████████▉                                  | 181/374 [00:48<00:54,  3.54it/s]

tensor(5.1110, grad_fn=<AddBackward0>)


Training Net:  49%|████████████████████████████████                                  | 182/374 [00:48<00:54,  3.55it/s]

tensor(5.1844, grad_fn=<AddBackward0>)


Training Net:  49%|████████████████████████████████▎                                 | 183/374 [00:49<00:54,  3.51it/s]

tensor(5.1376, grad_fn=<AddBackward0>)


Training Net:  49%|████████████████████████████████▍                                 | 184/374 [00:49<00:52,  3.59it/s]

tensor(5.1689, grad_fn=<AddBackward0>)


Training Net:  49%|████████████████████████████████▋                                 | 185/374 [00:49<00:52,  3.58it/s]

tensor(5.1750, grad_fn=<AddBackward0>)


Training Net:  50%|████████████████████████████████▊                                 | 186/374 [00:50<00:52,  3.56it/s]

tensor(5.1662, grad_fn=<AddBackward0>)


Training Net:  50%|█████████████████████████████████                                 | 187/374 [00:50<00:52,  3.58it/s]

tensor(5.1923, grad_fn=<AddBackward0>)


Training Net:  50%|█████████████████████████████████▏                                | 188/374 [00:50<00:52,  3.52it/s]

tensor(5.1378, grad_fn=<AddBackward0>)


Training Net:  51%|█████████████████████████████████▎                                | 189/374 [00:50<00:52,  3.51it/s]

tensor(5.1794, grad_fn=<AddBackward0>)


Training Net:  51%|█████████████████████████████████▌                                | 190/374 [00:51<00:52,  3.51it/s]

tensor(5.1884, grad_fn=<AddBackward0>)


Training Net:  51%|█████████████████████████████████▋                                | 191/374 [00:51<00:50,  3.61it/s]

tensor(5.1818, grad_fn=<AddBackward0>)


Training Net:  51%|█████████████████████████████████▉                                | 192/374 [00:51<00:50,  3.58it/s]

tensor(5.1863, grad_fn=<AddBackward0>)


Training Net:  52%|██████████████████████████████████                                | 193/374 [00:51<00:50,  3.56it/s]

tensor(5.1105, grad_fn=<AddBackward0>)


Training Net:  52%|██████████████████████████████████▏                               | 194/374 [00:52<00:49,  3.63it/s]

tensor(5.1746, grad_fn=<AddBackward0>)


Training Net:  52%|██████████████████████████████████▍                               | 195/374 [00:52<00:48,  3.71it/s]

tensor(5.1717, grad_fn=<AddBackward0>)


Training Net:  52%|██████████████████████████████████▌                               | 196/374 [00:52<00:48,  3.65it/s]

tensor(5.1759, grad_fn=<AddBackward0>)


Training Net:  53%|██████████████████████████████████▊                               | 197/374 [00:53<00:48,  3.64it/s]

tensor(5.1740, grad_fn=<AddBackward0>)


Training Net:  53%|██████████████████████████████████▉                               | 198/374 [00:53<00:47,  3.69it/s]

tensor(5.1104, grad_fn=<AddBackward0>)


Training Net:  53%|███████████████████████████████████                               | 199/374 [00:53<00:49,  3.56it/s]

tensor(5.1289, grad_fn=<AddBackward0>)


Training Net:  53%|███████████████████████████████████▎                              | 200/374 [00:53<00:49,  3.53it/s]

tensor(5.1241, grad_fn=<AddBackward0>)


Training Net:  54%|███████████████████████████████████▍                              | 201/374 [00:54<00:48,  3.53it/s]

tensor(5.1133, grad_fn=<AddBackward0>)


Training Net:  54%|███████████████████████████████████▋                              | 202/374 [00:54<00:48,  3.52it/s]

tensor(5.1874, grad_fn=<AddBackward0>)


Training Net:  54%|███████████████████████████████████▊                              | 203/374 [00:54<00:50,  3.40it/s]

tensor(5.0434, grad_fn=<AddBackward0>)


Training Net:  55%|████████████████████████████████████                              | 204/374 [00:55<00:53,  3.20it/s]

tensor(5.1751, grad_fn=<AddBackward0>)


Training Net:  55%|████████████████████████████████████▏                             | 205/374 [00:55<00:52,  3.23it/s]

tensor(5.1730, grad_fn=<AddBackward0>)


Training Net:  55%|████████████████████████████████████▎                             | 206/374 [00:55<00:51,  3.27it/s]

tensor(5.1904, grad_fn=<AddBackward0>)


Training Net:  55%|████████████████████████████████████▌                             | 207/374 [00:56<00:50,  3.32it/s]

tensor(5.1918, grad_fn=<AddBackward0>)


Training Net:  56%|████████████████████████████████████▋                             | 208/374 [00:56<00:49,  3.33it/s]

tensor(5.1892, grad_fn=<AddBackward0>)


Training Net:  56%|████████████████████████████████████▉                             | 209/374 [00:56<00:49,  3.34it/s]

tensor(5.1108, grad_fn=<AddBackward0>)


Training Net:  56%|█████████████████████████████████████                             | 210/374 [00:56<00:49,  3.34it/s]

tensor(5.1805, grad_fn=<AddBackward0>)


Training Net:  56%|█████████████████████████████████████▏                            | 211/374 [00:57<00:49,  3.31it/s]

tensor(5.1630, grad_fn=<AddBackward0>)


Training Net:  57%|█████████████████████████████████████▍                            | 212/374 [00:57<00:48,  3.31it/s]

tensor(5.1708, grad_fn=<AddBackward0>)


Training Net:  57%|█████████████████████████████████████▌                            | 213/374 [00:57<00:48,  3.34it/s]

tensor(5.1134, grad_fn=<AddBackward0>)


Training Net:  57%|█████████████████████████████████████▊                            | 214/374 [00:58<00:48,  3.33it/s]

tensor(5.2428, grad_fn=<AddBackward0>)


Training Net:  57%|█████████████████████████████████████▉                            | 215/374 [00:58<00:47,  3.32it/s]

tensor(5.1788, grad_fn=<AddBackward0>)


Training Net:  58%|██████████████████████████████████████                            | 216/374 [00:58<00:47,  3.32it/s]

tensor(5.1842, grad_fn=<AddBackward0>)


Training Net:  58%|██████████████████████████████████████▎                           | 217/374 [00:59<00:48,  3.27it/s]

tensor(5.1858, grad_fn=<AddBackward0>)


Training Net:  58%|██████████████████████████████████████▍                           | 218/374 [00:59<00:46,  3.34it/s]

tensor(5.0836, grad_fn=<AddBackward0>)


Training Net:  59%|██████████████████████████████████████▋                           | 219/374 [00:59<00:46,  3.31it/s]

tensor(5.1454, grad_fn=<AddBackward0>)


Training Net:  59%|██████████████████████████████████████▊                           | 220/374 [00:59<00:46,  3.34it/s]

tensor(5.1910, grad_fn=<AddBackward0>)


Training Net:  59%|███████████████████████████████████████                           | 221/374 [01:00<00:46,  3.32it/s]

tensor(5.1556, grad_fn=<AddBackward0>)


Training Net:  59%|███████████████████████████████████████▏                          | 222/374 [01:00<00:46,  3.28it/s]

tensor(5.1872, grad_fn=<AddBackward0>)


Training Net:  60%|███████████████████████████████████████▎                          | 223/374 [01:00<00:45,  3.30it/s]

tensor(5.1116, grad_fn=<AddBackward0>)


Training Net:  60%|███████████████████████████████████████▌                          | 224/374 [01:01<00:45,  3.32it/s]

tensor(5.1624, grad_fn=<AddBackward0>)


Training Net:  60%|███████████████████████████████████████▋                          | 225/374 [01:01<00:44,  3.33it/s]

tensor(5.0547, grad_fn=<AddBackward0>)


Training Net:  60%|███████████████████████████████████████▉                          | 226/374 [01:01<00:44,  3.34it/s]

tensor(5.1871, grad_fn=<AddBackward0>)


Training Net:  61%|████████████████████████████████████████                          | 227/374 [01:02<00:44,  3.33it/s]

tensor(5.1186, grad_fn=<AddBackward0>)


Training Net:  61%|████████████████████████████████████████▏                         | 228/374 [01:02<00:43,  3.35it/s]

tensor(5.1634, grad_fn=<AddBackward0>)


Training Net:  61%|████████████████████████████████████████▍                         | 229/374 [01:02<00:44,  3.29it/s]

tensor(5.1867, grad_fn=<AddBackward0>)


Training Net:  61%|████████████████████████████████████████▌                         | 230/374 [01:02<00:43,  3.28it/s]

tensor(5.1842, grad_fn=<AddBackward0>)


Training Net:  62%|████████████████████████████████████████▊                         | 231/374 [01:03<00:43,  3.32it/s]

tensor(5.1739, grad_fn=<AddBackward0>)


Training Net:  62%|████████████████████████████████████████▉                         | 232/374 [01:03<00:42,  3.35it/s]

tensor(5.0766, grad_fn=<AddBackward0>)


Training Net:  62%|█████████████████████████████████████████                         | 233/374 [01:03<00:41,  3.39it/s]

tensor(5.1860, grad_fn=<AddBackward0>)


Training Net:  63%|█████████████████████████████████████████▎                        | 234/374 [01:04<00:41,  3.36it/s]

tensor(5.1072, grad_fn=<AddBackward0>)


Training Net:  63%|█████████████████████████████████████████▍                        | 235/374 [01:04<00:41,  3.34it/s]

tensor(5.0428, grad_fn=<AddBackward0>)


Training Net:  63%|█████████████████████████████████████████▋                        | 236/374 [01:04<00:43,  3.20it/s]

tensor(5.1027, grad_fn=<AddBackward0>)


Training Net:  63%|█████████████████████████████████████████▊                        | 237/374 [01:05<00:43,  3.16it/s]

tensor(5.1240, grad_fn=<AddBackward0>)


Training Net:  64%|██████████████████████████████████████████                        | 238/374 [01:05<00:42,  3.20it/s]

tensor(5.1810, grad_fn=<AddBackward0>)


Training Net:  64%|██████████████████████████████████████████▏                       | 239/374 [01:05<00:41,  3.23it/s]

tensor(5.1737, grad_fn=<AddBackward0>)


Training Net:  64%|██████████████████████████████████████████▎                       | 240/374 [01:06<00:41,  3.25it/s]

tensor(5.1185, grad_fn=<AddBackward0>)


Training Net:  64%|██████████████████████████████████████████▌                       | 241/374 [01:06<00:41,  3.23it/s]

tensor(5.1542, grad_fn=<AddBackward0>)


Training Net:  65%|██████████████████████████████████████████▋                       | 242/374 [01:06<00:41,  3.20it/s]

tensor(5.1117, grad_fn=<AddBackward0>)


Training Net:  65%|██████████████████████████████████████████▉                       | 243/374 [01:06<00:40,  3.24it/s]

tensor(5.1147, grad_fn=<AddBackward0>)


Training Net:  65%|███████████████████████████████████████████                       | 244/374 [01:07<00:40,  3.20it/s]

tensor(5.1756, grad_fn=<AddBackward0>)


Training Net:  66%|███████████████████████████████████████████▏                      | 245/374 [01:07<00:40,  3.22it/s]

tensor(5.1315, grad_fn=<AddBackward0>)


Training Net:  66%|███████████████████████████████████████████▍                      | 246/374 [01:07<00:39,  3.23it/s]

tensor(5.1690, grad_fn=<AddBackward0>)


Training Net:  66%|███████████████████████████████████████████▌                      | 247/374 [01:08<00:39,  3.23it/s]

tensor(5.1876, grad_fn=<AddBackward0>)


Training Net:  66%|███████████████████████████████████████████▊                      | 248/374 [01:08<00:38,  3.24it/s]

tensor(5.1991, grad_fn=<AddBackward0>)


Training Net:  67%|███████████████████████████████████████████▉                      | 249/374 [01:08<00:38,  3.23it/s]

tensor(5.1707, grad_fn=<AddBackward0>)


Training Net:  67%|████████████████████████████████████████████                      | 250/374 [01:09<00:38,  3.24it/s]

tensor(5.1752, grad_fn=<AddBackward0>)


Training Net:  67%|████████████████████████████████████████████▎                     | 251/374 [01:09<00:37,  3.26it/s]

tensor(5.1847, grad_fn=<AddBackward0>)


Training Net:  67%|████████████████████████████████████████████▍                     | 252/374 [01:09<00:37,  3.29it/s]

tensor(5.0612, grad_fn=<AddBackward0>)


Training Net:  68%|████████████████████████████████████████████▋                     | 253/374 [01:10<00:36,  3.35it/s]

tensor(5.1842, grad_fn=<AddBackward0>)


Training Net:  68%|████████████████████████████████████████████▊                     | 254/374 [01:10<00:35,  3.42it/s]

tensor(5.1604, grad_fn=<AddBackward0>)


Training Net:  68%|█████████████████████████████████████████████                     | 255/374 [01:10<00:34,  3.41it/s]

tensor(5.1827, grad_fn=<AddBackward0>)


Training Net:  68%|█████████████████████████████████████████████▏                    | 256/374 [01:10<00:35,  3.36it/s]

tensor(5.1946, grad_fn=<AddBackward0>)


Training Net:  69%|█████████████████████████████████████████████▎                    | 257/374 [01:11<00:34,  3.35it/s]

tensor(5.1819, grad_fn=<AddBackward0>)


Training Net:  69%|█████████████████████████████████████████████▌                    | 258/374 [01:11<00:33,  3.43it/s]

tensor(5.1614, grad_fn=<AddBackward0>)


Training Net:  69%|█████████████████████████████████████████████▋                    | 259/374 [01:11<00:33,  3.48it/s]

tensor(5.1120, grad_fn=<AddBackward0>)


Training Net:  70%|█████████████████████████████████████████████▉                    | 260/374 [01:12<00:33,  3.45it/s]

tensor(5.1768, grad_fn=<AddBackward0>)


Training Net:  70%|██████████████████████████████████████████████                    | 261/374 [01:12<00:33,  3.39it/s]

tensor(5.1809, grad_fn=<AddBackward0>)


Training Net:  70%|██████████████████████████████████████████████▏                   | 262/374 [01:12<00:33,  3.30it/s]

tensor(5.0846, grad_fn=<AddBackward0>)


Training Net:  70%|██████████████████████████████████████████████▍                   | 263/374 [01:13<00:34,  3.20it/s]

tensor(5.1196, grad_fn=<AddBackward0>)


Training Net:  71%|██████████████████████████████████████████████▌                   | 264/374 [01:13<00:34,  3.18it/s]

tensor(5.1199, grad_fn=<AddBackward0>)


Training Net:  71%|██████████████████████████████████████████████▊                   | 265/374 [01:13<00:33,  3.24it/s]

tensor(5.1704, grad_fn=<AddBackward0>)


Training Net:  71%|██████████████████████████████████████████████▉                   | 266/374 [01:13<00:33,  3.23it/s]

tensor(5.1816, grad_fn=<AddBackward0>)


Training Net:  71%|███████████████████████████████████████████████                   | 267/374 [01:14<00:33,  3.23it/s]

tensor(5.1766, grad_fn=<AddBackward0>)


Training Net:  72%|███████████████████████████████████████████████▎                  | 268/374 [01:14<00:32,  3.22it/s]

tensor(5.1624, grad_fn=<AddBackward0>)


Training Net:  72%|███████████████████████████████████████████████▍                  | 269/374 [01:14<00:31,  3.28it/s]

tensor(5.1524, grad_fn=<AddBackward0>)


Training Net:  72%|███████████████████████████████████████████████▋                  | 270/374 [01:15<00:32,  3.22it/s]

tensor(5.1340, grad_fn=<AddBackward0>)


Training Net:  72%|███████████████████████████████████████████████▊                  | 271/374 [01:15<00:32,  3.21it/s]

tensor(5.1217, grad_fn=<AddBackward0>)


Training Net:  73%|████████████████████████████████████████████████                  | 272/374 [01:15<00:31,  3.22it/s]

tensor(5.1019, grad_fn=<AddBackward0>)


Training Net:  73%|████████████████████████████████████████████████▏                 | 273/374 [01:16<00:31,  3.23it/s]

tensor(5.1551, grad_fn=<AddBackward0>)


Training Net:  73%|████████████████████████████████████████████████▎                 | 274/374 [01:16<00:31,  3.21it/s]

tensor(5.1796, grad_fn=<AddBackward0>)


Training Net:  74%|████████████████████████████████████████████████▌                 | 275/374 [01:16<00:30,  3.22it/s]

tensor(5.0758, grad_fn=<AddBackward0>)


Training Net:  74%|████████████████████████████████████████████████▋                 | 276/374 [01:17<00:29,  3.29it/s]

tensor(5.1242, grad_fn=<AddBackward0>)


Training Net:  74%|████████████████████████████████████████████████▉                 | 277/374 [01:17<00:29,  3.29it/s]

tensor(5.1847, grad_fn=<AddBackward0>)


Training Net:  74%|█████████████████████████████████████████████████                 | 278/374 [01:17<00:29,  3.29it/s]

tensor(5.1674, grad_fn=<AddBackward0>)


Training Net:  75%|█████████████████████████████████████████████████▏                | 279/374 [01:17<00:28,  3.36it/s]

tensor(5.1197, grad_fn=<AddBackward0>)


Training Net:  75%|█████████████████████████████████████████████████▍                | 280/374 [01:18<00:28,  3.31it/s]

tensor(5.1811, grad_fn=<AddBackward0>)


Training Net:  75%|█████████████████████████████████████████████████▌                | 281/374 [01:18<00:27,  3.34it/s]

tensor(5.0776, grad_fn=<AddBackward0>)


Training Net:  75%|█████████████████████████████████████████████████▊                | 282/374 [01:18<00:27,  3.35it/s]

tensor(5.0902, grad_fn=<AddBackward0>)


Training Net:  76%|█████████████████████████████████████████████████▉                | 283/374 [01:19<00:26,  3.38it/s]

tensor(5.1719, grad_fn=<AddBackward0>)


Training Net:  76%|██████████████████████████████████████████████████                | 284/374 [01:19<00:27,  3.30it/s]

tensor(5.1431, grad_fn=<AddBackward0>)


Training Net:  76%|██████████████████████████████████████████████████▎               | 285/374 [01:19<00:26,  3.35it/s]

tensor(5.0772, grad_fn=<AddBackward0>)


Training Net:  76%|██████████████████████████████████████████████████▍               | 286/374 [01:20<00:26,  3.36it/s]

tensor(5.0545, grad_fn=<AddBackward0>)


Training Net:  77%|██████████████████████████████████████████████████▋               | 287/374 [01:20<00:25,  3.36it/s]

tensor(5.1742, grad_fn=<AddBackward0>)


Training Net:  77%|██████████████████████████████████████████████████▊               | 288/374 [01:20<00:25,  3.32it/s]

tensor(5.1249, grad_fn=<AddBackward0>)


Training Net:  77%|███████████████████████████████████████████████████               | 289/374 [01:20<00:25,  3.32it/s]

tensor(5.1785, grad_fn=<AddBackward0>)


Training Net:  78%|███████████████████████████████████████████████████▏              | 290/374 [01:21<00:26,  3.22it/s]

tensor(5.1688, grad_fn=<AddBackward0>)


Training Net:  78%|███████████████████████████████████████████████████▎              | 291/374 [01:21<00:25,  3.28it/s]

tensor(5.1683, grad_fn=<AddBackward0>)


Training Net:  78%|███████████████████████████████████████████████████▌              | 292/374 [01:21<00:24,  3.31it/s]

tensor(5.1768, grad_fn=<AddBackward0>)


Training Net:  78%|███████████████████████████████████████████████████▋              | 293/374 [01:22<00:23,  3.42it/s]

tensor(5.0974, grad_fn=<AddBackward0>)


Training Net:  79%|███████████████████████████████████████████████████▉              | 294/374 [01:22<00:23,  3.37it/s]

tensor(5.1729, grad_fn=<AddBackward0>)


Training Net:  79%|████████████████████████████████████████████████████              | 295/374 [01:22<00:24,  3.27it/s]

tensor(5.1610, grad_fn=<AddBackward0>)


Training Net:  79%|████████████████████████████████████████████████████▏             | 296/374 [01:23<00:23,  3.25it/s]

tensor(5.1801, grad_fn=<AddBackward0>)


Training Net:  79%|████████████████████████████████████████████████████▍             | 297/374 [01:23<00:23,  3.21it/s]

tensor(5.1707, grad_fn=<AddBackward0>)


Training Net:  80%|████████████████████████████████████████████████████▌             | 298/374 [01:23<00:23,  3.19it/s]

tensor(5.0950, grad_fn=<AddBackward0>)


Training Net:  80%|████████████████████████████████████████████████████▊             | 299/374 [01:24<00:23,  3.21it/s]

tensor(5.0669, grad_fn=<AddBackward0>)


Training Net:  80%|████████████████████████████████████████████████████▉             | 300/374 [01:24<00:23,  3.14it/s]

tensor(5.1787, grad_fn=<AddBackward0>)


Training Net:  80%|█████████████████████████████████████████████████████             | 301/374 [01:24<00:23,  3.16it/s]

tensor(5.1808, grad_fn=<AddBackward0>)


Training Net:  81%|█████████████████████████████████████████████████████▎            | 302/374 [01:24<00:22,  3.17it/s]

tensor(5.0893, grad_fn=<AddBackward0>)


Training Net:  81%|█████████████████████████████████████████████████████▍            | 303/374 [01:25<00:22,  3.18it/s]

tensor(5.1208, grad_fn=<AddBackward0>)


Training Net:  81%|█████████████████████████████████████████████████████▋            | 304/374 [01:25<00:21,  3.20it/s]

tensor(5.1223, grad_fn=<AddBackward0>)


Training Net:  82%|█████████████████████████████████████████████████████▊            | 305/374 [01:25<00:21,  3.18it/s]

tensor(5.1008, grad_fn=<AddBackward0>)


Training Net:  82%|██████████████████████████████████████████████████████            | 306/374 [01:26<00:21,  3.24it/s]

tensor(5.1770, grad_fn=<AddBackward0>)


Training Net:  82%|██████████████████████████████████████████████████████▏           | 307/374 [01:26<00:20,  3.28it/s]

tensor(5.1772, grad_fn=<AddBackward0>)


Training Net:  82%|██████████████████████████████████████████████████████▎           | 308/374 [01:26<00:19,  3.34it/s]

tensor(5.1052, grad_fn=<AddBackward0>)


Training Net:  83%|██████████████████████████████████████████████████████▌           | 309/374 [01:27<00:19,  3.33it/s]

tensor(5.0727, grad_fn=<AddBackward0>)


Training Net:  83%|██████████████████████████████████████████████████████▋           | 310/374 [01:27<00:19,  3.37it/s]

tensor(5.1792, grad_fn=<AddBackward0>)


Training Net:  83%|██████████████████████████████████████████████████████▉           | 311/374 [01:27<00:18,  3.40it/s]

tensor(5.0355, grad_fn=<AddBackward0>)


Training Net:  83%|███████████████████████████████████████████████████████           | 312/374 [01:27<00:18,  3.37it/s]

tensor(5.1827, grad_fn=<AddBackward0>)


Training Net:  84%|███████████████████████████████████████████████████████▏          | 313/374 [01:28<00:18,  3.31it/s]

tensor(5.1753, grad_fn=<AddBackward0>)


Training Net:  84%|███████████████████████████████████████████████████████▍          | 314/374 [01:28<00:18,  3.28it/s]

tensor(5.1621, grad_fn=<AddBackward0>)


Training Net:  84%|███████████████████████████████████████████████████████▌          | 315/374 [01:28<00:17,  3.30it/s]

tensor(5.1602, grad_fn=<AddBackward0>)


Training Net:  84%|███████████████████████████████████████████████████████▊          | 316/374 [01:29<00:17,  3.27it/s]

tensor(5.1707, grad_fn=<AddBackward0>)


Training Net:  85%|███████████████████████████████████████████████████████▉          | 317/374 [01:29<00:17,  3.21it/s]

tensor(5.1055, grad_fn=<AddBackward0>)


Training Net:  85%|████████████████████████████████████████████████████████          | 318/374 [01:29<00:18,  2.98it/s]

tensor(5.1741, grad_fn=<AddBackward0>)


Training Net:  85%|████████████████████████████████████████████████████████▎         | 319/374 [01:30<00:17,  3.09it/s]

tensor(5.1075, grad_fn=<AddBackward0>)


Training Net:  86%|████████████████████████████████████████████████████████▍         | 320/374 [01:30<00:16,  3.19it/s]

tensor(5.1774, grad_fn=<AddBackward0>)


Training Net:  86%|████████████████████████████████████████████████████████▋         | 321/374 [01:30<00:16,  3.26it/s]

tensor(5.1360, grad_fn=<AddBackward0>)


Training Net:  86%|████████████████████████████████████████████████████████▊         | 322/374 [01:31<00:15,  3.32it/s]

tensor(5.1786, grad_fn=<AddBackward0>)


Training Net:  86%|█████████████████████████████████████████████████████████         | 323/374 [01:31<00:14,  3.44it/s]

tensor(5.1169, grad_fn=<AddBackward0>)


Training Net:  87%|█████████████████████████████████████████████████████████▏        | 324/374 [01:31<00:14,  3.40it/s]

tensor(5.0990, grad_fn=<AddBackward0>)


Training Net:  87%|█████████████████████████████████████████████████████████▎        | 325/374 [01:31<00:14,  3.32it/s]

tensor(5.1688, grad_fn=<AddBackward0>)


Training Net:  87%|█████████████████████████████████████████████████████████▌        | 326/374 [01:32<00:14,  3.32it/s]

tensor(5.1500, grad_fn=<AddBackward0>)


Training Net:  87%|█████████████████████████████████████████████████████████▋        | 327/374 [01:32<00:14,  3.34it/s]

tensor(5.1265, grad_fn=<AddBackward0>)


Training Net:  88%|█████████████████████████████████████████████████████████▉        | 328/374 [01:32<00:13,  3.31it/s]

tensor(5.1710, grad_fn=<AddBackward0>)


Training Net:  88%|██████████████████████████████████████████████████████████        | 329/374 [01:33<00:13,  3.28it/s]

tensor(5.1618, grad_fn=<AddBackward0>)


Training Net:  88%|██████████████████████████████████████████████████████████▏       | 330/374 [01:33<00:13,  3.20it/s]

tensor(5.1435, grad_fn=<AddBackward0>)


Training Net:  89%|██████████████████████████████████████████████████████████▍       | 331/374 [01:33<00:13,  3.24it/s]

tensor(5.1395, grad_fn=<AddBackward0>)


Training Net:  89%|██████████████████████████████████████████████████████████▌       | 332/374 [01:34<00:13,  3.22it/s]

tensor(5.1097, grad_fn=<AddBackward0>)


Training Net:  89%|██████████████████████████████████████████████████████████▊       | 333/374 [01:34<00:12,  3.29it/s]

tensor(5.1358, grad_fn=<AddBackward0>)


Training Net:  89%|██████████████████████████████████████████████████████████▉       | 334/374 [01:34<00:12,  3.29it/s]

tensor(5.1470, grad_fn=<AddBackward0>)


Training Net:  90%|███████████████████████████████████████████████████████████       | 335/374 [01:35<00:11,  3.29it/s]

tensor(5.1324, grad_fn=<AddBackward0>)


Training Net:  90%|███████████████████████████████████████████████████████████▎      | 336/374 [01:35<00:11,  3.38it/s]

tensor(5.1725, grad_fn=<AddBackward0>)


Training Net:  90%|███████████████████████████████████████████████████████████▍      | 337/374 [01:35<00:10,  3.49it/s]

tensor(5.0549, grad_fn=<AddBackward0>)


Training Net:  90%|███████████████████████████████████████████████████████████▋      | 338/374 [01:35<00:10,  3.49it/s]

tensor(5.1698, grad_fn=<AddBackward0>)


Training Net:  91%|███████████████████████████████████████████████████████████▊      | 339/374 [01:36<00:10,  3.41it/s]

tensor(5.1210, grad_fn=<AddBackward0>)


Training Net:  91%|████████████████████████████████████████████████████████████      | 340/374 [01:36<00:10,  3.36it/s]

tensor(5.1602, grad_fn=<AddBackward0>)


Training Net:  91%|████████████████████████████████████████████████████████████▏     | 341/374 [01:36<00:09,  3.37it/s]

tensor(5.1650, grad_fn=<AddBackward0>)


Training Net:  91%|████████████████████████████████████████████████████████████▎     | 342/374 [01:37<00:09,  3.30it/s]

tensor(5.1627, grad_fn=<AddBackward0>)


Training Net:  92%|████████████████████████████████████████████████████████████▌     | 343/374 [01:37<00:09,  3.26it/s]

tensor(5.0844, grad_fn=<AddBackward0>)


Training Net:  92%|████████████████████████████████████████████████████████████▋     | 344/374 [01:37<00:09,  3.29it/s]

tensor(5.1603, grad_fn=<AddBackward0>)


Training Net:  92%|████████████████████████████████████████████████████████████▉     | 345/374 [01:38<00:08,  3.30it/s]

tensor(5.1478, grad_fn=<AddBackward0>)


Training Net:  93%|█████████████████████████████████████████████████████████████     | 346/374 [01:38<00:08,  3.35it/s]

tensor(5.1651, grad_fn=<AddBackward0>)


Training Net:  93%|█████████████████████████████████████████████████████████████▏    | 347/374 [01:38<00:08,  3.32it/s]

tensor(5.0501, grad_fn=<AddBackward0>)


Training Net:  93%|█████████████████████████████████████████████████████████████▍    | 348/374 [01:38<00:07,  3.30it/s]

tensor(5.1128, grad_fn=<AddBackward0>)


Training Net:  93%|█████████████████████████████████████████████████████████████▌    | 349/374 [01:39<00:07,  3.23it/s]

tensor(5.1496, grad_fn=<AddBackward0>)


Training Net:  94%|█████████████████████████████████████████████████████████████▊    | 350/374 [01:39<00:07,  3.22it/s]

tensor(5.1116, grad_fn=<AddBackward0>)


Training Net:  94%|█████████████████████████████████████████████████████████████▉    | 351/374 [01:39<00:07,  3.18it/s]

tensor(5.1390, grad_fn=<AddBackward0>)


Training Net:  94%|██████████████████████████████████████████████████████████████    | 352/374 [01:40<00:06,  3.19it/s]

tensor(5.1155, grad_fn=<AddBackward0>)


Training Net:  94%|██████████████████████████████████████████████████████████████▎   | 353/374 [01:40<00:06,  3.18it/s]

tensor(5.1065, grad_fn=<AddBackward0>)


Training Net:  95%|██████████████████████████████████████████████████████████████▍   | 354/374 [01:40<00:06,  3.18it/s]

tensor(5.0919, grad_fn=<AddBackward0>)


Training Net:  95%|██████████████████████████████████████████████████████████████▋   | 355/374 [01:41<00:05,  3.17it/s]

tensor(5.1775, grad_fn=<AddBackward0>)


Training Net:  95%|██████████████████████████████████████████████████████████████▊   | 356/374 [01:41<00:05,  3.14it/s]

tensor(5.1680, grad_fn=<AddBackward0>)


Training Net:  95%|███████████████████████████████████████████████████████████████   | 357/374 [01:41<00:05,  3.15it/s]

tensor(5.1901, grad_fn=<AddBackward0>)


Training Net:  96%|███████████████████████████████████████████████████████████████▏  | 358/374 [01:42<00:05,  3.13it/s]

tensor(5.1165, grad_fn=<AddBackward0>)


Training Net:  96%|███████████████████████████████████████████████████████████████▎  | 359/374 [01:42<00:04,  3.12it/s]

tensor(5.1752, grad_fn=<AddBackward0>)


Training Net:  96%|███████████████████████████████████████████████████████████████▌  | 360/374 [01:42<00:04,  3.13it/s]

tensor(5.0868, grad_fn=<AddBackward0>)


Training Net:  97%|███████████████████████████████████████████████████████████████▋  | 361/374 [01:43<00:04,  3.10it/s]

tensor(5.1687, grad_fn=<AddBackward0>)


Training Net:  97%|███████████████████████████████████████████████████████████████▉  | 362/374 [01:43<00:03,  3.02it/s]

tensor(5.1652, grad_fn=<AddBackward0>)


Training Net:  97%|████████████████████████████████████████████████████████████████  | 363/374 [01:43<00:03,  3.04it/s]

tensor(5.1400, grad_fn=<AddBackward0>)


Training Net:  97%|████████████████████████████████████████████████████████████████▏ | 364/374 [01:44<00:03,  3.02it/s]

tensor(5.1675, grad_fn=<AddBackward0>)


Training Net:  98%|████████████████████████████████████████████████████████████████▍ | 365/374 [01:44<00:02,  3.09it/s]

tensor(5.1223, grad_fn=<AddBackward0>)


Training Net:  98%|████████████████████████████████████████████████████████████████▌ | 366/374 [01:44<00:02,  3.07it/s]

tensor(5.1184, grad_fn=<AddBackward0>)


Training Net:  98%|████████████████████████████████████████████████████████████████▊ | 367/374 [01:45<00:02,  3.06it/s]

tensor(5.1569, grad_fn=<AddBackward0>)


Training Net:  98%|████████████████████████████████████████████████████████████████▉ | 368/374 [01:45<00:01,  3.10it/s]

tensor(5.1744, grad_fn=<AddBackward0>)


Training Net:  99%|█████████████████████████████████████████████████████████████████ | 369/374 [01:45<00:01,  3.11it/s]

tensor(5.1670, grad_fn=<AddBackward0>)


Training Net:  99%|█████████████████████████████████████████████████████████████████▎| 370/374 [01:45<00:01,  3.13it/s]

tensor(5.1762, grad_fn=<AddBackward0>)


Training Net:  99%|█████████████████████████████████████████████████████████████████▍| 371/374 [01:46<00:00,  3.16it/s]

tensor(5.1377, grad_fn=<AddBackward0>)


Training Net:  99%|█████████████████████████████████████████████████████████████████▋| 372/374 [01:46<00:00,  3.26it/s]

tensor(5.1884, grad_fn=<AddBackward0>)


Training Net: 100%|█████████████████████████████████████████████████████████████████▊| 373/374 [01:46<00:00,  3.16it/s]

tensor(5.1760, grad_fn=<AddBackward0>)


Training Net: 100%|██████████████████████████████████████████████████████████████████| 374/374 [01:47<00:00,  3.49it/s]


tensor(5.1661, grad_fn=<AddBackward0>)


Training Net:   0%|▏                                                                   | 1/374 [00:00<01:59,  3.13it/s]

tensor(5.1683, grad_fn=<AddBackward0>)


Training Net:   1%|▎                                                                   | 2/374 [00:00<01:56,  3.18it/s]

tensor(5.1809, grad_fn=<AddBackward0>)


Training Net:   1%|▌                                                                   | 3/374 [00:00<01:57,  3.17it/s]

tensor(5.1831, grad_fn=<AddBackward0>)


Training Net:   1%|▋                                                                   | 4/374 [00:01<01:55,  3.20it/s]

tensor(5.0554, grad_fn=<AddBackward0>)


Training Net:   1%|▉                                                                   | 5/374 [00:01<01:52,  3.27it/s]

tensor(5.1695, grad_fn=<AddBackward0>)


Training Net:   2%|█                                                                   | 6/374 [00:01<01:55,  3.18it/s]

tensor(5.1420, grad_fn=<AddBackward0>)


Training Net:   2%|█▎                                                                  | 7/374 [00:02<01:56,  3.14it/s]

tensor(5.1671, grad_fn=<AddBackward0>)


Training Net:   2%|█▍                                                                  | 8/374 [00:02<01:56,  3.14it/s]

tensor(5.1094, grad_fn=<AddBackward0>)


Training Net:   2%|█▋                                                                  | 9/374 [00:02<01:56,  3.14it/s]

tensor(5.1659, grad_fn=<AddBackward0>)


Training Net:   3%|█▊                                                                 | 10/374 [00:03<01:56,  3.14it/s]

tensor(5.1365, grad_fn=<AddBackward0>)


Training Net:   3%|█▉                                                                 | 11/374 [00:03<01:55,  3.15it/s]

tensor(5.1938, grad_fn=<AddBackward0>)


Training Net:   3%|██▏                                                                | 12/374 [00:03<01:56,  3.10it/s]

tensor(5.0759, grad_fn=<AddBackward0>)


Training Net:   3%|██▎                                                                | 13/374 [00:04<01:57,  3.08it/s]

tensor(5.1208, grad_fn=<AddBackward0>)


Training Net:   4%|██▌                                                                | 14/374 [00:04<01:55,  3.12it/s]

tensor(5.1523, grad_fn=<AddBackward0>)


Training Net:   4%|██▋                                                                | 15/374 [00:04<01:53,  3.15it/s]

tensor(5.1801, grad_fn=<AddBackward0>)


Training Net:   4%|██▊                                                                | 16/374 [00:05<01:51,  3.22it/s]

tensor(5.1321, grad_fn=<AddBackward0>)


Training Net:   5%|███                                                                | 17/374 [00:05<01:52,  3.18it/s]

tensor(5.1637, grad_fn=<AddBackward0>)


Training Net:   5%|███▏                                                               | 18/374 [00:05<01:51,  3.20it/s]

tensor(5.1357, grad_fn=<AddBackward0>)


Training Net:   5%|███▍                                                               | 19/374 [00:06<01:56,  3.04it/s]

tensor(5.1137, grad_fn=<AddBackward0>)


Training Net:   5%|███▌                                                               | 20/374 [00:06<01:54,  3.08it/s]

tensor(5.1762, grad_fn=<AddBackward0>)


Training Net:   6%|███▊                                                               | 21/374 [00:06<01:58,  2.98it/s]

tensor(5.1847, grad_fn=<AddBackward0>)


Training Net:   6%|███▉                                                               | 22/374 [00:07<01:55,  3.06it/s]

tensor(5.1764, grad_fn=<AddBackward0>)


Training Net:   6%|████                                                               | 23/374 [00:07<01:57,  2.99it/s]

tensor(5.1473, grad_fn=<AddBackward0>)


Training Net:   6%|████▎                                                              | 24/374 [00:07<01:55,  3.02it/s]

tensor(5.1548, grad_fn=<AddBackward0>)


Training Net:   7%|████▍                                                              | 25/374 [00:08<01:55,  3.01it/s]

tensor(5.1861, grad_fn=<AddBackward0>)


Training Net:   7%|████▋                                                              | 26/374 [00:08<01:54,  3.04it/s]

tensor(5.1610, grad_fn=<AddBackward0>)


Training Net:   7%|████▊                                                              | 27/374 [00:08<01:51,  3.12it/s]

tensor(5.1442, grad_fn=<AddBackward0>)


Training Net:   7%|█████                                                              | 28/374 [00:09<01:53,  3.05it/s]

tensor(5.1756, grad_fn=<AddBackward0>)


Training Net:   8%|█████▏                                                             | 29/374 [00:09<01:54,  3.00it/s]

tensor(5.1451, grad_fn=<AddBackward0>)


Training Net:   8%|█████▎                                                             | 30/374 [00:09<01:57,  2.94it/s]

tensor(5.1286, grad_fn=<AddBackward0>)


Training Net:   8%|█████▌                                                             | 31/374 [00:10<01:57,  2.91it/s]

tensor(5.1353, grad_fn=<AddBackward0>)


Training Net:   9%|█████▋                                                             | 32/374 [00:10<01:54,  2.97it/s]

tensor(5.1434, grad_fn=<AddBackward0>)


Training Net:   9%|█████▉                                                             | 33/374 [00:10<01:54,  2.98it/s]

tensor(5.1677, grad_fn=<AddBackward0>)


Training Net:   9%|██████                                                             | 34/374 [00:11<01:53,  3.00it/s]

tensor(5.1443, grad_fn=<AddBackward0>)


Training Net:   9%|██████▎                                                            | 35/374 [00:11<01:51,  3.04it/s]

tensor(5.0329, grad_fn=<AddBackward0>)


Training Net:  10%|██████▍                                                            | 36/374 [00:11<01:48,  3.11it/s]

tensor(5.1867, grad_fn=<AddBackward0>)


Training Net:  10%|██████▋                                                            | 37/374 [00:12<01:51,  3.01it/s]

tensor(5.1873, grad_fn=<AddBackward0>)


Training Net:  10%|██████▊                                                            | 38/374 [00:12<01:50,  3.05it/s]

tensor(5.1791, grad_fn=<AddBackward0>)


Training Net:  10%|██████▉                                                            | 39/374 [00:12<01:48,  3.10it/s]

tensor(5.1701, grad_fn=<AddBackward0>)


Training Net:  11%|███████▏                                                           | 40/374 [00:12<01:45,  3.18it/s]

tensor(5.1273, grad_fn=<AddBackward0>)


Training Net:  11%|███████▎                                                           | 41/374 [00:13<01:48,  3.06it/s]

tensor(5.1642, grad_fn=<AddBackward0>)


Training Net:  11%|███████▌                                                           | 42/374 [00:13<01:48,  3.05it/s]

tensor(5.1670, grad_fn=<AddBackward0>)


Training Net:  11%|███████▋                                                           | 43/374 [00:13<01:45,  3.12it/s]

tensor(5.1569, grad_fn=<AddBackward0>)


Training Net:  12%|███████▉                                                           | 44/374 [00:14<01:44,  3.15it/s]

tensor(5.1784, grad_fn=<AddBackward0>)


Training Net:  12%|████████                                                           | 45/374 [00:14<01:43,  3.16it/s]

tensor(5.1426, grad_fn=<AddBackward0>)


Training Net:  12%|████████▏                                                          | 46/374 [00:14<01:46,  3.08it/s]

tensor(5.1043, grad_fn=<AddBackward0>)


Training Net:  13%|████████▍                                                          | 47/374 [00:15<01:45,  3.10it/s]

tensor(5.1144, grad_fn=<AddBackward0>)


Training Net:  13%|████████▌                                                          | 48/374 [00:15<01:44,  3.12it/s]

tensor(5.1788, grad_fn=<AddBackward0>)


Training Net:  13%|████████▊                                                          | 49/374 [00:15<01:48,  2.99it/s]

tensor(5.1789, grad_fn=<AddBackward0>)


Training Net:  13%|████████▉                                                          | 50/374 [00:16<01:48,  3.00it/s]

tensor(5.1628, grad_fn=<AddBackward0>)


Training Net:  14%|█████████▏                                                         | 51/374 [00:16<01:49,  2.94it/s]

tensor(5.1657, grad_fn=<AddBackward0>)


Training Net:  14%|█████████▎                                                         | 52/374 [00:16<01:50,  2.92it/s]

tensor(5.1240, grad_fn=<AddBackward0>)


Training Net:  14%|█████████▍                                                         | 53/374 [00:17<01:49,  2.94it/s]

tensor(5.1796, grad_fn=<AddBackward0>)


Training Net:  14%|█████████▋                                                         | 54/374 [00:17<01:47,  2.99it/s]

tensor(5.1141, grad_fn=<AddBackward0>)


Training Net:  15%|█████████▊                                                         | 55/374 [00:17<01:51,  2.87it/s]

tensor(5.1427, grad_fn=<AddBackward0>)


Training Net:  15%|██████████                                                         | 56/374 [00:18<01:49,  2.90it/s]

tensor(5.1722, grad_fn=<AddBackward0>)


Training Net:  15%|██████████▏                                                        | 57/374 [00:18<01:46,  2.99it/s]

tensor(5.0990, grad_fn=<AddBackward0>)


Training Net:  16%|██████████▍                                                        | 58/374 [00:18<01:44,  3.03it/s]

tensor(5.1621, grad_fn=<AddBackward0>)


Training Net:  16%|██████████▌                                                        | 59/374 [00:19<01:39,  3.15it/s]

tensor(5.1686, grad_fn=<AddBackward0>)


Training Net:  16%|██████████▋                                                        | 60/374 [00:19<01:39,  3.14it/s]

tensor(5.1829, grad_fn=<AddBackward0>)


Training Net:  16%|██████████▉                                                        | 61/374 [00:19<01:38,  3.19it/s]

tensor(5.1820, grad_fn=<AddBackward0>)


Training Net:  17%|███████████                                                        | 62/374 [00:20<01:42,  3.05it/s]

tensor(5.1605, grad_fn=<AddBackward0>)


Training Net:  17%|███████████▎                                                       | 63/374 [00:20<01:40,  3.08it/s]

tensor(5.1015, grad_fn=<AddBackward0>)


Training Net:  17%|███████████▍                                                       | 64/374 [00:20<01:36,  3.20it/s]

tensor(5.1128, grad_fn=<AddBackward0>)


Training Net:  17%|███████████▋                                                       | 65/374 [00:21<01:33,  3.31it/s]

tensor(5.1728, grad_fn=<AddBackward0>)


Training Net:  18%|███████████▊                                                       | 66/374 [00:21<01:35,  3.24it/s]

tensor(5.0998, grad_fn=<AddBackward0>)


Training Net:  18%|████████████                                                       | 67/374 [00:21<01:40,  3.05it/s]

tensor(5.1671, grad_fn=<AddBackward0>)


Training Net:  18%|████████████▏                                                      | 68/374 [00:22<01:39,  3.07it/s]

tensor(5.1242, grad_fn=<AddBackward0>)


Training Net:  18%|████████████▎                                                      | 69/374 [00:22<01:38,  3.08it/s]

tensor(5.1007, grad_fn=<AddBackward0>)


Training Net:  19%|████████████▌                                                      | 70/374 [00:22<01:34,  3.21it/s]

tensor(5.1627, grad_fn=<AddBackward0>)


Training Net:  19%|████████████▋                                                      | 71/374 [00:23<01:33,  3.23it/s]

tensor(5.1421, grad_fn=<AddBackward0>)


Training Net:  19%|████████████▉                                                      | 72/374 [00:23<01:31,  3.32it/s]

tensor(5.1772, grad_fn=<AddBackward0>)


Training Net:  20%|█████████████                                                      | 73/374 [00:23<01:29,  3.36it/s]

tensor(5.1772, grad_fn=<AddBackward0>)


Training Net:  20%|█████████████▎                                                     | 74/374 [00:23<01:29,  3.36it/s]

tensor(5.0756, grad_fn=<AddBackward0>)


Training Net:  20%|█████████████▍                                                     | 75/374 [00:24<01:29,  3.34it/s]

tensor(5.1074, grad_fn=<AddBackward0>)


Training Net:  20%|█████████████▌                                                     | 76/374 [00:24<01:29,  3.34it/s]

tensor(5.1650, grad_fn=<AddBackward0>)


Training Net:  21%|█████████████▊                                                     | 77/374 [00:24<01:31,  3.26it/s]

tensor(5.0753, grad_fn=<AddBackward0>)


Training Net:  21%|█████████████▉                                                     | 78/374 [00:25<01:30,  3.26it/s]

tensor(5.1771, grad_fn=<AddBackward0>)


Training Net:  21%|██████████████▏                                                    | 79/374 [00:25<01:28,  3.35it/s]

tensor(5.1212, grad_fn=<AddBackward0>)


Training Net:  21%|██████████████▎                                                    | 80/374 [00:25<01:29,  3.30it/s]

tensor(5.0533, grad_fn=<AddBackward0>)


Training Net:  22%|██████████████▌                                                    | 81/374 [00:26<01:30,  3.23it/s]

tensor(5.1413, grad_fn=<AddBackward0>)


Training Net:  22%|██████████████▋                                                    | 82/374 [00:26<01:30,  3.22it/s]

tensor(5.1671, grad_fn=<AddBackward0>)


Training Net:  22%|██████████████▊                                                    | 83/374 [00:26<01:28,  3.31it/s]

tensor(5.1814, grad_fn=<AddBackward0>)


Training Net:  22%|███████████████                                                    | 84/374 [00:26<01:26,  3.34it/s]

tensor(5.1324, grad_fn=<AddBackward0>)


Training Net:  23%|███████████████▏                                                   | 85/374 [00:27<01:24,  3.41it/s]

tensor(5.1920, grad_fn=<AddBackward0>)


Training Net:  23%|███████████████▍                                                   | 86/374 [00:27<01:23,  3.47it/s]

tensor(5.1314, grad_fn=<AddBackward0>)


Training Net:  23%|███████████████▌                                                   | 87/374 [00:27<01:28,  3.24it/s]

tensor(5.1353, grad_fn=<AddBackward0>)


Training Net:  24%|███████████████▊                                                   | 88/374 [00:28<01:27,  3.29it/s]

tensor(5.1895, grad_fn=<AddBackward0>)


Training Net:  24%|███████████████▉                                                   | 89/374 [00:28<01:24,  3.38it/s]

tensor(5.2458, grad_fn=<AddBackward0>)


Training Net:  24%|████████████████                                                   | 90/374 [00:28<01:21,  3.48it/s]

tensor(5.1249, grad_fn=<AddBackward0>)


Training Net:  24%|████████████████▎                                                  | 91/374 [00:29<01:26,  3.29it/s]

tensor(5.1803, grad_fn=<AddBackward0>)


Training Net:  25%|████████████████▍                                                  | 92/374 [00:29<01:24,  3.32it/s]

tensor(5.1765, grad_fn=<AddBackward0>)


Training Net:  25%|████████████████▋                                                  | 93/374 [00:29<01:21,  3.44it/s]

tensor(5.0497, grad_fn=<AddBackward0>)


Training Net:  25%|████████████████▊                                                  | 94/374 [00:29<01:21,  3.45it/s]

tensor(5.1795, grad_fn=<AddBackward0>)


Training Net:  25%|█████████████████                                                  | 95/374 [00:30<01:21,  3.41it/s]

tensor(5.1916, grad_fn=<AddBackward0>)


Training Net:  26%|█████████████████▏                                                 | 96/374 [00:30<01:25,  3.26it/s]

tensor(5.1855, grad_fn=<AddBackward0>)


Training Net:  26%|█████████████████▍                                                 | 97/374 [00:30<01:23,  3.32it/s]

tensor(5.1708, grad_fn=<AddBackward0>)


Training Net:  26%|█████████████████▌                                                 | 98/374 [00:31<01:20,  3.41it/s]

tensor(5.1811, grad_fn=<AddBackward0>)


Training Net:  26%|█████████████████▋                                                 | 99/374 [00:31<01:18,  3.49it/s]

tensor(5.0951, grad_fn=<AddBackward0>)


Training Net:  27%|█████████████████▋                                                | 100/374 [00:31<01:19,  3.43it/s]

tensor(5.1797, grad_fn=<AddBackward0>)


Training Net:  27%|█████████████████▊                                                | 101/374 [00:31<01:23,  3.27it/s]

tensor(5.1782, grad_fn=<AddBackward0>)


Training Net:  27%|██████████████████                                                | 102/374 [00:32<01:20,  3.38it/s]

tensor(5.1743, grad_fn=<AddBackward0>)


Training Net:  28%|██████████████████▏                                               | 103/374 [00:32<01:20,  3.36it/s]

tensor(5.1347, grad_fn=<AddBackward0>)


Training Net:  28%|██████████████████▎                                               | 104/374 [00:32<01:20,  3.37it/s]

tensor(5.1067, grad_fn=<AddBackward0>)


Training Net:  28%|██████████████████▌                                               | 105/374 [00:33<01:19,  3.37it/s]

tensor(5.1851, grad_fn=<AddBackward0>)


Training Net:  28%|██████████████████▋                                               | 106/374 [00:33<01:17,  3.44it/s]

tensor(5.1858, grad_fn=<AddBackward0>)


Training Net:  29%|██████████████████▉                                               | 107/374 [00:33<01:17,  3.45it/s]

tensor(5.1717, grad_fn=<AddBackward0>)


Training Net:  29%|███████████████████                                               | 108/374 [00:33<01:15,  3.51it/s]

tensor(5.1796, grad_fn=<AddBackward0>)


Training Net:  29%|███████████████████▏                                              | 109/374 [00:34<01:17,  3.42it/s]

tensor(5.1547, grad_fn=<AddBackward0>)


Training Net:  29%|███████████████████▍                                              | 110/374 [00:34<01:19,  3.34it/s]

tensor(5.1158, grad_fn=<AddBackward0>)


Training Net:  30%|███████████████████▌                                              | 111/374 [00:34<01:16,  3.43it/s]

tensor(5.0515, grad_fn=<AddBackward0>)


Training Net:  30%|███████████████████▊                                              | 112/374 [00:35<01:18,  3.35it/s]

tensor(5.0906, grad_fn=<AddBackward0>)


Training Net:  30%|███████████████████▉                                              | 113/374 [00:35<01:20,  3.24it/s]

tensor(5.1715, grad_fn=<AddBackward0>)


Training Net:  30%|████████████████████                                              | 114/374 [00:35<01:17,  3.37it/s]

tensor(5.1702, grad_fn=<AddBackward0>)


Training Net:  31%|████████████████████▎                                             | 115/374 [00:36<01:17,  3.34it/s]

tensor(5.1406, grad_fn=<AddBackward0>)


Training Net:  31%|████████████████████▍                                             | 116/374 [00:36<01:17,  3.32it/s]

tensor(5.1756, grad_fn=<AddBackward0>)


Training Net:  31%|████████████████████▋                                             | 117/374 [00:36<01:17,  3.30it/s]

tensor(5.0763, grad_fn=<AddBackward0>)


Training Net:  32%|████████████████████▊                                             | 118/374 [00:37<01:16,  3.36it/s]

tensor(5.1819, grad_fn=<AddBackward0>)


Training Net:  32%|█████████████████████                                             | 119/374 [00:37<01:19,  3.21it/s]

tensor(5.1385, grad_fn=<AddBackward0>)


Training Net:  32%|█████████████████████▏                                            | 120/374 [00:37<01:19,  3.19it/s]

tensor(5.1398, grad_fn=<AddBackward0>)


Training Net:  32%|█████████████████████▎                                            | 121/374 [00:38<01:22,  3.08it/s]

tensor(5.1400, grad_fn=<AddBackward0>)


Training Net:  33%|█████████████████████▌                                            | 122/374 [00:38<01:21,  3.10it/s]

tensor(5.1171, grad_fn=<AddBackward0>)


Training Net:  33%|█████████████████████▋                                            | 123/374 [00:38<01:18,  3.19it/s]

tensor(5.1769, grad_fn=<AddBackward0>)


Training Net:  33%|█████████████████████▉                                            | 124/374 [00:38<01:18,  3.17it/s]

tensor(5.1440, grad_fn=<AddBackward0>)


Training Net:  33%|██████████████████████                                            | 125/374 [00:39<01:18,  3.16it/s]

tensor(5.1683, grad_fn=<AddBackward0>)


Training Net:  34%|██████████████████████▏                                           | 126/374 [00:39<01:17,  3.20it/s]

tensor(5.1056, grad_fn=<AddBackward0>)


Training Net:  34%|██████████████████████▍                                           | 127/374 [00:39<01:16,  3.23it/s]

tensor(5.1751, grad_fn=<AddBackward0>)


Training Net:  34%|██████████████████████▌                                           | 128/374 [00:40<01:14,  3.29it/s]

tensor(5.1532, grad_fn=<AddBackward0>)


Training Net:  34%|██████████████████████▊                                           | 129/374 [00:40<01:14,  3.30it/s]

tensor(5.1145, grad_fn=<AddBackward0>)


Training Net:  35%|██████████████████████▉                                           | 130/374 [00:40<01:13,  3.30it/s]

tensor(5.1789, grad_fn=<AddBackward0>)


Training Net:  35%|███████████████████████                                           | 131/374 [00:41<01:13,  3.32it/s]

tensor(5.1459, grad_fn=<AddBackward0>)


Training Net:  35%|███████████████████████▎                                          | 132/374 [00:41<01:12,  3.35it/s]

tensor(5.1689, grad_fn=<AddBackward0>)


Training Net:  36%|███████████████████████▍                                          | 133/374 [00:41<01:11,  3.38it/s]

tensor(5.0596, grad_fn=<AddBackward0>)


Training Net:  36%|███████████████████████▋                                          | 134/374 [00:41<01:12,  3.33it/s]

tensor(5.0988, grad_fn=<AddBackward0>)


Training Net:  36%|███████████████████████▊                                          | 135/374 [00:42<01:12,  3.29it/s]

tensor(5.0995, grad_fn=<AddBackward0>)


Training Net:  36%|████████████████████████                                          | 136/374 [00:42<01:13,  3.24it/s]

tensor(5.0818, grad_fn=<AddBackward0>)


Training Net:  37%|████████████████████████▏                                         | 137/374 [00:42<01:10,  3.36it/s]

tensor(5.1844, grad_fn=<AddBackward0>)


Training Net:  37%|████████████████████████▎                                         | 138/374 [00:43<01:10,  3.37it/s]

tensor(5.1382, grad_fn=<AddBackward0>)


Training Net:  37%|████████████████████████▌                                         | 139/374 [00:43<01:09,  3.39it/s]

tensor(5.1893, grad_fn=<AddBackward0>)


Training Net:  37%|████████████████████████▋                                         | 140/374 [00:43<01:09,  3.37it/s]

tensor(5.0894, grad_fn=<AddBackward0>)


Training Net:  38%|████████████████████████▉                                         | 141/374 [00:44<01:07,  3.45it/s]

tensor(5.1657, grad_fn=<AddBackward0>)


Training Net:  38%|█████████████████████████                                         | 142/374 [00:44<01:07,  3.44it/s]

tensor(5.1063, grad_fn=<AddBackward0>)


Training Net:  38%|█████████████████████████▏                                        | 143/374 [00:44<01:06,  3.46it/s]

tensor(5.1811, grad_fn=<AddBackward0>)


Training Net:  39%|█████████████████████████▍                                        | 144/374 [00:44<01:03,  3.60it/s]

tensor(5.0224, grad_fn=<AddBackward0>)


Training Net:  39%|█████████████████████████▌                                        | 145/374 [00:45<01:04,  3.54it/s]

tensor(5.1301, grad_fn=<AddBackward0>)


Training Net:  39%|█████████████████████████▊                                        | 146/374 [00:45<01:04,  3.51it/s]

tensor(5.1913, grad_fn=<AddBackward0>)


Training Net:  39%|█████████████████████████▉                                        | 147/374 [00:45<01:04,  3.50it/s]

tensor(5.1650, grad_fn=<AddBackward0>)


Training Net:  40%|██████████████████████████                                        | 148/374 [00:46<01:04,  3.48it/s]

tensor(5.1773, grad_fn=<AddBackward0>)


Training Net:  40%|██████████████████████████▎                                       | 149/374 [00:46<01:04,  3.48it/s]

tensor(5.1731, grad_fn=<AddBackward0>)


Training Net:  40%|██████████████████████████▍                                       | 150/374 [00:46<01:05,  3.43it/s]

tensor(5.1726, grad_fn=<AddBackward0>)


Training Net:  40%|██████████████████████████▋                                       | 151/374 [00:46<01:04,  3.47it/s]

tensor(5.1462, grad_fn=<AddBackward0>)


Training Net:  41%|██████████████████████████▊                                       | 152/374 [00:47<01:03,  3.49it/s]

tensor(5.1568, grad_fn=<AddBackward0>)


Training Net:  41%|███████████████████████████                                       | 153/374 [00:47<01:03,  3.47it/s]

tensor(5.1791, grad_fn=<AddBackward0>)


Training Net:  41%|███████████████████████████▏                                      | 154/374 [00:47<01:03,  3.49it/s]

tensor(5.1523, grad_fn=<AddBackward0>)


Training Net:  41%|███████████████████████████▎                                      | 155/374 [00:48<01:03,  3.47it/s]

tensor(5.1186, grad_fn=<AddBackward0>)


Training Net:  42%|███████████████████████████▌                                      | 156/374 [00:48<01:03,  3.43it/s]

tensor(5.1790, grad_fn=<AddBackward0>)


Training Net:  42%|███████████████████████████▋                                      | 157/374 [00:48<01:03,  3.40it/s]

tensor(5.0506, grad_fn=<AddBackward0>)


Training Net:  42%|███████████████████████████▉                                      | 158/374 [00:48<01:03,  3.40it/s]

tensor(5.1022, grad_fn=<AddBackward0>)


Training Net:  43%|████████████████████████████                                      | 159/374 [00:49<01:03,  3.40it/s]

tensor(5.0235, grad_fn=<AddBackward0>)


Training Net:  43%|████████████████████████████▏                                     | 160/374 [00:49<01:01,  3.47it/s]

tensor(5.1797, grad_fn=<AddBackward0>)


Training Net:  43%|████████████████████████████▍                                     | 161/374 [00:49<01:01,  3.47it/s]

tensor(5.1433, grad_fn=<AddBackward0>)


Training Net:  43%|████████████████████████████▌                                     | 162/374 [00:50<01:02,  3.41it/s]

tensor(5.1737, grad_fn=<AddBackward0>)


Training Net:  44%|████████████████████████████▊                                     | 163/374 [00:50<01:01,  3.45it/s]

tensor(5.1703, grad_fn=<AddBackward0>)


Training Net:  44%|████████████████████████████▉                                     | 164/374 [00:50<00:59,  3.51it/s]

tensor(5.1808, grad_fn=<AddBackward0>)


Training Net:  44%|█████████████████████████████                                     | 165/374 [00:50<01:00,  3.47it/s]

tensor(5.0557, grad_fn=<AddBackward0>)


Training Net:  44%|█████████████████████████████▎                                    | 166/374 [00:51<00:59,  3.49it/s]

tensor(5.1047, grad_fn=<AddBackward0>)


Training Net:  45%|█████████████████████████████▍                                    | 167/374 [00:51<00:57,  3.57it/s]

tensor(5.1411, grad_fn=<AddBackward0>)


Training Net:  45%|█████████████████████████████▋                                    | 168/374 [00:51<00:58,  3.50it/s]

tensor(5.1081, grad_fn=<AddBackward0>)


Training Net:  45%|█████████████████████████████▊                                    | 169/374 [00:52<00:58,  3.48it/s]

tensor(5.1701, grad_fn=<AddBackward0>)


Training Net:  45%|██████████████████████████████                                    | 170/374 [00:52<00:57,  3.53it/s]

tensor(5.1589, grad_fn=<AddBackward0>)


Training Net:  46%|██████████████████████████████▏                                   | 171/374 [00:52<00:57,  3.50it/s]

tensor(5.1142, grad_fn=<AddBackward0>)


Training Net:  46%|██████████████████████████████▎                                   | 172/374 [00:52<00:57,  3.49it/s]

tensor(5.1603, grad_fn=<AddBackward0>)


Training Net:  46%|██████████████████████████████▌                                   | 173/374 [00:53<00:57,  3.50it/s]

tensor(5.1527, grad_fn=<AddBackward0>)


Training Net:  47%|██████████████████████████████▋                                   | 174/374 [00:53<00:57,  3.47it/s]

tensor(5.1634, grad_fn=<AddBackward0>)


Training Net:  47%|██████████████████████████████▉                                   | 175/374 [00:53<00:56,  3.49it/s]

tensor(5.1857, grad_fn=<AddBackward0>)


Training Net:  47%|███████████████████████████████                                   | 176/374 [00:54<00:56,  3.49it/s]

tensor(5.1766, grad_fn=<AddBackward0>)


Training Net:  47%|███████████████████████████████▏                                  | 177/374 [00:54<00:57,  3.44it/s]

tensor(5.1843, grad_fn=<AddBackward0>)


Training Net:  48%|███████████████████████████████▍                                  | 178/374 [00:54<00:57,  3.41it/s]

tensor(5.1733, grad_fn=<AddBackward0>)


Training Net:  48%|███████████████████████████████▌                                  | 179/374 [00:54<00:57,  3.42it/s]

tensor(5.1303, grad_fn=<AddBackward0>)


Training Net:  48%|███████████████████████████████▊                                  | 180/374 [00:55<00:56,  3.43it/s]

tensor(5.0953, grad_fn=<AddBackward0>)


Training Net:  48%|███████████████████████████████▉                                  | 181/374 [00:55<00:55,  3.46it/s]

tensor(5.1636, grad_fn=<AddBackward0>)


Training Net:  49%|████████████████████████████████                                  | 182/374 [00:55<00:55,  3.47it/s]

tensor(5.1776, grad_fn=<AddBackward0>)


Training Net:  49%|████████████████████████████████▎                                 | 183/374 [00:56<00:55,  3.41it/s]

tensor(5.1643, grad_fn=<AddBackward0>)


Training Net:  49%|████████████████████████████████▍                                 | 184/374 [00:56<00:56,  3.36it/s]

tensor(5.1774, grad_fn=<AddBackward0>)


Training Net:  49%|████████████████████████████████▋                                 | 185/374 [00:56<00:56,  3.35it/s]

tensor(5.0389, grad_fn=<AddBackward0>)


Training Net:  50%|████████████████████████████████▊                                 | 186/374 [00:57<00:55,  3.39it/s]

tensor(5.1137, grad_fn=<AddBackward0>)


Training Net:  50%|█████████████████████████████████                                 | 187/374 [00:57<00:54,  3.40it/s]

tensor(5.1637, grad_fn=<AddBackward0>)


Training Net:  50%|█████████████████████████████████▏                                | 188/374 [00:57<00:53,  3.48it/s]

tensor(5.0033, grad_fn=<AddBackward0>)


Training Net:  51%|█████████████████████████████████▎                                | 189/374 [00:57<00:52,  3.53it/s]

tensor(5.1095, grad_fn=<AddBackward0>)


Training Net:  51%|█████████████████████████████████▌                                | 190/374 [00:58<00:52,  3.47it/s]

tensor(5.1549, grad_fn=<AddBackward0>)


Training Net:  51%|█████████████████████████████████▋                                | 191/374 [00:58<00:52,  3.51it/s]

tensor(5.1745, grad_fn=<AddBackward0>)


Training Net:  51%|█████████████████████████████████▉                                | 192/374 [00:58<00:52,  3.48it/s]

tensor(5.1768, grad_fn=<AddBackward0>)


Training Net:  52%|██████████████████████████████████                                | 193/374 [00:59<00:51,  3.50it/s]

tensor(5.1778, grad_fn=<AddBackward0>)


Training Net:  52%|██████████████████████████████████▏                               | 194/374 [00:59<00:51,  3.48it/s]

tensor(5.0814, grad_fn=<AddBackward0>)


Training Net:  52%|██████████████████████████████████▍                               | 195/374 [00:59<00:50,  3.52it/s]

tensor(5.1217, grad_fn=<AddBackward0>)


Training Net:  52%|██████████████████████████████████▌                               | 196/374 [00:59<00:51,  3.48it/s]

tensor(5.1232, grad_fn=<AddBackward0>)


Training Net:  53%|██████████████████████████████████▊                               | 197/374 [01:00<00:51,  3.46it/s]

tensor(5.1493, grad_fn=<AddBackward0>)


Training Net:  53%|██████████████████████████████████▉                               | 198/374 [01:00<00:50,  3.49it/s]

tensor(5.1373, grad_fn=<AddBackward0>)


Training Net:  53%|███████████████████████████████████                               | 199/374 [01:00<00:50,  3.45it/s]

tensor(5.1421, grad_fn=<AddBackward0>)


Training Net:  53%|███████████████████████████████████▎                              | 200/374 [01:01<00:50,  3.44it/s]

tensor(5.1066, grad_fn=<AddBackward0>)


Training Net:  54%|███████████████████████████████████▍                              | 201/374 [01:01<00:50,  3.45it/s]

tensor(5.1272, grad_fn=<AddBackward0>)


Training Net:  54%|███████████████████████████████████▋                              | 202/374 [01:01<00:50,  3.44it/s]

tensor(5.0859, grad_fn=<AddBackward0>)


Training Net:  54%|███████████████████████████████████▊                              | 203/374 [01:01<00:49,  3.48it/s]

tensor(5.1826, grad_fn=<AddBackward0>)


Training Net:  55%|████████████████████████████████████                              | 204/374 [01:02<00:49,  3.42it/s]

tensor(5.0233, grad_fn=<AddBackward0>)


Training Net:  55%|████████████████████████████████████▏                             | 205/374 [01:02<00:48,  3.48it/s]

tensor(5.1794, grad_fn=<AddBackward0>)


Training Net:  55%|████████████████████████████████████▎                             | 206/374 [01:02<00:48,  3.43it/s]

tensor(5.1589, grad_fn=<AddBackward0>)


Training Net:  55%|████████████████████████████████████▌                             | 207/374 [01:03<00:48,  3.42it/s]

tensor(5.1408, grad_fn=<AddBackward0>)


Training Net:  56%|████████████████████████████████████▋                             | 208/374 [01:03<00:48,  3.46it/s]

tensor(5.1574, grad_fn=<AddBackward0>)


Training Net:  56%|████████████████████████████████████▉                             | 209/374 [01:03<00:46,  3.58it/s]

tensor(5.1456, grad_fn=<AddBackward0>)


Training Net:  56%|█████████████████████████████████████                             | 210/374 [01:03<00:46,  3.55it/s]

tensor(5.0864, grad_fn=<AddBackward0>)


Training Net:  56%|█████████████████████████████████████▏                            | 211/374 [01:04<00:46,  3.52it/s]

tensor(5.1544, grad_fn=<AddBackward0>)


Training Net:  57%|█████████████████████████████████████▍                            | 212/374 [01:04<00:45,  3.54it/s]

tensor(5.0858, grad_fn=<AddBackward0>)


Training Net:  57%|█████████████████████████████████████▌                            | 213/374 [01:04<00:46,  3.48it/s]

tensor(5.0361, grad_fn=<AddBackward0>)


Training Net:  57%|█████████████████████████████████████▊                            | 214/374 [01:05<00:46,  3.47it/s]

tensor(5.1850, grad_fn=<AddBackward0>)


Training Net:  57%|█████████████████████████████████████▉                            | 215/374 [01:05<00:46,  3.43it/s]

tensor(5.1593, grad_fn=<AddBackward0>)


Training Net:  58%|██████████████████████████████████████                            | 216/374 [01:05<00:46,  3.43it/s]

tensor(5.1455, grad_fn=<AddBackward0>)


Training Net:  58%|██████████████████████████████████████▎                           | 217/374 [01:05<00:46,  3.38it/s]

tensor(5.1787, grad_fn=<AddBackward0>)


Training Net:  58%|██████████████████████████████████████▍                           | 218/374 [01:06<00:46,  3.34it/s]

tensor(5.1822, grad_fn=<AddBackward0>)


Training Net:  59%|██████████████████████████████████████▋                           | 219/374 [01:06<00:47,  3.24it/s]

tensor(5.0605, grad_fn=<AddBackward0>)


Training Net:  59%|██████████████████████████████████████▊                           | 220/374 [01:06<00:46,  3.29it/s]

tensor(5.1007, grad_fn=<AddBackward0>)


Training Net:  59%|███████████████████████████████████████                           | 221/374 [01:07<00:46,  3.30it/s]

tensor(5.1741, grad_fn=<AddBackward0>)


Training Net:  59%|███████████████████████████████████████▏                          | 222/374 [01:07<00:46,  3.29it/s]

tensor(5.1447, grad_fn=<AddBackward0>)


Training Net:  60%|███████████████████████████████████████▎                          | 223/374 [01:07<00:48,  3.13it/s]

tensor(5.0194, grad_fn=<AddBackward0>)


Training Net:  60%|███████████████████████████████████████▌                          | 224/374 [01:08<00:48,  3.12it/s]

tensor(5.1833, grad_fn=<AddBackward0>)


Training Net:  60%|███████████████████████████████████████▋                          | 225/374 [01:08<00:47,  3.13it/s]

tensor(5.1555, grad_fn=<AddBackward0>)


Training Net:  60%|███████████████████████████████████████▉                          | 226/374 [01:08<00:47,  3.12it/s]

tensor(5.1831, grad_fn=<AddBackward0>)


Training Net:  61%|████████████████████████████████████████                          | 227/374 [01:09<00:47,  3.13it/s]

tensor(5.1827, grad_fn=<AddBackward0>)


Training Net:  61%|████████████████████████████████████████▏                         | 228/374 [01:09<00:46,  3.17it/s]

tensor(5.1533, grad_fn=<AddBackward0>)


Training Net:  61%|████████████████████████████████████████▍                         | 229/374 [01:09<00:45,  3.16it/s]

tensor(5.1805, grad_fn=<AddBackward0>)


Training Net:  61%|████████████████████████████████████████▌                         | 230/374 [01:10<00:45,  3.15it/s]

tensor(5.1417, grad_fn=<AddBackward0>)


Training Net:  62%|████████████████████████████████████████▊                         | 231/374 [01:10<00:45,  3.14it/s]

tensor(5.1748, grad_fn=<AddBackward0>)


Training Net:  62%|████████████████████████████████████████▉                         | 232/374 [01:10<00:45,  3.14it/s]

tensor(5.1852, grad_fn=<AddBackward0>)


Training Net:  62%|█████████████████████████████████████████                         | 233/374 [01:11<00:44,  3.17it/s]

tensor(5.1742, grad_fn=<AddBackward0>)


Training Net:  63%|█████████████████████████████████████████▎                        | 234/374 [01:11<00:43,  3.19it/s]

tensor(5.1486, grad_fn=<AddBackward0>)


Training Net:  63%|█████████████████████████████████████████▍                        | 235/374 [01:11<00:43,  3.19it/s]

tensor(5.1502, grad_fn=<AddBackward0>)


Training Net:  63%|█████████████████████████████████████████▋                        | 236/374 [01:11<00:43,  3.15it/s]

tensor(5.1737, grad_fn=<AddBackward0>)


Training Net:  63%|█████████████████████████████████████████▊                        | 237/374 [01:12<00:42,  3.20it/s]

tensor(5.1062, grad_fn=<AddBackward0>)


Training Net:  64%|██████████████████████████████████████████                        | 238/374 [01:12<00:42,  3.17it/s]

tensor(5.1723, grad_fn=<AddBackward0>)


Training Net:  64%|██████████████████████████████████████████▏                       | 239/374 [01:12<00:42,  3.16it/s]

tensor(5.1816, grad_fn=<AddBackward0>)


Training Net:  64%|██████████████████████████████████████████▎                       | 240/374 [01:13<00:42,  3.17it/s]

tensor(5.1869, grad_fn=<AddBackward0>)


Training Net:  64%|██████████████████████████████████████████▌                       | 241/374 [01:13<00:41,  3.23it/s]

tensor(5.1796, grad_fn=<AddBackward0>)


Training Net:  65%|██████████████████████████████████████████▋                       | 242/374 [01:13<00:41,  3.19it/s]

tensor(5.0310, grad_fn=<AddBackward0>)


Training Net:  65%|██████████████████████████████████████████▉                       | 243/374 [01:14<00:41,  3.14it/s]

tensor(5.1589, grad_fn=<AddBackward0>)


Training Net:  65%|███████████████████████████████████████████                       | 244/374 [01:14<00:41,  3.11it/s]

tensor(5.1734, grad_fn=<AddBackward0>)


Training Net:  66%|███████████████████████████████████████████▏                      | 245/374 [01:14<00:41,  3.09it/s]

tensor(5.1783, grad_fn=<AddBackward0>)


Training Net:  66%|███████████████████████████████████████████▍                      | 246/374 [01:15<00:41,  3.05it/s]

tensor(5.1526, grad_fn=<AddBackward0>)


Training Net:  66%|███████████████████████████████████████████▌                      | 247/374 [01:15<00:40,  3.10it/s]

tensor(5.1732, grad_fn=<AddBackward0>)


Training Net:  66%|███████████████████████████████████████████▊                      | 248/374 [01:15<00:40,  3.11it/s]

tensor(5.1807, grad_fn=<AddBackward0>)


Training Net:  67%|███████████████████████████████████████████▉                      | 249/374 [01:16<00:40,  3.09it/s]

tensor(5.1864, grad_fn=<AddBackward0>)


Training Net:  67%|████████████████████████████████████████████                      | 250/374 [01:16<00:39,  3.10it/s]

tensor(5.1482, grad_fn=<AddBackward0>)


Training Net:  67%|████████████████████████████████████████████▎                     | 251/374 [01:16<00:39,  3.10it/s]

tensor(5.1864, grad_fn=<AddBackward0>)


Training Net:  67%|████████████████████████████████████████████▍                     | 252/374 [01:17<00:38,  3.14it/s]

tensor(5.1759, grad_fn=<AddBackward0>)


Training Net:  68%|████████████████████████████████████████████▋                     | 253/374 [01:17<00:38,  3.11it/s]

tensor(5.0929, grad_fn=<AddBackward0>)


Training Net:  68%|████████████████████████████████████████████▊                     | 254/374 [01:17<00:38,  3.12it/s]

tensor(5.1067, grad_fn=<AddBackward0>)


Training Net:  68%|█████████████████████████████████████████████                     | 255/374 [01:18<00:38,  3.12it/s]

tensor(5.1952, grad_fn=<AddBackward0>)


Training Net:  68%|█████████████████████████████████████████████▏                    | 256/374 [01:18<00:38,  3.09it/s]

tensor(5.1923, grad_fn=<AddBackward0>)


Training Net:  69%|█████████████████████████████████████████████▎                    | 257/374 [01:18<00:37,  3.11it/s]

tensor(5.1101, grad_fn=<AddBackward0>)


Training Net:  69%|█████████████████████████████████████████████▌                    | 258/374 [01:19<00:37,  3.13it/s]

tensor(5.1710, grad_fn=<AddBackward0>)


Training Net:  69%|█████████████████████████████████████████████▋                    | 259/374 [01:19<00:36,  3.14it/s]

tensor(5.1297, grad_fn=<AddBackward0>)


Training Net:  70%|█████████████████████████████████████████████▉                    | 260/374 [01:19<00:36,  3.12it/s]

tensor(5.0284, grad_fn=<AddBackward0>)


Training Net:  70%|██████████████████████████████████████████████                    | 261/374 [01:19<00:36,  3.10it/s]

tensor(5.1457, grad_fn=<AddBackward0>)


Training Net:  70%|██████████████████████████████████████████████▏                   | 262/374 [01:20<00:36,  3.09it/s]

tensor(5.0680, grad_fn=<AddBackward0>)


Training Net:  70%|██████████████████████████████████████████████▍                   | 263/374 [01:20<00:36,  3.08it/s]

tensor(5.1069, grad_fn=<AddBackward0>)


Training Net:  71%|██████████████████████████████████████████████▌                   | 264/374 [01:20<00:35,  3.08it/s]

tensor(5.1452, grad_fn=<AddBackward0>)


Training Net:  71%|██████████████████████████████████████████████▊                   | 265/374 [01:21<00:34,  3.17it/s]

tensor(5.1744, grad_fn=<AddBackward0>)


Training Net:  71%|██████████████████████████████████████████████▉                   | 266/374 [01:21<00:34,  3.16it/s]

tensor(5.1484, grad_fn=<AddBackward0>)


Training Net:  71%|███████████████████████████████████████████████                   | 267/374 [01:21<00:34,  3.15it/s]

tensor(5.1115, grad_fn=<AddBackward0>)


Training Net:  72%|███████████████████████████████████████████████▎                  | 268/374 [01:22<00:34,  3.11it/s]

tensor(5.1555, grad_fn=<AddBackward0>)


Training Net:  72%|███████████████████████████████████████████████▍                  | 269/374 [01:22<00:34,  3.03it/s]

tensor(5.0956, grad_fn=<AddBackward0>)


Training Net:  72%|███████████████████████████████████████████████▋                  | 270/374 [01:22<00:33,  3.08it/s]

tensor(5.1279, grad_fn=<AddBackward0>)


Training Net:  72%|███████████████████████████████████████████████▊                  | 271/374 [01:23<00:33,  3.07it/s]

tensor(4.9870, grad_fn=<AddBackward0>)


Training Net:  73%|████████████████████████████████████████████████                  | 272/374 [01:23<00:32,  3.15it/s]

tensor(5.1715, grad_fn=<AddBackward0>)


Training Net:  73%|████████████████████████████████████████████████▏                 | 273/374 [01:23<00:32,  3.09it/s]

tensor(5.1453, grad_fn=<AddBackward0>)


Training Net:  73%|████████████████████████████████████████████████▎                 | 274/374 [01:24<00:32,  3.08it/s]

tensor(5.1516, grad_fn=<AddBackward0>)


Training Net:  74%|████████████████████████████████████████████████▌                 | 275/374 [01:24<00:32,  3.08it/s]

tensor(5.1620, grad_fn=<AddBackward0>)


Training Net:  74%|████████████████████████████████████████████████▋                 | 276/374 [01:24<00:31,  3.10it/s]

tensor(5.1768, grad_fn=<AddBackward0>)


Training Net:  74%|████████████████████████████████████████████████▉                 | 277/374 [01:25<00:31,  3.12it/s]

tensor(5.1457, grad_fn=<AddBackward0>)


Training Net:  74%|█████████████████████████████████████████████████                 | 278/374 [01:25<00:30,  3.17it/s]

tensor(5.1789, grad_fn=<AddBackward0>)


Training Net:  75%|█████████████████████████████████████████████████▏                | 279/374 [01:25<00:30,  3.14it/s]

tensor(5.1492, grad_fn=<AddBackward0>)


Training Net:  75%|█████████████████████████████████████████████████▍                | 280/374 [01:26<00:30,  3.11it/s]

tensor(5.0900, grad_fn=<AddBackward0>)


Training Net:  75%|█████████████████████████████████████████████████▌                | 281/374 [01:26<00:30,  3.06it/s]

tensor(5.1400, grad_fn=<AddBackward0>)


Training Net:  75%|█████████████████████████████████████████████████▊                | 282/374 [01:26<00:30,  3.02it/s]

tensor(5.1656, grad_fn=<AddBackward0>)


Training Net:  76%|█████████████████████████████████████████████████▉                | 283/374 [01:27<00:30,  3.01it/s]

tensor(5.1132, grad_fn=<AddBackward0>)


Training Net:  76%|██████████████████████████████████████████████████                | 284/374 [01:27<00:29,  3.05it/s]

tensor(5.0649, grad_fn=<AddBackward0>)


Training Net:  76%|██████████████████████████████████████████████████▎               | 285/374 [01:27<00:28,  3.09it/s]

tensor(5.1123, grad_fn=<AddBackward0>)


Training Net:  76%|██████████████████████████████████████████████████▍               | 286/374 [01:28<00:28,  3.06it/s]

tensor(5.1190, grad_fn=<AddBackward0>)


Training Net:  77%|██████████████████████████████████████████████████▋               | 287/374 [01:28<00:29,  2.91it/s]

tensor(5.1700, grad_fn=<AddBackward0>)


Training Net:  77%|██████████████████████████████████████████████████▊               | 288/374 [01:28<00:30,  2.85it/s]

tensor(5.0967, grad_fn=<AddBackward0>)


Training Net:  77%|███████████████████████████████████████████████████               | 289/374 [01:29<00:29,  2.92it/s]

tensor(5.1642, grad_fn=<AddBackward0>)


Training Net:  78%|███████████████████████████████████████████████████▏              | 290/374 [01:29<00:28,  2.97it/s]

tensor(5.0416, grad_fn=<AddBackward0>)


Training Net:  78%|███████████████████████████████████████████████████▎              | 291/374 [01:29<00:27,  3.00it/s]

tensor(5.1710, grad_fn=<AddBackward0>)


Training Net:  78%|███████████████████████████████████████████████████▌              | 292/374 [01:30<00:27,  3.03it/s]

tensor(5.1337, grad_fn=<AddBackward0>)


Training Net:  78%|███████████████████████████████████████████████████▋              | 293/374 [01:30<00:26,  3.01it/s]

tensor(5.1844, grad_fn=<AddBackward0>)


Training Net:  79%|███████████████████████████████████████████████████▉              | 294/374 [01:30<00:26,  2.99it/s]

tensor(5.1065, grad_fn=<AddBackward0>)


Training Net:  79%|████████████████████████████████████████████████████              | 295/374 [01:31<00:26,  3.02it/s]

tensor(5.0639, grad_fn=<AddBackward0>)


Training Net:  79%|████████████████████████████████████████████████████▏             | 296/374 [01:31<00:25,  3.04it/s]

tensor(5.1228, grad_fn=<AddBackward0>)


Training Net:  79%|████████████████████████████████████████████████████▍             | 297/374 [01:31<00:25,  3.03it/s]

tensor(5.1764, grad_fn=<AddBackward0>)


Training Net:  80%|████████████████████████████████████████████████████▌             | 298/374 [01:32<00:25,  2.99it/s]

tensor(5.0534, grad_fn=<AddBackward0>)


Training Net:  80%|████████████████████████████████████████████████████▊             | 299/374 [01:32<00:25,  2.97it/s]

tensor(5.1686, grad_fn=<AddBackward0>)


Training Net:  80%|████████████████████████████████████████████████████▉             | 300/374 [01:32<00:25,  2.92it/s]

tensor(5.1473, grad_fn=<AddBackward0>)


Training Net:  80%|█████████████████████████████████████████████████████             | 301/374 [01:33<00:25,  2.90it/s]

tensor(5.1680, grad_fn=<AddBackward0>)


Training Net:  81%|█████████████████████████████████████████████████████▎            | 302/374 [01:33<00:24,  2.95it/s]

tensor(5.1120, grad_fn=<AddBackward0>)


Training Net:  81%|█████████████████████████████████████████████████████▍            | 303/374 [01:33<00:23,  2.97it/s]

tensor(5.1608, grad_fn=<AddBackward0>)


Training Net:  81%|█████████████████████████████████████████████████████▋            | 304/374 [01:34<00:23,  2.93it/s]

tensor(5.1735, grad_fn=<AddBackward0>)


Training Net:  82%|█████████████████████████████████████████████████████▊            | 305/374 [01:34<00:23,  2.97it/s]

tensor(5.0637, grad_fn=<AddBackward0>)


Training Net:  82%|██████████████████████████████████████████████████████            | 306/374 [01:34<00:22,  2.96it/s]

tensor(5.1833, grad_fn=<AddBackward0>)


Training Net:  82%|██████████████████████████████████████████████████████▏           | 307/374 [01:35<00:22,  2.92it/s]

tensor(5.1848, grad_fn=<AddBackward0>)


Training Net:  82%|██████████████████████████████████████████████████████▎           | 308/374 [01:35<00:22,  2.95it/s]

tensor(5.0706, grad_fn=<AddBackward0>)


Training Net:  83%|██████████████████████████████████████████████████████▌           | 309/374 [01:35<00:21,  2.99it/s]

tensor(5.1708, grad_fn=<AddBackward0>)


Training Net:  83%|██████████████████████████████████████████████████████▋           | 310/374 [01:36<00:21,  3.00it/s]

tensor(5.1730, grad_fn=<AddBackward0>)


Training Net:  83%|██████████████████████████████████████████████████████▉           | 311/374 [01:36<00:22,  2.86it/s]

tensor(5.1456, grad_fn=<AddBackward0>)


Training Net:  83%|███████████████████████████████████████████████████████           | 312/374 [01:36<00:22,  2.78it/s]

tensor(5.1497, grad_fn=<AddBackward0>)


Training Net:  84%|███████████████████████████████████████████████████████▏          | 313/374 [01:37<00:21,  2.78it/s]

tensor(5.1773, grad_fn=<AddBackward0>)


Training Net:  84%|███████████████████████████████████████████████████████▍          | 314/374 [01:37<00:21,  2.78it/s]

tensor(5.1050, grad_fn=<AddBackward0>)


Training Net:  84%|███████████████████████████████████████████████████████▌          | 315/374 [01:38<00:21,  2.79it/s]

tensor(5.1481, grad_fn=<AddBackward0>)


Training Net:  84%|███████████████████████████████████████████████████████▊          | 316/374 [01:38<00:20,  2.79it/s]

tensor(5.1566, grad_fn=<AddBackward0>)


Training Net:  85%|███████████████████████████████████████████████████████▉          | 317/374 [01:38<00:20,  2.81it/s]

tensor(5.1625, grad_fn=<AddBackward0>)


Training Net:  85%|████████████████████████████████████████████████████████          | 318/374 [01:39<00:19,  2.85it/s]

tensor(5.0882, grad_fn=<AddBackward0>)


Training Net:  85%|████████████████████████████████████████████████████████▎         | 319/374 [01:39<00:19,  2.89it/s]

tensor(5.1359, grad_fn=<AddBackward0>)


Training Net:  86%|████████████████████████████████████████████████████████▍         | 320/374 [01:39<00:18,  2.91it/s]

tensor(5.1799, grad_fn=<AddBackward0>)


Training Net:  86%|████████████████████████████████████████████████████████▋         | 321/374 [01:40<00:18,  2.92it/s]

tensor(5.1820, grad_fn=<AddBackward0>)


Training Net:  86%|████████████████████████████████████████████████████████▊         | 322/374 [01:40<00:17,  2.89it/s]

tensor(5.1761, grad_fn=<AddBackward0>)


Training Net:  86%|█████████████████████████████████████████████████████████         | 323/374 [01:40<00:17,  2.85it/s]

tensor(5.0541, grad_fn=<AddBackward0>)


Training Net:  87%|█████████████████████████████████████████████████████████▏        | 324/374 [01:41<00:17,  2.80it/s]

tensor(5.1594, grad_fn=<AddBackward0>)


Training Net:  87%|█████████████████████████████████████████████████████████▎        | 325/374 [01:41<00:17,  2.79it/s]

tensor(5.1695, grad_fn=<AddBackward0>)


Training Net:  87%|█████████████████████████████████████████████████████████▌        | 326/374 [01:41<00:17,  2.81it/s]

tensor(5.1820, grad_fn=<AddBackward0>)


Training Net:  87%|█████████████████████████████████████████████████████████▋        | 327/374 [01:42<00:16,  2.77it/s]

tensor(5.1388, grad_fn=<AddBackward0>)


Training Net:  88%|█████████████████████████████████████████████████████████▉        | 328/374 [01:42<00:16,  2.75it/s]

tensor(5.1592, grad_fn=<AddBackward0>)


Training Net:  88%|██████████████████████████████████████████████████████████        | 329/374 [01:42<00:16,  2.75it/s]

tensor(5.1239, grad_fn=<AddBackward0>)


Training Net:  88%|██████████████████████████████████████████████████████████▏       | 330/374 [01:43<00:15,  2.78it/s]

tensor(5.1701, grad_fn=<AddBackward0>)


Training Net:  89%|██████████████████████████████████████████████████████████▍       | 331/374 [01:43<00:15,  2.81it/s]

tensor(5.1746, grad_fn=<AddBackward0>)


Training Net:  89%|██████████████████████████████████████████████████████████▌       | 332/374 [01:44<00:15,  2.79it/s]

tensor(5.1812, grad_fn=<AddBackward0>)


Training Net:  89%|██████████████████████████████████████████████████████████▊       | 333/374 [01:44<00:14,  2.75it/s]

tensor(5.1672, grad_fn=<AddBackward0>)


Training Net:  89%|██████████████████████████████████████████████████████████▉       | 334/374 [01:44<00:14,  2.79it/s]

tensor(5.0538, grad_fn=<AddBackward0>)


Training Net:  90%|███████████████████████████████████████████████████████████       | 335/374 [01:45<00:13,  2.89it/s]

tensor(5.1601, grad_fn=<AddBackward0>)


Training Net:  90%|███████████████████████████████████████████████████████████▎      | 336/374 [01:45<00:13,  2.89it/s]

tensor(5.1198, grad_fn=<AddBackward0>)


Training Net:  90%|███████████████████████████████████████████████████████████▍      | 337/374 [01:45<00:13,  2.84it/s]

tensor(5.1143, grad_fn=<AddBackward0>)


Training Net:  90%|███████████████████████████████████████████████████████████▋      | 338/374 [01:46<00:12,  2.81it/s]

tensor(5.1066, grad_fn=<AddBackward0>)


Training Net:  91%|███████████████████████████████████████████████████████████▊      | 339/374 [01:46<00:12,  2.79it/s]

tensor(5.1514, grad_fn=<AddBackward0>)


Training Net:  91%|████████████████████████████████████████████████████████████      | 340/374 [01:46<00:11,  2.89it/s]

tensor(5.1681, grad_fn=<AddBackward0>)


Training Net:  91%|████████████████████████████████████████████████████████████▏     | 341/374 [01:47<00:11,  2.86it/s]

tensor(5.1855, grad_fn=<AddBackward0>)


Training Net:  91%|████████████████████████████████████████████████████████████▎     | 342/374 [01:47<00:11,  2.85it/s]

tensor(5.1764, grad_fn=<AddBackward0>)


Training Net:  92%|████████████████████████████████████████████████████████████▌     | 343/374 [01:47<00:10,  2.91it/s]

tensor(5.1682, grad_fn=<AddBackward0>)


Training Net:  92%|████████████████████████████████████████████████████████████▋     | 344/374 [01:48<00:10,  2.87it/s]

tensor(5.1618, grad_fn=<AddBackward0>)


Training Net:  92%|████████████████████████████████████████████████████████████▉     | 345/374 [01:48<00:10,  2.83it/s]

tensor(5.1514, grad_fn=<AddBackward0>)


Training Net:  93%|█████████████████████████████████████████████████████████████     | 346/374 [01:48<00:09,  2.81it/s]

tensor(5.1671, grad_fn=<AddBackward0>)


Training Net:  93%|█████████████████████████████████████████████████████████████▏    | 347/374 [01:49<00:09,  2.84it/s]

tensor(5.1740, grad_fn=<AddBackward0>)


Training Net:  93%|█████████████████████████████████████████████████████████████▍    | 348/374 [01:49<00:09,  2.86it/s]

tensor(5.1592, grad_fn=<AddBackward0>)


Training Net:  93%|█████████████████████████████████████████████████████████████▌    | 349/374 [01:50<00:08,  2.79it/s]

tensor(5.0387, grad_fn=<AddBackward0>)


Training Net:  94%|█████████████████████████████████████████████████████████████▊    | 350/374 [01:50<00:08,  2.84it/s]

tensor(5.1671, grad_fn=<AddBackward0>)


Training Net:  94%|█████████████████████████████████████████████████████████████▉    | 351/374 [01:50<00:08,  2.79it/s]

tensor(5.1008, grad_fn=<AddBackward0>)


Training Net:  94%|██████████████████████████████████████████████████████████████    | 352/374 [01:51<00:07,  2.85it/s]

tensor(5.1841, grad_fn=<AddBackward0>)


Training Net:  94%|██████████████████████████████████████████████████████████████▎   | 353/374 [01:51<00:07,  2.87it/s]

tensor(5.0307, grad_fn=<AddBackward0>)


Training Net:  95%|██████████████████████████████████████████████████████████████▍   | 354/374 [01:51<00:06,  2.93it/s]

tensor(5.1696, grad_fn=<AddBackward0>)


Training Net:  95%|██████████████████████████████████████████████████████████████▋   | 355/374 [01:52<00:06,  2.95it/s]

tensor(5.1659, grad_fn=<AddBackward0>)


Training Net:  95%|██████████████████████████████████████████████████████████████▊   | 356/374 [01:52<00:06,  2.94it/s]

tensor(5.1345, grad_fn=<AddBackward0>)


Training Net:  95%|███████████████████████████████████████████████████████████████   | 357/374 [01:52<00:05,  2.97it/s]

tensor(5.1502, grad_fn=<AddBackward0>)


Training Net:  96%|███████████████████████████████████████████████████████████████▏  | 358/374 [01:53<00:05,  2.93it/s]

tensor(5.1112, grad_fn=<AddBackward0>)


Training Net:  96%|███████████████████████████████████████████████████████████████▎  | 359/374 [01:53<00:05,  2.93it/s]

tensor(5.1723, grad_fn=<AddBackward0>)


Training Net:  96%|███████████████████████████████████████████████████████████████▌  | 360/374 [01:53<00:04,  2.97it/s]

tensor(5.1764, grad_fn=<AddBackward0>)


Training Net:  97%|███████████████████████████████████████████████████████████████▋  | 361/374 [01:54<00:04,  2.97it/s]

tensor(5.1791, grad_fn=<AddBackward0>)


Training Net:  97%|███████████████████████████████████████████████████████████████▉  | 362/374 [01:54<00:04,  2.96it/s]

tensor(5.1739, grad_fn=<AddBackward0>)


Training Net:  97%|████████████████████████████████████████████████████████████████  | 363/374 [01:54<00:03,  2.95it/s]

tensor(5.1753, grad_fn=<AddBackward0>)


Training Net:  97%|████████████████████████████████████████████████████████████████▏ | 364/374 [01:55<00:03,  2.98it/s]

tensor(5.1269, grad_fn=<AddBackward0>)


Training Net:  98%|████████████████████████████████████████████████████████████████▍ | 365/374 [01:55<00:03,  2.97it/s]

tensor(5.1140, grad_fn=<AddBackward0>)


Training Net:  98%|████████████████████████████████████████████████████████████████▌ | 366/374 [01:55<00:02,  2.96it/s]

tensor(5.1189, grad_fn=<AddBackward0>)


Training Net:  98%|████████████████████████████████████████████████████████████████▊ | 367/374 [01:56<00:02,  2.96it/s]

tensor(5.1112, grad_fn=<AddBackward0>)


Training Net:  98%|████████████████████████████████████████████████████████████████▉ | 368/374 [01:56<00:02,  2.93it/s]

tensor(5.1581, grad_fn=<AddBackward0>)


Training Net:  99%|█████████████████████████████████████████████████████████████████ | 369/374 [01:56<00:01,  2.90it/s]

tensor(5.1073, grad_fn=<AddBackward0>)


Training Net:  99%|█████████████████████████████████████████████████████████████████▎| 370/374 [01:57<00:01,  2.97it/s]

tensor(5.1767, grad_fn=<AddBackward0>)


Training Net:  99%|█████████████████████████████████████████████████████████████████▍| 371/374 [01:57<00:01,  2.98it/s]

tensor(5.1535, grad_fn=<AddBackward0>)


Training Net:  99%|█████████████████████████████████████████████████████████████████▋| 372/374 [01:57<00:00,  2.98it/s]

tensor(5.1430, grad_fn=<AddBackward0>)


Training Net: 100%|█████████████████████████████████████████████████████████████████▊| 373/374 [01:58<00:00,  2.95it/s]

tensor(5.1251, grad_fn=<AddBackward0>)


Training Net: 100%|██████████████████████████████████████████████████████████████████| 374/374 [01:58<00:00,  3.16it/s]


tensor(5.1657, grad_fn=<AddBackward0>)


Training Net:   0%|▏                                                                   | 1/374 [00:00<02:01,  3.06it/s]

tensor(5.1753, grad_fn=<AddBackward0>)


Training Net:   1%|▎                                                                   | 2/374 [00:00<01:59,  3.11it/s]

tensor(5.1473, grad_fn=<AddBackward0>)


Training Net:   1%|▌                                                                   | 3/374 [00:00<01:58,  3.12it/s]

tensor(5.1728, grad_fn=<AddBackward0>)


Training Net:   1%|▋                                                                   | 4/374 [00:01<01:57,  3.15it/s]

tensor(5.1808, grad_fn=<AddBackward0>)


Training Net:   1%|▉                                                                   | 5/374 [00:01<01:59,  3.08it/s]

tensor(5.1163, grad_fn=<AddBackward0>)


Training Net:   2%|█                                                                   | 6/374 [00:01<01:59,  3.07it/s]

tensor(5.0778, grad_fn=<AddBackward0>)


Training Net:   2%|█▎                                                                  | 7/374 [00:02<02:00,  3.05it/s]

tensor(5.1141, grad_fn=<AddBackward0>)


Training Net:   2%|█▍                                                                  | 8/374 [00:02<02:02,  2.98it/s]

tensor(5.0510, grad_fn=<AddBackward0>)


Training Net:   2%|█▋                                                                  | 9/374 [00:02<02:02,  2.99it/s]

tensor(5.1516, grad_fn=<AddBackward0>)


Training Net:   3%|█▊                                                                 | 10/374 [00:03<02:00,  3.02it/s]

tensor(5.0961, grad_fn=<AddBackward0>)


Training Net:   3%|█▉                                                                 | 11/374 [00:03<02:01,  2.98it/s]

tensor(5.1727, grad_fn=<AddBackward0>)


Training Net:   3%|██▏                                                                | 12/374 [00:03<02:01,  2.98it/s]

tensor(5.0832, grad_fn=<AddBackward0>)


Training Net:   3%|██▎                                                                | 13/374 [00:04<02:00,  3.00it/s]

tensor(5.1214, grad_fn=<AddBackward0>)


Training Net:   4%|██▌                                                                | 14/374 [00:04<02:00,  3.00it/s]

tensor(5.0554, grad_fn=<AddBackward0>)


Training Net:   4%|██▋                                                                | 15/374 [00:04<01:59,  2.99it/s]

tensor(5.1449, grad_fn=<AddBackward0>)


Training Net:   4%|██▊                                                                | 16/374 [00:05<01:59,  3.00it/s]

tensor(5.1895, grad_fn=<AddBackward0>)


Training Net:   5%|███                                                                | 17/374 [00:05<01:59,  2.98it/s]

tensor(5.1828, grad_fn=<AddBackward0>)


Training Net:   5%|███▏                                                               | 18/374 [00:05<02:00,  2.95it/s]

tensor(5.1460, grad_fn=<AddBackward0>)


Training Net:   5%|███▍                                                               | 19/374 [00:06<02:00,  2.95it/s]

tensor(5.1713, grad_fn=<AddBackward0>)


Training Net:   5%|███▌                                                               | 20/374 [00:06<02:00,  2.94it/s]

tensor(5.1737, grad_fn=<AddBackward0>)


Training Net:   6%|███▊                                                               | 21/374 [00:07<02:00,  2.92it/s]

tensor(5.1176, grad_fn=<AddBackward0>)


Training Net:   6%|███▉                                                               | 22/374 [00:07<02:01,  2.89it/s]

tensor(5.0531, grad_fn=<AddBackward0>)


Training Net:   6%|████                                                               | 23/374 [00:07<02:01,  2.89it/s]

tensor(5.1515, grad_fn=<AddBackward0>)


Training Net:   6%|████▎                                                              | 24/374 [00:08<02:02,  2.86it/s]

tensor(5.1802, grad_fn=<AddBackward0>)


Training Net:   7%|████▍                                                              | 25/374 [00:08<02:03,  2.83it/s]

tensor(5.0477, grad_fn=<AddBackward0>)


Training Net:   7%|████▋                                                              | 26/374 [00:08<02:02,  2.84it/s]

tensor(5.1587, grad_fn=<AddBackward0>)


Training Net:   7%|████▊                                                              | 27/374 [00:09<02:00,  2.87it/s]

tensor(5.1137, grad_fn=<AddBackward0>)


Training Net:   7%|█████                                                              | 28/374 [00:09<02:02,  2.84it/s]

tensor(5.0708, grad_fn=<AddBackward0>)


Training Net:   8%|█████▏                                                             | 29/374 [00:09<02:02,  2.82it/s]

tensor(5.1796, grad_fn=<AddBackward0>)


Training Net:   8%|█████▎                                                             | 30/374 [00:10<02:01,  2.82it/s]

tensor(5.1182, grad_fn=<AddBackward0>)


Training Net:   8%|█████▌                                                             | 31/374 [00:10<02:00,  2.85it/s]

tensor(5.1291, grad_fn=<AddBackward0>)


Training Net:   9%|█████▋                                                             | 32/374 [00:10<01:58,  2.89it/s]

tensor(5.1801, grad_fn=<AddBackward0>)


Training Net:   9%|█████▉                                                             | 33/374 [00:11<01:57,  2.90it/s]

tensor(5.1356, grad_fn=<AddBackward0>)


Training Net:   9%|██████                                                             | 34/374 [00:11<01:57,  2.88it/s]

tensor(5.1661, grad_fn=<AddBackward0>)


Training Net:   9%|██████▎                                                            | 35/374 [00:11<01:59,  2.83it/s]

tensor(5.1648, grad_fn=<AddBackward0>)


Training Net:  10%|██████▍                                                            | 36/374 [00:12<01:58,  2.85it/s]

tensor(5.0979, grad_fn=<AddBackward0>)


Training Net:  10%|██████▋                                                            | 37/374 [00:12<01:59,  2.83it/s]

tensor(5.1050, grad_fn=<AddBackward0>)


Training Net:  10%|██████▊                                                            | 38/374 [00:12<01:58,  2.83it/s]

tensor(5.1107, grad_fn=<AddBackward0>)


Training Net:  10%|██████▉                                                            | 39/374 [00:13<01:58,  2.82it/s]

tensor(5.1051, grad_fn=<AddBackward0>)


Training Net:  11%|███████▏                                                           | 40/374 [00:13<01:59,  2.80it/s]

tensor(5.0961, grad_fn=<AddBackward0>)


Training Net:  11%|███████▎                                                           | 41/374 [00:14<02:01,  2.74it/s]

tensor(5.1126, grad_fn=<AddBackward0>)


Training Net:  11%|███████▌                                                           | 42/374 [00:14<01:59,  2.77it/s]

tensor(5.1770, grad_fn=<AddBackward0>)


Training Net:  11%|███████▋                                                           | 43/374 [00:14<01:57,  2.81it/s]

tensor(5.1078, grad_fn=<AddBackward0>)


Training Net:  12%|███████▉                                                           | 44/374 [00:15<01:55,  2.85it/s]

tensor(5.1478, grad_fn=<AddBackward0>)


Training Net:  12%|████████                                                           | 45/374 [00:15<01:55,  2.85it/s]

tensor(5.1738, grad_fn=<AddBackward0>)


Training Net:  12%|████████▏                                                          | 46/374 [00:15<01:54,  2.86it/s]

tensor(5.0794, grad_fn=<AddBackward0>)


Training Net:  13%|████████▍                                                          | 47/374 [00:16<01:54,  2.85it/s]

tensor(5.1083, grad_fn=<AddBackward0>)


Training Net:  13%|████████▌                                                          | 48/374 [00:16<01:54,  2.84it/s]

tensor(5.1376, grad_fn=<AddBackward0>)


Training Net:  13%|████████▊                                                          | 49/374 [00:16<01:53,  2.86it/s]

tensor(5.1769, grad_fn=<AddBackward0>)


Training Net:  13%|████████▉                                                          | 50/374 [00:17<01:51,  2.90it/s]

tensor(5.1354, grad_fn=<AddBackward0>)


Training Net:  14%|█████████▏                                                         | 51/374 [00:17<01:50,  2.93it/s]

tensor(5.1113, grad_fn=<AddBackward0>)


Training Net:  14%|█████████▎                                                         | 52/374 [00:17<01:48,  2.95it/s]

tensor(5.1503, grad_fn=<AddBackward0>)


Training Net:  14%|█████████▍                                                         | 53/374 [00:18<01:49,  2.93it/s]

tensor(5.1638, grad_fn=<AddBackward0>)


Training Net:  14%|█████████▋                                                         | 54/374 [00:18<01:48,  2.95it/s]

tensor(4.9533, grad_fn=<AddBackward0>)


Training Net:  15%|█████████▊                                                         | 55/374 [00:18<01:47,  2.95it/s]

tensor(5.1514, grad_fn=<AddBackward0>)


Training Net:  15%|██████████                                                         | 56/374 [00:19<01:47,  2.96it/s]

tensor(5.1465, grad_fn=<AddBackward0>)


Training Net:  15%|██████████▏                                                        | 57/374 [00:19<01:48,  2.92it/s]

tensor(5.0950, grad_fn=<AddBackward0>)


Training Net:  16%|██████████▍                                                        | 58/374 [00:19<01:48,  2.92it/s]

tensor(5.1718, grad_fn=<AddBackward0>)


Training Net:  16%|██████████▌                                                        | 59/374 [00:20<01:48,  2.90it/s]

tensor(5.0420, grad_fn=<AddBackward0>)


Training Net:  16%|██████████▋                                                        | 60/374 [00:20<01:48,  2.89it/s]

tensor(5.0789, grad_fn=<AddBackward0>)


Training Net:  16%|██████████▉                                                        | 61/374 [00:20<01:47,  2.92it/s]

tensor(5.1439, grad_fn=<AddBackward0>)


Training Net:  17%|███████████                                                        | 62/374 [00:21<01:47,  2.91it/s]

tensor(5.1258, grad_fn=<AddBackward0>)


Training Net:  17%|███████████▎                                                       | 63/374 [00:21<01:46,  2.92it/s]

tensor(5.1118, grad_fn=<AddBackward0>)


Training Net:  17%|███████████▍                                                       | 64/374 [00:22<01:46,  2.91it/s]

tensor(5.1520, grad_fn=<AddBackward0>)


Training Net:  17%|███████████▋                                                       | 65/374 [00:22<01:46,  2.90it/s]

tensor(5.1136, grad_fn=<AddBackward0>)


Training Net:  18%|███████████▊                                                       | 66/374 [00:22<01:45,  2.91it/s]

tensor(5.1288, grad_fn=<AddBackward0>)


Training Net:  18%|████████████                                                       | 67/374 [00:23<01:45,  2.90it/s]

tensor(5.1660, grad_fn=<AddBackward0>)


Training Net:  18%|████████████▏                                                      | 68/374 [00:23<01:45,  2.91it/s]

tensor(5.1454, grad_fn=<AddBackward0>)


Training Net:  18%|████████████▎                                                      | 69/374 [00:23<01:44,  2.91it/s]

tensor(5.1732, grad_fn=<AddBackward0>)


Training Net:  19%|████████████▌                                                      | 70/374 [00:24<01:48,  2.80it/s]

tensor(5.0185, grad_fn=<AddBackward0>)


Training Net:  19%|████████████▋                                                      | 71/374 [00:24<01:49,  2.78it/s]

tensor(5.1833, grad_fn=<AddBackward0>)


Training Net:  19%|████████████▉                                                      | 72/374 [00:24<01:45,  2.85it/s]

tensor(5.1692, grad_fn=<AddBackward0>)


Training Net:  20%|█████████████                                                      | 73/374 [00:25<01:43,  2.90it/s]

tensor(5.1749, grad_fn=<AddBackward0>)


Training Net:  20%|█████████████▎                                                     | 74/374 [00:25<01:43,  2.91it/s]

tensor(5.1773, grad_fn=<AddBackward0>)


Training Net:  20%|█████████████▍                                                     | 75/374 [00:25<01:42,  2.91it/s]

tensor(5.1868, grad_fn=<AddBackward0>)


Training Net:  20%|█████████████▌                                                     | 76/374 [00:26<01:43,  2.89it/s]

tensor(5.0835, grad_fn=<AddBackward0>)


Training Net:  21%|█████████████▊                                                     | 77/374 [00:26<01:43,  2.86it/s]

tensor(5.1795, grad_fn=<AddBackward0>)


Training Net:  21%|█████████████▉                                                     | 78/374 [00:26<01:41,  2.90it/s]

tensor(5.0871, grad_fn=<AddBackward0>)


Training Net:  21%|██████████████▏                                                    | 79/374 [00:27<01:40,  2.94it/s]

tensor(5.1818, grad_fn=<AddBackward0>)


Training Net:  21%|██████████████▎                                                    | 80/374 [00:27<01:39,  2.94it/s]

tensor(5.1668, grad_fn=<AddBackward0>)


Training Net:  22%|██████████████▌                                                    | 81/374 [00:27<01:39,  2.96it/s]

tensor(5.1615, grad_fn=<AddBackward0>)


Training Net:  22%|██████████████▋                                                    | 82/374 [00:28<01:37,  2.99it/s]

tensor(5.1176, grad_fn=<AddBackward0>)


Training Net:  22%|██████████████▊                                                    | 83/374 [00:28<01:36,  3.02it/s]

tensor(5.1031, grad_fn=<AddBackward0>)


Training Net:  22%|███████████████                                                    | 84/374 [00:28<01:35,  3.05it/s]

tensor(5.1658, grad_fn=<AddBackward0>)


Training Net:  23%|███████████████▏                                                   | 85/374 [00:29<01:31,  3.16it/s]

tensor(5.1654, grad_fn=<AddBackward0>)


Training Net:  23%|███████████████▍                                                   | 86/374 [00:29<01:31,  3.16it/s]

tensor(5.1519, grad_fn=<AddBackward0>)


Training Net:  23%|███████████████▌                                                   | 87/374 [00:29<01:31,  3.15it/s]

tensor(5.1794, grad_fn=<AddBackward0>)


Training Net:  24%|███████████████▊                                                   | 88/374 [00:30<01:29,  3.19it/s]

tensor(5.1748, grad_fn=<AddBackward0>)


Training Net:  24%|███████████████▉                                                   | 89/374 [00:30<01:30,  3.14it/s]

tensor(5.1722, grad_fn=<AddBackward0>)


Training Net:  24%|████████████████                                                   | 90/374 [00:30<01:29,  3.16it/s]

tensor(5.1597, grad_fn=<AddBackward0>)


Training Net:  24%|████████████████▎                                                  | 91/374 [00:31<01:28,  3.18it/s]

tensor(5.1788, grad_fn=<AddBackward0>)


Training Net:  25%|████████████████▍                                                  | 92/374 [00:31<01:28,  3.19it/s]

tensor(5.1283, grad_fn=<AddBackward0>)


Training Net:  25%|████████████████▋                                                  | 93/374 [00:31<01:29,  3.15it/s]

tensor(5.0717, grad_fn=<AddBackward0>)


Training Net:  25%|████████████████▊                                                  | 94/374 [00:31<01:30,  3.11it/s]

tensor(5.1697, grad_fn=<AddBackward0>)


Training Net:  25%|█████████████████                                                  | 95/374 [00:32<01:30,  3.08it/s]

tensor(5.1812, grad_fn=<AddBackward0>)


Training Net:  26%|█████████████████▏                                                 | 96/374 [00:32<01:29,  3.10it/s]

tensor(5.1618, grad_fn=<AddBackward0>)


Training Net:  26%|█████████████████▍                                                 | 97/374 [00:32<01:29,  3.10it/s]

tensor(5.1175, grad_fn=<AddBackward0>)


Training Net:  26%|█████████████████▌                                                 | 98/374 [00:33<01:28,  3.13it/s]

tensor(5.1771, grad_fn=<AddBackward0>)


Training Net:  26%|█████████████████▋                                                 | 99/374 [00:33<01:28,  3.12it/s]

tensor(5.1045, grad_fn=<AddBackward0>)


Training Net:  27%|█████████████████▋                                                | 100/374 [00:33<01:27,  3.13it/s]

tensor(5.1459, grad_fn=<AddBackward0>)


Training Net:  27%|█████████████████▊                                                | 101/374 [00:34<01:27,  3.12it/s]

tensor(5.1540, grad_fn=<AddBackward0>)


Training Net:  27%|██████████████████                                                | 102/374 [00:34<01:27,  3.10it/s]

tensor(5.1421, grad_fn=<AddBackward0>)


Training Net:  28%|██████████████████▏                                               | 103/374 [00:34<01:26,  3.14it/s]

tensor(5.1047, grad_fn=<AddBackward0>)


Training Net:  28%|██████████████████▎                                               | 104/374 [00:35<01:24,  3.19it/s]

tensor(5.0994, grad_fn=<AddBackward0>)


Training Net:  28%|██████████████████▌                                               | 105/374 [00:35<01:25,  3.16it/s]

tensor(5.1773, grad_fn=<AddBackward0>)


Training Net:  28%|██████████████████▋                                               | 106/374 [00:35<01:25,  3.14it/s]

tensor(5.0894, grad_fn=<AddBackward0>)


Training Net:  29%|██████████████████▉                                               | 107/374 [00:36<01:25,  3.12it/s]

tensor(5.1755, grad_fn=<AddBackward0>)


Training Net:  29%|███████████████████                                               | 108/374 [00:36<01:26,  3.08it/s]

tensor(5.1038, grad_fn=<AddBackward0>)


Training Net:  29%|███████████████████▏                                              | 109/374 [00:36<01:24,  3.13it/s]

tensor(5.1737, grad_fn=<AddBackward0>)


Training Net:  29%|███████████████████▍                                              | 110/374 [00:37<01:24,  3.13it/s]

tensor(5.1291, grad_fn=<AddBackward0>)


Training Net:  30%|███████████████████▌                                              | 111/374 [00:37<01:23,  3.15it/s]

tensor(5.1090, grad_fn=<AddBackward0>)


Training Net:  30%|███████████████████▊                                              | 112/374 [00:37<01:23,  3.14it/s]

tensor(5.1032, grad_fn=<AddBackward0>)


Training Net:  30%|███████████████████▉                                              | 113/374 [00:38<01:23,  3.11it/s]

tensor(5.1122, grad_fn=<AddBackward0>)


Training Net:  30%|████████████████████                                              | 114/374 [00:38<01:23,  3.12it/s]

tensor(5.1146, grad_fn=<AddBackward0>)


Training Net:  31%|████████████████████▎                                             | 115/374 [00:38<01:23,  3.12it/s]

tensor(5.1733, grad_fn=<AddBackward0>)


Training Net:  31%|████████████████████▍                                             | 116/374 [00:39<01:21,  3.15it/s]

tensor(5.1710, grad_fn=<AddBackward0>)


Training Net:  31%|████████████████████▋                                             | 117/374 [00:39<01:20,  3.19it/s]

tensor(5.0617, grad_fn=<AddBackward0>)


Training Net:  32%|████████████████████▊                                             | 118/374 [00:39<01:20,  3.18it/s]

tensor(5.1342, grad_fn=<AddBackward0>)


Training Net:  32%|█████████████████████                                             | 119/374 [00:39<01:21,  3.14it/s]

tensor(5.1645, grad_fn=<AddBackward0>)


Training Net:  32%|█████████████████████▏                                            | 120/374 [00:40<01:20,  3.14it/s]

tensor(5.1657, grad_fn=<AddBackward0>)


Training Net:  32%|█████████████████████▎                                            | 121/374 [00:40<01:20,  3.13it/s]

tensor(5.1472, grad_fn=<AddBackward0>)


Training Net:  33%|█████████████████████▌                                            | 122/374 [00:40<01:20,  3.13it/s]

tensor(5.1110, grad_fn=<AddBackward0>)


Training Net:  33%|█████████████████████▋                                            | 123/374 [00:41<01:20,  3.13it/s]

tensor(5.1744, grad_fn=<AddBackward0>)


Training Net:  33%|█████████████████████▉                                            | 124/374 [00:41<01:19,  3.14it/s]

tensor(5.1398, grad_fn=<AddBackward0>)


Training Net:  33%|██████████████████████                                            | 125/374 [00:41<01:18,  3.16it/s]

tensor(5.1784, grad_fn=<AddBackward0>)


Training Net:  34%|██████████████████████▏                                           | 126/374 [00:42<01:17,  3.20it/s]

tensor(5.1590, grad_fn=<AddBackward0>)


Training Net:  34%|██████████████████████▍                                           | 127/374 [00:42<01:18,  3.15it/s]

tensor(5.1013, grad_fn=<AddBackward0>)


Training Net:  34%|██████████████████████▌                                           | 128/374 [00:42<01:16,  3.21it/s]

tensor(5.2123, grad_fn=<AddBackward0>)


Training Net:  34%|██████████████████████▊                                           | 129/374 [00:43<01:15,  3.23it/s]

tensor(5.1864, grad_fn=<AddBackward0>)


Training Net:  35%|██████████████████████▉                                           | 130/374 [00:43<01:16,  3.20it/s]

tensor(5.1198, grad_fn=<AddBackward0>)


Training Net:  35%|███████████████████████                                           | 131/374 [00:43<01:15,  3.22it/s]

tensor(5.1371, grad_fn=<AddBackward0>)


Training Net:  35%|███████████████████████▎                                          | 132/374 [00:44<01:16,  3.16it/s]

tensor(5.1326, grad_fn=<AddBackward0>)


Training Net:  36%|███████████████████████▍                                          | 133/374 [00:44<01:18,  3.09it/s]

tensor(5.1918, grad_fn=<AddBackward0>)


Training Net:  36%|███████████████████████▋                                          | 134/374 [00:44<01:17,  3.10it/s]

tensor(5.1816, grad_fn=<AddBackward0>)


Training Net:  36%|███████████████████████▊                                          | 135/374 [00:45<01:15,  3.18it/s]

tensor(5.1166, grad_fn=<AddBackward0>)


Training Net:  36%|████████████████████████                                          | 136/374 [00:45<01:14,  3.19it/s]

tensor(5.1731, grad_fn=<AddBackward0>)


Training Net:  37%|████████████████████████▏                                         | 137/374 [00:45<01:15,  3.14it/s]

tensor(5.1691, grad_fn=<AddBackward0>)


Training Net:  37%|████████████████████████▎                                         | 138/374 [00:45<01:14,  3.15it/s]

tensor(5.1663, grad_fn=<AddBackward0>)


Training Net:  37%|████████████████████████▌                                         | 139/374 [00:46<01:15,  3.12it/s]

tensor(5.1128, grad_fn=<AddBackward0>)


Training Net:  37%|████████████████████████▋                                         | 140/374 [00:46<01:15,  3.09it/s]

tensor(5.1794, grad_fn=<AddBackward0>)


Training Net:  38%|████████████████████████▉                                         | 141/374 [00:46<01:13,  3.15it/s]

tensor(5.1689, grad_fn=<AddBackward0>)


Training Net:  38%|█████████████████████████                                         | 142/374 [00:47<01:12,  3.18it/s]

tensor(5.1167, grad_fn=<AddBackward0>)


Training Net:  38%|█████████████████████████▏                                        | 143/374 [00:47<01:12,  3.17it/s]

tensor(5.0516, grad_fn=<AddBackward0>)


Training Net:  39%|█████████████████████████▍                                        | 144/374 [00:47<01:13,  3.11it/s]

tensor(5.1112, grad_fn=<AddBackward0>)


Training Net:  39%|█████████████████████████▌                                        | 145/374 [00:48<01:13,  3.10it/s]

tensor(5.1494, grad_fn=<AddBackward0>)


Training Net:  39%|█████████████████████████▊                                        | 146/374 [00:48<01:12,  3.14it/s]

tensor(5.1091, grad_fn=<AddBackward0>)


Training Net:  39%|█████████████████████████▉                                        | 147/374 [00:48<01:11,  3.18it/s]

tensor(5.0710, grad_fn=<AddBackward0>)


Training Net:  40%|██████████████████████████                                        | 148/374 [00:49<01:09,  3.24it/s]

tensor(5.0375, grad_fn=<AddBackward0>)


Training Net:  40%|██████████████████████████▎                                       | 149/374 [00:49<01:10,  3.19it/s]

tensor(5.1584, grad_fn=<AddBackward0>)


Training Net:  40%|██████████████████████████▍                                       | 150/374 [00:49<01:10,  3.19it/s]

tensor(5.1742, grad_fn=<AddBackward0>)


Training Net:  40%|██████████████████████████▋                                       | 151/374 [00:50<01:10,  3.15it/s]

tensor(5.1061, grad_fn=<AddBackward0>)


Training Net:  41%|██████████████████████████▊                                       | 152/374 [00:50<01:10,  3.16it/s]

tensor(5.1235, grad_fn=<AddBackward0>)


Training Net:  41%|███████████████████████████                                       | 153/374 [00:50<01:11,  3.08it/s]

tensor(5.1162, grad_fn=<AddBackward0>)


Training Net:  41%|███████████████████████████▏                                      | 154/374 [00:51<01:10,  3.14it/s]

tensor(5.1368, grad_fn=<AddBackward0>)


Training Net:  41%|███████████████████████████▎                                      | 155/374 [00:51<01:09,  3.16it/s]

tensor(5.1807, grad_fn=<AddBackward0>)


Training Net:  42%|███████████████████████████▌                                      | 156/374 [00:51<01:08,  3.19it/s]

tensor(5.1470, grad_fn=<AddBackward0>)


Training Net:  42%|███████████████████████████▋                                      | 157/374 [00:52<01:08,  3.16it/s]

tensor(5.1196, grad_fn=<AddBackward0>)


Training Net:  42%|███████████████████████████▉                                      | 158/374 [00:52<01:08,  3.15it/s]

tensor(5.0493, grad_fn=<AddBackward0>)


Training Net:  43%|████████████████████████████                                      | 159/374 [00:52<01:09,  3.10it/s]

tensor(5.1040, grad_fn=<AddBackward0>)


Training Net:  43%|████████████████████████████▏                                     | 160/374 [00:52<01:08,  3.12it/s]

tensor(5.1011, grad_fn=<AddBackward0>)


Training Net:  43%|████████████████████████████▍                                     | 161/374 [00:53<01:07,  3.15it/s]

tensor(5.1605, grad_fn=<AddBackward0>)


Training Net:  43%|████████████████████████████▌                                     | 162/374 [00:53<01:06,  3.16it/s]

tensor(5.1290, grad_fn=<AddBackward0>)


Training Net:  44%|████████████████████████████▊                                     | 163/374 [00:53<01:06,  3.18it/s]

tensor(5.0813, grad_fn=<AddBackward0>)


Training Net:  44%|████████████████████████████▉                                     | 164/374 [00:54<01:06,  3.17it/s]

tensor(5.0932, grad_fn=<AddBackward0>)


Training Net:  44%|█████████████████████████████                                     | 165/374 [00:54<01:05,  3.18it/s]

tensor(5.1683, grad_fn=<AddBackward0>)


Training Net:  44%|█████████████████████████████▎                                    | 166/374 [00:54<01:06,  3.14it/s]

tensor(5.1778, grad_fn=<AddBackward0>)


Training Net:  45%|█████████████████████████████▍                                    | 167/374 [00:55<01:06,  3.13it/s]

tensor(5.0329, grad_fn=<AddBackward0>)


Training Net:  45%|█████████████████████████████▋                                    | 168/374 [00:55<01:05,  3.14it/s]

tensor(5.0546, grad_fn=<AddBackward0>)


Training Net:  45%|█████████████████████████████▊                                    | 169/374 [00:55<01:04,  3.16it/s]

tensor(5.1636, grad_fn=<AddBackward0>)


Training Net:  45%|██████████████████████████████                                    | 170/374 [00:56<01:04,  3.14it/s]

tensor(5.1057, grad_fn=<AddBackward0>)


Training Net:  46%|██████████████████████████████▏                                   | 171/374 [00:56<01:05,  3.08it/s]

tensor(5.1076, grad_fn=<AddBackward0>)


Training Net:  46%|██████████████████████████████▎                                   | 172/374 [00:56<01:05,  3.08it/s]

tensor(5.1589, grad_fn=<AddBackward0>)


Training Net:  46%|██████████████████████████████▌                                   | 173/374 [00:57<01:04,  3.09it/s]

tensor(5.0954, grad_fn=<AddBackward0>)


Training Net:  47%|██████████████████████████████▋                                   | 174/374 [00:57<01:04,  3.09it/s]

tensor(5.1338, grad_fn=<AddBackward0>)


Training Net:  47%|██████████████████████████████▉                                   | 175/374 [00:57<01:03,  3.15it/s]

tensor(5.1903, grad_fn=<AddBackward0>)


Training Net:  47%|███████████████████████████████                                   | 176/374 [00:58<01:03,  3.13it/s]

tensor(5.0982, grad_fn=<AddBackward0>)


Training Net:  47%|███████████████████████████████▏                                  | 177/374 [00:58<01:04,  3.07it/s]

tensor(5.1426, grad_fn=<AddBackward0>)


Training Net:  48%|███████████████████████████████▍                                  | 178/374 [00:58<01:02,  3.11it/s]

tensor(5.1118, grad_fn=<AddBackward0>)


Training Net:  48%|███████████████████████████████▌                                  | 179/374 [00:59<01:02,  3.11it/s]

tensor(5.1300, grad_fn=<AddBackward0>)


Training Net:  48%|███████████████████████████████▊                                  | 180/374 [00:59<01:01,  3.15it/s]

tensor(5.1628, grad_fn=<AddBackward0>)


Training Net:  48%|███████████████████████████████▉                                  | 181/374 [00:59<01:01,  3.11it/s]

tensor(5.0582, grad_fn=<AddBackward0>)


Training Net:  49%|████████████████████████████████                                  | 182/374 [00:59<01:01,  3.13it/s]

tensor(5.1080, grad_fn=<AddBackward0>)


Training Net:  49%|████████████████████████████████▎                                 | 183/374 [01:00<01:02,  3.07it/s]

tensor(5.1120, grad_fn=<AddBackward0>)


Training Net:  49%|████████████████████████████████▍                                 | 184/374 [01:00<01:02,  3.02it/s]

tensor(5.1603, grad_fn=<AddBackward0>)


Training Net:  49%|████████████████████████████████▋                                 | 185/374 [01:01<01:02,  3.03it/s]

tensor(5.1546, grad_fn=<AddBackward0>)


Training Net:  50%|████████████████████████████████▊                                 | 186/374 [01:01<01:01,  3.03it/s]

tensor(5.1148, grad_fn=<AddBackward0>)


Training Net:  50%|█████████████████████████████████                                 | 187/374 [01:01<01:01,  3.06it/s]

tensor(5.1305, grad_fn=<AddBackward0>)


Training Net:  50%|█████████████████████████████████▏                                | 188/374 [01:01<00:59,  3.11it/s]

tensor(5.1773, grad_fn=<AddBackward0>)


Training Net:  51%|█████████████████████████████████▎                                | 189/374 [01:02<00:59,  3.09it/s]

tensor(5.1814, grad_fn=<AddBackward0>)


Training Net:  51%|█████████████████████████████████▌                                | 190/374 [01:02<01:00,  3.06it/s]

tensor(5.1788, grad_fn=<AddBackward0>)


Training Net:  51%|█████████████████████████████████▋                                | 191/374 [01:02<01:00,  3.05it/s]

tensor(5.1857, grad_fn=<AddBackward0>)


Training Net:  51%|█████████████████████████████████▉                                | 192/374 [01:03<00:59,  3.07it/s]

tensor(5.1631, grad_fn=<AddBackward0>)


Training Net:  52%|██████████████████████████████████                                | 193/374 [01:03<00:58,  3.07it/s]

tensor(5.1645, grad_fn=<AddBackward0>)


Training Net:  52%|██████████████████████████████████▏                               | 194/374 [01:03<00:58,  3.09it/s]

tensor(5.1748, grad_fn=<AddBackward0>)


Training Net:  52%|██████████████████████████████████▍                               | 195/374 [01:04<00:59,  3.03it/s]

tensor(5.1526, grad_fn=<AddBackward0>)


Training Net:  52%|██████████████████████████████████▌                               | 196/374 [01:04<00:59,  3.01it/s]

tensor(5.1588, grad_fn=<AddBackward0>)


Training Net:  53%|██████████████████████████████████▊                               | 197/374 [01:04<00:58,  3.03it/s]

tensor(5.1163, grad_fn=<AddBackward0>)


Training Net:  53%|██████████████████████████████████▉                               | 198/374 [01:05<00:58,  3.03it/s]

tensor(5.1683, grad_fn=<AddBackward0>)


Training Net:  53%|███████████████████████████████████                               | 199/374 [01:05<00:56,  3.10it/s]

tensor(5.1422, grad_fn=<AddBackward0>)


Training Net:  53%|███████████████████████████████████▎                              | 200/374 [01:05<00:56,  3.06it/s]

tensor(5.1191, grad_fn=<AddBackward0>)


Training Net:  54%|███████████████████████████████████▍                              | 201/374 [01:06<00:56,  3.05it/s]

tensor(5.1437, grad_fn=<AddBackward0>)


Training Net:  54%|███████████████████████████████████▋                              | 202/374 [01:06<00:56,  3.03it/s]

tensor(5.1285, grad_fn=<AddBackward0>)


Training Net:  54%|███████████████████████████████████▊                              | 203/374 [01:06<00:56,  3.04it/s]

tensor(5.1870, grad_fn=<AddBackward0>)


Training Net:  55%|████████████████████████████████████                              | 204/374 [01:07<00:55,  3.06it/s]

tensor(5.1426, grad_fn=<AddBackward0>)


Training Net:  55%|████████████████████████████████████▏                             | 205/374 [01:07<00:54,  3.09it/s]

tensor(5.1507, grad_fn=<AddBackward0>)


Training Net:  55%|████████████████████████████████████▎                             | 206/374 [01:07<00:56,  2.97it/s]

tensor(5.1290, grad_fn=<AddBackward0>)


Training Net:  55%|████████████████████████████████████▌                             | 207/374 [01:08<00:56,  2.95it/s]

tensor(5.2189, grad_fn=<AddBackward0>)


Training Net:  56%|████████████████████████████████████▋                             | 208/374 [01:08<00:56,  2.94it/s]

tensor(5.1351, grad_fn=<AddBackward0>)


Training Net:  56%|████████████████████████████████████▉                             | 209/374 [01:08<00:56,  2.91it/s]

tensor(5.1855, grad_fn=<AddBackward0>)


Training Net:  56%|█████████████████████████████████████                             | 210/374 [01:09<00:57,  2.87it/s]

tensor(5.1695, grad_fn=<AddBackward0>)


Training Net:  56%|█████████████████████████████████████▏                            | 211/374 [01:09<00:56,  2.86it/s]

tensor(5.1715, grad_fn=<AddBackward0>)


Training Net:  57%|█████████████████████████████████████▍                            | 212/374 [01:10<00:57,  2.82it/s]

tensor(5.1601, grad_fn=<AddBackward0>)


Training Net:  57%|█████████████████████████████████████▌                            | 213/374 [01:10<00:57,  2.80it/s]

tensor(5.0790, grad_fn=<AddBackward0>)


Training Net:  57%|█████████████████████████████████████▊                            | 214/374 [01:10<00:57,  2.79it/s]

tensor(5.1039, grad_fn=<AddBackward0>)


Training Net:  57%|█████████████████████████████████████▉                            | 215/374 [01:11<00:56,  2.81it/s]

tensor(5.1789, grad_fn=<AddBackward0>)


Training Net:  58%|██████████████████████████████████████                            | 216/374 [01:11<00:55,  2.84it/s]

tensor(5.1988, grad_fn=<AddBackward0>)


Training Net:  58%|██████████████████████████████████████▎                           | 217/374 [01:11<00:55,  2.82it/s]

tensor(5.0984, grad_fn=<AddBackward0>)


Training Net:  58%|██████████████████████████████████████▍                           | 218/374 [01:12<00:55,  2.79it/s]

tensor(5.0760, grad_fn=<AddBackward0>)


Training Net:  59%|██████████████████████████████████████▋                           | 219/374 [01:12<00:56,  2.73it/s]

tensor(5.0797, grad_fn=<AddBackward0>)


Training Net:  59%|██████████████████████████████████████▊                           | 220/374 [01:12<00:55,  2.77it/s]

tensor(5.1780, grad_fn=<AddBackward0>)


Training Net:  59%|███████████████████████████████████████                           | 221/374 [01:13<00:54,  2.79it/s]

tensor(5.1785, grad_fn=<AddBackward0>)


Training Net:  59%|███████████████████████████████████████▏                          | 222/374 [01:13<00:55,  2.76it/s]

tensor(5.1665, grad_fn=<AddBackward0>)


Training Net:  60%|███████████████████████████████████████▎                          | 223/374 [01:13<00:54,  2.75it/s]

tensor(5.0545, grad_fn=<AddBackward0>)


Training Net:  60%|███████████████████████████████████████▌                          | 224/374 [01:14<00:55,  2.72it/s]

tensor(5.1723, grad_fn=<AddBackward0>)


Training Net:  60%|███████████████████████████████████████▋                          | 225/374 [01:14<00:54,  2.76it/s]

tensor(5.1174, grad_fn=<AddBackward0>)


Training Net:  60%|███████████████████████████████████████▉                          | 226/374 [01:15<00:53,  2.78it/s]

tensor(5.1153, grad_fn=<AddBackward0>)


Training Net:  61%|████████████████████████████████████████                          | 227/374 [01:15<00:52,  2.80it/s]

tensor(5.1720, grad_fn=<AddBackward0>)


Training Net:  61%|████████████████████████████████████████▏                         | 228/374 [01:15<00:52,  2.77it/s]

tensor(5.1916, grad_fn=<AddBackward0>)


Training Net:  61%|████████████████████████████████████████▍                         | 229/374 [01:16<00:51,  2.79it/s]

tensor(5.0928, grad_fn=<AddBackward0>)


Training Net:  61%|████████████████████████████████████████▌                         | 230/374 [01:16<00:52,  2.76it/s]

tensor(5.1734, grad_fn=<AddBackward0>)


Training Net:  62%|████████████████████████████████████████▊                         | 231/374 [01:16<00:51,  2.80it/s]

tensor(5.1624, grad_fn=<AddBackward0>)


Training Net:  62%|████████████████████████████████████████▉                         | 232/374 [01:17<00:50,  2.80it/s]

tensor(5.1745, grad_fn=<AddBackward0>)


Training Net:  62%|█████████████████████████████████████████                         | 233/374 [01:17<00:50,  2.81it/s]

tensor(5.0791, grad_fn=<AddBackward0>)


Training Net:  63%|█████████████████████████████████████████▎                        | 234/374 [01:17<00:49,  2.82it/s]

tensor(5.1772, grad_fn=<AddBackward0>)


Training Net:  63%|█████████████████████████████████████████▍                        | 235/374 [01:18<00:49,  2.80it/s]

tensor(5.1548, grad_fn=<AddBackward0>)


Training Net:  63%|█████████████████████████████████████████▋                        | 236/374 [01:18<00:49,  2.78it/s]

tensor(5.0474, grad_fn=<AddBackward0>)


Training Net:  63%|█████████████████████████████████████████▊                        | 237/374 [01:19<00:49,  2.79it/s]

tensor(5.1781, grad_fn=<AddBackward0>)


Training Net:  64%|██████████████████████████████████████████                        | 238/374 [01:19<00:48,  2.78it/s]

tensor(5.0997, grad_fn=<AddBackward0>)


Training Net:  64%|██████████████████████████████████████████▏                       | 239/374 [01:19<00:48,  2.76it/s]

tensor(5.1128, grad_fn=<AddBackward0>)


Training Net:  64%|██████████████████████████████████████████▎                       | 240/374 [01:20<00:48,  2.74it/s]

tensor(5.1738, grad_fn=<AddBackward0>)


Training Net:  64%|██████████████████████████████████████████▌                       | 241/374 [01:20<00:48,  2.73it/s]

tensor(5.1647, grad_fn=<AddBackward0>)


Training Net:  65%|██████████████████████████████████████████▋                       | 242/374 [01:20<00:48,  2.73it/s]

tensor(5.1845, grad_fn=<AddBackward0>)


Training Net:  65%|██████████████████████████████████████████▉                       | 243/374 [01:21<00:47,  2.77it/s]

tensor(5.1870, grad_fn=<AddBackward0>)


Training Net:  65%|███████████████████████████████████████████                       | 244/374 [01:21<00:47,  2.75it/s]

tensor(5.1413, grad_fn=<AddBackward0>)


Training Net:  66%|███████████████████████████████████████████▏                      | 245/374 [01:21<00:48,  2.68it/s]

tensor(5.1076, grad_fn=<AddBackward0>)


Training Net:  66%|███████████████████████████████████████████▍                      | 246/374 [01:22<00:49,  2.61it/s]

tensor(5.1010, grad_fn=<AddBackward0>)


Training Net:  66%|███████████████████████████████████████████▌                      | 247/374 [01:22<00:49,  2.56it/s]

tensor(5.1696, grad_fn=<AddBackward0>)


Training Net:  66%|███████████████████████████████████████████▊                      | 248/374 [01:23<00:48,  2.58it/s]

tensor(5.1562, grad_fn=<AddBackward0>)


Training Net:  67%|███████████████████████████████████████████▉                      | 249/374 [01:23<00:46,  2.67it/s]

tensor(5.1777, grad_fn=<AddBackward0>)


Training Net:  67%|████████████████████████████████████████████                      | 250/374 [01:23<00:45,  2.72it/s]

tensor(5.1786, grad_fn=<AddBackward0>)


Training Net:  67%|████████████████████████████████████████████▎                     | 251/374 [01:24<00:46,  2.67it/s]

tensor(5.0992, grad_fn=<AddBackward0>)


Training Net:  67%|████████████████████████████████████████████▍                     | 252/374 [01:24<00:45,  2.69it/s]

tensor(5.1722, grad_fn=<AddBackward0>)


Training Net:  68%|████████████████████████████████████████████▋                     | 253/374 [01:24<00:44,  2.73it/s]

tensor(5.1553, grad_fn=<AddBackward0>)


Training Net:  68%|████████████████████████████████████████████▊                     | 254/374 [01:25<00:43,  2.75it/s]

tensor(5.0575, grad_fn=<AddBackward0>)


Training Net:  68%|█████████████████████████████████████████████                     | 255/374 [01:25<00:43,  2.72it/s]

tensor(5.1040, grad_fn=<AddBackward0>)


Training Net:  68%|█████████████████████████████████████████████▏                    | 256/374 [01:26<00:43,  2.68it/s]

tensor(5.1363, grad_fn=<AddBackward0>)


Training Net:  69%|█████████████████████████████████████████████▎                    | 257/374 [01:26<00:43,  2.66it/s]

tensor(5.1491, grad_fn=<AddBackward0>)


Training Net:  69%|█████████████████████████████████████████████▌                    | 258/374 [01:26<00:42,  2.71it/s]

tensor(4.9693, grad_fn=<AddBackward0>)


Training Net:  69%|█████████████████████████████████████████████▋                    | 259/374 [01:27<00:42,  2.72it/s]

tensor(5.1456, grad_fn=<AddBackward0>)


Training Net:  70%|█████████████████████████████████████████████▉                    | 260/374 [01:27<00:41,  2.74it/s]

tensor(5.1681, grad_fn=<AddBackward0>)


Training Net:  70%|██████████████████████████████████████████████                    | 261/374 [01:27<00:41,  2.75it/s]

tensor(5.0905, grad_fn=<AddBackward0>)


Training Net:  70%|██████████████████████████████████████████████▏                   | 262/374 [01:28<00:41,  2.72it/s]

tensor(5.1518, grad_fn=<AddBackward0>)


Training Net:  70%|██████████████████████████████████████████████▍                   | 263/374 [01:28<00:40,  2.71it/s]

tensor(5.1642, grad_fn=<AddBackward0>)


Training Net:  71%|██████████████████████████████████████████████▌                   | 264/374 [01:29<00:40,  2.69it/s]

tensor(5.1770, grad_fn=<AddBackward0>)


Training Net:  71%|██████████████████████████████████████████████▊                   | 265/374 [01:29<00:40,  2.72it/s]

tensor(5.1753, grad_fn=<AddBackward0>)


Training Net:  71%|██████████████████████████████████████████████▉                   | 266/374 [01:29<00:39,  2.70it/s]

tensor(5.1343, grad_fn=<AddBackward0>)


Training Net:  71%|███████████████████████████████████████████████                   | 267/374 [01:30<00:40,  2.62it/s]

tensor(5.0990, grad_fn=<AddBackward0>)


Training Net:  72%|███████████████████████████████████████████████▎                  | 268/374 [01:30<00:40,  2.59it/s]

tensor(5.1102, grad_fn=<AddBackward0>)


Training Net:  72%|███████████████████████████████████████████████▍                  | 269/374 [01:30<00:40,  2.58it/s]

tensor(5.1696, grad_fn=<AddBackward0>)


Training Net:  72%|███████████████████████████████████████████████▋                  | 270/374 [01:31<00:40,  2.57it/s]

tensor(5.1652, grad_fn=<AddBackward0>)


Training Net:  72%|███████████████████████████████████████████████▊                  | 271/374 [01:31<00:39,  2.62it/s]

tensor(5.1784, grad_fn=<AddBackward0>)


Training Net:  73%|████████████████████████████████████████████████                  | 272/374 [01:32<00:39,  2.61it/s]

tensor(5.1344, grad_fn=<AddBackward0>)


Training Net:  73%|████████████████████████████████████████████████▏                 | 273/374 [01:32<00:39,  2.54it/s]

tensor(5.1780, grad_fn=<AddBackward0>)


Training Net:  73%|████████████████████████████████████████████████▎                 | 274/374 [01:32<00:38,  2.59it/s]

tensor(5.1408, grad_fn=<AddBackward0>)


Training Net:  74%|████████████████████████████████████████████████▌                 | 275/374 [01:33<00:37,  2.62it/s]

tensor(5.1756, grad_fn=<AddBackward0>)


Training Net:  74%|████████████████████████████████████████████████▋                 | 276/374 [01:33<00:37,  2.64it/s]

tensor(5.1684, grad_fn=<AddBackward0>)


Training Net:  74%|████████████████████████████████████████████████▉                 | 277/374 [01:33<00:36,  2.69it/s]

tensor(5.1575, grad_fn=<AddBackward0>)


Training Net:  74%|█████████████████████████████████████████████████                 | 278/374 [01:34<00:36,  2.60it/s]

tensor(5.1652, grad_fn=<AddBackward0>)


Training Net:  75%|█████████████████████████████████████████████████▏                | 279/374 [01:34<00:35,  2.66it/s]

tensor(5.1266, grad_fn=<AddBackward0>)


Training Net:  75%|█████████████████████████████████████████████████▍                | 280/374 [01:35<00:35,  2.64it/s]

tensor(5.0121, grad_fn=<AddBackward0>)


Training Net:  75%|█████████████████████████████████████████████████▌                | 281/374 [01:35<00:33,  2.75it/s]

tensor(5.1729, grad_fn=<AddBackward0>)


Training Net:  75%|█████████████████████████████████████████████████▊                | 282/374 [01:35<00:32,  2.79it/s]

tensor(5.1375, grad_fn=<AddBackward0>)


Training Net:  76%|█████████████████████████████████████████████████▉                | 283/374 [01:36<00:32,  2.80it/s]

tensor(5.1042, grad_fn=<AddBackward0>)


Training Net:  76%|██████████████████████████████████████████████████                | 284/374 [01:36<00:32,  2.80it/s]

tensor(5.1382, grad_fn=<AddBackward0>)


Training Net:  76%|██████████████████████████████████████████████████▎               | 285/374 [01:36<00:32,  2.77it/s]

tensor(5.1189, grad_fn=<AddBackward0>)


Training Net:  76%|██████████████████████████████████████████████████▍               | 286/374 [01:37<00:31,  2.76it/s]

tensor(5.1714, grad_fn=<AddBackward0>)


Training Net:  77%|██████████████████████████████████████████████████▋               | 287/374 [01:37<00:31,  2.78it/s]

tensor(5.1357, grad_fn=<AddBackward0>)


Training Net:  77%|██████████████████████████████████████████████████▊               | 288/374 [01:37<00:30,  2.78it/s]

tensor(5.1732, grad_fn=<AddBackward0>)


Training Net:  77%|███████████████████████████████████████████████████               | 289/374 [01:38<00:30,  2.80it/s]

tensor(5.1093, grad_fn=<AddBackward0>)


Training Net:  78%|███████████████████████████████████████████████████▏              | 290/374 [01:38<00:30,  2.77it/s]

tensor(5.1635, grad_fn=<AddBackward0>)


Training Net:  78%|███████████████████████████████████████████████████▎              | 291/374 [01:39<00:29,  2.80it/s]

tensor(5.0956, grad_fn=<AddBackward0>)


Training Net:  78%|███████████████████████████████████████████████████▌              | 292/374 [01:39<00:28,  2.85it/s]

tensor(5.0768, grad_fn=<AddBackward0>)


Training Net:  78%|███████████████████████████████████████████████████▋              | 293/374 [01:39<00:28,  2.81it/s]

tensor(5.1564, grad_fn=<AddBackward0>)


Training Net:  79%|███████████████████████████████████████████████████▉              | 294/374 [01:40<00:28,  2.77it/s]

tensor(5.1339, grad_fn=<AddBackward0>)


Training Net:  79%|████████████████████████████████████████████████████              | 295/374 [01:40<00:28,  2.75it/s]

tensor(5.1700, grad_fn=<AddBackward0>)


Training Net:  79%|████████████████████████████████████████████████████▏             | 296/374 [01:40<00:28,  2.72it/s]

tensor(5.1726, grad_fn=<AddBackward0>)


Training Net:  79%|████████████████████████████████████████████████████▍             | 297/374 [01:41<00:27,  2.77it/s]

tensor(5.1455, grad_fn=<AddBackward0>)


Training Net:  80%|████████████████████████████████████████████████████▌             | 298/374 [01:41<00:27,  2.78it/s]

tensor(5.1702, grad_fn=<AddBackward0>)


Training Net:  80%|████████████████████████████████████████████████████▊             | 299/374 [01:41<00:27,  2.76it/s]

tensor(5.1156, grad_fn=<AddBackward0>)


Training Net:  80%|████████████████████████████████████████████████████▉             | 300/374 [01:42<00:27,  2.73it/s]

tensor(5.1778, grad_fn=<AddBackward0>)


Training Net:  80%|█████████████████████████████████████████████████████             | 301/374 [01:42<00:27,  2.64it/s]

tensor(5.1705, grad_fn=<AddBackward0>)


Training Net:  81%|█████████████████████████████████████████████████████▎            | 302/374 [01:43<00:27,  2.62it/s]

tensor(5.1573, grad_fn=<AddBackward0>)


Training Net:  81%|█████████████████████████████████████████████████████▍            | 303/374 [01:43<00:27,  2.60it/s]

tensor(5.1099, grad_fn=<AddBackward0>)


Training Net:  81%|█████████████████████████████████████████████████████▋            | 304/374 [01:43<00:26,  2.61it/s]

tensor(5.0431, grad_fn=<AddBackward0>)


Training Net:  82%|█████████████████████████████████████████████████████▊            | 305/374 [01:44<00:26,  2.65it/s]

tensor(5.1341, grad_fn=<AddBackward0>)


Training Net:  82%|██████████████████████████████████████████████████████            | 306/374 [01:44<00:25,  2.70it/s]

tensor(5.0385, grad_fn=<AddBackward0>)


Training Net:  82%|██████████████████████████████████████████████████████▏           | 307/374 [01:44<00:24,  2.73it/s]

tensor(5.1559, grad_fn=<AddBackward0>)


Training Net:  82%|██████████████████████████████████████████████████████▎           | 308/374 [01:45<00:24,  2.65it/s]

tensor(5.1174, grad_fn=<AddBackward0>)


Training Net:  83%|██████████████████████████████████████████████████████▌           | 309/374 [01:45<00:25,  2.58it/s]

tensor(5.1698, grad_fn=<AddBackward0>)


Training Net:  83%|██████████████████████████████████████████████████████▋           | 310/374 [01:46<00:26,  2.46it/s]

tensor(5.1640, grad_fn=<AddBackward0>)


Training Net:  83%|██████████████████████████████████████████████████████▉           | 311/374 [01:46<00:25,  2.44it/s]

tensor(5.1469, grad_fn=<AddBackward0>)


Training Net:  83%|███████████████████████████████████████████████████████           | 312/374 [01:46<00:24,  2.53it/s]

tensor(5.1144, grad_fn=<AddBackward0>)


Training Net:  84%|███████████████████████████████████████████████████████▏          | 313/374 [01:47<00:23,  2.59it/s]

tensor(5.1382, grad_fn=<AddBackward0>)


Training Net:  84%|███████████████████████████████████████████████████████▍          | 314/374 [01:47<00:22,  2.62it/s]

tensor(5.1407, grad_fn=<AddBackward0>)


Training Net:  84%|███████████████████████████████████████████████████████▌          | 315/374 [01:48<00:22,  2.60it/s]

tensor(5.1555, grad_fn=<AddBackward0>)


Training Net:  84%|███████████████████████████████████████████████████████▊          | 316/374 [01:48<00:21,  2.68it/s]

tensor(5.1620, grad_fn=<AddBackward0>)


Training Net:  85%|███████████████████████████████████████████████████████▉          | 317/374 [01:48<00:21,  2.71it/s]

tensor(5.1425, grad_fn=<AddBackward0>)


Training Net:  85%|████████████████████████████████████████████████████████          | 318/374 [01:49<00:20,  2.75it/s]

tensor(5.1559, grad_fn=<AddBackward0>)


Training Net:  85%|████████████████████████████████████████████████████████▎         | 319/374 [01:49<00:19,  2.78it/s]

tensor(5.1323, grad_fn=<AddBackward0>)


Training Net:  86%|████████████████████████████████████████████████████████▍         | 320/374 [01:49<00:19,  2.80it/s]

tensor(5.1712, grad_fn=<AddBackward0>)


Training Net:  86%|████████████████████████████████████████████████████████▋         | 321/374 [01:50<00:18,  2.81it/s]

tensor(5.1869, grad_fn=<AddBackward0>)


Training Net:  86%|████████████████████████████████████████████████████████▊         | 322/374 [01:50<00:18,  2.78it/s]

tensor(5.1553, grad_fn=<AddBackward0>)


Training Net:  86%|█████████████████████████████████████████████████████████         | 323/374 [01:50<00:18,  2.81it/s]

tensor(5.1745, grad_fn=<AddBackward0>)


Training Net:  87%|█████████████████████████████████████████████████████████▏        | 324/374 [01:51<00:17,  2.85it/s]

tensor(5.1539, grad_fn=<AddBackward0>)


Training Net:  87%|█████████████████████████████████████████████████████████▎        | 325/374 [01:51<00:17,  2.87it/s]

tensor(5.1326, grad_fn=<AddBackward0>)


Training Net:  87%|█████████████████████████████████████████████████████████▌        | 326/374 [01:51<00:16,  2.88it/s]

tensor(5.0530, grad_fn=<AddBackward0>)


Training Net:  87%|█████████████████████████████████████████████████████████▋        | 327/374 [01:52<00:16,  2.88it/s]

tensor(5.1722, grad_fn=<AddBackward0>)


Training Net:  88%|█████████████████████████████████████████████████████████▉        | 328/374 [01:52<00:16,  2.87it/s]

tensor(5.0550, grad_fn=<AddBackward0>)


Training Net:  88%|██████████████████████████████████████████████████████████        | 329/374 [01:53<00:15,  2.85it/s]

tensor(5.1634, grad_fn=<AddBackward0>)


Training Net:  88%|██████████████████████████████████████████████████████████▏       | 330/374 [01:53<00:15,  2.85it/s]

tensor(5.1193, grad_fn=<AddBackward0>)


Training Net:  89%|██████████████████████████████████████████████████████████▍       | 331/374 [01:53<00:15,  2.87it/s]

tensor(5.1037, grad_fn=<AddBackward0>)


Training Net:  89%|██████████████████████████████████████████████████████████▌       | 332/374 [01:54<00:14,  2.85it/s]

tensor(5.1222, grad_fn=<AddBackward0>)


Training Net:  89%|██████████████████████████████████████████████████████████▊       | 333/374 [01:54<00:14,  2.88it/s]

tensor(5.1708, grad_fn=<AddBackward0>)


Training Net:  89%|██████████████████████████████████████████████████████████▉       | 334/374 [01:54<00:13,  2.87it/s]

tensor(5.1316, grad_fn=<AddBackward0>)


Training Net:  90%|███████████████████████████████████████████████████████████       | 335/374 [01:55<00:13,  2.84it/s]

tensor(5.1614, grad_fn=<AddBackward0>)


Training Net:  90%|███████████████████████████████████████████████████████████▎      | 336/374 [01:55<00:13,  2.84it/s]

tensor(5.1717, grad_fn=<AddBackward0>)


Training Net:  90%|███████████████████████████████████████████████████████████▍      | 337/374 [01:55<00:12,  2.85it/s]

tensor(5.1355, grad_fn=<AddBackward0>)


Training Net:  90%|███████████████████████████████████████████████████████████▋      | 338/374 [01:56<00:12,  2.85it/s]

tensor(5.1742, grad_fn=<AddBackward0>)


Training Net:  91%|███████████████████████████████████████████████████████████▊      | 339/374 [01:56<00:12,  2.79it/s]

tensor(5.1008, grad_fn=<AddBackward0>)


Training Net:  91%|████████████████████████████████████████████████████████████      | 340/374 [01:56<00:12,  2.81it/s]

tensor(5.1326, grad_fn=<AddBackward0>)


Training Net:  91%|████████████████████████████████████████████████████████████▏     | 341/374 [01:57<00:11,  2.85it/s]

tensor(5.1767, grad_fn=<AddBackward0>)


Training Net:  91%|████████████████████████████████████████████████████████████▎     | 342/374 [01:57<00:11,  2.84it/s]

tensor(5.1689, grad_fn=<AddBackward0>)


Training Net:  92%|████████████████████████████████████████████████████████████▌     | 343/374 [01:58<00:11,  2.72it/s]

tensor(5.1016, grad_fn=<AddBackward0>)


Training Net:  92%|████████████████████████████████████████████████████████████▋     | 344/374 [01:58<00:11,  2.69it/s]

tensor(5.1525, grad_fn=<AddBackward0>)


Training Net:  92%|████████████████████████████████████████████████████████████▉     | 345/374 [01:58<00:10,  2.71it/s]

tensor(5.1317, grad_fn=<AddBackward0>)


Training Net:  93%|█████████████████████████████████████████████████████████████     | 346/374 [01:59<00:10,  2.71it/s]

tensor(5.0652, grad_fn=<AddBackward0>)


Training Net:  93%|█████████████████████████████████████████████████████████████▏    | 347/374 [01:59<00:09,  2.77it/s]

tensor(5.1107, grad_fn=<AddBackward0>)


Training Net:  93%|█████████████████████████████████████████████████████████████▍    | 348/374 [01:59<00:09,  2.77it/s]

tensor(5.1829, grad_fn=<AddBackward0>)


Training Net:  93%|█████████████████████████████████████████████████████████████▌    | 349/374 [02:00<00:09,  2.76it/s]

tensor(5.1106, grad_fn=<AddBackward0>)


Training Net:  94%|█████████████████████████████████████████████████████████████▊    | 350/374 [02:00<00:08,  2.74it/s]

tensor(5.1470, grad_fn=<AddBackward0>)


Training Net:  94%|█████████████████████████████████████████████████████████████▉    | 351/374 [02:00<00:08,  2.77it/s]

tensor(5.0877, grad_fn=<AddBackward0>)


Training Net:  94%|██████████████████████████████████████████████████████████████    | 352/374 [02:01<00:07,  2.82it/s]

tensor(5.1593, grad_fn=<AddBackward0>)


Training Net:  94%|██████████████████████████████████████████████████████████████▎   | 353/374 [02:01<00:07,  2.85it/s]

tensor(5.0904, grad_fn=<AddBackward0>)


Training Net:  95%|██████████████████████████████████████████████████████████████▍   | 354/374 [02:01<00:06,  2.88it/s]

tensor(5.1269, grad_fn=<AddBackward0>)


Training Net:  95%|██████████████████████████████████████████████████████████████▋   | 355/374 [02:02<00:06,  2.84it/s]

tensor(5.1715, grad_fn=<AddBackward0>)


Training Net:  95%|██████████████████████████████████████████████████████████████▊   | 356/374 [02:02<00:06,  2.84it/s]

tensor(5.0576, grad_fn=<AddBackward0>)


Training Net:  95%|███████████████████████████████████████████████████████████████   | 357/374 [02:02<00:05,  2.85it/s]

tensor(5.1250, grad_fn=<AddBackward0>)


Training Net:  96%|███████████████████████████████████████████████████████████████▏  | 358/374 [02:03<00:05,  2.87it/s]

tensor(5.0903, grad_fn=<AddBackward0>)


Training Net:  96%|███████████████████████████████████████████████████████████████▎  | 359/374 [02:03<00:05,  2.89it/s]

tensor(5.1425, grad_fn=<AddBackward0>)


Training Net:  96%|███████████████████████████████████████████████████████████████▌  | 360/374 [02:04<00:04,  2.84it/s]

tensor(5.1707, grad_fn=<AddBackward0>)


Training Net:  97%|███████████████████████████████████████████████████████████████▋  | 361/374 [02:04<00:04,  2.88it/s]

tensor(5.1632, grad_fn=<AddBackward0>)


Training Net:  97%|███████████████████████████████████████████████████████████████▉  | 362/374 [02:04<00:04,  2.86it/s]

tensor(5.1200, grad_fn=<AddBackward0>)


Training Net:  97%|████████████████████████████████████████████████████████████████  | 363/374 [02:05<00:03,  2.84it/s]

tensor(5.1114, grad_fn=<AddBackward0>)


Training Net:  97%|████████████████████████████████████████████████████████████████▏ | 364/374 [02:05<00:03,  2.86it/s]

tensor(5.1745, grad_fn=<AddBackward0>)


Training Net:  98%|████████████████████████████████████████████████████████████████▍ | 365/374 [02:05<00:03,  2.86it/s]

tensor(5.1455, grad_fn=<AddBackward0>)


Training Net:  98%|████████████████████████████████████████████████████████████████▌ | 366/374 [02:06<00:02,  2.83it/s]

tensor(5.1240, grad_fn=<AddBackward0>)


Training Net:  98%|████████████████████████████████████████████████████████████████▊ | 367/374 [02:06<00:02,  2.83it/s]

tensor(5.1608, grad_fn=<AddBackward0>)


Training Net:  98%|████████████████████████████████████████████████████████████████▉ | 368/374 [02:06<00:02,  2.84it/s]

tensor(5.1740, grad_fn=<AddBackward0>)


Training Net:  99%|█████████████████████████████████████████████████████████████████ | 369/374 [02:07<00:01,  2.86it/s]

tensor(5.1685, grad_fn=<AddBackward0>)


Training Net:  99%|█████████████████████████████████████████████████████████████████▎| 370/374 [02:07<00:01,  2.89it/s]

tensor(5.1131, grad_fn=<AddBackward0>)


Training Net:  99%|█████████████████████████████████████████████████████████████████▍| 371/374 [02:07<00:01,  2.86it/s]

tensor(5.1787, grad_fn=<AddBackward0>)


Training Net:  99%|█████████████████████████████████████████████████████████████████▋| 372/374 [02:08<00:00,  2.84it/s]

tensor(5.1126, grad_fn=<AddBackward0>)


Training Net: 100%|█████████████████████████████████████████████████████████████████▊| 373/374 [02:08<00:00,  2.81it/s]

tensor(5.1679, grad_fn=<AddBackward0>)


Training Net: 100%|██████████████████████████████████████████████████████████████████| 374/374 [02:08<00:00,  2.90it/s]

tensor(5.1731, grad_fn=<AddBackward0>)





In [386]:
pmcts = MCTS(pnet,15,8)

In [396]:
nmcts = MCTS(nnet,15,8)

In [397]:
def play_game():
        
        players = [1,-1]
        
        position = Board(8)
        squares = [[a,b] for a in range(8) for b in range(8)]
        
        tree = [nmcts,pmcts]
        
        cur_player = 1
        cur_tree = 0
        moves = 0
        
        while position.get_game_ended() == 0:
            
            moves += 1
  
            
            action_idx = np.argmax(tree[cur_tree].get_action_probs(position,cur_player))
            
            move = squares[action_idx]
            
            position = position.execute_move(move,cur_player) 
            
            cur_player = -cur_player
            cur_tree = (cur_tree+1) % 2
            
        return position.get_game_ended()
            
        
                                        
            
            
            
            
    

In [399]:
def play_games(num_games):
    
    num = num_games//2
    
    player_1 = 0
    player_2 = 0
    draws = 0
    
    for _ in tqdm(range(num),desc='Games'):
        
        game_result = play_game()
        
        if game_result == 1:
            player_1 += 1
            
        elif game_result == -1:
            player_2 += 1
            
        else:
            draws += 0
            
            
    for _ in tqdm(range(num),desc='Games'):
        
        game_result = play_game()
        
        if game_result == 1:
            player_2 += 1
            
        elif game_result == -1:
            player_1 += 1
            
        else:
            draws += 0
            
    
    return player_1,player_2, draws    

In [400]:
play_games(10)

Games: 100%|█████████████████████████████████████████████████████████████████████████████| 5/5 [01:03<00:00, 12.72s/it]
Games: 100%|█████████████████████████████████████████████████████████████████████████████| 5/5 [01:08<00:00, 13.80s/it]


(6, 4, 0)