# Textual entailment

### Imports

In [1]:
from tqdm import tqdm
import tensorflow as tf
import numpy as np
import sys
display_step = 10

### Embeddings

Download Glove word embeddings

In [3]:
glove_zip_file = "data/glove.6B.zip"
glove_vectors_file = "data/glove.6B.50d.txt"
import zipfile, urllib.request, shutil, os
    
#large file - 862 MB
if (not os.path.isfile(glove_zip_file) and
    not os.path.isfile(glove_vectors_file)):
    with urllib.request.urlopen("http://nlp.stanford.edu/data/glove.6B.zip") as response, open(glove_zip_file, 'wb') as out_file:
        shutil.copyfileobj(response, out_file)

Unzip word embeddings

In [4]:
import zipfile
def unzip_single_file(zip_file_name, output_file_name):
    """
        If the outFile is already created, don't recreate
        If the outFile does not exist, create it from the zipFile
    """
    if not os.path.isfile(output_file_name):
        with open(output_file_name, 'wb') as out_file:
            with zipfile.ZipFile(zip_file_name) as zipped:
                for info in zipped.infolist():
                    if output_file_name in info.filename:
                        with zipped.open(info) as requested_file:
                            out_file.write(requested_file.read())
                            return

unzip_single_file(glove_zip_file, glove_vectors_file)

In [4]:
glove_wordmap = {}
with open(glove_vectors_file, "r", encoding="utf8") as glove:
    for line in glove:
        name, vector = tuple(line.split(" ", 1))
        glove_wordmap[name] = np.fromstring(vector, sep=" ")

## Model

### Embed sentences - sentence2sequence

In [5]:
def sentence2sequence(sentence):
    """
    - Turns an input sentence into an (n,d) matrix, 
        where n is the number of tokens in the sentence
        and d is the number of dimensions each word vector has.
    
      Tensorflow doesn't need to be used here, as simply
      turning the sentence into a sequence based off our 
      mapping does not need the computational power that
      Tensorflow provides. Normal Python suffices for this task.
    """
    tokens = sentence.lower().split(" ")
    rows = []
    words = []
    #Greedy search for tokens
    for token in tokens:
        i = len(token)
        while len(token) > 0 and i > 0:
            word = token[:i]
            if word in glove_wordmap:
                rows.append(glove_wordmap[word])
                words.append(word)
                token = token[i:]
                i = len(token)
            else:
                i = i-1
    return rows, words

In [7]:
display_step = 10
# one hot encoding
def score_setup(row):
    convert_dict = {
      'ENTAILMENT': 0,
      'NEUTRAL': 1,
      'CONTRADICTION': 2
    }
    score = np.zeros((3,))
    tag = row["entailment_judgment"]
    score[convert_dict[tag]] += 1
    return score

def fit_to_size(matrix, shape):
    res = np.zeros(shape)
    slices = [slice(0,min(dim,shape[e])) for e, dim in enumerate(matrix.shape)]
    res[slices] = matrix[slices]
    return res

### Cell used for development

In [56]:
def create_model():
    tf.reset_default_graph() 
    data_feature_list, correct_values, correct_scores = split_data_into_scores()

    l_h, l_e = max_hypothesis_length, max_evidence_length
    N, D, H = batch_size, vector_size, hidden_size
    l_seq = l_h + l_e
    lstm = tf.contrib.rnn.BasicLSTMCell(lstm_size)
    lstm_drop =  tf.contrib.rnn.DropoutWrapper(lstm, input_p, output_p)
    hyp = tf.placeholder(tf.float32, [N, l_h, D], 'hypothesis')
    evi = tf.placeholder(tf.float32, [N, l_e, D], 'evidence')
    y = tf.placeholder(tf.float32, [N, 3], 'label')
    lstm_back = tf.contrib.rnn.BasicLSTMCell(lstm_size)

    lstm_drop_back = tf.contrib.rnn.DropoutWrapper(lstm_back, input_p, output_p)

    fc_initializer = tf.random_normal_initializer(stddev=0.1) 
    fc_weight = tf.get_variable('fc_weight', [2*hidden_size, 3], 
                            initializer = fc_initializer)
    fc_bias = tf.get_variable('bias', [3])
    tf.add_to_collection(tf.GraphKeys.REGULARIZATION_LOSSES, 
                     tf.nn.l2_loss(fc_weight)) 

    x = tf.concat([hyp, evi], 1) # N, (Lh+Le), d
    x = tf.transpose(x, [1, 0, 2]) # (Le+Lh), N, d
    x = tf.reshape(x, [-1, vector_size]) # (Le+Lh)*N, d
    x = tf.split(x, l_seq,)
    rnn_outputs, _, _ = tf.contrib.rnn.static_bidirectional_rnn(lstm, lstm_back,
                                                            x, dtype=tf.float32)

    classification_scores = tf.matmul(rnn_outputs[-1], fc_weight) + fc_bias

    with tf.variable_scope('Accuracy'):
        predicts = tf.cast(tf.argmax(classification_scores, 1), 'int32')
        y_label = tf.cast(tf.argmax(y, 1), 'int32')
        corrects = tf.equal(predicts, y_label)
        num_corrects = tf.reduce_sum(tf.cast(corrects, tf.float32))
        accuracy = tf.reduce_mean(tf.cast(corrects, tf.float32))

    with tf.variable_scope("loss"):
        cross_entropy = tf.nn.softmax_cross_entropy_with_logits(
            logits = classification_scores, labels = y)
        loss = tf.reduce_mean(cross_entropy)
        total_loss = loss + weight_decay * tf.add_n(
            tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES))

    optimizer = tf.train.GradientDescentOptimizer(learning_rate)

    opt_op = optimizer.minimize(total_loss)
    # Initialize variables
    init = tf.global_variables_initializer()

    # Use TQDM if installed
    tqdm_installed = False
    try:
        from tqdm import tqdm
        tqdm_installed = True
    except:
        pass

    # Launch the Tensorflow session
    sess = tf.Session()
    sess.run(init)

    # training_iterations_count: The number of data pieces to train on in total
    # batch_size: The number of data pieces per batch
    training_iterations = range(0,training_iterations_count,batch_size)
    if tqdm_installed:
        # Add a progress bar if TQDM is installed
        training_iterations = tqdm(training_iterations)

    for i in training_iterations:
        if i % 1000 == 0:
        # Select indices for a random data subset
            batch = np.random.randint(data_feature_list[0].shape[0], size=batch_size)

        # Use the selected subset indices to initialize the graph's 
        #   placeholder values
        hyps, evis, ys = (data_feature_list[0][batch,:],
                          data_feature_list[1][batch,:],
                          correct_scores[batch])

        # Run the optimization with these initialized values
        sess.run([opt_op], feed_dict={hyp: hyps, evi: evis, y: ys})
        # display_step: how often the accuracy and loss should 
        #   be tested and displayed.
        if (i/batch_size) % display_step == 0:
            # Calculate batch accuracy
            acc = sess.run(accuracy, feed_dict={hyp: hyps, evi: evis, y: ys})
            # Calculate batch loss
            tmp_loss = sess.run(loss, feed_dict={hyp: hyps, evi: evis, y: ys})
            # Display results
            print("Iter " + str(i/batch_size) + ", Minibatch Loss= " + \
                  "{:.6f}".format(tmp_loss) + ", Training Accuracy= " + \
                  "{:.5f}".format(acc))

    data_feature_list, correct_values, correct_scores = split_test_data_into_scores("data/dev.txt")


    hyps, evis, ys = (data_feature_list[0][:],
                      data_feature_list[1][:],
                      correct_scores)
    predictions = sess.run(classification_scores, feed_dict={hyp: hyps, evi: evis, y: ys})
    total = len(predictions)
    correct_predictions = 0
    for i,prediction in enumerate(predictions):
        if np.argmax(prediction[0])==np.argmax(ys[i]):
            correct_predictions += 1
    #     print(["Positive", "Neutral", "Negative"][np.argmax(prediction[0])]+
    #       " / " + ["Positive", "Neutral", "Negative"][np.argmax(ys[i])])
    acc = correct_predictions*100/total
    print("Acc: %s" % str(acc))
    return acc

In [57]:
import numpy as np
accs = [] # 128
batches = [128, 64, 32, 1, 256]
for batch in batches:
    batch_size = batch
    accs.append(create_model())

print(accs)
print("Best batch size %s" % str(batches[np.argmax(accs)]))






  0%|                                                                                                                                                                                   | 0/782 [00:00<?, ?it/s]

Iter 0.0, Minibatch Loss= 0.956232, Training Accuracy= 0.58594






  0%|▏                                                                                                                                                                          | 1/782 [00:00<10:43,  1.21it/s]



  1%|▊                                                                                                                                                                          | 4/782 [00:00<07:39,  1.69it/s]



  1%|█▌                                                                                                                                                                         | 7/782 [00:01<05:30,  2.35it/s]



  1%|██▏                                                                                                                                                                       | 10/782 [00:01<04:00,  3.21it/s]

Iter 10.0, Minibatch Loss= 0.938195, Training Accuracy= 0.58594






  2%|██▌                                                                                                                                                                       | 12/782 [00:01<03:01,  4.23it/s]



  2%|███▎                                                                                                                                                                      | 15/782 [00:01<02:16,  5.64it/s]



  2%|███▉                                                                                                                                                                      | 18/782 [00:01<01:44,  7.31it/s]

Iter 20.0, Minibatch Loss= 0.937931, Training Accuracy= 0.58594






  3%|████▌                                                                                                                                                                     | 21/782 [00:01<01:26,  8.83it/s]



  3%|█████▏                                                                                                                                                                    | 24/782 [00:01<01:10, 10.81it/s]



  3%|█████▊                                                                                                                                                                    | 27/782 [00:02<00:57, 13.05it/s]



  4%|██████▌                                                                                                                                                                   | 30/782 [00:02<00:50, 14.98it/s]

Iter 30.0, Minibatch Loss= 0.937693, Training Accuracy= 0.58594






  4%|███████▏                                                                                                                                                                  | 33/782 [00:02<00:48, 15.50it/s]



  5%|███████▊                                                                                                                                                                  | 36/782 [00:02<00:43, 16.99it/s]



  5%|████████▍                                                                                                                                                                 | 39/782 [00:02<00:39, 18.86it/s]

Iter 40.0, Minibatch Loss= 0.937342, Training Accuracy= 0.58594






  5%|█████████▏                                                                                                                                                                | 42/782 [00:02<00:39, 18.77it/s]



  6%|█████████▊                                                                                                                                                                | 45/782 [00:02<00:35, 20.62it/s]



  6%|██████████▍                                                                                                                                                               | 48/782 [00:02<00:33, 22.13it/s]

Iter 50.0, Minibatch Loss= 0.936669, Training Accuracy= 0.58594






  7%|███████████                                                                                                                                                               | 51/782 [00:03<00:33, 21.57it/s]



  7%|███████████▋                                                                                                                                                              | 54/782 [00:03<00:32, 22.35it/s]



  7%|████████████▍                                                                                                                                                             | 57/782 [00:03<00:31, 22.82it/s]



  8%|█████████████                                                                                                                                                             | 60/782 [00:03<00:31, 23.11it/s]

Iter 60.0, Minibatch Loss= 0.935027, Training Accuracy= 0.58594






  8%|█████████████▋                                                                                                                                                            | 63/782 [00:03<00:33, 21.77it/s]



  8%|██████████████▎                                                                                                                                                           | 66/782 [00:03<00:31, 22.71it/s]



  9%|███████████████                                                                                                                                                           | 69/782 [00:03<00:29, 23.80it/s]

Iter 70.0, Minibatch Loss= 0.930252, Training Accuracy= 0.58594






  9%|███████████████▋                                                                                                                                                          | 72/782 [00:04<00:31, 22.68it/s]



 10%|████████████████▎                                                                                                                                                         | 75/782 [00:04<00:29, 23.72it/s]



 10%|████████████████▉                                                                                                                                                         | 78/782 [00:04<00:29, 23.97it/s]

Iter 80.0, Minibatch Loss= 0.917919, Training Accuracy= 0.58594






 10%|█████████████████▌                                                                                                                                                        | 81/782 [00:04<00:30, 22.76it/s]



 11%|██████████████████▎                                                                                                                                                       | 84/782 [00:04<00:29, 23.87it/s]



 11%|██████████████████▉                                                                                                                                                       | 87/782 [00:04<00:28, 24.68it/s]



 12%|███████████████████▌                                                                                                                                                      | 90/782 [00:04<00:27, 24.96it/s]

Iter 90.0, Minibatch Loss= 0.935087, Training Accuracy= 0.58594


KeyboardInterrupt: 

### Constants

In [67]:
#Constants setup
max_hypothesis_length, max_evidence_length = 30, 30
batch_size, vector_size, hidden_size = 128, 50, 128

training_iterations_count = 100000

lstm_size = hidden_size

weight_decay = 0.0005

learning_rate = 1

input_p, output_p = 0.6, 0.3

### [Training data](http://www.site.uottawa.ca/~diana/csi5386/A2_2019/SICK_train.txt)

In [68]:
import numpy as np

def split_data_into_scores(file_name="data/training.txt"):
    import csv
    with open(file_name,"r") as data:
        train = csv.DictReader(data , delimiter='\t')
        evi_sentences = []
        hyp_sentences = []
        labels = []
        scores = []
        count = 1
        for row in train:
            hyp_sentences.append(np.vstack(
                    sentence2sequence(row["sentence_A"].lower())[0]))
            evi_sentences.append(np.vstack(
                    sentence2sequence(row["sentence_B"].lower())[0]))
            labels.append(row["entailment_judgment"])
            scores.append(score_setup(row))
        
        hyp_sentences = np.stack([fit_to_size(x, (max_hypothesis_length, vector_size))
                          for x in hyp_sentences])
        evi_sentences = np.stack([fit_to_size(x, (max_evidence_length, vector_size))
                          for x in evi_sentences])
                                 
        return (hyp_sentences, evi_sentences), labels, np.array(scores)
data_feature_list, correct_values, correct_scores = split_data_into_scores()

l_h, l_e = max_hypothesis_length, max_evidence_length
N, D, H = batch_size, vector_size, hidden_size
l_seq = l_h + l_e



### TRAINING

In [69]:
tf.reset_default_graph()

In [70]:
lstm = tf.contrib.rnn.BasicLSTMCell(lstm_size)
lstm_drop =  tf.contrib.rnn.DropoutWrapper(lstm, input_p, output_p)

In [71]:
# N: The number of elements in each of our batches, 
#   which we use to train subsets of data for efficiency's sake.
# l_h: The maximum length of a hypothesis, or the second sentence.  This is
#   used because training an RNN is extraordinarily difficult without 
#   rolling it out to a fixed length.
# l_e: The maximum length of evidence, the first sentence.  This is used
#   because training an RNN is extraordinarily difficult without 
#   rolling it out to a fixed length.
# D: The size of our used GloVe or other vectors.
hyp = tf.placeholder(tf.float32, [N, l_h, D], 'hypothesis')
evi = tf.placeholder(tf.float32, [N, l_e, D], 'evidence')
y = tf.placeholder(tf.float32, [N, 3], 'label')
# hyp: Where the hypotheses will be stored during training.
# evi: Where the evidences will be stored during training.
# y: Where correct scores will be stored during training.

# lstm_size: the size of the gates in the LSTM, 
#    as in the first LSTM layer's initialization.
# lstm_back = tf.contrib.rnn.BasicLSTMCell(lstm_size)
lstm_back = tf.contrib.rnn.BasicLSTMCell(lstm_size)

# lstm_back:  The LSTM used for looking backwards 
#   through the sentences, similar to lstm.

# input_p: the probability that inputs to the LSTM will be retained at each
#   iteration of dropout.
# output_p: the probability that outputs from the LSTM will be retained at 
#   each iteration of dropout.
lstm_drop_back = tf.contrib.rnn.DropoutWrapper(lstm_back, input_p, output_p)
# lstm_drop_back:  A dropout wrapper for lstm_back, like lstm_drop.


fc_initializer = tf.random_normal_initializer(stddev=0.1) 
# fc_initializer: initial values for the fully connected layer's weights.
# hidden_size: the size of the outputs from each lstm layer.  
#   Multiplied by 2 to account for the two LSTMs.
fc_weight = tf.get_variable('fc_weight', [2*hidden_size, 3], 
                            initializer = fc_initializer)
# fc_weight: Storage for the fully connected layer's weights.
fc_bias = tf.get_variable('bias', [3])
# fc_bias: Storage for the fully connected layer's bias.

# tf.GraphKeys.REGULARIZATION_LOSSES:  A key to a collection in the graph
#   designated for losses due to regularization.
#   In this case, this portion of loss is regularization on the weights
#   for the fully connected layer.
tf.add_to_collection(tf.GraphKeys.REGULARIZATION_LOSSES, 
                     tf.nn.l2_loss(fc_weight)) 

x = tf.concat([hyp, evi], 1) # N, (Lh+Le), d
# Permuting batch_size and n_steps
x = tf.transpose(x, [1, 0, 2]) # (Le+Lh), N, d
# Reshaping to (n_steps*batch_size, n_input)
x = tf.reshape(x, [-1, vector_size]) # (Le+Lh)*N, d
# Split to get a list of 'n_steps' tensors of shape (batch_size, n_input)
x = tf.split(x, l_seq,)

# x: the inputs to the bidirectional_rnn


# tf.contrib.rnn.static_bidirectional_rnn: Runs the input through
#   two recurrent networks, one that runs the inputs forward and one
#   that runs the inputs in reversed order, combining the outputs.
rnn_outputs, _, _ = tf.contrib.rnn.static_bidirectional_rnn(lstm, lstm_back,
                                                            x, dtype=tf.float32)
# rnn_outputs: the list of LSTM outputs, as a list. 
#   What we want is the latest output, rnn_outputs[-1]

classification_scores = tf.matmul(rnn_outputs[-1], fc_weight) + fc_bias
# The scores are relative certainties for how likely the output matches
#   a certain entailment: 
#     0: Positive entailment
#     1: Neutral entailment
#     2: Negative entailment

In [72]:
with tf.variable_scope('Accuracy'):
    predicts = tf.cast(tf.argmax(classification_scores, 1), 'int32')
    y_label = tf.cast(tf.argmax(y, 1), 'int32')
    corrects = tf.equal(predicts, y_label)
    num_corrects = tf.reduce_sum(tf.cast(corrects, tf.float32))
    accuracy = tf.reduce_mean(tf.cast(corrects, tf.float32))

with tf.variable_scope("loss"):
    cross_entropy = tf.nn.softmax_cross_entropy_with_logits(
        logits = classification_scores, labels = y)
    loss = tf.reduce_mean(cross_entropy)
    total_loss = loss + weight_decay * tf.add_n(
        tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES))

optimizer = tf.train.GradientDescentOptimizer(learning_rate)

opt_op = optimizer.minimize(total_loss)

In [73]:
# Initialize variables
init = tf.global_variables_initializer()

from tqdm import tqdm

# Launch the Tensorflow session
sess = tf.Session()
sess.run(init)

# training_iterations_count: The number of data pieces to train on in total
# batch_size: The number of data pieces per batch
training_iterations = range(0,training_iterations_count,batch_size)
print(training_iterations)
training_iterations = tqdm(training_iterations)

for i in training_iterations:
    if i % 1000 == 0:
    # Select indices for a random data subset
        batch = np.random.randint(data_feature_list[0].shape[0], size=batch_size)
    
    # Use the selected subset indices to initialize the graph's 
    #   placeholder values
    hyps, evis, ys = (data_feature_list[0][batch,:],
                      data_feature_list[1][batch,:],
                      correct_scores[batch])
    
    # Run the optimization with these initialized values
    sess.run([opt_op], feed_dict={hyp: hyps, evi: evis, y: ys})
    # display_step: how often the accuracy and loss should 
    #   be tested and displayed.
    if (i/batch_size) % display_step == 0:
        # Calculate batch accuracy
        acc = sess.run(accuracy, feed_dict={hyp: hyps, evi: evis, y: ys})
        # Calculate batch loss
        tmp_loss = sess.run(loss, feed_dict={hyp: hyps, evi: evis, y: ys})
        # Display results
        print("Iter " + str(i/batch_size) + ", Minibatch Loss= " + \
              "{:.6f}".format(tmp_loss) + ", Training Accuracy= " + \
              "{:.5f}".format(acc))






  0%|                                                                                                                                                                                   | 0/782 [00:00<?, ?it/s]

Iter 0.0, Minibatch Loss= 1.004895, Training Accuracy= 0.53125







  0%|▏                                                                                                                                                                          | 1/782 [00:01<13:07,  1.01s/it]




  0%|▍                                                                                                                                                                          | 2/782 [00:01<09:42,  1.34it/s]




  0%|▋                                                                                                                                                                          | 3/782 [00:01<07:21,  1.76it/s]




  1%|▊                                                                                                                                                                          | 4/782 [00:01<05:44,  2.26it/s]




  1%|█                                                                                                                                         

Iter 10.0, Minibatch Loss= 0.974029, Training Accuracy= 0.53125







  1%|██▍                                                                                                                                                                       | 11/782 [00:02<02:31,  5.09it/s]




  2%|██▌                                                                                                                                                                       | 12/782 [00:02<02:18,  5.57it/s]




  2%|██▊                                                                                                                                                                       | 13/782 [00:02<02:09,  5.93it/s]




  2%|███                                                                                                                                                                       | 14/782 [00:02<02:03,  6.23it/s]




  2%|███▎                                                                                                                                      

Iter 20.0, Minibatch Loss= 0.970389, Training Accuracy= 0.53125







  3%|████▌                                                                                                                                                                     | 21/782 [00:04<02:08,  5.95it/s]




  3%|████▊                                                                                                                                                                     | 22/782 [00:04<02:00,  6.33it/s]




  3%|█████                                                                                                                                                                     | 23/782 [00:04<01:54,  6.62it/s]




  3%|█████▏                                                                                                                                                                    | 24/782 [00:04<01:51,  6.81it/s]




  3%|█████▍                                                                                                                                    

Iter 30.0, Minibatch Loss= 0.973572, Training Accuracy= 0.53125







  4%|██████▋                                                                                                                                                                   | 31/782 [00:05<02:28,  5.04it/s]




  4%|██████▉                                                                                                                                                                   | 32/782 [00:05<02:23,  5.23it/s]




  4%|███████▏                                                                                                                                                                  | 33/782 [00:06<02:16,  5.47it/s]




  4%|███████▍                                                                                                                                                                  | 34/782 [00:06<02:11,  5.67it/s]




  4%|███████▌                                                                                                                                  

Iter 40.0, Minibatch Loss= 0.964555, Training Accuracy= 0.53125







  5%|████████▉                                                                                                                                                                 | 41/782 [00:07<02:07,  5.80it/s]




  5%|█████████▏                                                                                                                                                                | 42/782 [00:07<02:01,  6.09it/s]




  5%|█████████▎                                                                                                                                                                | 43/782 [00:07<01:57,  6.31it/s]




  6%|█████████▌                                                                                                                                                                | 44/782 [00:07<01:52,  6.56it/s]




  6%|█████████▊                                                                                                                                

Iter 50.0, Minibatch Loss= 1.035479, Training Accuracy= 0.32812







  7%|███████████                                                                                                                                                               | 51/782 [00:08<02:21,  5.16it/s]




  7%|███████████▎                                                                                                                                                              | 52/782 [00:09<02:14,  5.44it/s]




  7%|███████████▌                                                                                                                                                              | 53/782 [00:09<02:10,  5.57it/s]




  7%|███████████▋                                                                                                                                                              | 54/782 [00:09<02:06,  5.74it/s]




  7%|███████████▉                                                                                                                              

Iter 60.0, Minibatch Loss= 0.957298, Training Accuracy= 0.53125







  8%|█████████████▎                                                                                                                                                            | 61/782 [00:10<02:12,  5.43it/s]




  8%|█████████████▍                                                                                                                                                            | 62/782 [00:10<02:06,  5.71it/s]




  8%|█████████████▋                                                                                                                                                            | 63/782 [00:10<01:59,  6.00it/s]




  8%|█████████████▉                                                                                                                                                            | 64/782 [00:11<01:56,  6.15it/s]




  8%|██████████████▏                                                                                                                           

Iter 70.0, Minibatch Loss= 1.654849, Training Accuracy= 0.53125







  9%|███████████████▍                                                                                                                                                          | 71/782 [00:12<02:17,  5.19it/s]




  9%|███████████████▋                                                                                                                                                          | 72/782 [00:12<02:12,  5.35it/s]




  9%|███████████████▊                                                                                                                                                          | 73/782 [00:12<02:12,  5.37it/s]




  9%|████████████████                                                                                                                                                          | 74/782 [00:12<02:06,  5.60it/s]




 10%|████████████████▎                                                                                                                         

Iter 80.0, Minibatch Loss= 0.970921, Training Accuracy= 0.53125







 10%|█████████████████▌                                                                                                                                                        | 81/782 [00:13<02:01,  5.78it/s]




 10%|█████████████████▊                                                                                                                                                        | 82/782 [00:14<01:53,  6.19it/s]




 11%|██████████████████                                                                                                                                                        | 83/782 [00:14<01:50,  6.31it/s]




 11%|██████████████████▎                                                                                                                                                       | 84/782 [00:14<01:47,  6.52it/s]




 11%|██████████████████▍                                                                                                                       

Iter 90.0, Minibatch Loss= 0.954958, Training Accuracy= 0.53125







 12%|███████████████████▊                                                                                                                                                      | 91/782 [00:15<01:57,  5.86it/s]




 12%|████████████████████                                                                                                                                                      | 92/782 [00:15<01:49,  6.29it/s]




 12%|████████████████████▏                                                                                                                                                     | 93/782 [00:15<01:45,  6.55it/s]




 12%|████████████████████▍                                                                                                                                                     | 94/782 [00:15<01:40,  6.84it/s]




 12%|████████████████████▋                                                                                                                     

Iter 100.0, Minibatch Loss= 0.917933, Training Accuracy= 0.57812







 13%|█████████████████████▊                                                                                                                                                   | 101/782 [00:16<01:56,  5.87it/s]




 13%|██████████████████████                                                                                                                                                   | 102/782 [00:17<01:47,  6.31it/s]




 13%|██████████████████████▎                                                                                                                                                  | 103/782 [00:17<01:46,  6.35it/s]




 13%|██████████████████████▍                                                                                                                                                  | 104/782 [00:17<01:44,  6.51it/s]




 13%|██████████████████████▋                                                                                                                   

Iter 110.0, Minibatch Loss= 0.995607, Training Accuracy= 0.44531







 14%|███████████████████████▉                                                                                                                                                 | 111/782 [00:18<01:58,  5.67it/s]




 14%|████████████████████████▏                                                                                                                                                | 112/782 [00:18<01:50,  6.07it/s]




 14%|████████████████████████▍                                                                                                                                                | 113/782 [00:18<01:48,  6.14it/s]




 15%|████████████████████████▋                                                                                                                                                | 114/782 [00:18<01:44,  6.39it/s]




 15%|████████████████████████▊                                                                                                                 

Iter 120.0, Minibatch Loss= 0.838335, Training Accuracy= 0.64844







 15%|██████████████████████████▏                                                                                                                                              | 121/782 [00:19<01:52,  5.88it/s]




 16%|██████████████████████████▎                                                                                                                                              | 122/782 [00:20<01:47,  6.13it/s]




 16%|██████████████████████████▌                                                                                                                                              | 123/782 [00:20<01:41,  6.49it/s]




 16%|██████████████████████████▊                                                                                                                                              | 124/782 [00:20<01:37,  6.73it/s]




 16%|███████████████████████████                                                                                                               

Iter 130.0, Minibatch Loss= 0.898886, Training Accuracy= 0.57031







 17%|████████████████████████████▎                                                                                                                                            | 131/782 [00:21<01:52,  5.80it/s]




 17%|████████████████████████████▌                                                                                                                                            | 132/782 [00:21<01:48,  5.98it/s]




 17%|████████████████████████████▋                                                                                                                                            | 133/782 [00:21<01:44,  6.22it/s]




 17%|████████████████████████████▉                                                                                                                                            | 134/782 [00:21<01:44,  6.20it/s]




 17%|█████████████████████████████▏                                                                                                            

Iter 140.0, Minibatch Loss= 0.951763, Training Accuracy= 0.57812







 18%|██████████████████████████████▍                                                                                                                                          | 141/782 [00:23<02:07,  5.03it/s]




 18%|██████████████████████████████▋                                                                                                                                          | 142/782 [00:23<01:59,  5.36it/s]




 18%|██████████████████████████████▉                                                                                                                                          | 143/782 [00:23<01:52,  5.69it/s]




 18%|███████████████████████████████                                                                                                                                          | 144/782 [00:23<01:43,  6.15it/s]




 19%|███████████████████████████████▎                                                                                                          

Iter 150.0, Minibatch Loss= 0.947881, Training Accuracy= 0.57812







 19%|████████████████████████████████▋                                                                                                                                        | 151/782 [00:24<01:49,  5.77it/s]




 19%|████████████████████████████████▊                                                                                                                                        | 152/782 [00:24<01:45,  5.97it/s]




 20%|█████████████████████████████████                                                                                                                                        | 153/782 [00:25<01:38,  6.38it/s]




 20%|█████████████████████████████████▎                                                                                                                                       | 154/782 [00:25<01:35,  6.55it/s]




 20%|█████████████████████████████████▍                                                                                                        

Iter 160.0, Minibatch Loss= 0.944343, Training Accuracy= 0.57812







 21%|██████████████████████████████████▊                                                                                                                                      | 161/782 [00:26<01:46,  5.84it/s]




 21%|███████████████████████████████████                                                                                                                                      | 162/782 [00:26<01:40,  6.15it/s]




 21%|███████████████████████████████████▏                                                                                                                                     | 163/782 [00:26<01:34,  6.53it/s]




 21%|███████████████████████████████████▍                                                                                                                                     | 164/782 [00:26<01:34,  6.54it/s]




 21%|███████████████████████████████████▋                                                                                                      

Iter 170.0, Minibatch Loss= 0.940034, Training Accuracy= 0.57812







 22%|████████████████████████████████████▉                                                                                                                                    | 171/782 [00:27<01:46,  5.76it/s]




 22%|█████████████████████████████████████▏                                                                                                                                   | 172/782 [00:27<01:39,  6.12it/s]




 22%|█████████████████████████████████████▍                                                                                                                                   | 173/782 [00:28<01:40,  6.03it/s]




 22%|█████████████████████████████████████▌                                                                                                                                   | 174/782 [00:28<01:38,  6.19it/s]




 22%|█████████████████████████████████████▊                                                                                                    

Iter 180.0, Minibatch Loss= 0.931343, Training Accuracy= 0.57812







 23%|███████████████████████████████████████                                                                                                                                  | 181/782 [00:29<01:46,  5.63it/s]




 23%|███████████████████████████████████████▎                                                                                                                                 | 182/782 [00:29<01:40,  5.95it/s]




 23%|███████████████████████████████████████▌                                                                                                                                 | 183/782 [00:29<01:34,  6.33it/s]




 24%|███████████████████████████████████████▊                                                                                                                                 | 184/782 [00:29<01:33,  6.43it/s]




 24%|███████████████████████████████████████▉                                                                                                  

Iter 190.0, Minibatch Loss= 0.943233, Training Accuracy= 0.57812







 24%|█████████████████████████████████████████▎                                                                                                                               | 191/782 [00:30<01:45,  5.61it/s]




 25%|█████████████████████████████████████████▍                                                                                                                               | 192/782 [00:31<01:36,  6.11it/s]




 25%|█████████████████████████████████████████▋                                                                                                                               | 193/782 [00:31<01:33,  6.28it/s]




 25%|█████████████████████████████████████████▉                                                                                                                               | 194/782 [00:31<01:31,  6.41it/s]




 25%|██████████████████████████████████████████▏                                                                                               

Iter 200.0, Minibatch Loss= 0.934181, Training Accuracy= 0.57812







 26%|███████████████████████████████████████████▍                                                                                                                             | 201/782 [00:32<01:45,  5.50it/s]




 26%|███████████████████████████████████████████▋                                                                                                                             | 202/782 [00:32<01:40,  5.78it/s]




 26%|███████████████████████████████████████████▊                                                                                                                             | 203/782 [00:32<01:36,  5.97it/s]




 26%|████████████████████████████████████████████                                                                                                                             | 204/782 [00:32<01:35,  6.04it/s]




 26%|████████████████████████████████████████████▎                                                                                             

Iter 210.0, Minibatch Loss= 0.922187, Training Accuracy= 0.57812







 27%|█████████████████████████████████████████████▌                                                                                                                           | 211/782 [00:34<01:43,  5.52it/s]




 27%|█████████████████████████████████████████████▊                                                                                                                           | 212/782 [00:34<01:36,  5.88it/s]




 27%|██████████████████████████████████████████████                                                                                                                           | 213/782 [00:34<01:34,  6.03it/s]




 27%|██████████████████████████████████████████████▏                                                                                                                          | 214/782 [00:34<01:27,  6.47it/s]




 27%|██████████████████████████████████████████████▍                                                                                           

Iter 220.0, Minibatch Loss= 0.775763, Training Accuracy= 0.64844







 28%|███████████████████████████████████████████████▊                                                                                                                         | 221/782 [00:35<01:40,  5.58it/s]




 28%|███████████████████████████████████████████████▉                                                                                                                         | 222/782 [00:35<01:32,  6.02it/s]




 29%|████████████████████████████████████████████████▏                                                                                                                        | 223/782 [00:35<01:29,  6.22it/s]




 29%|████████████████████████████████████████████████▍                                                                                                                        | 224/782 [00:36<01:25,  6.51it/s]




 29%|████████████████████████████████████████████████▋                                                                                         

Iter 230.0, Minibatch Loss= 0.931723, Training Accuracy= 0.57812







 30%|█████████████████████████████████████████████████▉                                                                                                                       | 231/782 [00:37<01:40,  5.47it/s]




 30%|██████████████████████████████████████████████████▏                                                                                                                      | 232/782 [00:37<01:32,  5.95it/s]




 30%|██████████████████████████████████████████████████▎                                                                                                                      | 233/782 [00:37<01:31,  6.03it/s]




 30%|██████████████████████████████████████████████████▌                                                                                                                      | 234/782 [00:37<01:28,  6.20it/s]




 30%|██████████████████████████████████████████████████▊                                                                                       

Iter 240.0, Minibatch Loss= 1.009574, Training Accuracy= 0.46094







 31%|████████████████████████████████████████████████████                                                                                                                     | 241/782 [00:38<01:37,  5.54it/s]




 31%|████████████████████████████████████████████████████▎                                                                                                                    | 242/782 [00:39<01:33,  5.75it/s]




 31%|████████████████████████████████████████████████████▌                                                                                                                    | 243/782 [00:39<01:32,  5.80it/s]




 31%|████████████████████████████████████████████████████▋                                                                                                                    | 244/782 [00:39<01:29,  6.00it/s]




 31%|████████████████████████████████████████████████████▉                                                                                     

Iter 250.0, Minibatch Loss= 0.974529, Training Accuracy= 0.54688







 32%|██████████████████████████████████████████████████████▏                                                                                                                  | 251/782 [00:40<01:37,  5.43it/s]




 32%|██████████████████████████████████████████████████████▍                                                                                                                  | 252/782 [00:40<01:31,  5.76it/s]




 32%|██████████████████████████████████████████████████████▋                                                                                                                  | 253/782 [00:40<01:28,  5.96it/s]




 32%|██████████████████████████████████████████████████████▉                                                                                                                  | 254/782 [00:40<01:26,  6.12it/s]




 33%|███████████████████████████████████████████████████████                                                                                   

Iter 260.0, Minibatch Loss= 0.945491, Training Accuracy= 0.55469







 33%|████████████████████████████████████████████████████████▍                                                                                                                | 261/782 [00:42<01:35,  5.46it/s]




 34%|████████████████████████████████████████████████████████▌                                                                                                                | 262/782 [00:42<01:30,  5.77it/s]




 34%|████████████████████████████████████████████████████████▊                                                                                                                | 263/782 [00:42<01:29,  5.80it/s]




 34%|█████████████████████████████████████████████████████████                                                                                                                | 264/782 [00:42<01:26,  6.01it/s]




 34%|█████████████████████████████████████████████████████████▎                                                                                

Iter 270.0, Minibatch Loss= 0.946321, Training Accuracy= 0.56250







 35%|██████████████████████████████████████████████████████████▌                                                                                                              | 271/782 [00:43<01:45,  4.86it/s]




 35%|██████████████████████████████████████████████████████████▊                                                                                                              | 272/782 [00:44<01:37,  5.21it/s]




 35%|██████████████████████████████████████████████████████████▉                                                                                                              | 273/782 [00:44<01:33,  5.43it/s]




 35%|███████████████████████████████████████████████████████████▏                                                                                                             | 274/782 [00:44<01:28,  5.76it/s]




 35%|███████████████████████████████████████████████████████████▍                                                                              

Iter 280.0, Minibatch Loss= 0.956379, Training Accuracy= 0.55469







 36%|████████████████████████████████████████████████████████████▋                                                                                                            | 281/782 [00:45<01:31,  5.47it/s]




 36%|████████████████████████████████████████████████████████████▉                                                                                                            | 282/782 [00:45<01:25,  5.83it/s]




 36%|█████████████████████████████████████████████████████████████▏                                                                                                           | 283/782 [00:45<01:22,  6.06it/s]




 36%|█████████████████████████████████████████████████████████████▍                                                                                                           | 284/782 [00:45<01:19,  6.23it/s]




 36%|█████████████████████████████████████████████████████████████▌                                                                            

Iter 290.0, Minibatch Loss= 0.950167, Training Accuracy= 0.55469







 37%|██████████████████████████████████████████████████████████████▉                                                                                                          | 291/782 [00:47<01:27,  5.60it/s]




 37%|███████████████████████████████████████████████████████████████                                                                                                          | 292/782 [00:47<01:21,  6.04it/s]




 37%|███████████████████████████████████████████████████████████████▎                                                                                                         | 293/782 [00:47<01:18,  6.23it/s]




 38%|███████████████████████████████████████████████████████████████▌                                                                                                         | 294/782 [00:47<01:16,  6.41it/s]




 38%|███████████████████████████████████████████████████████████████▊                                                                          

Iter 300.0, Minibatch Loss= 0.946672, Training Accuracy= 0.55469







 38%|█████████████████████████████████████████████████████████████████                                                                                                        | 301/782 [00:48<01:35,  5.02it/s]




 39%|█████████████████████████████████████████████████████████████████▎                                                                                                       | 302/782 [00:48<01:30,  5.29it/s]




 39%|█████████████████████████████████████████████████████████████████▍                                                                                                       | 303/782 [00:49<01:27,  5.50it/s]




 39%|█████████████████████████████████████████████████████████████████▋                                                                                                       | 304/782 [00:49<01:26,  5.51it/s]




 39%|█████████████████████████████████████████████████████████████████▉                                                                        

Iter 310.0, Minibatch Loss= 0.944966, Training Accuracy= 0.56250







 40%|███████████████████████████████████████████████████████████████████▏                                                                                                     | 311/782 [00:50<01:33,  5.02it/s]




 40%|███████████████████████████████████████████████████████████████████▍                                                                                                     | 312/782 [00:50<01:29,  5.27it/s]




 40%|███████████████████████████████████████████████████████████████████▋                                                                                                     | 313/782 [00:50<01:27,  5.37it/s]




 40%|███████████████████████████████████████████████████████████████████▊                                                                                                     | 314/782 [00:51<01:22,  5.66it/s]




 40%|████████████████████████████████████████████████████████████████████                                                                      

Iter 320.0, Minibatch Loss= 0.941816, Training Accuracy= 0.56250







 41%|█████████████████████████████████████████████████████████████████████▎                                                                                                   | 321/782 [00:52<01:34,  4.89it/s]




 41%|█████████████████████████████████████████████████████████████████████▌                                                                                                   | 322/782 [00:52<01:29,  5.13it/s]




 41%|█████████████████████████████████████████████████████████████████████▊                                                                                                   | 323/782 [00:52<01:26,  5.33it/s]




 41%|██████████████████████████████████████████████████████████████████████                                                                                                   | 324/782 [00:52<01:25,  5.36it/s]




 42%|██████████████████████████████████████████████████████████████████████▏                                                                   

Iter 330.0, Minibatch Loss= 0.938972, Training Accuracy= 0.56250







 42%|███████████████████████████████████████████████████████████████████████▌                                                                                                 | 331/782 [00:54<01:29,  5.02it/s]




 42%|███████████████████████████████████████████████████████████████████████▋                                                                                                 | 332/782 [00:54<01:25,  5.27it/s]




 43%|███████████████████████████████████████████████████████████████████████▉                                                                                                 | 333/782 [00:54<01:19,  5.64it/s]




 43%|████████████████████████████████████████████████████████████████████████▏                                                                                                | 334/782 [00:54<01:18,  5.69it/s]




 43%|████████████████████████████████████████████████████████████████████████▍                                                                 

Iter 340.0, Minibatch Loss= 0.935559, Training Accuracy= 0.56250







 44%|█████████████████████████████████████████████████████████████████████████▋                                                                                               | 341/782 [00:55<01:30,  4.89it/s]




 44%|█████████████████████████████████████████████████████████████████████████▉                                                                                               | 342/782 [00:56<01:26,  5.09it/s]




 44%|██████████████████████████████████████████████████████████████████████████▏                                                                                              | 343/782 [00:56<01:23,  5.24it/s]




 44%|██████████████████████████████████████████████████████████████████████████▎                                                                                              | 344/782 [00:56<01:20,  5.41it/s]




 44%|██████████████████████████████████████████████████████████████████████████▌                                                               

Iter 350.0, Minibatch Loss= 0.931678, Training Accuracy= 0.57031







 45%|███████████████████████████████████████████████████████████████████████████▊                                                                                             | 351/782 [00:57<01:24,  5.11it/s]




 45%|████████████████████████████████████████████████████████████████████████████                                                                                             | 352/782 [00:57<01:22,  5.24it/s]




 45%|████████████████████████████████████████████████████████████████████████████▎                                                                                            | 353/782 [00:58<01:21,  5.24it/s]




 45%|████████████████████████████████████████████████████████████████████████████▌                                                                                            | 354/782 [00:58<01:19,  5.39it/s]




 45%|████████████████████████████████████████████████████████████████████████████▋                                                             

Iter 360.0, Minibatch Loss= 0.926601, Training Accuracy= 0.57031







 46%|██████████████████████████████████████████████████████████████████████████████                                                                                           | 361/782 [00:59<01:20,  5.20it/s]




 46%|██████████████████████████████████████████████████████████████████████████████▏                                                                                          | 362/782 [00:59<01:13,  5.69it/s]




 46%|██████████████████████████████████████████████████████████████████████████████▍                                                                                          | 363/782 [00:59<01:11,  5.87it/s]




 47%|██████████████████████████████████████████████████████████████████████████████▋                                                                                          | 364/782 [00:59<01:08,  6.06it/s]




 47%|██████████████████████████████████████████████████████████████████████████████▉                                                           

Iter 370.0, Minibatch Loss= 0.921290, Training Accuracy= 0.57031







 47%|████████████████████████████████████████████████████████████████████████████████▏                                                                                        | 371/782 [01:01<01:17,  5.33it/s]




 48%|████████████████████████████████████████████████████████████████████████████████▍                                                                                        | 372/782 [01:01<01:12,  5.62it/s]




 48%|████████████████████████████████████████████████████████████████████████████████▌                                                                                        | 373/782 [01:01<01:10,  5.78it/s]




 48%|████████████████████████████████████████████████████████████████████████████████▊                                                                                        | 374/782 [01:01<01:10,  5.83it/s]




 48%|█████████████████████████████████████████████████████████████████████████████████                                                         

Iter 380.0, Minibatch Loss= 0.945679, Training Accuracy= 0.53906







 49%|██████████████████████████████████████████████████████████████████████████████████▎                                                                                      | 381/782 [01:02<01:13,  5.45it/s]




 49%|██████████████████████████████████████████████████████████████████████████████████▌                                                                                      | 382/782 [01:02<01:10,  5.68it/s]




 49%|██████████████████████████████████████████████████████████████████████████████████▊                                                                                      | 383/782 [01:03<01:08,  5.86it/s]




 49%|██████████████████████████████████████████████████████████████████████████████████▉                                                                                      | 384/782 [01:03<01:06,  5.98it/s]




 49%|███████████████████████████████████████████████████████████████████████████████████▏                                                      

Iter 390.0, Minibatch Loss= 0.935162, Training Accuracy= 0.53906







 50%|████████████████████████████████████████████████████████████████████████████████████▌                                                                                    | 391/782 [01:04<01:12,  5.43it/s]




 50%|████████████████████████████████████████████████████████████████████████████████████▋                                                                                    | 392/782 [01:04<01:08,  5.66it/s]




 50%|████████████████████████████████████████████████████████████████████████████████████▉                                                                                    | 393/782 [01:04<01:05,  5.96it/s]




 50%|█████████████████████████████████████████████████████████████████████████████████████▏                                                                                   | 394/782 [01:04<01:03,  6.12it/s]




 51%|█████████████████████████████████████████████████████████████████████████████████████▎                                                    

Iter 400.0, Minibatch Loss= 0.927629, Training Accuracy= 0.53906







 51%|██████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 401/782 [01:06<01:11,  5.31it/s]




 51%|██████████████████████████████████████████████████████████████████████████████████████▉                                                                                  | 402/782 [01:06<01:06,  5.69it/s]




 52%|███████████████████████████████████████████████████████████████████████████████████████                                                                                  | 403/782 [01:06<01:04,  5.84it/s]




 52%|███████████████████████████████████████████████████████████████████████████████████████▎                                                                                 | 404/782 [01:06<01:02,  6.07it/s]




 52%|███████████████████████████████████████████████████████████████████████████████████████▌                                                  

Iter 410.0, Minibatch Loss= 0.952507, Training Accuracy= 0.39844







 53%|████████████████████████████████████████████████████████████████████████████████████████▊                                                                                | 411/782 [01:07<01:16,  4.86it/s]




 53%|█████████████████████████████████████████████████████████████████████████████████████████                                                                                | 412/782 [01:07<01:14,  4.97it/s]




 53%|█████████████████████████████████████████████████████████████████████████████████████████▎                                                                               | 413/782 [01:08<01:12,  5.08it/s]




 53%|█████████████████████████████████████████████████████████████████████████████████████████▍                                                                               | 414/782 [01:08<01:12,  5.11it/s]




 53%|█████████████████████████████████████████████████████████████████████████████████████████▋                                                

Iter 420.0, Minibatch Loss= 0.881894, Training Accuracy= 0.53906







 54%|██████████████████████████████████████████████████████████████████████████████████████████▉                                                                              | 421/782 [01:09<01:15,  4.80it/s]




 54%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                             | 422/782 [01:09<01:08,  5.23it/s]




 54%|███████████████████████████████████████████████████████████████████████████████████████████▍                                                                             | 423/782 [01:09<01:04,  5.61it/s]




 54%|███████████████████████████████████████████████████████████████████████████████████████████▋                                                                             | 424/782 [01:10<00:58,  6.07it/s]




 54%|███████████████████████████████████████████████████████████████████████████████████████████▊                                              

Iter 430.0, Minibatch Loss= 0.914628, Training Accuracy= 0.55469







 55%|█████████████████████████████████████████████████████████████████████████████████████████████▏                                                                           | 431/782 [01:11<01:14,  4.70it/s]




 55%|█████████████████████████████████████████████████████████████████████████████████████████████▎                                                                           | 432/782 [01:11<01:09,  5.07it/s]




 55%|█████████████████████████████████████████████████████████████████████████████████████████████▌                                                                           | 433/782 [01:11<01:07,  5.19it/s]




 55%|█████████████████████████████████████████████████████████████████████████████████████████████▊                                                                           | 434/782 [01:11<01:04,  5.39it/s]




 56%|██████████████████████████████████████████████████████████████████████████████████████████████                                            

Iter 440.0, Minibatch Loss= 0.856379, Training Accuracy= 0.53906







 56%|███████████████████████████████████████████████████████████████████████████████████████████████▎                                                                         | 441/782 [01:13<01:05,  5.23it/s]




 57%|███████████████████████████████████████████████████████████████████████████████████████████████▌                                                                         | 442/782 [01:13<01:01,  5.50it/s]




 57%|███████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 443/782 [01:13<01:00,  5.63it/s]




 57%|███████████████████████████████████████████████████████████████████████████████████████████████▉                                                                         | 444/782 [01:13<01:00,  5.58it/s]




 57%|████████████████████████████████████████████████████████████████████████████████████████████████▏                                         

Iter 450.0, Minibatch Loss= 0.923243, Training Accuracy= 0.55469







 58%|█████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                       | 451/782 [01:14<01:08,  4.80it/s]




 58%|█████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                       | 452/782 [01:15<01:04,  5.13it/s]




 58%|█████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                       | 453/782 [01:15<01:01,  5.35it/s]




 58%|██████████████████████████████████████████████████████████████████████████████████████████████████                                                                       | 454/782 [01:15<00:57,  5.74it/s]




 58%|██████████████████████████████████████████████████████████████████████████████████████████████████▎                                       

Iter 460.0, Minibatch Loss= 0.972796, Training Accuracy= 0.53125







 59%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                     | 461/782 [01:16<01:01,  5.19it/s]




 59%|███████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                     | 462/782 [01:16<00:56,  5.71it/s]




 59%|████████████████████████████████████████████████████████████████████████████████████████████████████                                                                     | 463/782 [01:16<00:54,  5.86it/s]




 59%|████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                    | 464/782 [01:17<00:52,  6.04it/s]




 59%|████████████████████████████████████████████████████████████████████████████████████████████████████▍                                     

Iter 470.0, Minibatch Loss= 0.876938, Training Accuracy= 0.53906







 60%|█████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                   | 471/782 [01:18<00:59,  5.21it/s]




 60%|██████████████████████████████████████████████████████████████████████████████████████████████████████                                                                   | 472/782 [01:18<00:57,  5.36it/s]




 60%|██████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                  | 473/782 [01:18<00:55,  5.57it/s]




 61%|██████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                  | 474/782 [01:18<00:54,  5.69it/s]




 61%|██████████████████████████████████████████████████████████████████████████████████████████████████████▋                                   

Iter 480.0, Minibatch Loss= 0.962753, Training Accuracy= 0.53125







 62%|███████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                 | 481/782 [01:19<00:55,  5.39it/s]




 62%|████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                | 482/782 [01:20<00:52,  5.69it/s]




 62%|████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                | 483/782 [01:20<00:50,  5.92it/s]




 62%|████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                | 484/782 [01:20<00:48,  6.14it/s]




 62%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                 

Iter 490.0, Minibatch Loss= 0.878097, Training Accuracy= 0.53125







 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████                                                               | 491/782 [01:21<00:54,  5.34it/s]




 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                              | 492/782 [01:21<00:51,  5.64it/s]




 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                              | 493/782 [01:21<00:49,  5.86it/s]




 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                              | 494/782 [01:22<00:46,  6.15it/s]




 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▉                               

Iter 500.0, Minibatch Loss= 0.956765, Training Accuracy= 0.53125







 64%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                            | 501/782 [01:23<00:57,  4.87it/s]




 64%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                            | 502/782 [01:23<00:54,  5.16it/s]




 64%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                            | 503/782 [01:23<00:52,  5.32it/s]




 64%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                            | 504/782 [01:23<00:49,  5.56it/s]




 65%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                            

Iter 510.0, Minibatch Loss= 0.912069, Training Accuracy= 0.53125







 65%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                          | 511/782 [01:25<00:49,  5.49it/s]




 65%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                          | 512/782 [01:25<00:48,  5.52it/s]




 66%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                          | 513/782 [01:25<00:49,  5.45it/s]




 66%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                          | 514/782 [01:25<00:48,  5.55it/s]




 66%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                          

Iter 520.0, Minibatch Loss= 0.900667, Training Accuracy= 0.54688







 67%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                        | 521/782 [01:26<00:54,  4.81it/s]




 67%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                        | 522/782 [01:27<00:51,  5.03it/s]




 67%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                        | 523/782 [01:27<00:49,  5.24it/s]




 67%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                       | 524/782 [01:27<00:47,  5.43it/s]




 67%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                        

Iter 530.0, Minibatch Loss= 0.886856, Training Accuracy= 0.54688







 68%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                      | 531/782 [01:28<00:53,  4.72it/s]




 68%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                      | 532/782 [01:28<00:50,  4.98it/s]




 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                     | 533/782 [01:29<00:47,  5.25it/s]




 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                     | 534/782 [01:29<00:45,  5.47it/s]




 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                      

Iter 540.0, Minibatch Loss= 0.909694, Training Accuracy= 0.53125







 69%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                    | 541/782 [01:30<00:50,  4.76it/s]




 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                   | 542/782 [01:30<00:47,  5.07it/s]




 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                   | 543/782 [01:30<00:43,  5.44it/s]




 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                   | 544/782 [01:31<00:42,  5.62it/s]




 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                    

Iter 550.0, Minibatch Loss= 0.908306, Training Accuracy= 0.53125







 70%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                  | 551/782 [01:32<00:44,  5.21it/s]




 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                 | 552/782 [01:32<00:42,  5.44it/s]




 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                 | 553/782 [01:32<00:39,  5.75it/s]




 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                 | 554/782 [01:32<00:38,  5.93it/s]




 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                  

Iter 560.0, Minibatch Loss= 0.953577, Training Accuracy= 0.52344







 72%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                               | 561/782 [01:33<00:40,  5.46it/s]




 72%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                               | 562/782 [01:34<00:38,  5.69it/s]




 72%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                               | 563/782 [01:34<00:36,  5.99it/s]




 72%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                               | 564/782 [01:34<00:35,  6.19it/s]




 72%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                

Iter 570.0, Minibatch Loss= 0.849028, Training Accuracy= 0.62500







 73%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 571/782 [01:35<00:40,  5.18it/s]




 73%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                             | 572/782 [01:35<00:37,  5.55it/s]




 73%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                             | 573/782 [01:35<00:35,  5.81it/s]




 73%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                             | 574/782 [01:36<00:36,  5.76it/s]




 74%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎             

Iter 580.0, Minibatch Loss= 0.872558, Training Accuracy= 0.53906







 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                           | 581/782 [01:37<00:42,  4.78it/s]




 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                           | 582/782 [01:37<00:40,  4.99it/s]




 75%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                           | 583/782 [01:37<00:38,  5.16it/s]




 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                          | 584/782 [01:37<00:37,  5.32it/s]




 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍           

Iter 590.0, Minibatch Loss= 0.909623, Training Accuracy= 0.58594







 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                         | 591/782 [01:39<00:41,  4.57it/s]




 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                         | 592/782 [01:39<00:38,  4.88it/s]




 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                        | 593/782 [01:39<00:36,  5.20it/s]




 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                        | 594/782 [01:39<00:33,  5.61it/s]




 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌         

Iter 600.0, Minibatch Loss= 0.905664, Training Accuracy= 0.53125







 77%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                       | 601/782 [01:40<00:32,  5.54it/s]




 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                       | 602/782 [01:41<00:31,  5.70it/s]




 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                      | 603/782 [01:41<00:29,  6.08it/s]




 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                      | 604/782 [01:41<00:29,  6.12it/s]




 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋       

Iter 610.0, Minibatch Loss= 0.921571, Training Accuracy= 0.56250







 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                     | 611/782 [01:42<00:30,  5.53it/s]




 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                    | 612/782 [01:42<00:30,  5.64it/s]




 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 613/782 [01:42<00:28,  5.94it/s]




 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                    | 614/782 [01:42<00:27,  6.11it/s]




 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉     

Iter 620.0, Minibatch Loss= 0.921186, Training Accuracy= 0.53125







 79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                  | 621/782 [01:44<00:29,  5.41it/s]




 80%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                  | 622/782 [01:44<00:28,  5.64it/s]




 80%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                  | 623/782 [01:44<00:27,  5.85it/s]




 80%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                  | 624/782 [01:44<00:25,  6.20it/s]




 80%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████   

Iter 630.0, Minibatch Loss= 0.933970, Training Accuracy= 0.56250







 81%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                | 631/782 [01:45<00:27,  5.44it/s]




 81%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                | 632/782 [01:45<00:25,  5.79it/s]




 81%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                | 633/782 [01:46<00:24,  6.12it/s]




 81%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                | 634/782 [01:46<00:24,  6.14it/s]




 81%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏

Iter 640.0, Minibatch Loss= 0.902153, Training Accuracy= 0.56250







 82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                              | 641/782 [01:47<00:28,  4.87it/s]




 82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                              | 642/782 [01:47<00:27,  5.04it/s]




 82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                              | 643/782 [01:47<00:26,  5.17it/s]




 82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                             | 644/782 [01:48<00:26,  5.26it/s]




 82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 650.0, Minibatch Loss= 0.894288, Training Accuracy= 0.56250







 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                            | 651/782 [01:49<00:27,  4.70it/s]




 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                            | 652/782 [01:49<00:26,  4.96it/s]




 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                            | 653/782 [01:49<00:25,  5.13it/s]




 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                           | 654/782 [01:49<00:23,  5.36it/s]




 84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 660.0, Minibatch Loss= 0.868190, Training Accuracy= 0.56250







 85%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                          | 661/782 [01:51<00:24,  5.02it/s]




 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                          | 662/782 [01:51<00:23,  5.21it/s]




 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                         | 663/782 [01:51<00:22,  5.38it/s]




 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                         | 664/782 [01:51<00:21,  5.43it/s]




 85%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 670.0, Minibatch Loss= 0.920578, Training Accuracy= 0.55469







 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                        | 671/782 [01:53<00:25,  4.31it/s]




 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                       | 672/782 [01:53<00:24,  4.48it/s]




 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                       | 673/782 [01:53<00:22,  4.82it/s]




 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 674/782 [01:53<00:21,  5.05it/s]




 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 680.0, Minibatch Loss= 0.935246, Training Accuracy= 0.51562







 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                     | 681/782 [01:55<00:21,  4.73it/s]




 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                     | 682/782 [01:55<00:19,  5.10it/s]




 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                     | 683/782 [01:55<00:19,  5.19it/s]




 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                     | 684/782 [01:55<00:18,  5.39it/s]




 88%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 690.0, Minibatch Loss= 0.760015, Training Accuracy= 0.61719







 88%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                   | 691/782 [01:56<00:18,  4.87it/s]




 88%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                   | 692/782 [01:57<00:16,  5.44it/s]




 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                   | 693/782 [01:57<00:15,  5.79it/s]




 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                   | 694/782 [01:57<00:14,  5.91it/s]




 89%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 700.0, Minibatch Loss= 0.787486, Training Accuracy= 0.60156







 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 701/782 [01:58<00:16,  4.79it/s]




 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                 | 702/782 [01:58<00:15,  5.08it/s]




 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                 | 703/782 [01:58<00:15,  5.26it/s]




 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                | 704/782 [01:59<00:14,  5.42it/s]




 90%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 710.0, Minibatch Loss= 0.759051, Training Accuracy= 0.64062







 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋               | 711/782 [02:00<00:13,  5.34it/s]




 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊               | 712/782 [02:00<00:12,  5.61it/s]




 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████               | 713/782 [02:00<00:11,  5.82it/s]




 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎              | 714/782 [02:00<00:11,  5.74it/s]




 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 720.0, Minibatch Loss= 0.969423, Training Accuracy= 0.52344







 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 721/782 [02:02<00:12,  4.98it/s]




 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████             | 722/782 [02:02<00:11,  5.19it/s]




 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 723/782 [02:02<00:11,  5.30it/s]




 93%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍            | 724/782 [02:02<00:10,  5.47it/s]




 93%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 730.0, Minibatch Loss= 0.910146, Training Accuracy= 0.56250







 93%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉           | 731/782 [02:03<00:10,  4.90it/s]




 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏          | 732/782 [02:04<00:09,  5.39it/s]




 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍          | 733/782 [02:04<00:08,  5.64it/s]




 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋          | 734/782 [02:04<00:08,  5.61it/s]




 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 740.0, Minibatch Loss= 0.904655, Training Accuracy= 0.56250







 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏        | 741/782 [02:05<00:08,  4.70it/s]




 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎        | 742/782 [02:05<00:08,  4.94it/s]




 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌        | 743/782 [02:06<00:07,  5.13it/s]




 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊        | 744/782 [02:06<00:07,  5.30it/s]




 95%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 750.0, Minibatch Loss= 0.971343, Training Accuracy= 0.57812







 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎      | 751/782 [02:07<00:05,  5.31it/s]




 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌      | 752/782 [02:07<00:05,  5.49it/s]




 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋      | 753/782 [02:07<00:05,  5.48it/s]




 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉      | 754/782 [02:08<00:05,  5.52it/s]




 97%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 760.0, Minibatch Loss= 0.897740, Training Accuracy= 0.57812







 97%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍    | 761/782 [02:09<00:04,  4.77it/s]




 97%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋    | 762/782 [02:09<00:03,  5.03it/s]




 98%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉    | 763/782 [02:09<00:03,  5.26it/s]




 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████    | 764/782 [02:09<00:03,  5.36it/s]




 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 770.0, Minibatch Loss= 0.883874, Training Accuracy= 0.57812







 99%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌  | 771/782 [02:11<00:02,  4.96it/s]




 99%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊  | 772/782 [02:11<00:01,  5.23it/s]




 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████  | 773/782 [02:11<00:01,  5.33it/s]




 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎ | 774/782 [02:11<00:01,  5.31it/s]




 99%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 780.0, Minibatch Loss= 0.872677, Training Accuracy= 0.64062







100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊| 781/782 [02:13<00:00,  4.56it/s]




100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 782/782 [02:13<00:00,  4.81it/s]

In [74]:
data_feature_list, correct_values, correct_scores = split_data_into_scores("data/test_labeled.txt")

#hyps, evis, ys 
data = (data_feature_list[0],
                  data_feature_list[1],
                  correct_scores)
# predictions = []
correct_predictions = 0
total_predictions = 0
for i, f1 in enumerate(data_feature_list[0]):
    hyps, evis, ys = data_feature_list[0][i], data_feature_list[1][i], correct_scores[i]
    prediction = sess.run(classification_scores, feed_dict={hyp: ([hyps] * N), evi: ([evis] * N), y: ([ys] * N)})
#     predictions.append(prediction)
    total_predictions += 1
    if np.argmax(prediction[0])==np.argmax(ys):
        correct_predictions += 1
#     print(["Positive", "Neutral", "Negative"][np.argmax(prediction[0])]+
#       " / " + ["Positive", "Neutral", "Negative"][np.argmax(ys[i])])


# acc = sess.run(accuracy)#, feed_dict={'label': correct_scores})

print("Acc: %s" % str(correct_predictions*100/total_predictions))    
# print("Acc: %s" % str(acc))



Acc: 56.647046884513905


In [75]:
sess.close()