# Textual entailment

### Imports

In [1]:
from tqdm import tqdm
import tensorflow as tf
import numpy as np
import sys
display_step = 10

### Embeddings

Download Glove word embeddings

In [3]:
glove_zip_file = "data/glove.6B.zip"
glove_vectors_file = "data/glove.6B.50d.txt"
import zipfile, urllib.request, shutil, os
    
#large file - 862 MB
if (not os.path.isfile(glove_zip_file) and
    not os.path.isfile(glove_vectors_file)):
    with urllib.request.urlopen("http://nlp.stanford.edu/data/glove.6B.zip") as response, open(glove_zip_file, 'wb') as out_file:
        shutil.copyfileobj(response, out_file)

Unzip word embeddings

In [4]:
import zipfile
def unzip_single_file(zip_file_name, output_file_name):
    """
        If the outFile is already created, don't recreate
        If the outFile does not exist, create it from the zipFile
    """
    if not os.path.isfile(output_file_name):
        with open(output_file_name, 'wb') as out_file:
            with zipfile.ZipFile(zip_file_name) as zipped:
                for info in zipped.infolist():
                    if output_file_name in info.filename:
                        with zipped.open(info) as requested_file:
                            out_file.write(requested_file.read())
                            return

unzip_single_file(glove_zip_file, glove_vectors_file)

In [4]:
glove_wordmap = {}
with open(glove_vectors_file, "r", encoding="utf8") as glove:
    for line in glove:
        name, vector = tuple(line.split(" ", 1))
        glove_wordmap[name] = np.fromstring(vector, sep=" ")

## Model

### Embed sentences - sentence2sequence

In [5]:
def sentence2sequence(sentence):
    """
    - Turns an input sentence into an (n,d) matrix, 
        where n is the number of tokens in the sentence
        and d is the number of dimensions each word vector has.
    
      Tensorflow doesn't need to be used here, as simply
      turning the sentence into a sequence based off our 
      mapping does not need the computational power that
      Tensorflow provides. Normal Python suffices for this task.
    """
    tokens = sentence.lower().split(" ")
    rows = []
    words = []
    #Greedy search for tokens
    for token in tokens:
        i = len(token)
        while len(token) > 0 and i > 0:
            word = token[:i]
            if word in glove_wordmap:
                rows.append(glove_wordmap[word])
                words.append(word)
                token = token[i:]
                i = len(token)
            else:
                i = i-1
    return rows, words

In [7]:
display_step = 10
# one hot encoding
def score_setup(row):
    convert_dict = {
      'ENTAILMENT': 0,
      'NEUTRAL': 1,
      'CONTRADICTION': 2
    }
    score = np.zeros((3,))
    tag = row["entailment_judgment"]
    score[convert_dict[tag]] += 1
    return score

def fit_to_size(matrix, shape):
    res = np.zeros(shape)
    slices = [slice(0,min(dim,shape[e])) for e, dim in enumerate(matrix.shape)]
    res[slices] = matrix[slices]
    return res

### Constants

In [10]:
#Constants setup
max_hypothesis_length, max_evidence_length = 30, 30
batch_size, vector_size, hidden_size = 128, 50, 64

training_iterations_count = 100000

lstm_size = hidden_size

weight_decay = 0.0005

learning_rate = 1

input_p, output_p = 0.6, 0.3

### [Training data](http://www.site.uottawa.ca/~diana/csi5386/A2_2019/SICK_train.txt)

In [31]:
import numpy as np

def split_data_into_scores(file_name="data/training.txt"):
    import csv
    with open(file_name,"r") as data:
        train = csv.DictReader(data , delimiter='\t')
        evi_sentences = []
        hyp_sentences = []
        labels = []
        scores = []
        count = 1
        for row in train:
            hyp_sentences.append(np.vstack(
                    sentence2sequence(row["sentence_A"].lower())[0]))
            evi_sentences.append(np.vstack(
                    sentence2sequence(row["sentence_B"].lower())[0]))
            labels.append(row["entailment_judgment"])
            scores.append(score_setup(row))
        
        hyp_sentences = np.stack([fit_to_size(x, (max_hypothesis_length, vector_size))
                          for x in hyp_sentences])
        evi_sentences = np.stack([fit_to_size(x, (max_evidence_length, vector_size))
                          for x in evi_sentences])
                                 
        return (hyp_sentences, evi_sentences), labels, np.array(scores)
data_feature_list, correct_values, correct_scores = split_data_into_scores()

l_h, l_e = max_hypothesis_length, max_evidence_length
N, D, H = batch_size, vector_size, hidden_size
l_seq = l_h + l_e



### Cell used for development

In [86]:
def create_model():
    tf.reset_default_graph() 
    data_feature_list, correct_values, correct_scores = split_data_into_scores()

    l_h, l_e = max_hypothesis_length, max_evidence_length
    N, D, H = batch_size, vector_size, hidden_size
    l_seq = l_h + l_e
    lstm = tf.contrib.rnn.BasicLSTMCell(lstm_size)
    lstm_drop =  tf.contrib.rnn.DropoutWrapper(lstm, input_p, output_p)
    hyp = tf.placeholder(tf.float32, [N, l_h, D], 'hypothesis')
    evi = tf.placeholder(tf.float32, [N, l_e, D], 'evidence')
    y = tf.placeholder(tf.float32, [N, 3], 'label')
    lstm_back = tf.contrib.rnn.BasicLSTMCell(lstm_size)

    lstm_drop_back = tf.contrib.rnn.DropoutWrapper(lstm_back, input_p, output_p)

    fc_initializer = tf.random_normal_initializer(stddev=0.1) 
    fc_weight = tf.get_variable('fc_weight', [2*hidden_size, 3], 
                            initializer = fc_initializer)
    fc_bias = tf.get_variable('bias', [3])
    tf.add_to_collection(tf.GraphKeys.REGULARIZATION_LOSSES, 
                     tf.nn.l2_loss(fc_weight)) 

    x = tf.concat([hyp, evi], 1) # N, (Lh+Le), d
    x = tf.transpose(x, [1, 0, 2]) # (Le+Lh), N, d
    x = tf.reshape(x, [-1, vector_size]) # (Le+Lh)*N, d
    x = tf.split(x, l_seq,)
    rnn_outputs, _, _ = tf.contrib.rnn.static_bidirectional_rnn(lstm, lstm_back,
                                                            x, dtype=tf.float32)

    classification_scores = tf.matmul(rnn_outputs[-1], fc_weight) + fc_bias

    with tf.variable_scope('Accuracy'):
        predicts = tf.cast(tf.argmax(classification_scores, 1), 'int32')
        y_label = tf.cast(tf.argmax(y, 1), 'int32')
        corrects = tf.equal(predicts, y_label)
        num_corrects = tf.reduce_sum(tf.cast(corrects, tf.float32))
        accuracy = tf.reduce_mean(tf.cast(corrects, tf.float32))

    with tf.variable_scope("loss"):
        cross_entropy = tf.nn.softmax_cross_entropy_with_logits(
            logits = classification_scores, labels = y)
        loss = tf.reduce_mean(cross_entropy)
        total_loss = loss + weight_decay * tf.add_n(
            tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES))

    optimizer = tf.train.GradientDescentOptimizer(learning_rate)

    opt_op = optimizer.minimize(total_loss)
    # Initialize variables
    init = tf.global_variables_initializer()

    # Use TQDM if installed
    tqdm_installed = False
    try:
        from tqdm import tqdm
        tqdm_installed = True
    except:
        pass

    # Launch the Tensorflow session
    sess = tf.Session()
    sess.run(init)

    # training_iterations_count: The number of data pieces to train on in total
    # batch_size: The number of data pieces per batch
    training_iterations = range(0,training_iterations_count,batch_size)
    if tqdm_installed:
        # Add a progress bar if TQDM is installed
        training_iterations = tqdm(training_iterations)

    for i in training_iterations:
        if i % 1000 == 0:
        # Select indices for a random data subset
            batch = np.random.randint(data_feature_list[0].shape[0], size=batch_size)

        # Use the selected subset indices to initialize the graph's 
        #   placeholder values
        hyps, evis, ys = (data_feature_list[0][batch,:],
                          data_feature_list[1][batch,:],
                          correct_scores[batch])

        # Run the optimization with these initialized values
        sess.run([opt_op], feed_dict={hyp: hyps, evi: evis, y: ys})
        # display_step: how often the accuracy and loss should 
        #   be tested and displayed.
        if (i/batch_size) % display_step == 0:
            # Calculate batch accuracy
            acc = sess.run(accuracy, feed_dict={hyp: hyps, evi: evis, y: ys})
            # Calculate batch loss
            tmp_loss = sess.run(loss, feed_dict={hyp: hyps, evi: evis, y: ys})
            # Display results
            print("Iter " + str(i/batch_size) + ", Minibatch Loss= " + \
                  "{:.6f}".format(tmp_loss) + ", Training Accuracy= " + \
                  "{:.5f}".format(acc))

    data_feature_list, correct_values, correct_scores = split_test_data_into_scores("data/dev.txt")


    hyps, evis, ys = (data_feature_list[0][:],
                      data_feature_list[1][:],
                      correct_scores)
    predictions = sess.run(classification_scores, feed_dict={hyp: hyps, evi: evis, y: ys})
    total = len(predictions)
    correct_predictions = 0
    for i,prediction in enumerate(predictions):
        if np.argmax(prediction[0])==np.argmax(ys[i]):
            correct_predictions += 1
    #     print(["Positive", "Neutral", "Negative"][np.argmax(prediction[0])]+
    #       " / " + ["Positive", "Neutral", "Negative"][np.argmax(ys[i])])
    acc = correct_predictions*100/total
    print("Acc: %s" % str(acc))
    return acc

In [87]:
import numpy as np
accs = [] # 128
batches = [128, 64, 32, 1, 256]
for batch in batches:
    batch_size = batch
    accs.append(create_model())

print(accs)
print("Best batch size %s" % str(batches[np.argmax(accs)]))





  0%|                                                                          | 0/782 [00:00<?, ?it/s]

Iter 0.0, Minibatch Loss= 1.046311, Training Accuracy= 0.39844





  0%|                                                                  | 1/782 [00:03<39:48,  3.06s/it]


  1%|▎                                                                 | 4/782 [00:03<27:53,  2.15s/it]


  1%|▋                                                                 | 8/782 [00:03<19:32,  1.51s/it]

Iter 10.0, Minibatch Loss= 1.006866, Training Accuracy= 0.47656





  1%|▉                                                                | 11/782 [00:03<13:47,  1.07s/it]


  2%|█▏                                                               | 15/782 [00:03<09:43,  1.31it/s]


  2%|█▌                                                               | 19/782 [00:03<06:52,  1.85it/s]

Iter 20.0, Minibatch Loss= 1.030495, Training Accuracy= 0.46875





  3%|█▊                                                               | 22/782 [00:03<04:56,  2.56it/s]


  3%|██▏                                                              | 26/782 [00:03<03:32,  3.55it/s]


  4%|██▍                                                              | 30/782 [00:03<02:34,  4.86it/s]

Iter 30.0, Minibatch Loss= 0.998613, Training Accuracy= 0.50000





  4%|██▊                                                              | 34/782 [00:04<01:55,  6.46it/s]


  5%|███▏                                                             | 38/782 [00:04<01:26,  8.58it/s]

Iter 40.0, Minibatch Loss= 1.188272, Training Accuracy= 0.47656





  5%|███▍                                                             | 42/782 [00:04<01:08, 10.84it/s]


  6%|███▊                                                             | 46/782 [00:04<00:54, 13.58it/s]


  6%|████▏                                                            | 50/782 [00:04<00:44, 16.49it/s]

Iter 50.0, Minibatch Loss= 0.986133, Training Accuracy= 0.55469





  7%|████▍                                                            | 54/782 [00:04<00:41, 17.41it/s]


  7%|████▋                                                            | 57/782 [00:04<00:37, 19.57it/s]

Iter 60.0, Minibatch Loss= 1.038581, Training Accuracy= 0.46875





  8%|█████                                                            | 61/782 [00:05<00:34, 21.16it/s]


  8%|█████▍                                                           | 65/782 [00:05<00:30, 23.77it/s]


  9%|█████▋                                                           | 68/782 [00:05<00:30, 23.39it/s]

Iter 70.0, Minibatch Loss= 1.004398, Training Accuracy= 0.48438





  9%|█████▉                                                           | 71/782 [00:05<00:31, 22.76it/s]


 10%|██████▏                                                          | 75/782 [00:05<00:28, 25.06it/s]


 10%|██████▌                                                          | 79/782 [00:05<00:25, 27.19it/s]

Iter 80.0, Minibatch Loss= 1.010615, Training Accuracy= 0.46875





 10%|██████▊                                                          | 82/782 [00:05<00:27, 25.68it/s]


 11%|███████▏                                                         | 86/782 [00:05<00:25, 27.69it/s]


 12%|███████▍                                                         | 90/782 [00:06<00:23, 29.63it/s]

Iter 90.0, Minibatch Loss= 1.002805, Training Accuracy= 0.46875





 12%|███████▊                                                         | 94/782 [00:06<00:23, 29.63it/s]


 13%|████████▏                                                        | 98/782 [00:06<00:21, 31.45it/s]

Iter 100.0, Minibatch Loss= 0.968036, Training Accuracy= 0.53125





 13%|████████▎                                                       | 102/782 [00:06<00:22, 29.71it/s]


 14%|████████▋                                                       | 106/782 [00:06<00:21, 30.78it/s]


 14%|█████████                                                       | 110/782 [00:06<00:21, 31.58it/s]

Iter 110.0, Minibatch Loss= 0.988597, Training Accuracy= 0.52344





 15%|█████████▎                                                      | 114/782 [00:06<00:22, 30.06it/s]


 15%|█████████▋                                                      | 118/782 [00:06<00:21, 31.04it/s]

Iter 120.0, Minibatch Loss= 0.977643, Training Accuracy= 0.52344





 16%|█████████▉                                                      | 122/782 [00:07<00:21, 30.05it/s]


 16%|██████████▎                                                     | 126/782 [00:07<00:21, 31.19it/s]


 17%|██████████▋                                                     | 130/782 [00:07<00:20, 31.13it/s]

Iter 130.0, Minibatch Loss= 0.953897, Training Accuracy= 0.57812





 17%|██████████▉                                                     | 134/782 [00:07<00:22, 28.75it/s]


 18%|███████████▎                                                    | 138/782 [00:07<00:21, 30.05it/s]

Iter 140.0, Minibatch Loss= 0.942472, Training Accuracy= 0.58594





 18%|███████████▌                                                    | 142/782 [00:07<00:22, 27.86it/s]


 19%|███████████▉                                                    | 146/782 [00:07<00:21, 30.03it/s]


 19%|████████████▎                                                   | 150/782 [00:08<00:19, 31.68it/s]

Iter 150.0, Minibatch Loss= 0.928797, Training Accuracy= 0.59375





 20%|████████████▌                                                   | 154/782 [00:08<00:20, 31.04it/s]


 20%|████████████▉                                                   | 158/782 [00:08<00:19, 32.63it/s]

Iter 160.0, Minibatch Loss= 0.934262, Training Accuracy= 0.58594





 21%|█████████████▎                                                  | 162/782 [00:08<00:19, 31.74it/s]


 21%|█████████████▌                                                  | 166/782 [00:08<00:18, 33.00it/s]


 22%|█████████████▉                                                  | 170/782 [00:08<00:17, 34.20it/s]

Iter 170.0, Minibatch Loss= 0.954627, Training Accuracy= 0.57812





 22%|██████████████▏                                                 | 174/782 [00:08<00:19, 31.68it/s]


 23%|██████████████▌                                                 | 178/782 [00:08<00:18, 32.79it/s]

Iter 180.0, Minibatch Loss= 0.894737, Training Accuracy= 0.57812





 23%|██████████████▉                                                 | 182/782 [00:09<00:19, 30.96it/s]


 24%|███████████████▏                                                | 186/782 [00:09<00:18, 32.25it/s]


 24%|███████████████▌                                                | 190/782 [00:09<00:17, 33.55it/s]

Iter 190.0, Minibatch Loss= 0.995688, Training Accuracy= 0.57812





 25%|███████████████▉                                                | 194/782 [00:09<00:18, 31.58it/s]


 25%|████████████████▏                                               | 198/782 [00:09<00:18, 32.17it/s]

Iter 200.0, Minibatch Loss= 0.900557, Training Accuracy= 0.58594





 26%|████████████████▌                                               | 202/782 [00:09<00:18, 31.07it/s]


 26%|████████████████▊                                               | 206/782 [00:09<00:17, 32.41it/s]


 27%|█████████████████▏                                              | 210/782 [00:09<00:17, 32.36it/s]

Iter 210.0, Minibatch Loss= 1.035089, Training Accuracy= 0.45312





 27%|█████████████████▌                                              | 214/782 [00:10<00:18, 30.84it/s]


 28%|█████████████████▊                                              | 218/782 [00:10<00:17, 32.31it/s]

Iter 220.0, Minibatch Loss= 0.944693, Training Accuracy= 0.57812





 28%|██████████████████▏                                             | 222/782 [00:10<00:17, 31.53it/s]


 29%|██████████████████▍                                             | 226/782 [00:10<00:16, 33.17it/s]


 29%|██████████████████▊                                             | 230/782 [00:10<00:16, 34.07it/s]

Iter 230.0, Minibatch Loss= 0.985086, Training Accuracy= 0.57812





 30%|███████████████████▏                                            | 234/782 [00:10<00:17, 32.21it/s]


 30%|███████████████████▍                                            | 238/782 [00:10<00:16, 33.52it/s]

Iter 240.0, Minibatch Loss= 0.949658, Training Accuracy= 0.57812





 31%|███████████████████▊                                            | 242/782 [00:10<00:16, 32.25it/s]


 31%|████████████████████▏                                           | 246/782 [00:10<00:15, 33.64it/s]


 32%|████████████████████▍                                           | 250/782 [00:11<00:15, 34.50it/s]

Iter 250.0, Minibatch Loss= 0.934820, Training Accuracy= 0.54688





 32%|████████████████████▊                                           | 254/782 [00:11<00:16, 32.96it/s]


 33%|█████████████████████                                           | 258/782 [00:11<00:15, 34.17it/s]

Iter 260.0, Minibatch Loss= 0.941884, Training Accuracy= 0.53125





 34%|█████████████████████▍                                          | 262/782 [00:11<00:15, 32.83it/s]


 34%|█████████████████████▊                                          | 266/782 [00:11<00:15, 34.08it/s]


 35%|██████████████████████                                          | 270/782 [00:11<00:14, 34.82it/s]

Iter 270.0, Minibatch Loss= 0.923028, Training Accuracy= 0.54688





 35%|██████████████████████▍                                         | 274/782 [00:11<00:15, 32.84it/s]


 36%|██████████████████████▊                                         | 278/782 [00:11<00:14, 33.99it/s]

Iter 280.0, Minibatch Loss= 0.916794, Training Accuracy= 0.54688





 36%|███████████████████████                                         | 282/782 [00:12<00:17, 29.20it/s]


 37%|███████████████████████▍                                        | 286/782 [00:12<00:16, 29.20it/s]


 37%|███████████████████████▋                                        | 290/782 [00:12<00:16, 29.66it/s]

Iter 290.0, Minibatch Loss= 0.902774, Training Accuracy= 0.54688





 38%|████████████████████████                                        | 294/782 [00:12<00:17, 28.45it/s]


 38%|████████████████████████▍                                       | 298/782 [00:12<00:15, 30.43it/s]

Iter 300.0, Minibatch Loss= 0.984469, Training Accuracy= 0.51562





 39%|████████████████████████▋                                       | 302/782 [00:12<00:16, 29.92it/s]


 39%|█████████████████████████                                       | 306/782 [00:12<00:15, 31.22it/s]


 40%|█████████████████████████▎                                      | 310/782 [00:13<00:14, 32.52it/s]

Iter 310.0, Minibatch Loss= 0.923337, Training Accuracy= 0.54688





 40%|█████████████████████████▋                                      | 314/782 [00:13<00:15, 29.43it/s]


 41%|██████████████████████████                                      | 318/782 [00:13<00:15, 30.37it/s]

Iter 320.0, Minibatch Loss= 0.852724, Training Accuracy= 0.54688





 41%|██████████████████████████▎                                     | 322/782 [00:13<00:15, 29.03it/s]


 42%|██████████████████████████▋                                     | 326/782 [00:13<00:15, 30.33it/s]


 42%|███████████████████████████                                     | 330/782 [00:13<00:14, 31.85it/s]

Iter 330.0, Minibatch Loss= 0.944286, Training Accuracy= 0.54688





 43%|███████████████████████████▎                                    | 334/782 [00:13<00:14, 31.15it/s]


 43%|███████████████████████████▋                                    | 338/782 [00:13<00:13, 32.82it/s]

Iter 340.0, Minibatch Loss= 0.939195, Training Accuracy= 0.54688





 44%|███████████████████████████▉                                    | 342/782 [00:14<00:13, 31.97it/s]


 44%|████████████████████████████▎                                   | 346/782 [00:14<00:12, 33.98it/s]


 45%|████████████████████████████▋                                   | 350/782 [00:14<00:12, 34.31it/s]

Iter 350.0, Minibatch Loss= 0.938104, Training Accuracy= 0.54688





 45%|████████████████████████████▉                                   | 354/782 [00:14<00:13, 31.08it/s]


 46%|█████████████████████████████▎                                  | 358/782 [00:14<00:13, 31.27it/s]

Iter 360.0, Minibatch Loss= 0.937015, Training Accuracy= 0.54688





 46%|█████████████████████████████▋                                  | 362/782 [00:14<00:13, 30.62it/s]


 47%|█████████████████████████████▉                                  | 366/782 [00:14<00:13, 31.24it/s]


 47%|██████████████████████████████▎                                 | 370/782 [00:14<00:13, 31.32it/s]

Iter 370.0, Minibatch Loss= 0.935462, Training Accuracy= 0.54688





 48%|██████████████████████████████▌                                 | 374/782 [00:15<00:13, 29.96it/s]


 48%|██████████████████████████████▉                                 | 378/782 [00:15<00:12, 31.26it/s]

Iter 380.0, Minibatch Loss= 0.895507, Training Accuracy= 0.60938





 49%|███████████████████████████████▎                                | 382/782 [00:15<00:13, 29.08it/s]


 49%|███████████████████████████████▌                                | 385/782 [00:15<00:14, 28.35it/s]


 50%|███████████████████████████████▊                                | 389/782 [00:15<00:13, 28.85it/s]

Iter 390.0, Minibatch Loss= 0.885587, Training Accuracy= 0.61719





 50%|████████████████████████████████                                | 392/782 [00:15<00:15, 25.20it/s]


 51%|████████████████████████████████▎                               | 395/782 [00:15<00:14, 26.40it/s]


 51%|████████████████████████████████▌                               | 398/782 [00:15<00:14, 26.59it/s]

Iter 400.0, Minibatch Loss= 0.872792, Training Accuracy= 0.61719





 51%|████████████████████████████████▊                               | 401/782 [00:16<00:15, 24.61it/s]


 52%|█████████████████████████████████                               | 404/782 [00:16<00:15, 25.16it/s]


 52%|█████████████████████████████████▎                              | 407/782 [00:16<00:15, 24.44it/s]


 52%|█████████████████████████████████▌                              | 410/782 [00:16<00:14, 25.16it/s]

Iter 410.0, Minibatch Loss= 0.869730, Training Accuracy= 0.60938





 53%|█████████████████████████████████▊                              | 413/782 [00:16<00:16, 22.41it/s]


 53%|██████████████████████████████████▏                             | 417/782 [00:16<00:14, 24.76it/s]


 54%|██████████████████████████████████▎                             | 420/782 [00:16<00:14, 25.79it/s]

Iter 420.0, Minibatch Loss= 0.890985, Training Accuracy= 0.60938





 54%|██████████████████████████████████▌                             | 423/782 [00:17<00:14, 24.02it/s]


 54%|██████████████████████████████████▊                             | 426/782 [00:17<00:14, 24.19it/s]


 55%|███████████████████████████████████                             | 429/782 [00:17<00:14, 25.16it/s]

Iter 430.0, Minibatch Loss= 0.842923, Training Accuracy= 0.60938





 55%|███████████████████████████████████▎                            | 432/782 [00:17<00:14, 23.80it/s]


 56%|███████████████████████████████████▋                            | 436/782 [00:17<00:13, 25.63it/s]


 56%|███████████████████████████████████▉                            | 439/782 [00:17<00:13, 25.70it/s]

Iter 440.0, Minibatch Loss= 0.931465, Training Accuracy= 0.60156





 57%|████████████████████████████████████▏                           | 442/782 [00:17<00:13, 24.49it/s]


 57%|████████████████████████████████████▍                           | 445/782 [00:17<00:13, 25.78it/s]


 57%|████████████████████████████████████▋                           | 448/782 [00:17<00:12, 26.28it/s]

Iter 450.0, Minibatch Loss= 1.046192, Training Accuracy= 0.46875





 58%|████████████████████████████████████▉                           | 451/782 [00:18<00:13, 24.73it/s]


 58%|█████████████████████████████████████▏                          | 455/782 [00:18<00:12, 27.13it/s]


 59%|█████████████████████████████████████▍                          | 458/782 [00:18<00:12, 25.19it/s]

Iter 460.0, Minibatch Loss= 0.874843, Training Accuracy= 0.60938





 59%|█████████████████████████████████████▋                          | 461/782 [00:18<00:13, 24.45it/s]


 59%|██████████████████████████████████████                          | 465/782 [00:18<00:12, 25.65it/s]


 60%|██████████████████████████████████████▎                         | 468/782 [00:18<00:12, 25.26it/s]

Iter 470.0, Minibatch Loss= 0.869888, Training Accuracy= 0.60938





 60%|██████████████████████████████████████▌                         | 471/782 [00:18<00:13, 22.52it/s]


 61%|██████████████████████████████████████▊                         | 474/782 [00:19<00:12, 23.70it/s]


 61%|███████████████████████████████████████                         | 477/782 [00:19<00:12, 24.02it/s]


 61%|███████████████████████████████████████▎                        | 480/782 [00:19<00:12, 25.04it/s]

Iter 480.0, Minibatch Loss= 0.860514, Training Accuracy= 0.60938





 62%|███████████████████████████████████████▌                        | 483/782 [00:19<00:11, 25.47it/s]


 62%|███████████████████████████████████████▊                        | 487/782 [00:19<00:10, 27.92it/s]

Iter 490.0, Minibatch Loss= 0.846826, Training Accuracy= 0.60938





 63%|████████████████████████████████████████▏                       | 491/782 [00:19<00:10, 28.52it/s]


 63%|████████████████████████████████████████▌                       | 495/782 [00:19<00:09, 30.70it/s]


 64%|████████████████████████████████████████▊                       | 499/782 [00:19<00:08, 31.98it/s]

Iter 500.0, Minibatch Loss= 0.980472, Training Accuracy= 0.57031





 64%|█████████████████████████████████████████▏                      | 503/782 [00:19<00:08, 31.31it/s]


 65%|█████████████████████████████████████████▍                      | 507/782 [00:20<00:08, 32.67it/s]

Iter 510.0, Minibatch Loss= 0.946563, Training Accuracy= 0.57031





 65%|█████████████████████████████████████████▊                      | 511/782 [00:20<00:08, 31.77it/s]


 66%|██████████████████████████████████████████▏                     | 515/782 [00:20<00:08, 33.08it/s]


 66%|██████████████████████████████████████████▍                     | 519/782 [00:20<00:07, 33.08it/s]

Iter 520.0, Minibatch Loss= 0.915981, Training Accuracy= 0.57031





 67%|██████████████████████████████████████████▊                     | 523/782 [00:20<00:09, 27.26it/s]


 67%|███████████████████████████████████████████▏                    | 527/782 [00:20<00:09, 27.87it/s]


 68%|███████████████████████████████████████████▍                    | 530/782 [00:20<00:09, 27.01it/s]

Iter 530.0, Minibatch Loss= 0.889920, Training Accuracy= 0.57031





 68%|███████████████████████████████████████████▌                    | 533/782 [00:21<00:10, 24.87it/s]


 69%|███████████████████████████████████████████▉                    | 537/782 [00:21<00:09, 26.39it/s]

Iter 540.0, Minibatch Loss= 0.884960, Training Accuracy= 0.57031





 69%|████████████████████████████████████████████▎                   | 541/782 [00:21<00:08, 27.06it/s]


 70%|████████████████████████████████████████████▌                   | 545/782 [00:21<00:08, 28.80it/s]


 70%|████████████████████████████████████████████▉                   | 549/782 [00:21<00:07, 30.72it/s]

Iter 550.0, Minibatch Loss= 1.042768, Training Accuracy= 0.56250





 71%|█████████████████████████████████████████████▎                  | 553/782 [00:21<00:09, 23.00it/s]


 71%|█████████████████████████████████████████████▌                  | 556/782 [00:21<00:09, 23.56it/s]


 72%|█████████████████████████████████████████████▊                  | 560/782 [00:22<00:08, 25.49it/s]

Iter 560.0, Minibatch Loss= 0.976678, Training Accuracy= 0.57031





 72%|██████████████████████████████████████████████                  | 563/782 [00:22<00:08, 25.60it/s]


 73%|██████████████████████████████████████████████▍                 | 567/782 [00:22<00:07, 27.86it/s]

Iter 570.0, Minibatch Loss= 0.891604, Training Accuracy= 0.60156





 73%|██████████████████████████████████████████████▋                 | 571/782 [00:22<00:07, 28.37it/s]


 74%|███████████████████████████████████████████████                 | 575/782 [00:22<00:06, 29.69it/s]


 74%|███████████████████████████████████████████████▍                | 579/782 [00:22<00:06, 31.06it/s]

Iter 580.0, Minibatch Loss= 0.820257, Training Accuracy= 0.62500





 75%|███████████████████████████████████████████████▋                | 583/782 [00:22<00:07, 27.41it/s]


 75%|███████████████████████████████████████████████▉                | 586/782 [00:22<00:07, 26.71it/s]


 75%|████████████████████████████████████████████████▎               | 590/782 [00:23<00:06, 28.16it/s]

Iter 590.0, Minibatch Loss= 0.842359, Training Accuracy= 0.57812





 76%|████████████████████████████████████████████████▌               | 593/782 [00:23<00:07, 26.77it/s]


 76%|████████████████████████████████████████████████▊               | 597/782 [00:23<00:06, 28.94it/s]

Iter 600.0, Minibatch Loss= 0.850100, Training Accuracy= 0.58594





 77%|█████████████████████████████████████████████████▏              | 601/782 [00:23<00:06, 28.10it/s]


 77%|█████████████████████████████████████████████████▍              | 604/782 [00:23<00:06, 27.93it/s]


 78%|█████████████████████████████████████████████████▊              | 608/782 [00:23<00:05, 29.88it/s]

Iter 610.0, Minibatch Loss= 0.885810, Training Accuracy= 0.59375





 78%|██████████████████████████████████████████████████              | 612/782 [00:23<00:06, 27.81it/s]


 79%|██████████████████████████████████████████████████▍             | 616/782 [00:24<00:05, 29.53it/s]


 79%|██████████████████████████████████████████████████▋             | 620/782 [00:24<00:05, 31.00it/s]

Iter 620.0, Minibatch Loss= 0.991399, Training Accuracy= 0.51562





 80%|███████████████████████████████████████████████████             | 624/782 [00:24<00:05, 28.13it/s]


 80%|███████████████████████████████████████████████████▍            | 628/782 [00:24<00:05, 29.51it/s]

Iter 630.0, Minibatch Loss= 0.862071, Training Accuracy= 0.61719





 81%|███████████████████████████████████████████████████▋            | 632/782 [00:24<00:05, 28.66it/s]


 81%|████████████████████████████████████████████████████            | 636/782 [00:24<00:04, 29.92it/s]


 82%|████████████████████████████████████████████████████▍           | 640/782 [00:24<00:04, 31.60it/s]

Iter 640.0, Minibatch Loss= 0.781889, Training Accuracy= 0.66406





 82%|████████████████████████████████████████████████████▋           | 644/782 [00:24<00:04, 29.41it/s]


 83%|█████████████████████████████████████████████████████           | 648/782 [00:25<00:04, 30.77it/s]

Iter 650.0, Minibatch Loss= 0.808945, Training Accuracy= 0.62500





 83%|█████████████████████████████████████████████████████▎          | 652/782 [00:25<00:05, 25.62it/s]


 84%|█████████████████████████████████████████████████████▌          | 655/782 [00:25<00:04, 26.72it/s]


 84%|█████████████████████████████████████████████████████▊          | 658/782 [00:25<00:05, 21.69it/s]

Iter 660.0, Minibatch Loss= 1.031931, Training Accuracy= 0.60938





 85%|██████████████████████████████████████████████████████          | 661/782 [00:25<00:06, 19.10it/s]


 85%|██████████████████████████████████████████████████████▍         | 665/782 [00:25<00:05, 21.76it/s]


 86%|██████████████████████████████████████████████████████▊         | 669/782 [00:26<00:04, 24.95it/s]

Iter 670.0, Minibatch Loss= 0.879860, Training Accuracy= 0.60938





 86%|██████████████████████████████████████████████████████▉         | 672/782 [00:26<00:04, 25.06it/s]


 86%|███████████████████████████████████████████████████████▎        | 676/782 [00:26<00:03, 27.52it/s]


 87%|███████████████████████████████████████████████████████▋        | 680/782 [00:26<00:03, 29.75it/s]

Iter 680.0, Minibatch Loss= 0.837508, Training Accuracy= 0.61719





 87%|███████████████████████████████████████████████████████▉        | 684/782 [00:26<00:03, 30.54it/s]


 88%|████████████████████████████████████████████████████████▎       | 688/782 [00:26<00:02, 32.15it/s]

Iter 690.0, Minibatch Loss= 0.895742, Training Accuracy= 0.60156





 88%|████████████████████████████████████████████████████████▋       | 692/782 [00:26<00:02, 30.43it/s]


 89%|████████████████████████████████████████████████████████▉       | 696/782 [00:26<00:02, 30.81it/s]


 90%|█████████████████████████████████████████████████████████▎      | 700/782 [00:26<00:02, 32.29it/s]

Iter 700.0, Minibatch Loss= 0.754296, Training Accuracy= 0.67188





 90%|█████████████████████████████████████████████████████████▌      | 704/782 [00:27<00:02, 31.08it/s]


 91%|█████████████████████████████████████████████████████████▉      | 708/782 [00:27<00:02, 32.49it/s]

Iter 710.0, Minibatch Loss= 0.775030, Training Accuracy= 0.64062





 91%|██████████████████████████████████████████████████████████▎     | 712/782 [00:27<00:02, 31.28it/s]


 92%|██████████████████████████████████████████████████████████▌     | 716/782 [00:27<00:02, 32.41it/s]


 92%|██████████████████████████████████████████████████████████▉     | 720/782 [00:27<00:01, 33.76it/s]

Iter 720.0, Minibatch Loss= 0.641636, Training Accuracy= 0.70312





 93%|███████████████████████████████████████████████████████████▎    | 724/782 [00:27<00:01, 32.56it/s]


 93%|███████████████████████████████████████████████████████████▋    | 729/782 [00:27<00:01, 34.03it/s]

Iter 730.0, Minibatch Loss= 0.678659, Training Accuracy= 0.71875





 94%|███████████████████████████████████████████████████████████▉    | 733/782 [00:27<00:01, 32.60it/s]


 94%|████████████████████████████████████████████████████████████▍   | 738/782 [00:28<00:01, 33.88it/s]

Iter 740.0, Minibatch Loss= 0.881326, Training Accuracy= 0.62500





 95%|████████████████████████████████████████████████████████████▋   | 742/782 [00:28<00:01, 32.27it/s]


 95%|█████████████████████████████████████████████████████████████   | 746/782 [00:28<00:01, 33.48it/s]


 96%|█████████████████████████████████████████████████████████████▍  | 750/782 [00:28<00:00, 34.21it/s]

Iter 750.0, Minibatch Loss= 1.009959, Training Accuracy= 0.55469





 96%|█████████████████████████████████████████████████████████████▋  | 754/782 [00:28<00:00, 33.61it/s]


 97%|██████████████████████████████████████████████████████████████  | 758/782 [00:28<00:00, 32.99it/s]

Iter 760.0, Minibatch Loss= 0.902957, Training Accuracy= 0.60156





 97%|██████████████████████████████████████████████████████████████▎ | 762/782 [00:28<00:00, 31.83it/s]


 98%|██████████████████████████████████████████████████████████████▋ | 766/782 [00:28<00:00, 33.21it/s]


 98%|███████████████████████████████████████████████████████████████ | 770/782 [00:29<00:00, 32.68it/s]

Iter 770.0, Minibatch Loss= 0.971054, Training Accuracy= 0.55469





 99%|███████████████████████████████████████████████████████████████▎| 774/782 [00:29<00:00, 32.03it/s]


 99%|███████████████████████████████████████████████████████████████▋| 778/782 [00:29<00:00, 32.23it/s]

Iter 780.0, Minibatch Loss= 0.936251, Training Accuracy= 0.55469





100%|████████████████████████████████████████████████████████████████| 782/782 [00:29<00:00, 31.56it/s]

ValueError: Cannot feed value of shape (500, 30, 50) for Tensor 'hypothesis:0', which has shape '(128, 30, 50)'

### TRAINING

In [32]:
tf.reset_default_graph()

In [33]:
lstm = tf.contrib.rnn.BasicLSTMCell(lstm_size)
lstm_drop =  tf.contrib.rnn.DropoutWrapper(lstm, input_p, output_p)

In [34]:
# N: The number of elements in each of our batches, 
#   which we use to train subsets of data for efficiency's sake.
# l_h: The maximum length of a hypothesis, or the second sentence.  This is
#   used because training an RNN is extraordinarily difficult without 
#   rolling it out to a fixed length.
# l_e: The maximum length of evidence, the first sentence.  This is used
#   because training an RNN is extraordinarily difficult without 
#   rolling it out to a fixed length.
# D: The size of our used GloVe or other vectors.
hyp = tf.placeholder(tf.float32, [N, l_h, D], 'hypothesis')
evi = tf.placeholder(tf.float32, [N, l_e, D], 'evidence')
y = tf.placeholder(tf.float32, [N, 3], 'label')
# hyp: Where the hypotheses will be stored during training.
# evi: Where the evidences will be stored during training.
# y: Where correct scores will be stored during training.

# lstm_size: the size of the gates in the LSTM, 
#    as in the first LSTM layer's initialization.
# lstm_back = tf.contrib.rnn.BasicLSTMCell(lstm_size)
lstm_back = tf.contrib.rnn.BasicLSTMCell(lstm_size)

# lstm_back:  The LSTM used for looking backwards 
#   through the sentences, similar to lstm.

# input_p: the probability that inputs to the LSTM will be retained at each
#   iteration of dropout.
# output_p: the probability that outputs from the LSTM will be retained at 
#   each iteration of dropout.
lstm_drop_back = tf.contrib.rnn.DropoutWrapper(lstm_back, input_p, output_p)
# lstm_drop_back:  A dropout wrapper for lstm_back, like lstm_drop.


fc_initializer = tf.random_normal_initializer(stddev=0.1) 
# fc_initializer: initial values for the fully connected layer's weights.
# hidden_size: the size of the outputs from each lstm layer.  
#   Multiplied by 2 to account for the two LSTMs.
fc_weight = tf.get_variable('fc_weight', [2*hidden_size, 3], 
                            initializer = fc_initializer)
# fc_weight: Storage for the fully connected layer's weights.
fc_bias = tf.get_variable('bias', [3])
# fc_bias: Storage for the fully connected layer's bias.

# tf.GraphKeys.REGULARIZATION_LOSSES:  A key to a collection in the graph
#   designated for losses due to regularization.
#   In this case, this portion of loss is regularization on the weights
#   for the fully connected layer.
tf.add_to_collection(tf.GraphKeys.REGULARIZATION_LOSSES, 
                     tf.nn.l2_loss(fc_weight)) 

x = tf.concat([hyp, evi], 1) # N, (Lh+Le), d
# Permuting batch_size and n_steps
x = tf.transpose(x, [1, 0, 2]) # (Le+Lh), N, d
# Reshaping to (n_steps*batch_size, n_input)
x = tf.reshape(x, [-1, vector_size]) # (Le+Lh)*N, d
# Split to get a list of 'n_steps' tensors of shape (batch_size, n_input)
x = tf.split(x, l_seq,)

# x: the inputs to the bidirectional_rnn


# tf.contrib.rnn.static_bidirectional_rnn: Runs the input through
#   two recurrent networks, one that runs the inputs forward and one
#   that runs the inputs in reversed order, combining the outputs.
rnn_outputs, _, _ = tf.contrib.rnn.static_bidirectional_rnn(lstm, lstm_back,
                                                            x, dtype=tf.float32)
# rnn_outputs: the list of LSTM outputs, as a list. 
#   What we want is the latest output, rnn_outputs[-1]

classification_scores = tf.matmul(rnn_outputs[-1], fc_weight) + fc_bias
# The scores are relative certainties for how likely the output matches
#   a certain entailment: 
#     0: Positive entailment
#     1: Neutral entailment
#     2: Negative entailment

In [35]:
with tf.variable_scope('Accuracy'):
    predicts = tf.cast(tf.argmax(classification_scores, 1), 'int32')
    y_label = tf.cast(tf.argmax(y, 1), 'int32')
    corrects = tf.equal(predicts, y_label)
    num_corrects = tf.reduce_sum(tf.cast(corrects, tf.float32))
    accuracy = tf.reduce_mean(tf.cast(corrects, tf.float32))

with tf.variable_scope("loss"):
    cross_entropy = tf.nn.softmax_cross_entropy_with_logits(
        logits = classification_scores, labels = y)
    loss = tf.reduce_mean(cross_entropy)
    total_loss = loss + weight_decay * tf.add_n(
        tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES))

optimizer = tf.train.GradientDescentOptimizer(learning_rate)

opt_op = optimizer.minimize(total_loss)

In [36]:
# Initialize variables
init = tf.global_variables_initializer()

from tqdm import tqdm

# Launch the Tensorflow session
sess = tf.Session()
sess.run(init)

# training_iterations_count: The number of data pieces to train on in total
# batch_size: The number of data pieces per batch
training_iterations = range(0,training_iterations_count,batch_size)
training_iterations = tqdm(training_iterations)

for i in training_iterations:
    if i % 1000 == 0:
    # Select indices for a random data subset
        batch = np.random.randint(data_feature_list[0].shape[0], size=batch_size)
    
    # Use the selected subset indices to initialize the graph's 
    #   placeholder values
    hyps, evis, ys = (data_feature_list[0][batch,:],
                      data_feature_list[1][batch,:],
                      correct_scores[batch])
    
    # Run the optimization with these initialized values
    sess.run([opt_op], feed_dict={hyp: hyps, evi: evis, y: ys})
    # display_step: how often the accuracy and loss should 
    #   be tested and displayed.
    if (i/batch_size) % display_step == 0:
        # Calculate batch accuracy
        acc = sess.run(accuracy, feed_dict={hyp: hyps, evi: evis, y: ys})
        # Calculate batch loss
        tmp_loss = sess.run(loss, feed_dict={hyp: hyps, evi: evis, y: ys})
        # Display results
        print("Iter " + str(i/batch_size) + ", Minibatch Loss= " + \
              "{:.6f}".format(tmp_loss) + ", Training Accuracy= " + \
              "{:.5f}".format(acc))





  0%|                                                                                                                                                                                   | 0/782 [00:00<?, ?it/s]

Iter 0.0, Minibatch Loss= 0.946429, Training Accuracy= 0.58594






  0%|▏                                                                                                                                                                          | 1/782 [00:01<14:18,  1.10s/it]



  0%|▍                                                                                                                                                                          | 2/782 [00:01<10:33,  1.23it/s]



  0%|▋                                                                                                                                                                          | 3/782 [00:01<07:55,  1.64it/s]



  1%|▊                                                                                                                                                                          | 4/782 [00:01<05:55,  2.19it/s]



  1%|█                                                                                                                                              

Iter 10.0, Minibatch Loss= 0.934780, Training Accuracy= 0.58594






  1%|██▍                                                                                                                                                                       | 11/782 [00:02<03:03,  4.21it/s]



  2%|██▌                                                                                                                                                                       | 12/782 [00:02<03:04,  4.17it/s]



  2%|██▊                                                                                                                                                                       | 13/782 [00:03<03:13,  3.97it/s]



  2%|███                                                                                                                                                                       | 14/782 [00:03<03:16,  3.92it/s]



  2%|███▎                                                                                                                                           

Iter 20.0, Minibatch Loss= 0.923602, Training Accuracy= 0.58594






  3%|████▌                                                                                                                                                                     | 21/782 [00:04<02:32,  5.00it/s]



  3%|████▊                                                                                                                                                                     | 22/782 [00:04<02:23,  5.29it/s]



  3%|█████                                                                                                                                                                     | 23/782 [00:04<02:19,  5.42it/s]



  3%|█████▏                                                                                                                                                                    | 24/782 [00:05<02:11,  5.76it/s]



  3%|█████▍                                                                                                                                         

Iter 30.0, Minibatch Loss= 0.939573, Training Accuracy= 0.58594






  4%|██████▋                                                                                                                                                                   | 31/782 [00:06<02:11,  5.71it/s]



  4%|██████▉                                                                                                                                                                   | 32/782 [00:06<02:03,  6.07it/s]



  4%|███████▏                                                                                                                                                                  | 33/782 [00:06<01:58,  6.30it/s]



  4%|███████▍                                                                                                                                                                  | 34/782 [00:06<01:52,  6.64it/s]



  4%|███████▌                                                                                                                                       

Iter 40.0, Minibatch Loss= 0.935904, Training Accuracy= 0.58594






  5%|████████▉                                                                                                                                                                 | 41/782 [00:08<02:42,  4.55it/s]



  5%|█████████▏                                                                                                                                                                | 42/782 [00:08<02:26,  5.06it/s]



  5%|█████████▎                                                                                                                                                                | 43/782 [00:08<02:14,  5.48it/s]



  6%|█████████▌                                                                                                                                                                | 44/782 [00:08<02:11,  5.60it/s]



  6%|█████████▊                                                                                                                                     

Iter 50.0, Minibatch Loss= 0.930309, Training Accuracy= 0.58594






  7%|███████████                                                                                                                                                               | 51/782 [00:09<02:16,  5.36it/s]



  7%|███████████▎                                                                                                                                                              | 52/782 [00:09<02:12,  5.52it/s]



  7%|███████████▌                                                                                                                                                              | 53/782 [00:09<02:06,  5.77it/s]



  7%|███████████▋                                                                                                                                                              | 54/782 [00:10<02:00,  6.05it/s]



  7%|███████████▉                                                                                                                                   

Iter 60.0, Minibatch Loss= 0.909945, Training Accuracy= 0.58594






  8%|█████████████▎                                                                                                                                                            | 61/782 [00:11<02:38,  4.55it/s]



  8%|█████████████▍                                                                                                                                                            | 62/782 [00:11<02:20,  5.12it/s]



  8%|█████████████▋                                                                                                                                                            | 63/782 [00:11<02:10,  5.50it/s]



  8%|█████████████▉                                                                                                                                                            | 64/782 [00:12<02:05,  5.70it/s]



  8%|██████████████▏                                                                                                                                

Iter 70.0, Minibatch Loss= 0.952184, Training Accuracy= 0.58594






  9%|███████████████▍                                                                                                                                                          | 71/782 [00:13<01:55,  6.13it/s]



  9%|███████████████▋                                                                                                                                                          | 72/782 [00:13<01:52,  6.31it/s]



  9%|███████████████▊                                                                                                                                                          | 73/782 [00:13<01:43,  6.85it/s]



  9%|████████████████                                                                                                                                                          | 74/782 [00:13<01:45,  6.74it/s]



 10%|████████████████▎                                                                                                                              

Iter 80.0, Minibatch Loss= 0.938658, Training Accuracy= 0.58594






 10%|█████████████████▌                                                                                                                                                        | 81/782 [00:14<01:52,  6.21it/s]



 10%|█████████████████▊                                                                                                                                                        | 82/782 [00:14<01:45,  6.61it/s]



 11%|██████████████████                                                                                                                                                        | 83/782 [00:14<01:41,  6.86it/s]



 11%|██████████████████▎                                                                                                                                                       | 84/782 [00:14<01:42,  6.84it/s]



 11%|██████████████████▍                                                                                                                            

Iter 90.0, Minibatch Loss= 0.922176, Training Accuracy= 0.58594






 12%|███████████████████▊                                                                                                                                                      | 91/782 [00:15<01:52,  6.12it/s]



 12%|████████████████████                                                                                                                                                      | 92/782 [00:16<01:47,  6.44it/s]



 12%|████████████████████▏                                                                                                                                                     | 93/782 [00:16<01:46,  6.49it/s]



 12%|████████████████████▍                                                                                                                                                     | 94/782 [00:16<01:41,  6.79it/s]



 12%|████████████████████▋                                                                                                                          

Iter 100.0, Minibatch Loss= 0.905492, Training Accuracy= 0.58594






 13%|█████████████████████▊                                                                                                                                                   | 101/782 [00:17<01:47,  6.34it/s]



 13%|██████████████████████                                                                                                                                                   | 102/782 [00:17<01:41,  6.67it/s]



 13%|██████████████████████▎                                                                                                                                                  | 103/782 [00:17<01:36,  7.01it/s]



 13%|██████████████████████▍                                                                                                                                                  | 104/782 [00:17<01:34,  7.20it/s]



 13%|██████████████████████▋                                                                                                                        

Iter 110.0, Minibatch Loss= 0.933959, Training Accuracy= 0.58594






 14%|███████████████████████▉                                                                                                                                                 | 111/782 [00:18<01:42,  6.54it/s]



 14%|████████████████████████▏                                                                                                                                                | 112/782 [00:18<01:44,  6.41it/s]



 14%|████████████████████████▍                                                                                                                                                | 113/782 [00:19<01:38,  6.80it/s]



 15%|████████████████████████▋                                                                                                                                                | 114/782 [00:19<01:35,  7.03it/s]



 15%|████████████████████████▊                                                                                                                      

Iter 120.0, Minibatch Loss= 0.890788, Training Accuracy= 0.58594






 15%|██████████████████████████▏                                                                                                                                              | 121/782 [00:20<01:53,  5.83it/s]



 16%|██████████████████████████▎                                                                                                                                              | 122/782 [00:20<01:49,  6.01it/s]



 16%|██████████████████████████▌                                                                                                                                              | 123/782 [00:20<01:42,  6.41it/s]



 16%|██████████████████████████▊                                                                                                                                              | 124/782 [00:20<01:37,  6.73it/s]



 16%|███████████████████████████                                                                                                                    

Iter 130.0, Minibatch Loss= 0.904897, Training Accuracy= 0.60938






 17%|████████████████████████████▎                                                                                                                                            | 131/782 [00:21<01:45,  6.19it/s]



 17%|████████████████████████████▌                                                                                                                                            | 132/782 [00:21<01:42,  6.35it/s]



 17%|████████████████████████████▋                                                                                                                                            | 133/782 [00:22<01:35,  6.76it/s]



 17%|████████████████████████████▉                                                                                                                                            | 134/782 [00:22<01:33,  6.94it/s]



 17%|█████████████████████████████▏                                                                                                                 

Iter 140.0, Minibatch Loss= 0.896502, Training Accuracy= 0.60938






 18%|██████████████████████████████▍                                                                                                                                          | 141/782 [00:23<02:07,  5.04it/s]



 18%|██████████████████████████████▋                                                                                                                                          | 142/782 [00:23<01:55,  5.56it/s]



 18%|██████████████████████████████▉                                                                                                                                          | 143/782 [00:23<01:47,  5.97it/s]



 18%|███████████████████████████████                                                                                                                                          | 144/782 [00:23<01:39,  6.42it/s]



 19%|███████████████████████████████▎                                                                                                               

Iter 150.0, Minibatch Loss= 0.890190, Training Accuracy= 0.60938






 19%|████████████████████████████████▋                                                                                                                                        | 151/782 [00:24<01:45,  5.96it/s]



 19%|████████████████████████████████▊                                                                                                                                        | 152/782 [00:25<01:39,  6.32it/s]



 20%|█████████████████████████████████                                                                                                                                        | 153/782 [00:25<01:37,  6.44it/s]



 20%|█████████████████████████████████▎                                                                                                                                       | 154/782 [00:25<01:36,  6.53it/s]



 20%|█████████████████████████████████▍                                                                                                             

Iter 160.0, Minibatch Loss= 0.897904, Training Accuracy= 0.60938






 21%|██████████████████████████████████▊                                                                                                                                      | 161/782 [00:26<01:55,  5.37it/s]



 21%|███████████████████████████████████                                                                                                                                      | 162/782 [00:26<01:49,  5.65it/s]



 21%|███████████████████████████████████▏                                                                                                                                     | 163/782 [00:26<01:47,  5.78it/s]



 21%|███████████████████████████████████▍                                                                                                                                     | 164/782 [00:27<01:45,  5.88it/s]



 21%|███████████████████████████████████▋                                                                                                           

Iter 170.0, Minibatch Loss= 0.897819, Training Accuracy= 0.60938






 22%|████████████████████████████████████▉                                                                                                                                    | 171/782 [00:28<01:52,  5.43it/s]



 22%|█████████████████████████████████████▏                                                                                                                                   | 172/782 [00:28<01:48,  5.60it/s]



 22%|█████████████████████████████████████▍                                                                                                                                   | 173/782 [00:28<01:47,  5.66it/s]



 22%|█████████████████████████████████████▌                                                                                                                                   | 174/782 [00:28<01:44,  5.82it/s]



 22%|█████████████████████████████████████▊                                                                                                         

Iter 180.0, Minibatch Loss= 0.894594, Training Accuracy= 0.60938






 23%|███████████████████████████████████████                                                                                                                                  | 181/782 [00:29<01:41,  5.92it/s]



 23%|███████████████████████████████████████▎                                                                                                                                 | 182/782 [00:29<01:38,  6.08it/s]



 23%|███████████████████████████████████████▌                                                                                                                                 | 183/782 [00:30<01:32,  6.50it/s]



 24%|███████████████████████████████████████▊                                                                                                                                 | 184/782 [00:30<01:34,  6.35it/s]



 24%|███████████████████████████████████████▉                                                                                                       

Iter 190.0, Minibatch Loss= 0.891710, Training Accuracy= 0.60938






 24%|█████████████████████████████████████████▎                                                                                                                               | 191/782 [00:31<01:33,  6.29it/s]



 25%|█████████████████████████████████████████▍                                                                                                                               | 192/782 [00:31<01:34,  6.23it/s]



 25%|█████████████████████████████████████████▋                                                                                                                               | 193/782 [00:31<01:28,  6.69it/s]



 25%|█████████████████████████████████████████▉                                                                                                                               | 194/782 [00:31<01:24,  6.93it/s]



 25%|██████████████████████████████████████████▏                                                                                                    

Iter 200.0, Minibatch Loss= 0.888848, Training Accuracy= 0.60938






 26%|███████████████████████████████████████████▍                                                                                                                             | 201/782 [00:32<01:35,  6.09it/s]



 26%|███████████████████████████████████████████▋                                                                                                                             | 202/782 [00:32<01:34,  6.13it/s]



 26%|███████████████████████████████████████████▊                                                                                                                             | 203/782 [00:33<01:28,  6.55it/s]



 26%|████████████████████████████████████████████                                                                                                                             | 204/782 [00:33<01:23,  6.89it/s]



 26%|████████████████████████████████████████████▎                                                                                                  

Iter 210.0, Minibatch Loss= 0.885097, Training Accuracy= 0.60938






 27%|█████████████████████████████████████████████▌                                                                                                                           | 211/782 [00:34<01:32,  6.18it/s]



 27%|█████████████████████████████████████████████▊                                                                                                                           | 212/782 [00:34<01:29,  6.36it/s]



 27%|██████████████████████████████████████████████                                                                                                                           | 213/782 [00:34<01:25,  6.63it/s]



 27%|██████████████████████████████████████████████▏                                                                                                                          | 214/782 [00:34<01:21,  6.96it/s]



 27%|██████████████████████████████████████████████▍                                                                                                

Iter 220.0, Minibatch Loss= 0.880490, Training Accuracy= 0.61719






 28%|███████████████████████████████████████████████▊                                                                                                                         | 221/782 [00:35<01:32,  6.10it/s]



 28%|███████████████████████████████████████████████▉                                                                                                                         | 222/782 [00:35<01:27,  6.44it/s]



 29%|████████████████████████████████████████████████▏                                                                                                                        | 223/782 [00:36<01:23,  6.70it/s]



 29%|████████████████████████████████████████████████▍                                                                                                                        | 224/782 [00:36<01:22,  6.73it/s]



 29%|████████████████████████████████████████████████▋                                                                                              

Iter 230.0, Minibatch Loss= 0.875556, Training Accuracy= 0.61719






 30%|█████████████████████████████████████████████████▉                                                                                                                       | 231/782 [00:37<01:25,  6.42it/s]



 30%|██████████████████████████████████████████████████▏                                                                                                                      | 232/782 [00:37<01:27,  6.26it/s]



 30%|██████████████████████████████████████████████████▎                                                                                                                      | 233/782 [00:37<01:34,  5.79it/s]



 30%|██████████████████████████████████████████████████▌                                                                                                                      | 234/782 [00:37<01:33,  5.87it/s]



 30%|██████████████████████████████████████████████████▊                                                                                            

Iter 240.0, Minibatch Loss= 0.870799, Training Accuracy= 0.61719






 31%|████████████████████████████████████████████████████                                                                                                                     | 241/782 [00:39<01:42,  5.29it/s]



 31%|████████████████████████████████████████████████████▎                                                                                                                    | 242/782 [00:39<01:33,  5.76it/s]



 31%|████████████████████████████████████████████████████▌                                                                                                                    | 243/782 [00:39<01:26,  6.24it/s]



 31%|████████████████████████████████████████████████████▋                                                                                                                    | 244/782 [00:39<01:20,  6.70it/s]



 31%|████████████████████████████████████████████████████▉                                                                                          

Iter 250.0, Minibatch Loss= 0.914108, Training Accuracy= 0.60156






 32%|██████████████████████████████████████████████████████▏                                                                                                                  | 251/782 [00:40<01:36,  5.50it/s]



 32%|██████████████████████████████████████████████████████▍                                                                                                                  | 252/782 [00:40<01:33,  5.67it/s]



 32%|██████████████████████████████████████████████████████▋                                                                                                                  | 253/782 [00:40<01:31,  5.79it/s]



 32%|██████████████████████████████████████████████████████▉                                                                                                                  | 254/782 [00:41<01:28,  5.94it/s]



 33%|███████████████████████████████████████████████████████                                                                                        

Iter 260.0, Minibatch Loss= 0.881986, Training Accuracy= 0.60156






 33%|████████████████████████████████████████████████████████▍                                                                                                                | 261/782 [00:42<01:23,  6.27it/s]



 34%|████████████████████████████████████████████████████████▌                                                                                                                | 262/782 [00:42<01:18,  6.62it/s]



 34%|████████████████████████████████████████████████████████▊                                                                                                                | 263/782 [00:42<01:16,  6.77it/s]



 34%|█████████████████████████████████████████████████████████                                                                                                                | 264/782 [00:42<01:19,  6.52it/s]



 34%|█████████████████████████████████████████████████████████▎                                                                                     

Iter 270.0, Minibatch Loss= 0.870487, Training Accuracy= 0.60156






 35%|██████████████████████████████████████████████████████████▌                                                                                                              | 271/782 [00:43<01:27,  5.85it/s]



 35%|██████████████████████████████████████████████████████████▊                                                                                                              | 272/782 [00:43<01:20,  6.34it/s]



 35%|██████████████████████████████████████████████████████████▉                                                                                                              | 273/782 [00:43<01:16,  6.69it/s]



 35%|███████████████████████████████████████████████████████████▏                                                                                                             | 274/782 [00:44<01:15,  6.72it/s]



 35%|███████████████████████████████████████████████████████████▍                                                                                   

Iter 280.0, Minibatch Loss= 0.859226, Training Accuracy= 0.60156






 36%|████████████████████████████████████████████████████████████▋                                                                                                            | 281/782 [00:45<01:24,  5.95it/s]



 36%|████████████████████████████████████████████████████████████▉                                                                                                            | 282/782 [00:45<01:23,  6.01it/s]



 36%|█████████████████████████████████████████████████████████████▏                                                                                                           | 283/782 [00:45<01:24,  5.91it/s]



 36%|█████████████████████████████████████████████████████████████▍                                                                                                           | 284/782 [00:45<01:23,  6.00it/s]



 36%|█████████████████████████████████████████████████████████████▌                                                                                 

Iter 290.0, Minibatch Loss= 0.842014, Training Accuracy= 0.60156






 37%|██████████████████████████████████████████████████████████████▉                                                                                                          | 291/782 [00:46<01:29,  5.50it/s]



 37%|███████████████████████████████████████████████████████████████                                                                                                          | 292/782 [00:46<01:21,  6.05it/s]



 37%|███████████████████████████████████████████████████████████████▎                                                                                                         | 293/782 [00:47<01:18,  6.26it/s]



 38%|███████████████████████████████████████████████████████████████▌                                                                                                         | 294/782 [00:47<01:12,  6.69it/s]



 38%|███████████████████████████████████████████████████████████████▊                                                                               

Iter 300.0, Minibatch Loss= 0.879232, Training Accuracy= 0.60156






 38%|█████████████████████████████████████████████████████████████████                                                                                                        | 301/782 [00:48<01:18,  6.17it/s]



 39%|█████████████████████████████████████████████████████████████████▎                                                                                                       | 302/782 [00:48<01:13,  6.55it/s]



 39%|█████████████████████████████████████████████████████████████████▍                                                                                                       | 303/782 [00:48<01:10,  6.84it/s]



 39%|█████████████████████████████████████████████████████████████████▋                                                                                                       | 304/782 [00:48<01:10,  6.73it/s]



 39%|█████████████████████████████████████████████████████████████████▉                                                                             

Iter 310.0, Minibatch Loss= 0.866970, Training Accuracy= 0.60156






 40%|███████████████████████████████████████████████████████████████████▏                                                                                                     | 311/782 [00:49<01:12,  6.51it/s]



 40%|███████████████████████████████████████████████████████████████████▍                                                                                                     | 312/782 [00:49<01:10,  6.63it/s]



 40%|███████████████████████████████████████████████████████████████████▋                                                                                                     | 313/782 [00:49<01:07,  7.00it/s]



 40%|███████████████████████████████████████████████████████████████████▊                                                                                                     | 314/782 [00:49<01:05,  7.17it/s]



 40%|████████████████████████████████████████████████████████████████████                                                                           

Iter 320.0, Minibatch Loss= 0.864884, Training Accuracy= 0.60156






 41%|█████████████████████████████████████████████████████████████████████▎                                                                                                   | 321/782 [00:51<01:13,  6.31it/s]



 41%|█████████████████████████████████████████████████████████████████████▌                                                                                                   | 322/782 [00:51<01:09,  6.65it/s]



 41%|█████████████████████████████████████████████████████████████████████▊                                                                                                   | 323/782 [00:51<01:07,  6.84it/s]



 41%|██████████████████████████████████████████████████████████████████████                                                                                                   | 324/782 [00:51<01:08,  6.65it/s]



 42%|██████████████████████████████████████████████████████████████████████▏                                                                        

Iter 330.0, Minibatch Loss= 0.858355, Training Accuracy= 0.60156






 42%|███████████████████████████████████████████████████████████████████████▌                                                                                                 | 331/782 [00:52<01:11,  6.32it/s]



 42%|███████████████████████████████████████████████████████████████████████▋                                                                                                 | 332/782 [00:52<01:07,  6.69it/s]



 43%|███████████████████████████████████████████████████████████████████████▉                                                                                                 | 333/782 [00:52<01:06,  6.71it/s]



 43%|████████████████████████████████████████████████████████████████████████▏                                                                                                | 334/782 [00:52<01:05,  6.88it/s]



 43%|████████████████████████████████████████████████████████████████████████▍                                                                      

Iter 340.0, Minibatch Loss= 0.842174, Training Accuracy= 0.60156






 44%|█████████████████████████████████████████████████████████████████████████▋                                                                                               | 341/782 [00:54<01:15,  5.86it/s]



 44%|█████████████████████████████████████████████████████████████████████████▉                                                                                               | 342/782 [00:54<01:09,  6.35it/s]



 44%|██████████████████████████████████████████████████████████████████████████▏                                                                                              | 343/782 [00:54<01:04,  6.83it/s]



 44%|██████████████████████████████████████████████████████████████████████████▎                                                                                              | 344/782 [00:54<01:02,  7.05it/s]



 44%|██████████████████████████████████████████████████████████████████████████▌                                                                    

Iter 350.0, Minibatch Loss= 0.854658, Training Accuracy= 0.60156






 45%|███████████████████████████████████████████████████████████████████████████▊                                                                                             | 351/782 [00:55<01:15,  5.70it/s]



 45%|████████████████████████████████████████████████████████████████████████████                                                                                             | 352/782 [00:55<01:10,  6.08it/s]



 45%|████████████████████████████████████████████████████████████████████████████▎                                                                                            | 353/782 [00:55<01:05,  6.55it/s]



 45%|████████████████████████████████████████████████████████████████████████████▌                                                                                            | 354/782 [00:56<01:02,  6.84it/s]



 45%|████████████████████████████████████████████████████████████████████████████▋                                                                  

Iter 360.0, Minibatch Loss= 1.081075, Training Accuracy= 0.53906






 46%|██████████████████████████████████████████████████████████████████████████████                                                                                           | 361/782 [00:57<01:19,  5.31it/s]



 46%|██████████████████████████████████████████████████████████████████████████████▏                                                                                          | 362/782 [00:57<01:16,  5.48it/s]



 46%|██████████████████████████████████████████████████████████████████████████████▍                                                                                          | 363/782 [00:57<01:12,  5.75it/s]



 47%|██████████████████████████████████████████████████████████████████████████████▋                                                                                          | 364/782 [00:57<01:14,  5.65it/s]



 47%|██████████████████████████████████████████████████████████████████████████████▉                                                                

Iter 370.0, Minibatch Loss= 0.760929, Training Accuracy= 0.60156






 47%|████████████████████████████████████████████████████████████████████████████████▏                                                                                        | 371/782 [00:58<01:21,  5.06it/s]



 48%|████████████████████████████████████████████████████████████████████████████████▍                                                                                        | 372/782 [00:59<01:13,  5.59it/s]



 48%|████████████████████████████████████████████████████████████████████████████████▌                                                                                        | 373/782 [00:59<01:07,  6.09it/s]



 48%|████████████████████████████████████████████████████████████████████████████████▊                                                                                        | 374/782 [00:59<01:03,  6.43it/s]



 48%|█████████████████████████████████████████████████████████████████████████████████                                                              

Iter 380.0, Minibatch Loss= 0.933688, Training Accuracy= 0.53906






 49%|██████████████████████████████████████████████████████████████████████████████████▎                                                                                      | 381/782 [01:00<01:12,  5.54it/s]



 49%|██████████████████████████████████████████████████████████████████████████████████▌                                                                                      | 382/782 [01:00<01:08,  5.85it/s]



 49%|██████████████████████████████████████████████████████████████████████████████████▊                                                                                      | 383/782 [01:00<01:02,  6.34it/s]



 49%|██████████████████████████████████████████████████████████████████████████████████▉                                                                                      | 384/782 [01:00<00:59,  6.70it/s]



 49%|███████████████████████████████████████████████████████████████████████████████████▏                                                           

Iter 390.0, Minibatch Loss= 0.940042, Training Accuracy= 0.50000






 50%|████████████████████████████████████████████████████████████████████████████████████▌                                                                                    | 391/782 [01:01<01:06,  5.91it/s]



 50%|████████████████████████████████████████████████████████████████████████████████████▋                                                                                    | 392/782 [01:02<01:03,  6.18it/s]



 50%|████████████████████████████████████████████████████████████████████████████████████▉                                                                                    | 393/782 [01:02<00:59,  6.55it/s]



 50%|█████████████████████████████████████████████████████████████████████████████████████▏                                                                                   | 394/782 [01:02<00:55,  7.02it/s]



 51%|█████████████████████████████████████████████████████████████████████████████████████▎                                                         

Iter 400.0, Minibatch Loss= 0.891899, Training Accuracy= 0.60156






 51%|██████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 401/782 [01:03<01:03,  5.97it/s]



 51%|██████████████████████████████████████████████████████████████████████████████████████▉                                                                                  | 402/782 [01:03<01:02,  6.06it/s]



 52%|███████████████████████████████████████████████████████████████████████████████████████                                                                                  | 403/782 [01:03<00:58,  6.49it/s]



 52%|███████████████████████████████████████████████████████████████████████████████████████▎                                                                                 | 404/782 [01:03<00:55,  6.79it/s]



 52%|███████████████████████████████████████████████████████████████████████████████████████▌                                                       

Iter 410.0, Minibatch Loss= 1.017620, Training Accuracy= 0.48438






 53%|████████████████████████████████████████████████████████████████████████████████████████▊                                                                                | 411/782 [01:04<00:56,  6.56it/s]



 53%|█████████████████████████████████████████████████████████████████████████████████████████                                                                                | 412/782 [01:05<00:54,  6.79it/s]



 53%|█████████████████████████████████████████████████████████████████████████████████████████▎                                                                               | 413/782 [01:05<00:53,  6.94it/s]



 53%|█████████████████████████████████████████████████████████████████████████████████████████▍                                                                               | 414/782 [01:05<00:55,  6.62it/s]



 53%|█████████████████████████████████████████████████████████████████████████████████████████▋                                                     

Iter 420.0, Minibatch Loss= 0.906517, Training Accuracy= 0.55469






 54%|██████████████████████████████████████████████████████████████████████████████████████████▉                                                                              | 421/782 [01:06<00:55,  6.46it/s]



 54%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                             | 422/782 [01:06<00:55,  6.45it/s]



 54%|███████████████████████████████████████████████████████████████████████████████████████████▍                                                                             | 423/782 [01:06<00:54,  6.54it/s]



 54%|███████████████████████████████████████████████████████████████████████████████████████████▋                                                                             | 424/782 [01:06<00:52,  6.86it/s]



 54%|███████████████████████████████████████████████████████████████████████████████████████████▊                                                   

Iter 430.0, Minibatch Loss= 0.979632, Training Accuracy= 0.48438






 55%|█████████████████████████████████████████████████████████████████████████████████████████████▏                                                                           | 431/782 [01:07<00:56,  6.19it/s]



 55%|█████████████████████████████████████████████████████████████████████████████████████████████▎                                                                           | 432/782 [01:07<00:53,  6.55it/s]



 55%|█████████████████████████████████████████████████████████████████████████████████████████████▌                                                                           | 433/782 [01:08<00:51,  6.75it/s]



 55%|█████████████████████████████████████████████████████████████████████████████████████████████▊                                                                           | 434/782 [01:08<00:48,  7.12it/s]



 56%|██████████████████████████████████████████████████████████████████████████████████████████████                                                 

Iter 440.0, Minibatch Loss= 1.028106, Training Accuracy= 0.46094






 56%|███████████████████████████████████████████████████████████████████████████████████████████████▎                                                                         | 441/782 [01:09<00:54,  6.27it/s]



 57%|███████████████████████████████████████████████████████████████████████████████████████████████▌                                                                         | 442/782 [01:09<00:52,  6.50it/s]



 57%|███████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 443/782 [01:09<00:50,  6.77it/s]



 57%|███████████████████████████████████████████████████████████████████████████████████████████████▉                                                                         | 444/782 [01:09<00:49,  6.78it/s]



 57%|████████████████████████████████████████████████████████████████████████████████████████████████▏                                              

Iter 450.0, Minibatch Loss= 0.835143, Training Accuracy= 0.58594






 58%|█████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                       | 451/782 [01:10<00:53,  6.17it/s]



 58%|█████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                       | 452/782 [01:10<00:48,  6.74it/s]



 58%|█████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                       | 453/782 [01:11<00:49,  6.63it/s]



 58%|██████████████████████████████████████████████████████████████████████████████████████████████████                                                                       | 454/782 [01:11<00:47,  6.92it/s]



 58%|██████████████████████████████████████████████████████████████████████████████████████████████████▎                                            

Iter 460.0, Minibatch Loss= 0.812400, Training Accuracy= 0.60938






 59%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                     | 461/782 [01:12<00:49,  6.44it/s]



 59%|███████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                     | 462/782 [01:12<00:48,  6.54it/s]



 59%|████████████████████████████████████████████████████████████████████████████████████████████████████                                                                     | 463/782 [01:12<00:46,  6.84it/s]



 59%|████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                    | 464/782 [01:12<00:46,  6.91it/s]



 59%|████████████████████████████████████████████████████████████████████████████████████████████████████▍                                          

Iter 470.0, Minibatch Loss= 0.883614, Training Accuracy= 0.53906






 60%|█████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                   | 471/782 [01:13<00:47,  6.51it/s]



 60%|██████████████████████████████████████████████████████████████████████████████████████████████████████                                                                   | 472/782 [01:13<00:47,  6.49it/s]



 60%|██████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                  | 473/782 [01:13<00:45,  6.78it/s]



 61%|██████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                  | 474/782 [01:14<00:44,  6.92it/s]



 61%|██████████████████████████████████████████████████████████████████████████████████████████████████████▋                                        

Iter 480.0, Minibatch Loss= 0.941012, Training Accuracy= 0.46875






 62%|███████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                 | 481/782 [01:15<00:46,  6.42it/s]



 62%|████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                | 482/782 [01:15<00:45,  6.62it/s]



 62%|████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                | 483/782 [01:15<00:45,  6.56it/s]



 62%|████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                | 484/782 [01:15<00:45,  6.56it/s]



 62%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                      

Iter 490.0, Minibatch Loss= 0.848268, Training Accuracy= 0.59375






 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████                                                               | 491/782 [01:16<00:50,  5.78it/s]



 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                              | 492/782 [01:16<00:46,  6.20it/s]



 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                              | 493/782 [01:16<00:44,  6.56it/s]



 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                              | 494/782 [01:17<00:42,  6.81it/s]



 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                    

Iter 500.0, Minibatch Loss= 0.898701, Training Accuracy= 0.59375






 64%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                            | 501/782 [01:18<00:42,  6.54it/s]



 64%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                            | 502/782 [01:18<00:41,  6.70it/s]



 64%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                            | 503/782 [01:18<00:40,  6.94it/s]



 64%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                            | 504/782 [01:18<00:39,  7.05it/s]



 65%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                 

Iter 510.0, Minibatch Loss= 0.830089, Training Accuracy= 0.63281






 65%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                          | 511/782 [01:19<00:43,  6.26it/s]



 65%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                          | 512/782 [01:19<00:41,  6.45it/s]



 66%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                          | 513/782 [01:19<00:39,  6.81it/s]



 66%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                          | 514/782 [01:19<00:38,  7.03it/s]



 66%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                               

Iter 520.0, Minibatch Loss= 0.777563, Training Accuracy= 0.67188






 67%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                        | 521/782 [01:21<00:43,  6.06it/s]



 67%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                        | 522/782 [01:21<00:41,  6.21it/s]



 67%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                        | 523/782 [01:21<00:39,  6.50it/s]



 67%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                       | 524/782 [01:21<00:37,  6.80it/s]



 67%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                             

Iter 530.0, Minibatch Loss= 0.783202, Training Accuracy= 0.67969






 68%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                      | 531/782 [01:22<00:46,  5.43it/s]



 68%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                      | 532/782 [01:22<00:43,  5.76it/s]



 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                     | 533/782 [01:22<00:40,  6.19it/s]



 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                     | 534/782 [01:22<00:38,  6.43it/s]



 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                           

Iter 540.0, Minibatch Loss= 0.731016, Training Accuracy= 0.69531






 69%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                    | 541/782 [01:24<00:38,  6.31it/s]



 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                   | 542/782 [01:24<00:37,  6.44it/s]



 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                   | 543/782 [01:24<00:35,  6.80it/s]



 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                   | 544/782 [01:24<00:33,  7.03it/s]



 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                         

Iter 550.0, Minibatch Loss= 0.767478, Training Accuracy= 0.62500






 70%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                  | 551/782 [01:25<00:50,  4.57it/s]



 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                 | 552/782 [01:25<00:47,  4.82it/s]



 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                 | 553/782 [01:26<00:46,  4.90it/s]



 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                 | 554/782 [01:26<00:45,  5.00it/s]



 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                       

Iter 560.0, Minibatch Loss= 0.698316, Training Accuracy= 0.70312






 72%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                               | 561/782 [01:27<00:52,  4.23it/s]



 72%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                               | 562/782 [01:28<00:50,  4.40it/s]



 72%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                               | 563/782 [01:28<00:47,  4.60it/s]



 72%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                               | 564/782 [01:28<00:45,  4.82it/s]



 72%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                     

Iter 570.0, Minibatch Loss= 0.685787, Training Accuracy= 0.71094






 73%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 571/782 [01:29<00:49,  4.28it/s]



 73%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                             | 572/782 [01:30<00:48,  4.34it/s]



 73%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                             | 573/782 [01:30<00:47,  4.44it/s]



 73%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                             | 574/782 [01:30<00:44,  4.67it/s]



 74%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  

Iter 580.0, Minibatch Loss= 0.723446, Training Accuracy= 0.64844






 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                           | 581/782 [01:32<00:47,  4.25it/s]



 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                           | 582/782 [01:32<00:42,  4.67it/s]



 75%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                           | 583/782 [01:32<00:39,  4.98it/s]



 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                          | 584/782 [01:32<00:41,  4.74it/s]



 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                

Iter 590.0, Minibatch Loss= 0.516327, Training Accuracy= 0.75781






 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                         | 591/782 [01:34<00:40,  4.69it/s]



 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                         | 592/782 [01:34<00:39,  4.82it/s]



 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                        | 593/782 [01:34<00:37,  5.08it/s]



 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                        | 594/782 [01:34<00:36,  5.16it/s]



 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌              

Iter 600.0, Minibatch Loss= 0.999878, Training Accuracy= 0.61719






 77%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                       | 601/782 [01:36<00:41,  4.41it/s]



 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                       | 602/782 [01:36<00:38,  4.72it/s]



 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                      | 603/782 [01:36<00:32,  5.45it/s]



 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                      | 604/782 [01:36<00:30,  5.90it/s]



 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋            

Iter 610.0, Minibatch Loss= 0.762634, Training Accuracy= 0.67188






 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                     | 611/782 [01:37<00:27,  6.13it/s]



 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                    | 612/782 [01:37<00:27,  6.26it/s]



 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 613/782 [01:37<00:25,  6.69it/s]



 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                    | 614/782 [01:37<00:24,  6.95it/s]



 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉          

Iter 620.0, Minibatch Loss= 0.793004, Training Accuracy= 0.58594






 79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                  | 621/782 [01:38<00:26,  6.15it/s]



 80%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                  | 622/782 [01:39<00:24,  6.48it/s]



 80%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                  | 623/782 [01:39<00:23,  6.75it/s]



 80%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                  | 624/782 [01:39<00:22,  6.88it/s]



 80%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████        

Iter 630.0, Minibatch Loss= 0.881955, Training Accuracy= 0.63281






 81%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                | 631/782 [01:40<00:26,  5.74it/s]



 81%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                | 632/782 [01:40<00:25,  5.98it/s]



 81%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                | 633/782 [01:40<00:24,  6.15it/s]



 81%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                | 634/782 [01:40<00:22,  6.56it/s]



 81%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏     

Iter 640.0, Minibatch Loss= 0.872970, Training Accuracy= 0.59375






 82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                              | 641/782 [01:41<00:22,  6.28it/s]



 82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                              | 642/782 [01:42<00:21,  6.52it/s]



 82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                              | 643/782 [01:42<00:21,  6.53it/s]



 82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                             | 644/782 [01:42<00:20,  6.82it/s]



 82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍   

Iter 650.0, Minibatch Loss= 0.741584, Training Accuracy= 0.69531






 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                            | 651/782 [01:43<00:21,  6.19it/s]



 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                            | 652/782 [01:43<00:20,  6.23it/s]



 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                            | 653/782 [01:43<00:20,  6.43it/s]



 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                           | 654/782 [01:43<00:19,  6.69it/s]



 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌ 

Iter 660.0, Minibatch Loss= 0.835332, Training Accuracy= 0.66406






 85%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                          | 661/782 [01:45<00:23,  5.21it/s]



 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                          | 662/782 [01:45<00:21,  5.62it/s]



 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                         | 663/782 [01:45<00:20,  5.68it/s]



 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                         | 664/782 [01:45<00:20,  5.80it/s]



 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 670.0, Minibatch Loss= 0.839975, Training Accuracy= 0.60938






 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                        | 671/782 [01:46<00:20,  5.48it/s]



 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                       | 672/782 [01:46<00:18,  5.98it/s]



 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                       | 673/782 [01:47<00:17,  6.33it/s]



 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 674/782 [01:47<00:16,  6.60it/s]



 86%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 680.0, Minibatch Loss= 0.802679, Training Accuracy= 0.67969






 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                     | 681/782 [01:48<00:16,  6.27it/s]



 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                     | 682/782 [01:48<00:15,  6.62it/s]



 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                     | 683/782 [01:48<00:15,  6.54it/s]



 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                     | 684/782 [01:48<00:14,  6.69it/s]



 88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 690.0, Minibatch Loss= 0.790880, Training Accuracy= 0.64062






 88%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                   | 691/782 [01:49<00:16,  5.66it/s]



 88%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                   | 692/782 [01:49<00:14,  6.12it/s]



 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                   | 693/782 [01:49<00:13,  6.49it/s]



 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                   | 694/782 [01:50<00:12,  6.82it/s]



 89%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 700.0, Minibatch Loss= 0.880726, Training Accuracy= 0.62500






 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 701/782 [01:51<00:13,  6.11it/s]



 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                 | 702/782 [01:51<00:12,  6.43it/s]



 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                 | 703/782 [01:51<00:11,  6.71it/s]



 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                | 704/782 [01:51<00:11,  6.84it/s]



 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 710.0, Minibatch Loss= 0.628120, Training Accuracy= 0.74219






 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋               | 711/782 [01:52<00:11,  6.28it/s]



 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊               | 712/782 [01:52<00:10,  6.57it/s]



 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████               | 713/782 [01:52<00:10,  6.84it/s]



 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎              | 714/782 [01:53<00:10,  6.57it/s]



 91%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 720.0, Minibatch Loss= 0.837529, Training Accuracy= 0.60938






 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 721/782 [01:54<00:12,  5.08it/s]



 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████             | 722/782 [01:54<00:10,  5.55it/s]



 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 723/782 [01:54<00:09,  5.99it/s]



 93%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍            | 724/782 [01:54<00:09,  6.40it/s]



 93%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 730.0, Minibatch Loss= 0.782699, Training Accuracy= 0.72656






 93%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉           | 731/782 [01:55<00:08,  6.17it/s]



 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏          | 732/782 [01:56<00:08,  6.23it/s]



 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍          | 733/782 [01:56<00:07,  6.25it/s]



 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋          | 734/782 [01:56<00:07,  6.40it/s]



 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 740.0, Minibatch Loss= 1.380069, Training Accuracy= 0.54688






 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏        | 741/782 [01:57<00:08,  4.86it/s]



 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎        | 742/782 [01:57<00:07,  5.12it/s]



 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌        | 743/782 [01:58<00:07,  5.51it/s]



 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊        | 744/782 [01:58<00:07,  5.43it/s]



 95%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 750.0, Minibatch Loss= 1.000833, Training Accuracy= 0.60938






 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎      | 751/782 [01:59<00:05,  5.85it/s]



 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌      | 752/782 [01:59<00:04,  6.08it/s]



 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋      | 753/782 [01:59<00:04,  6.37it/s]



 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉      | 754/782 [01:59<00:04,  6.64it/s]



 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 760.0, Minibatch Loss= 0.836468, Training Accuracy= 0.61719






 97%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍    | 761/782 [02:00<00:03,  5.87it/s]



 97%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋    | 762/782 [02:01<00:03,  6.32it/s]



 98%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉    | 763/782 [02:01<00:02,  6.46it/s]



 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████    | 764/782 [02:01<00:02,  6.58it/s]



 98%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 770.0, Minibatch Loss= 1.093636, Training Accuracy= 0.56250






 99%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌  | 771/782 [02:02<00:01,  6.00it/s]



 99%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊  | 772/782 [02:02<00:01,  6.21it/s]



 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████  | 773/782 [02:02<00:01,  6.42it/s]



 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎ | 774/782 [02:02<00:01,  6.71it/s]



 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

Iter 780.0, Minibatch Loss= 0.789685, Training Accuracy= 0.64062






100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊| 781/782 [02:03<00:00,  6.33it/s]



100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 782/782 [02:04<00:00,  6.43it/s]

In [50]:
data_feature_list, correct_values, correct_scores = split_data_into_scores("data/test_labeled.txt")

#hyps, evis, ys 
data = (data_feature_list[0],
                  data_feature_list[1],
                  correct_scores)
# predictions = []
correct_predictions = 0
total_predictions = 0
for i, f1 in enumerate(data_feature_list[0]):
    hyps, evis, ys = data_feature_list[0][i], data_feature_list[1][i], correct_scores[i]
    prediction = sess.run(classification_scores, feed_dict={hyp: ([hyps] * N), evi: ([evis] * N), y: ([ys] * N)})
#     predictions.append(prediction)
    total_predictions += 1
    if np.argmax(prediction[0])==np.argmax(ys):
        correct_predictions += 1
#     print(["Positive", "Neutral", "Negative"][np.argmax(prediction[0])]+
#       " / " + ["Positive", "Neutral", "Negative"][np.argmax(ys[i])])


# acc = sess.run(accuracy)#, feed_dict={'label': correct_scores})

print("Acc: %s" % str(correct_predictions*100/total_predictions))    
# print("Acc: %s" % str(acc))



Acc: 48.487923685812866


In [16]:
sess.close()