Classification_baseline_shallow_with_embedding.py


import os
import copy
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data as mnist_input_data
import numpy as np
from sklearn import cluster
from scipy.spatial import distance
import pandas as pd
from keras.utils import np_utils
import gpflow as gpf
from sklearn.metrics import f1_score
from sklearn.preprocessing import LabelEncoder


def create_bias(shape, initial_val=0.1, dtype=tf.float32):
    initial = tf.constant(initial_val, shape=shape, dtype=dtype, name="bias")
    return initial


def standardize_data(X_train, X_test, X_valid):
    unique_X_train = np.unique(X_train, axis=0)
    X_mean = np.mean(unique_X_train, axis=0)
    #print(X_mean)
    X_std = np.std(unique_X_train, axis=0)+0.0000001 #a small noise
    #print(X_std)
    X_train -= X_mean
    X_train /= X_std
    X_test -= X_mean
    X_test /= X_std
    X_valid -= X_mean
    X_valid /= X_std

    return X_train, X_test, X_valid


def compute_scores(flat_true, flat_pred):
    f1_bad, f1_good = f1_score(flat_true, flat_pred, average=None, pos_label=None)
    print("F1-BAD: ", f1_bad, "F1-OK: ", f1_good)
    print("F1-score multiplied: ", f1_bad * f1_good)

def resampleFile():
    filename = open("train.revised", "w")
    file = open("train", "r")
    for x in file:
        x = x.strip()
        filename.write(x+"\n")
        if x.endswith(",0"):
            #filename.write(x+"\n")
            filename.write(x+"\n")
            filename.write(x+"\n")
            
    filename.close()
    file.close()

x1 = tf.placeholder("float", [None, 14])
x2 = tf.placeholder("float", [None, 300])
x3 = tf.placeholder("float", [None, 300])
y = tf.placeholder("float", [None, 1])

def make_feedforward_nn(x1, x2, x3):
	#x = tf.concat([x1, x2, x3], axis=1)
	#print(tf.shape(x))
	#print(x.get_shape())

	W_pre_2 = tf.get_variable("W_pre_2", shape=[300, 300], initializer=tf.contrib.layers.xavier_initializer())
	b_pre_2 = tf.get_variable("b_pre_2", initializer=create_bias([300]))
	x2_pre = (tf.matmul(x2, W_pre_2) + b_pre_2)

	W_pre_3 = tf.get_variable("W_pre_3", shape=[300, 300], initializer=tf.contrib.layers.xavier_initializer())
	b_pre_3 = tf.get_variable("b_pre_3", initializer=create_bias([300]))
	x3_pre = (tf.matmul(x3, W_pre_3) + b_pre_3)

	x = tf.concat([x1, x2_pre, x3_pre, x2, x3], axis=1)

	W1 = tf.get_variable("W1", shape=[1214, 512], initializer=tf.contrib.layers.xavier_initializer())
	b1 = tf.get_variable("b1", initializer=create_bias([512]))
	print(x.get_shape())
	print(W1.get_shape())
	h1 = tf.nn.relu(tf.matmul(x, W1) + b1)
	W2 = tf.get_variable("W2", shape=[512, 1], initializer=tf.contrib.layers.xavier_initializer())
	b2 = tf.get_variable("b2", initializer=create_bias([1]))
	h2 = (tf.matmul(h1, W2) + b2)
	return h2

def convertContinuoustoOutput(y_preds):
    flat_list = []
    for sublist in y_preds:
        for item in sublist:
            flat_list.append(item)

    y_preds_binary = []
    for x in flat_list:
        if x > 0.5:
            x = 1
        else:
            x = 0
        y_preds_binary.append(x)
    return y_preds_binary

def main():
    dataset = np.loadtxt("test", delimiter=",")
    x_test_2017 = dataset[:,0:614]
    x_1_test = np.concatenate([dataset[:,0:3], dataset[:,603:614]], axis=1)
    x_2_test = dataset[:,3:303]
    x_3_test = dataset[:,303:603]    
    y_test_2017 = dataset[:,614].reshape(-1,1)


    dataset = np.loadtxt("dev", delimiter=",")
    x_valid = dataset[:,0:614]
    y_valid = dataset[:,614].reshape(-1,1)

    x_1_valid = np.concatenate([dataset[:,0:3], dataset[:,603:614]], axis=1)
    x_2_valid = dataset[:,3:303]
    x_3_valid = dataset[:,303:603]

    #resampleFile()
    dataset = np.loadtxt("train.revised", delimiter=",")
    x_1_train = np.concatenate([dataset[:,0:3], dataset[:,603:614]], axis=1)

    x_2_train = dataset[:,3:303]
    x_3_train = dataset[:,303:603]

    y_train = dataset[:,614].reshape(-1,1)

    
    x_train_root = x_1_train
    x_valid_root = x_1_valid
    x_1_train, x_1_test, x_1_valid = standardize_data(copy.deepcopy(x_train_root), x_1_test, copy.deepcopy(x_valid_root))

    
    # ## We have some settings for the model and its training which we will set up below.
    num_h = 17
    num_classes = 1 #could be improved here
    num_inducing = 100
    minibatch_size = 250


    #print(len(y_train))
    #print(len(y_test_2017))
    #print(len(y_valid))


    model = make_feedforward_nn(x1, x2, x3)
    cost = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=model, labels=y))
    optimizer = tf.train.AdamOptimizer(learning_rate=1e-4).minimize(cost)
    predict = tf.sigmoid(model)
    

    init = tf.global_variables_initializer()
    saver = tf.train.Saver(max_to_keep = 1000)

    with tf.Session() as sess:
        sess.run(init)
        # ## We now go through a training loop where we optimise the NN and GP. we will print out the test results at
        # regular intervals.    
        results = []    
        SEED = 449
        np.random.seed(SEED)
        for i in range(20): #100 epochs        
            print("epoch: ")
            print(i)
            if i>0:
                saver.restore(sess, "baselinemodel_at_epoch"+str((i-1))+".ckpt")
                predict_op = sess.run([predict], feed_dict={x1: x_1_valid, x2: x_2_valid, x3: x_3_valid, y: y_valid})
                print("Result from the previous epoch on dev:")
                compute_scores(y_valid, convertContinuoustoOutput(predict_op))
               

                predict_op = sess.run([predict], feed_dict={x1: x_1_test, x2: x_2_test, x3: x_3_test, y: y_test_2017})
                print("Result from the previous epoch on test:")
                compute_scores(y_test_2017, convertContinuoustoOutput(predict_op))

            shuffle = np.arange(len(y_train))        
            np.random.shuffle(shuffle)
            #print(shuffle)
            x_train_shuffle_1 = x_1_train[shuffle]
            x_train_shuffle_2 = x_2_train[shuffle]
            x_train_shuffle_3 = x_3_train[shuffle]
            y_train_shuffle = y_train[shuffle]
            data_indx = 0
            while data_indx<len(y_train):
                lastIndex = data_indx + minibatch_size
                if lastIndex>=len(y_train):
                    lastIndex = len(y_train)
                #print("hoang cuong")
                #print(x_train_shuffle_1.shape[0])
                indx_array = np.mod(np.arange(data_indx, lastIndex), x_train_shuffle_1.shape[0])
                data_indx += minibatch_size
                #print(x_train_shuffle_1[indx_array].shape)
                #print(x_train_shuffle_2[indx_array].shape)
                #print(x_train_shuffle_3[indx_array].shape)
                sess.run([optimizer,cost], feed_dict={x1: x_train_shuffle_1[indx_array], 
                	x2: x_train_shuffle_2[indx_array], x3: x_train_shuffle_3[indx_array], y: y_train_shuffle[indx_array]})
            save_path = saver.save(sess, "./baselinemodel_at_epoch"+str((i))+".ckpt")

            
    print("Done!")


if __name__ == '__main__':
    main()