In [None]:
'''
PURPOSE: build a classifier that classifies actors as male or female
'''

In [2]:
import numpy as np

In [91]:
def replace_labels(y,labels):
    y_relabeled = np.copy(y)
    for label in labels:
        for index in np.where(y == label[0]):
            np.put(y_relabeled, index, label[1])
    return y_relabeled.astype(int)

def flatten_set(x):
    #returned ndarray should have shape (N, M), where N = # pixels and M = # images
    for i in range(x.shape[-1]):
        flattened_image = x[...,i].flatten() 
        if i == 0:
            x_flattened = flattened_image
        else:
            x_flattened = np.vstack((x_flattened, flattened_image))
            
    return x_flattened.T

def cost(x,y,theta):
    #quadratic cost function
    #x = np.vstack( (np.ones((1, x.shape[1])), x))
    return np.sum( (y - np.dot(theta.T,x)) ** 2)

def dcost_dtheta(x,y,theta):
    #x = np.vstack( (np.ones((1, x.shape[1])), x))
    return -2*np.sum((y-np.dot(theta.T, x))*x, 1)


def grad_descent(cost, dcost_dtheta, x, y, init_theta, alpha,max_iter):
    EPS = 1e-5   #EPS = 10**(-5)
    prev_t = init_theta-10*EPS
    t = init_theta.copy()
    itr  = 1
 
    while np.linalg.norm(t - prev_t) >  EPS and itr < max_iter:
        prev_t = t.copy()
        t -= alpha*dcost_dtheta(x, y, t)
        if itr % 50 == 0:
            print "Iter", itr
            print ("cost(x) = %.2f" %  cost(x, y, t)) 
            
#            print "x = (%.2f, %.2f, %.2f), cost(x) = %.2f" % (t[0], t[1], t[2], cost(x, y, t)) 
#            print "Gradient: ", dcost_dtheta(x, y, t), "\n"
            y_pred = pred_y(x,t)
            print("Performance: ",performance(y_pred,y_val))
        itr += 1

    
    return t


def pred_y(x,theta):

    #x = np.vstack((np.ones((1, x.shape[1])), x ))    
    h_all = np.dot(theta.T,x)
#    print("h(theta) for all images: ")
#    print(h_all)
    y_pred = np.ones(h_all.shape[0])
    
    for i in range(h_all.shape[0]):
        h=h_all[i]
        if h > 0:
            y_pred[i] = 1
        elif h < 0:
            y_pred[i] = 0
        else:
            y_pred[i]=randint(-1,1)
    return y_pred


def performance(y_pred, y):
    sum = 0.0
    test_size = y.shape[0]
    for i in range(test_size):
        if y_pred[i] == y[i]:
            sum +=1
    return sum/test_size * 100



In [95]:
x_train = np.load("x_train.npy")
y_train = np.load("y_train.npy")
x_val = np.load("x_val.npy")
y_val = np.load("y_val.npy")
x_test = np.load("x_test.npy")
y_test = np.load("y_test.npy")

In [96]:
labels =   [("Alec Baldwin",-1), ("Steve Carell",-1), ("Lorraine Bracco",1),("Peri Gilpin",1),("Bill Hader",-1),("Angie Harmon",1)]

y_train = replace_labels(y_train, labels)
y_val = replace_labels(y_val, labels)
y_test = replace_labels(y_test, labels)


In [97]:
x_train = flatten_set(x_train) / 255.0
x_val = flatten_set(x_val) / 255.0
x_test = flatten_set(x_test) / 255.0

In [111]:
pixel_inten_mean = np.mean(x_train)
pixel_inten_std  = np.std(x_train)
theta0 = np.random.normal( 0, 0.01, x_train.shape[0]+1) #of dimension (1025,)

In [102]:
x_train_w_bias = np.vstack( (np.ones((1, x_train.shape[1])), x_train))
x_val_w_bias = np.vstack( (np.ones((1, x_val.shape[1])), x_val))

In [112]:
theta_complete = grad_descent(cost, dcost_dtheta, x_train_w_bias, y_train, theta0, 0.0000001,30000)



Iter 50
cost(x) = 424.53
('Performance: ', 20.0)
Iter 100
cost(x) = 415.03
('Performance: ', 26.666666666666668)
Iter 150
cost(x) = 406.62
('Performance: ', 23.333333333333332)
Iter 200
cost(x) = 398.76
('Performance: ', 20.0)
Iter 250
cost(x) = 391.35
('Performance: ', 20.0)
Iter 300
cost(x) = 384.36
('Performance: ', 16.666666666666664)
Iter 350
cost(x) = 377.77
('Performance: ', 16.666666666666664)
Iter 400
cost(x) = 371.56
('Performance: ', 16.666666666666664)
Iter 450
cost(x) = 365.70
('Performance: ', 15.0)
Iter 500
cost(x) = 360.17
('Performance: ', 15.0)
Iter 550
cost(x) = 354.94
('Performance: ', 15.0)
Iter 600
cost(x) = 350.01
('Performance: ', 15.0)
Iter 650
cost(x) = 345.35
('Performance: ', 11.666666666666666)
Iter 700
cost(x) = 340.95
('Performance: ', 11.666666666666666)
Iter 750
cost(x) = 336.78
('Performance: ', 10.0)
Iter 800
cost(x) = 332.85
('Performance: ', 8.333333333333332)
Iter 850
cost(x) = 329.12
('Performance: ', 8.333333333333332)
Iter 900
cost(x) = 325.60
(

Iter 7950
cost(x) = 227.44
('Performance: ', 5.0)
Iter 8000
cost(x) = 227.18
('Performance: ', 5.0)
Iter 8050
cost(x) = 226.91
('Performance: ', 5.0)
Iter 8100
cost(x) = 226.65
('Performance: ', 5.0)
Iter 8150
cost(x) = 226.39
('Performance: ', 5.0)
Iter 8200
cost(x) = 226.13
('Performance: ', 5.0)
Iter 8250
cost(x) = 225.87
('Performance: ', 5.0)
Iter 8300
cost(x) = 225.61
('Performance: ', 5.0)
Iter 8350
cost(x) = 225.35
('Performance: ', 5.0)
Iter 8400
cost(x) = 225.09
('Performance: ', 5.0)
Iter 8450
cost(x) = 224.84
('Performance: ', 5.0)
Iter 8500
cost(x) = 224.58
('Performance: ', 5.0)
Iter 8550
cost(x) = 224.33
('Performance: ', 5.0)
Iter 8600
cost(x) = 224.08
('Performance: ', 5.0)
Iter 8650
cost(x) = 223.82
('Performance: ', 5.0)
Iter 8700
cost(x) = 223.57
('Performance: ', 5.0)
Iter 8750
cost(x) = 223.32
('Performance: ', 5.0)
Iter 8800
cost(x) = 223.07
('Performance: ', 5.0)
Iter 8850
cost(x) = 222.83
('Performance: ', 5.0)
Iter 8900
cost(x) = 222.58
('Performance: ', 5.0)


Iter 15750
cost(x) = 195.39
('Performance: ', 3.3333333333333335)
Iter 15800
cost(x) = 195.23
('Performance: ', 3.3333333333333335)
Iter 15850
cost(x) = 195.07
('Performance: ', 3.3333333333333335)
Iter 15900
cost(x) = 194.91
('Performance: ', 3.3333333333333335)
Iter 15950
cost(x) = 194.75
('Performance: ', 3.3333333333333335)
Iter 16000
cost(x) = 194.59
('Performance: ', 3.3333333333333335)
Iter 16050
cost(x) = 194.43
('Performance: ', 3.3333333333333335)
Iter 16100
cost(x) = 194.27
('Performance: ', 3.3333333333333335)
Iter 16150
cost(x) = 194.11
('Performance: ', 3.3333333333333335)
Iter 16200
cost(x) = 193.96
('Performance: ', 3.3333333333333335)
Iter 16250
cost(x) = 193.80
('Performance: ', 3.3333333333333335)
Iter 16300
cost(x) = 193.64
('Performance: ', 3.3333333333333335)
Iter 16350
cost(x) = 193.48
('Performance: ', 3.3333333333333335)
Iter 16400
cost(x) = 193.33
('Performance: ', 3.3333333333333335)
Iter 16450
cost(x) = 193.17
('Performance: ', 3.3333333333333335)
Iter 16500

Iter 22000
cost(x) = 177.99
('Performance: ', 1.6666666666666667)
Iter 22050
cost(x) = 177.87
('Performance: ', 1.6666666666666667)
Iter 22100
cost(x) = 177.75
('Performance: ', 1.6666666666666667)
Iter 22150
cost(x) = 177.63
('Performance: ', 1.6666666666666667)
Iter 22200
cost(x) = 177.51
('Performance: ', 1.6666666666666667)
Iter 22250
cost(x) = 177.39
('Performance: ', 1.6666666666666667)
Iter 22300
cost(x) = 177.27
('Performance: ', 1.6666666666666667)
Iter 22350
cost(x) = 177.16
('Performance: ', 1.6666666666666667)
Iter 22400
cost(x) = 177.04
('Performance: ', 1.6666666666666667)
Iter 22450
cost(x) = 176.92
('Performance: ', 1.6666666666666667)
Iter 22500
cost(x) = 176.80
('Performance: ', 1.6666666666666667)
Iter 22550
cost(x) = 176.68
('Performance: ', 1.6666666666666667)
Iter 22600
cost(x) = 176.56
('Performance: ', 1.6666666666666667)
Iter 22650
cost(x) = 176.45
('Performance: ', 1.6666666666666667)
Iter 22700
cost(x) = 176.33
('Performance: ', 1.6666666666666667)
Iter 22750

Iter 28250
cost(x) = 164.59
('Performance: ', 1.6666666666666667)
Iter 28300
cost(x) = 164.49
('Performance: ', 1.6666666666666667)
Iter 28350
cost(x) = 164.40
('Performance: ', 1.6666666666666667)
Iter 28400
cost(x) = 164.30
('Performance: ', 1.6666666666666667)
Iter 28450
cost(x) = 164.21
('Performance: ', 1.6666666666666667)
Iter 28500
cost(x) = 164.11
('Performance: ', 1.6666666666666667)
Iter 28550
cost(x) = 164.02
('Performance: ', 1.6666666666666667)
Iter 28600
cost(x) = 163.93
('Performance: ', 1.6666666666666667)
Iter 28650
cost(x) = 163.83
('Performance: ', 1.6666666666666667)
Iter 28700
cost(x) = 163.74
('Performance: ', 1.6666666666666667)
Iter 28750
cost(x) = 163.64
('Performance: ', 1.6666666666666667)
Iter 28800
cost(x) = 163.55
('Performance: ', 1.6666666666666667)
Iter 28850
cost(x) = 163.46
('Performance: ', 1.6666666666666667)
Iter 28900
cost(x) = 163.36
('Performance: ', 1.6666666666666667)
Iter 28950
cost(x) = 163.27
('Performance: ', 1.6666666666666667)
Iter 29000

In [109]:
x_train_w_bias.view()

array([[ 1.        ,  1.        ,  1.        , ...,  1.        ,
         1.        ,  1.        ],
       [ 0.68627451,  0.14901961,  0.26666667, ...,  0.30588235,
         0.49411765,  0.00784314],
       [ 0.0627451 ,  0.45098039,  0.23529412, ...,  0.21568627,
         0.23921569,  0.00392157],
       ..., 
       [ 0.82745098,  0.01568627,  0.42352941, ...,  0.10196078,
         0.29411765,  0.75294118],
       [ 0.82352941,  0.87843137,  0.60784314, ...,  0.10588235,
         0.31372549,  0.74117647],
       [ 0.38039216,  0.93333333,  0.97647059, ...,  0.08627451,
         0.37647059,  0.73333333]])

In [86]:
theta0 = np.random.normal( 0, 0.1, x_train.shape[0]+1) #of dimension (1025,)
#theta0 = np.zeros(x_train_w_bias.shape[0])
theta0.view()

array([ 0.08473606,  0.02237585, -0.19373855, ..., -0.18082666,
        0.12962728,  0.0859115 ])

In [None]:
np.dot(theta0.T,x_train_w_bias)
#why do I get so many negative values? :()

In [None]:
#create dataset for actors not included in act
