# Predicción Simple_1

Basado en "ann_predict.py". 

Los datos contienen eventos de la navegación de usuarios en una web. 

Objetivo: hacer predicciones sobre las acciones de los usuarios una vez que tenemos ciertos datos del usuario.

- is_mobile: si usa un dispositivo movil para navegar
- n_products_viewed: numero de productos visitados
- visit_duration: duracion de la visita en minutos
- is_returning_visitor: 0 - nuevo, 1 - visitante que vuelve
- time_of_day: se ha segmentado el dia en 4 partes, 0 (de 00.00 a 06.00), 1 (de 06.00 a 12:00), etc..
- user_action:0 - bounce, 1 - add_to_cart, 2 - begin_checkout, 3 - finish_checkout 

Este es un problema de clasificación donde podemos usar Logistic regression con 2 clases (0 o cualquiera de las otras) o *"multi-class classification"*. 


No hay entranamiento, solo el procedimiento de forward y su prediccion.

- leemos datos del fichero'ecommerce_data.csv'
- definimos las funciones de softmax() y forward()
- inicializamos unos pesos
- hacemos una prediccion (que será mala porque no hay training)

In [4]:
import numpy as np
import numpy as np
import pandas as pd
import os

Los datos de entrada tienen este aspecto:

In [5]:
df = pd.read_csv('ecommerce_data.csv')
df.head()

Unnamed: 0,is_mobile,n_products_viewed,visit_duration,is_returning_visitor,time_of_day,user_action
0,1,0,0.65751,0,3,0
1,1,1,0.568571,0,2,1
2,1,0,0.042246,1,1,0
3,1,1,1.659793,1,1,2
4,0,1,2.014745,1,1,2


In [6]:
# Funcion para leer y transformar los datos
def get_data():
    df = pd.read_csv('ecommerce_data.csv')

    # lo pasamos a un array de numpy
    data = df.as_matrix()

    # Separamos los datos y la etiqueta
    X = data[:,:-1]   # todo menos la ultima
    Y = data[:,-1]    # solo la ultima

    # normalizamos las columnas 1 y 2
    X[:,1] = (X[:,1] - X[:,1].mean()) / X[:,1].std()
    X[:,2] = (X[:,2] - X[:,2].mean()) / X[:,2].std()

    # creamos una nueva matriz X2 con el numero correcto de columnas
    N, D = X.shape
    X2 = np.zeros((N, D+3))
    X2[:,0:(D-1)] = X[:,0:(D-1)] # no-categoricas

    # hacemos el one-hot encoding para las categoricas
    for n in xrange(N):
        t = int(X[n,D-1])
        X2[n,t+D-1] = 1

    return X2, Y

In [7]:
def softmax(a):
    expA = np.exp(a)
    return expA / expA.sum(axis=1, keepdims=True)

In [8]:
# make predictions
def forward(X, W1, b1, W2, b2):
    Z = np.tanh(X.dot(W1) + b1)
    return softmax(Z.dot(W2) + b2)

In [9]:
# calculate the accuracy
def classification_rate(Y, P):
    return np.mean(Y == P)

### main( )

Una vez definidas todas las funciones, leemos los datos e inicializamos los pesos.

In [10]:
X, Y = get_data()

In [11]:
# inicializamos pesos
M = 5
D = X.shape[1]
K = len(set(Y))
W1 = np.random.randn(D, M)
b1 = np.zeros(M)
W2 = np.random.randn(M, K)
b2 = np.zeros(K)

Para entrenar hacemos simplemente un forward

In [12]:
P_Y_given_X = forward(X, W1, b1, W2, b2)
predictions = np.argmax(P_Y_given_X, axis=1)

In [13]:
print "Score:", classification_rate(Y, predictions)

Score: 0.1
