# Unidad 2: Modelos de clasificación

Importar librerias básicas

In [1]:
#Utilidades numéricas
import numpy as np

#Utilidades gráficas
import matplotlib.pyplot as plt
from mpl_toolkits import mplot3d
from mpl_toolkits.mplot3d import axes3d

#Habilitar gráficas dinámicas
%matplotlib notebook
#matplotlib inline

### 1.- Procesamiento de los datos

In [21]:
#Cargar datos
data = np.load("datos/clasificacion_p1.npy")

#Extraer informacion
x = data[0:2, :]
y = data[2, :]

#Ordenar informacion
x = np.transpose(x)
y = y.astype("uint8")

# Imprimir dimensiones de los datos
print("X" + str(x.shape))
print("Y" + str(y.shape))

# Normalizar Y
for i in range (x.shape[1]):
    x[:,i] = (x[:,i]-np.min(x[:,i]))
    x[:,i] = x[:,i]/np.max(x[:,i])

#Graficar informacion
plt.figure(figsize=(4,4))
plt.scatter(x[:, 0], x[:, 1], c=y, s=20, cmap=plt.cm.Spectral)
plt.grid()
plt.show()

X(1000, 2)
Y(1000,)


<IPython.core.display.Javascript object>

### 2.- Definicion del modelo - Hipótesis

In [4]:
# Modelo matemático
#    h = ax + b
#    y = e^h(i)/sum(e^h(i)) ---> Softmax
#
# Error
#    E = -ln(Ym(d)) ---> Entropía cruzada (d: clase correcta) 
#
# Se propone Gradiete Descendiente
#  Donde el mínimo e, es determinado por a, b
#  wo = wo -Lr(de/dw)  --> Se aplican derivadas parciales
#   de/dYm(d) = -1/Ym(d)
#   dYm(d)/dh(d) = Ym(d)[1-Ym(d)]
#   dYm(d)/dh(j) = -Ym(d)Ym(j)
#   dh/da = x
#   dh/db = 1

In [16]:
#Funciones auxiliares
def softmax(x):
    
    ym = np.exp(x)/np.sum(np.exp(x))
    return ym

def cross_entropy(x):
    
    e = -np.log(x)
    return e

In [19]:
#Crear clase de modelo de clasificacion
class classifier():
    
    #Definir constructor
    def __init__(self,d,s):
        
        # Inicializar parámetros
        self.a = np.random.rand(s,d) - 0.5
        self.b = np.random.rand(s,1) - 0.5
    
    #Procesamiento del modelo
    def forward(self): 
        
        # Modelo parametrizado
        h = np.dot(self.a,x)+self.b
        
        # Función softmax
        ym = softmax(h)
        return ym
    
    #Entrenamiento del modelo
    def train(self, x, y, Lr, epoch):
        
        # Inicializar el error
        self.e = np.zeros(epoch)
        
        # Ciclo épocas
        for i in range(epoch):
            
            # Ciclo de los datos
            for j in range(x.shape[1]):
                
                # Obtener entradas y salidas
                x_in = np.transpose(x[j:j+1,:])  #(2,1)
                yd = y[j]
                
                # Obtener salidas
                
                # Modelo parametrizado
                h = np.dot(self.a,x_in)+self.b
                
                # Función softmax
                ym = softmax(h)
                
                # Calcular las gradiantes de la función de error
                de_ym = -1/ym[yd]
                
                # Calcular gradiente de la función softmax
                dym_h = np.zeros([2,1])
                for k in range(dym_h.shape[0]):
                    
                    # Fila de la clase correcta
                    if (k==yd):
                        dym_h[k] = ym[yd]*(1-ym[yd])
                        
                    # Fila incorrecta
                    else:
                        dym_h[k] = -ym[k]*ym[yd]
                        
                # Modelo parametrizado
                dh_a = x_in
                dh_b = 1.0
                
                # Construir gradientes
                de_a = de_ym*np.dot(dym_h,np.transpose(dh_a))  # (1)*(2,1)*(2,1)--->(1)*(2,1)*(1,2) = (2,2)
                de_b = de_ym*dym_h*dh_b                        # (1)*(2,1)*(2,1) = (2,1)
                
                # Actualizar los parámetros
                self.a = self.a-Lr*de_a
                self.b = self.b-Lr*de_b
                
                # Calcular error
                self.e[i] = self.e[i]+cross_entropy(ym[yd])
                
            # Promediar error de la epoca
            self.e[i] = self.e[i]/x.shape[1]
    

### 3.- Entrenamiento del modelo

In [20]:
# Crear instancia
separador = classifier(2,2)

# Ejecutar entrenamiento
separador.train(x,y,0.1,50)

# Imprimir error
plt.figure(2)
plt.plot(separador.e,"r")
plt.grid()
plt.show()

<IPython.core.display.Javascript object>

### 4.- Evaluación del modelo

In [None]:
#Crear gradilla de datos
x_val = np.zeros([2, 400])
y_val = np.zeros(x_val.shape[1], dtype=int)
for i in range(20):
     
    x_val[0, i*20:(i+1)*20] = i/20.0
    x_val[1, i*20:(i+1)*20] = np.linspace(0, 100, 20)/100.0

#Graficar resultados
plt.figure(figsize=(4, 4))
plt.scatter(x_val[0, :], x_val[1, :], c=y_val, s=100, cmap=plt.cm.Spectral)
plt.show()

In [None]:
#Visualizar hiperplanos
fig = plt.figure()
bx = plt.axes(projection = '3d')
bx.scatter(x_val[0, :], x_val[1, :], y_3d[0,:], marker='o', s=10, c='red')
bx.scatter(x_val[0, :], x_val[1, :], y_3d[1,:], marker='o', s=10, c='blue')
bx.scatter(x[0, :], x[1, :], np.zeros(x[0, :].shape) + 0.5, marker='*', s=10, c='black')