# Problema 1: Aplicaciones en Sistemas Operativos

In [87]:
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits import mplot3d
from mpl_toolkits.mplot3d import axes3d
import scipy.io

%matplotlib notebook

from numpy.random import seed
from numpy.random import shuffle
from numpy.random import randint

## 1. Análisis de datos

In [88]:
#Cargar datos
data = np.load('datos/datos_p1.npy')
print("Tamaño de los datos: "+str(data.shape))


#Extraer informacion
x = data[:,0:3]
y = data[:,3:4].astype("uint8")

#Normalizar datos
x[:,0]=x[:,0]-np.min(x[:,0])
x[:,0]=x[:,0]/np.max(x[:,0])

x[:,1]=x[:,1]-np.min(x[:,1])
x[:,1]=x[:,1]/np.max(x[:,1])

x[:,2]=x[:,2]-np.min(x[:,2])
x[:,2]=x[:,2]/np.max(x[:,2])

#generar vector con posiciones aleatorias
index=np.arange(x.shape[0])
np.random.shuffle(index)#desordenar

#desordenar datos con vector
x=x[index,:]
y=y[index,:]-1

print("tamaño de x: "+str(x.shape))
print("Tamaño de y: "+str(y.shape))
#Visualizar datos
plt.figure(1)
f1 = plt.axes(projection='3d')
plt.title("Clasificación de sistemas")
f1.set_xlabel("Edad")
f1.set_ylabel("Puntaje 1")
f1.set_zlabel("Puntaje 2")
f1.scatter(x[:,0], x[:, 1], x[:, 2], marker='o',c=y[:, 0])


Tamaño de los datos: (7500, 4)
tamaño de x: (7500, 3)
Tamaño de y: (7500, 1)


<IPython.core.display.Javascript object>

<mpl_toolkits.mplot3d.art3d.Path3DCollection at 0x7f0218db4310>

separar datos en entrenamiento y validación

In [89]:
#calcular dimensiones de la base de datos
train_samples = np.floor(0.9*x.shape[0]).astype("int")
val_samples = x.shape[0] - train_samples

print("Muestras para entrenar: "+str(train_samples))
print("Muestras para validar: "+str(val_samples))

#Distribuir datos (90% entrenamiento, 10% validación)
x_train = x[0:train_samples,:]
y_train = y[0:train_samples,:]
x_test = x[train_samples:,:]
y_test = y[train_samples:,:]

Muestras para entrenar: 6750
Muestras para validar: 750


# 2. Funciones auxiliares

In [90]:
#Funciones auxiliares
def sigmoid(x):
    
    y = 1.0/(1.0+np.exp(-x))
    return y

def softmax(x):
    
    y = np.exp(x)/np.sum(np.exp(x))
    return y

def cross_entropy(x):
    
    y = -np.log(x)
    return y

# 3. Modelo

In [91]:
#Crear clase de modelo de clasificacion
class mlp:
    
    #Definir constructor
    def __init__(self,ne,no,ns,d):
        
        # Capa de entrada
        self.w1 = np.random.rand(ne,d)-0.5
        self.b1 = np.random.rand(ne,1)-0.5
        
        # Capa oculta
        self.w2 = np.random.rand(no,ne)-0.5
        self.b2 = np.random.rand(no,1)-0.5
        
        # Capa salida
        self.w3 = np.random.rand(ns,no)-0.5
        self.b3 = np.random.rand(ns,1)-0.5
    
    #Procesamiento del modelo
    def forward(self,x): 
        
        # Capa de entrada
        
        h1 = np.dot(self.w1,x) + self.b1
        y1 = sigmoid(h1)
        
        # Capa oculta
        h2 = np.dot(self.w2,y1) + self.b2
        y2 = sigmoid(h2)
        
        # Capa de salida
        h3 = np.dot(self.w3,y2) + self.b3
        ym = softmax(h3)
        
        return ym
    
    #Entrenamiento del modelo
    def train(self, x, y, x_v, y_v, Lr, epoch):
        
        #inicializar erro de entrenamiento
        self.e=np.zeros(epoch)
        self.ev = np.zeros(epoch)
        
        #inicializar rendimiento
        self.r = np.zeros(epoch)
        self.rv = np.zeros(epoch)
        
        
        #ciclo de las epocas
        for i in range (epoch):
            #ciclo de los datos
            for j in range(x.shape[0]):
                
                #a)ppaso hacia adelante
                
                #tomar entrada i de vector de entradas
                x_in=x[j,:].reshape([self.w1.shape[1],1])
                
                # Capa de entrada
                h1 = np.dot(self.w1,x_in) + self.b1
                y1 = sigmoid(h1)

                # Capa oculta
                h2 = np.dot(self.w2,y1) + self.b2
                y2 = sigmoid(h2)

                # Capa de salida
                h3 = np.dot(self.w3,y2) + self.b3
                ym = softmax(h3)
                
                #acumular error de la epoca
                self.e[i]=self.e[i]+cross_entropy(ym[y[j]])
                
                #calcular rendimiento de la epoca
                if(np.argmax(ym)==y[j]):
                    self.r[i]=self.r[i]+1
                
                ##b) calcular los gradientes
                
                #FUNCION DE ERROR
                de_ym=-1.0/ym[y[j]]#1
                
                #duncion softmax
                dym_h3=np.zeros(ym.shape)#(ns,1)
                for k in range(dym_h3.shape[0]):
                    
                    #posicion correcta
                    if(k==y[j]):
                        dym_h3[k,:]=ym[y[j]]*(1-ym[y[j]])
                    #posicion incorrecta
                    else:
                        dym_h3[k,:]=-ym[y[j]]*ym[k]
                
                            
                #capa de salida
                dh3_w3 = y2 #(no,1)
                dh3_b3 = 1 #(1)
                dh3_y2 = self.w3 #(ns,no)
                
                #capa oculta
                dy2_h2 = y2*(1-y2) #(no,1)
                dh2_w2 = y1 #(ne,1)
                dh2_b2 = 1 #(1)
                dh2_y1 = self.w2 #(no,ne)
                
                #capa de entrada
                dy1_h1 = y1*(1-y1) #(ne,1)
                dh1_w1 = x_in #(d,1)
                dh1_b1 = 1 #(1)
                
                ## c)construir gradientes
                
                #capa de salida
                de_w3 = de_ym*np.dot(dym_h3,np.transpose(dh3_w3))#(1)*(ns,1)x(1,no)=(ns,no)
                de_b3 = de_ym*dym_h3*dh3_b3#(1)*(ns,1)*(1)=(ns,1)
                de_y2 = de_ym*np.dot(np.transpose(dym_h3),dh3_y2)#(1)*(1,ns)*(ns,no)= (1,no)
                de_y2 = np.transpose(de_y2)#(no,1)
                
                #capa oculta
                de_w2 = np.dot(de_y2*dy2_h2,np.transpose(dh2_w2))#(no,1)*(no,1)x(1,ne)=(no,ne)
                de_b2 = de_y2*dy2_h2*dh2_b2#(no,1)*(no,1)*(1)=(no,1)
                de_y1 = np.dot(np.transpose(de_y2*dy2_h2), dh2_y1)#[(no,1)*(no,n1)]'x(no,ne)= (1,ne)
                de_y1 = np.transpose(de_y1)#(ne,1)
                
                #capa de entrada
                de_w1 = np.dot(de_y1*dy1_h1,np.transpose(dh1_w1))#=(ne,1)*(ne,1)x(1,d)=(ne,d)
                de_b1 = de_y1*dy1_h1*dh1_b1#(ne,1)*(ne,1)*(1)=(ne,1)
                
                ##ACTUALIZAR PESOS DE LA RED
                
                #capa de entrada
                self.w1 = self.w1 - Lr*de_w1
                self.b1 = self.b1 - Lr*de_b1
                
                #capa oculta
                self.w2 = self.w2 - Lr*de_w2
                self.b2 = self.b2 - Lr*de_b2
                
                #capa de salida
                self.w3 = self.w3 - Lr*de_w3
                self.b3 = self.b3 - Lr*de_b3
                
                
            #promediar error de la epoca
            self.e[i]=self.e[i]/x.shape[0]
            self.r[i]=self.r[i]/x.shape[0]
            
            #ciclo de validación
            for j in range(x_v.shape[0]):
                
                #tomar elemento j del vector
                x_in = x_v[j,:].reshape(x_v.shape[1],1) #(d,1)
                
                #obtener salida del modelo
                ym = self.forward(x_in) #(c,1)
                
                #calcular error
                self.ev[i] = self.ev[i] + cross_entropy(ym[y_v[j]])
                
                #calcular rendimento
                if(np.argmax(ym)==y_v[j]):
                    self.rv[i] = self.rv[i] +1
            
            #promediar error de la validacion
            self.ev[i]=self.ev[i]/x_v.shape[0]
            self.rv[i]=self.rv[i]/x_v.shape[0]
            
        
    

# 4. Entrenamiento del modelo 

In [92]:
#crear instancia del modelo
SisOp = mlp(5,5,6,3)

#entrenar modelo
SisOp.train(x_train,y_train,x_test,y_test,0.1,50)


# 5. Validación

In [93]:
#imprimir curva de error
plt.figure(2)
plt.title("Gráfica del ERROR")
plt.plot(SisOp.e,'r',label="Modelo")
plt.plot(SisOp.ev,'b', label="Validación")
plt.legend()
plt.show()

#imprimir curva de error
plt.figure(3)
plt.title("Gráfica del RENDIMIENTO")
plt.plot(SisOp.r,'r',label="Modelo")
plt.plot(SisOp.rv,'b', label="Validación")
plt.legend()
plt.show()


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [94]:
#rendimiento maximo

print("Rendimiento MÁXIMO")
r_max_index=np.argmax(SisOp.rv)
print("Época en la que se alcanza el rendimiento máximo:"+str(r_max_index))
print("Rendimiento de validación: "+str(SisOp.rv[r_max_index]*100)+"%")
print("Error de validación: "+str(SisOp.ev[r_max_index]*100)+"%")
print("Rendimiento del modelo: "+str(SisOp.r[r_max_index]*100)+"%")
print("Error del modelo: "+str(SisOp.e[r_max_index]*100)+"%")


#error minimo
print("")
print("Error MÍNIMO")
e_min_index=np.argmin(SisOp.ev)
print("Época en la que se alcanza el error mínimo:"+str(e_min_index))
print("Rendimiento de validación: "+str(SisOp.rv[e_min_index]*100)+"%")
print("Error de validación: "+str(SisOp.ev[e_min_index]*100)+"%")
print("Rendimiento del modelo: "+str(SisOp.r[e_min_index]*100)+"%")
print("Error del modelo: "+str(SisOp.e[e_min_index]*100)+"%")

Rendimiento MÁXIMO
Época en la que se alcanza el rendimiento máximo:6
Rendimiento de validación: 100.0%
Error de validación: 0.4436779570954856%
Rendimiento del modelo: 99.80740740740741%
Error del modelo: 1.0125117012395344%

Error MÍNIMO
Época en la que se alcanza el error mínimo:44
Rendimiento de validación: 100.0%
Error de validación: 0.040617358215715195%
Rendimiento del modelo: 99.97037037037036%
Error del modelo: 0.15565177856203666%


# 6. Evaluación del modelo

In [95]:
#crear vector de salidas del modelo
ym=np.zeros(y.shape).astype("int")

#inicializar error del modelo
e=0.0

#someter el modelo a los datos de entrada
for i in range (x.shape[0]):
    
    #tomar elemento i del vector
    x_in = x[i,:].reshape(x.shape[1],1)#(d,1)
    
    #evaluar usando el modelo
    y_prob=SisOp.forward(x_in)#(C,1)
    

    
    #tomar probabilidad mas alta
    ym[i]=np.argmax(y_prob)
    
    #acumular error
    e=cross_entropy(y_prob[ym[i].astype("int")])
    
#promediar el error
e=e/x.shape[0]

#Graficar informacion
plt.figure(figsize=(5,5))
f1 = plt.axes(projection='3d')
plt.title("Clasificación de sistemas")
f1.set_xlabel("Edad")
f1.set_ylabel("Puntaje 1")
f1.set_zlabel("Puntaje 2")
f1.scatter(x[:,0], x[:, 1], x[:, 2], marker='o',c=ym)


<IPython.core.display.Javascript object>

<mpl_toolkits.mplot3d.art3d.Path3DCollection at 0x7f0218dccac0>