# Clasificación construyendo perceptron

**Profesor:** Roberto Muñoz <br />
**E-mail:** <rmunoz@metricarts.com> <br />

**Colaborador:** Sebastián Arpón <br />
**E-mail:** <rmunoz@metricarts.com> <br />

En este taller construiremos un modelo de perceptrón usando funciones básicas de Python.

Usaremos un dataset de personas que contiene datos como altura, peso, tamaño del pie y sexo de la persona. El objetivo es construir un modelo predictivo que permita determinar de qué sexo es la persona solamente basado en altura, peso y tamaño del pie.

In [None]:
import numpy as np
import matplotlib
from matplotlib import pyplot as plt

%matplotlib inline

Creamos la variable data que contiene tanto los valores de entrada (features) y las etiquetas (labels).

La primera columna es la altura en metros, la segunda el peso en kilos y la tercera es el tamaño del pie en metros.

La cuarta columna corresponde al sexo. El valor 0 corresponde a hombres y el valor 1 corresponde a mujeres.

In [None]:
data = [[1.81, 0.80, 0.44, 0],
        [1.77, 0.70, 0.43, 0],
        [1.60, 0.60, 0.38, 1],
        [1.54, 0.54, 0.37, 1],
        [1.66, 0.65, 0.40, 0],
        [1.90, 0.90, 0.47, 0],
        [1.75, 0.64, 0.39, 1],
        [1.77, 0.70, 0.40, 1],
        [1.59, 0.55, 0.37, 1],
        [1.71, 0.75, 0.42, 0],
        [1.81, 0.85, 0.43, 0]]

Numero de registros en la tabla

In [None]:
len(data)

Extraer tercera fila

In [None]:
data[2]

In [None]:
data[:,0]

In [None]:
data_np=np.array(data)
data_np

In [None]:
data_np[:,0]

In [None]:
data_np[:,1]

In [None]:
data_np[:,2]

Convertimos la columna de sexo en una lista de colores

In [None]:
colors=['red', 'blue']
labels=np.array(data_np[:,3], dtype=int)
np.array(colors)[labels]

In [None]:
plt.scatter(data_np[:,0], data_np[:,1], c=np.array(colors)[labels])

plt.xlabel("altura")
plt.ylabel("peso")

custom_lines = [matplotlib.lines.Line2D([0], [0], color="red", lw=4),
                matplotlib.lines.Line2D([0], [0], color="blue", lw=4)]
plt.legend(custom_lines, ['Hombre', 'Mujer'])

Definir funcion de activación y derivada

In [None]:
def sigmoid(x) :
    return 1/(1 + np.exp(-x))

def sigmoid_p(x) :
    return sigmoid(x) * (1-sigmoid(x))

Definimos loop de entrenamiento

In [None]:
# loop de entrenamiento

learning_rate = 0.2
n_iterations = 1000

costs = []

w1 = np.random.randn()
w2 = np.random.randn()
w3 = np.random.randn()
b = np.random.randn()

for i in range(n_iterations):
    random_row = np.random.randint(len(data))
    point = data[random_row]
    
    z = point[0] * w1 + point[1] * w2 + point[2] * w3 + b
    prediction = sigmoid(z)
    
    target = point[3]
    cost = np.square(prediction - target)
    
    dcost_prediction = 2 * (prediction - target)
    dprediction_dz = sigmoid_p(z)
    
    dz_dw1 = point[0]
    dz_dw2 = point[1]
    dz_dw3 = point[2]
    dz_db = 1
    
    dcost_dz = dcost_prediction * dprediction_dz
    
    dcost_dw1 = dcost_dz * dz_dw1
    dcost_dw2 = dcost_dz * dz_dw2
    dcost_dw3 = dcost_dz * dz_dw3
    dcost_db = dcost_dz * dz_db
    
    w1 = w1 - learning_rate * dcost_dw1
    w2 = w2 - learning_rate * dcost_dw2
    w3 = w3 - learning_rate * dcost_dw3
    b = b - learning_rate * dcost_db
    
    if i % 100 == 0 :
        cost_sum = 0
        for j in range(len(data)) :
            point = data[random_row]
            
            z = point[0] * w1 + point[1] * w2 + point[2] * w3 + b
            prediction = sigmoid(z)
            
            target = point[3]
            cost_sum += np.square(prediction - target)
            
        costs.append(cost_sum/len(data))

plt.plot(costs)

In [None]:
# loop de predicciones

for i in range(len(data)) :
    point = data[i]
    print(point)
    
    z = point[0] * w1 + point[1] * w2 + point[2] * w3 + b
    prediction = sigmoid(z)
    print("predicción : {}" .format(prediction))

Supongamos que llega un nuevo registro y necesitamos determinar a qué sexo pertenece

In [None]:
point_new = [1.63, 0.60, 0.37]

In [None]:
z = point_new[0] * w1 + point_new[1] * w2 + point_new[2] * w3 + b
prediction = sigmoid(z)
prediction

In [None]:
def determinar_sexo(height, weight, shoe_size) :
    z = height * w1 + weight * w2 + shoe_size * w3 + b
    prediction = sigmoid(z)
    if prediction < .5:
        print('hombre')
    else:
        print('mujer')

In [None]:
determinar_sexo(1.63, 0.60, 0.37)

In [None]:
determinar_sexo(1.62, 0.49, 0.38)