***

Profesor: Gonzalo A. Ruz, PhD

Curso: Aprendizaje Automático

***

## Implementación del Perceptrón

In [1]:
import numpy as np

In [2]:
class Perceptron:
  def __init__(self, N, alpha=0.1):
		# inicializar la matriz de pesos y guardar la tasa de aprendizaje
    self.W = np.random.randn(N + 1) / np.sqrt(N)
    self.alpha = alpha
  
  def step(self, x):
		# aplicar la función escalón
    return 1 if x > 0 else 0

  def fit(self, X, y, epochs=10):
		# inserte una columna de 1s como la última entrada en la 
    # matriz de características: este pequeño truco nos permite tratar 
    # el sesgo como un parámetro entrenable dentro de la matriz de peso
    X = np.c_[X, np.ones((X.shape[0]))]
    # bucle sobre el número deseado de épocas
    for epoch in np.arange(0, epochs): #por defecto seteado en 10 épocas
      # bucle sobre cada punto de datos individual
      for (x, target) in zip(X, y):
        # tome el producto punto entre las características
        # de entrada y la matriz de peso, luego pase este valor 
        # a través de la función escalón/umbral para obtener la predicción
        p = self.step(np.dot(x, self.W)) #np.dot es el producto punto
        # solo realice una actualización de peso si
        # nuestra predicción no coincide con el objetivo (target)
        if p != target: #si la salida es diferente (!=) al target, debo actualizar los pesos (backpropagation)
          # determinar el error
          error = p - target
          # actualizar la matriz de pesos
          self.W += -self.alpha * error * x #el w es igual al error anterior * error
          
  def predict(self, X, addBias=True):
    # asegúrese de que nuestra entrada sea una matriz
    X = np.atleast_2d(X)
    # verifique si se debe agregar la columna de sesgo
    if addBias:
      # inserte una columna de 1s como la última entrada
      # en la matriz de características (sesgo)
      X = np.c_[X, np.ones((X.shape[0]))]
      # tome el producto punto entre las características 
      # de entrada y la matriz de peso, luego pase el valor 
      # a través de la función escalón
    return self.step(np.dot(X, self.W))
    
  def score(self, X, y): #calculo de un accuracy: total de datos - error / total de datos
    misclassified_data_count = 0
    for xi, target in zip(X, y):
      output = self.predict(xi)
      if(target != output):
        misclassified_data_count += 1
    total_data_count = len(X)
    self.score_ = (total_data_count - misclassified_data_count)/total_data_count
    return self.score_


#### Caso OR

In [9]:
# construir el conjunto de datos OR
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([[0], [1], [1], [1]])

# definir nuestro perceptrón y entrenarlo
print("[INFO] training perceptron...")
p = Perceptron(X.shape[1], alpha=0.1)
p.fit(X, y, epochs=20)

[INFO] training perceptron...


In [11]:
p.W

array([ 0.24551845,  0.84349321, -0.07352034])

Evaluación

In [12]:
# Ahora que nuestro perceptrón está entrenado podemos evaluarlo
print("[INFO] testing perceptron...")

# ahora que nuestra red está entrenada, podemos recorrer los puntos de datos
for (x, target) in zip(X, y):
	# hacer una predicción sobre el punto de dato y 
  # mostrar el resultado en nuestra consola
	pred = p.predict(x)
	print("[INFO] data={}, ground-truth={}, pred={}".format(
		x, target[0], pred))

print("Accuracy")
p.score(X,y)

[INFO] testing perceptron...
[INFO] data=[0 0], ground-truth=0, pred=0
[INFO] data=[0 1], ground-truth=1, pred=1
[INFO] data=[1 0], ground-truth=1, pred=1
[INFO] data=[1 1], ground-truth=1, pred=1
Accuracy


1.0

#### Caso AND

In [13]:
# construir el conjunto de datos AND
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([[0], [0], [0], [1]])
# definir nuestro perceptrón y entrenarlo
print("[INFO] training perceptron...")
p = Perceptron(X.shape[1], alpha=0.1)
p.fit(X, y, epochs=20)

[INFO] training perceptron...


Evaluación

In [14]:
# Ahora que nuestro perceptrón está entrenado podemos evaluarlo
print("[INFO] testing perceptron...")
# ahora que nuestra red está entrenada, podemos recorrer los puntos de datos
for (x, target) in zip(X, y):
	# hacer una predicción sobre el punto de dato y 
  # mostrar el resultado en nuestra consola
	pred = p.predict(x)
	print("[INFO] data={}, ground-truth={}, pred={}".format(
		x, target[0], pred))
 
print("Accuray")
p.score(X,y)

[INFO] testing perceptron...
[INFO] data=[0 0], ground-truth=0, pred=0
[INFO] data=[0 1], ground-truth=0, pred=0
[INFO] data=[1 0], ground-truth=0, pred=0
[INFO] data=[1 1], ground-truth=1, pred=1
Accuray


1.0

#### Caso XOR

In [15]:
# construir el conjunto de datos XOR
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([[0], [1], [1], [0]])
# definir nuestro perceptrón y entrenarlo
print("[INFO] training perceptron...")
p = Perceptron(X.shape[1], alpha=0.1)
p.fit(X, y, epochs=20)

[INFO] training perceptron...


Evaluación

In [16]:
# Ahora que nuestro perceptrón está entrenado podemos evaluarlo
print("[INFO] testing perceptron...")
# ahora que nuestra red está entrenada, podemos recorrer los puntos de datos
for (x, target) in zip(X, y):
	# hacer una predicción sobre el punto de dato y 
  # mostrar el resultado en nuestra consola
	pred = p.predict(x)
	print("[INFO] data={}, ground-truth={}, pred={}".format(
		x, target[0], pred))

print("Accuray")
p.score(X,y)

[INFO] testing perceptron...
[INFO] data=[0 0], ground-truth=0, pred=1
[INFO] data=[0 1], ground-truth=1, pred=0
[INFO] data=[1 0], ground-truth=1, pred=0
[INFO] data=[1 1], ground-truth=0, pred=0
Accuray


0.25

## Veamos un dataset más complejo

In [17]:
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
#
# Cargar el dataset
#
bc = datasets.load_breast_cancer()
X = bc.data
y = bc.target
#
# Crear división de entrenamiento y prueba
#
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42, stratify=y)
#
# Crear una instancia de Perceptron
#
prcptrn = Perceptron(X_train.shape[1], alpha=0.1)
#
# entrenamiento
#
prcptrn.fit(X_train, y_train,epochs=20)
#
# Accuracy en test y train
#
prcptrn.score(X_test, y_test), prcptrn.score(X_train, y_train)

(0.9005847953216374, 0.9195979899497487)

## Podríamos usar el perceptrón de Scikit-learn?

In [18]:
from sklearn import datasets
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Perceptron
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score

# Cargar el dataset
#
bc = datasets.load_breast_cancer()
X = bc.data
y = bc.target
#
# Crear división de entrenamiento y prueba
#
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42, stratify=y)

ppn = Perceptron(eta0=0.1, random_state=1) #eta es el alfa, con esto se genera el modelo
ppn.fit(X_train, y_train)
 
y_pred = ppn.predict(X_test)
 
print('Accuracy: %.3f' % accuracy_score(y_test, y_pred))
print('Accuracy: %.3f' % ppn.score(X_test, y_test))

Accuracy: 0.895
Accuracy: 0.895


## Iris dataset?

In [19]:
from sklearn import datasets
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Perceptron
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score
 
iris = datasets.load_iris()
X = iris.data
y = iris.target
 
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=1, stratify=y)
 
sc = StandardScaler() #standarizacion
sc.fit(X_train) #aprender la media y desv standar (para eso es el fit)
X_train_std = sc.transform(X_train) #standarizamos el train
X_test_std = sc.transform(X_test) #standarizamos el test
 
ppn = Perceptron(eta0=0.1, random_state=1)
ppn.fit(X_train_std, y_train)
 
y_pred = ppn.predict(X_test_std)
 
print('Accuracy: %.3f' % accuracy_score(y_test, y_pred))
print('Accuracy: %.3f' % ppn.score(X_test_std, y_test))

Accuracy: 0.956
Accuracy: 0.956
