<a href="https://colab.research.google.com/github/estebanhernandezr/Entregas-Semanales/blob/main/Perceptron_ADAline.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [100]:
import numpy as np
import pandas as pd
import sklearn as sk
from sklearn.model_selection import train_test_split

# **PERCEPTRON**

In [101]:
class Perceptron:
    def __init__(self, umbral=0.5, W=None):
        self.umbral = umbral
        self.W = W

    def sum_union_func(self, x):
        gX = np.matmul(x, self.W)
        return gX

    def threshold_func(self, val):
        y = None
        if val > self.umbral: y = 1
        else: y = -1
        return y

    def train(self, X, y, learn_rate, epochs):
        # PASO 1
        self.W = np.zeros(X.shape[1])
        # PASO 2
        for iter in range(epochs):
            for i, x in enumerate(X):
                gX = self.sum_union_func(x)
                yb = self.threshold_func(gX)

                aux_W = [w for w in self.W]
                for j in range(len(aux_W)):
                    aux_W[j] = self.W[j] + (learn_rate*(y[i]-yb)*x[j])
                self.W = [w for w in aux_W]
        # PASO 3
        print('¡Neuron has been trainned!')
        return None

    def predict(self, x):
        gX = self.sum_union_func(x)
        yb = self.threshold_func(gX)
        return yb

In [102]:
# AND GATE
X = np.array([
     [0, 0],
     [0, 1],
     [1, 0],
     [1, 1]
    ])

y = np.array([-1, -1, -1, 1])

Perceptron_AND = Perceptron()
Perceptron_AND.train(X, y, 0.02, 200)
print('0 + 0 := ', Perceptron_AND.predict([0, 0]))
print('0 + 1 := ', Perceptron_AND.predict([0, 1]))
print('1 + 0 := ', Perceptron_AND.predict([1, 0]))
print('1 + 1 := ', Perceptron_AND.predict([1, 1]))
print('pesos: ', Perceptron_AND.W)

¡Neuron has been trainned!
0 + 0 :=  -1
0 + 1 :=  -1
1 + 0 :=  -1
1 + 1 :=  1
pesos:  [0.28, 0.28]


In [103]:
# OR GATE
X = np.array([
     [0, 0],
     [0, 1],
     [1, 0],
     [1, 1]
    ])

y = np.array([-1, 1, 1, 1])

Perceptron_OR = Perceptron()
Perceptron_OR.train(X, y, 0.2, 100)
print('0 + 0 :=', Perceptron_OR.predict([0, 0]))
print('0 + 1 :=', Perceptron_OR.predict([0, 1]))
print('1 + 0 :=', Perceptron_OR.predict([1, 0]))
print('1 + 1 :=', Perceptron_OR.predict([1, 1]))
print('pesos:', Perceptron_OR.W)

¡Neuron has been trainned!
0 + 0 := -1
0 + 1 := 1
1 + 0 := 1
1 + 1 := 1
pesos: [0.8, 0.8]


# **ADAline**

In [104]:
class ADAline:
    def __init__(self, umbral=0.5, W=None):
        self.umbral = umbral
        self.W = W

    def sum_union_func(self, x):
        gX = np.dot(x, self.W[1:]) + self.W[0]
        return gX

    def threshold_func(self, val):
        y = None
        if val > self.umbral: y = 1
        else: y = -1
        return y

    def train(self, X, y, learn_rate, epochs):
        # PASO 1
        self.W = np.zeros(X.shape[1]+1)
        # PASO 2
        for iter in range(epochs):
            ybs = []
            for x in X:
                gX = self.sum_union_func(x)
                yb = gX # self.threshold_func(gX)
                ybs.append(yb)
            # GRADIENTE DESCENDENTE
            errors = y - ybs
            self.W[0] = self.W[0] + learn_rate*errors.sum()
            self.W[1:] = self.W[1:] + learn_rate*X.T.dot(errors)
        # PASO 3
        print('¡Neuron has been trainned!')
        return None

    def predict(self, x):
        gX = self.sum_union_func(x)
        yb = self.threshold_func(gX)
        return yb

In [105]:
# AND GATE
X = np.array([
     [0, 0],
     [0, 1],
     [1, 0],
     [1, 1]
    ])

y = np.array([-1, -1, -1, 1])

ADAline_AND = ADAline(umbral=0)
ADAline_AND.train(X, y, 0.2, 100)
print('0 + 0 :=', ADAline_AND.predict([0, 0]))
print('0 + 1 :=', ADAline_AND.predict([0, 1]))
print('1 + 0 :=', ADAline_AND.predict([1, 0]))
print('1 + 1 :=', ADAline_AND.predict([1, 1]))
print('pesos:', ADAline_AND.W)

¡Neuron has been trainned!
0 + 0 := -1
0 + 1 := -1
1 + 0 := -1
1 + 1 := 1
pesos: [-1.49999804  0.99999834  0.99999834]


In [106]:
# OR GATE
X = np.array([
     [0, 0],
     [0, 1],
     [1, 0],
     [1, 1]
    ])

y = np.array([-1, 1, 1, 1])

ADAline_OR = ADAline(umbral=0)
ADAline_OR.train(X, y, 0.2, 100)
print('0 + 0 :=', ADAline_OR.predict([0, 0]))
print('0 + 1 :=', ADAline_OR.predict([0, 1]))
print('1 + 0 :=', ADAline_OR.predict([1, 0]))
print('1 + 1 :=', ADAline_OR.predict([1, 1]))
print('pesos: ', ADAline_OR.W)

¡Neuron has been trainned!
0 + 0 := -1
0 + 1 := 1
1 + 0 := 1
1 + 1 := 1
pesos:  [-0.49999865  0.99999886  0.99999886]


In [107]:
# NOR GATE
X = np.array([
     [0, 0],
     [0, 1],
     [1, 0],
     [1, 1]
    ])

y = np.array([1, -1, -1, -1])

ADAline_NOR = ADAline(umbral=0)
ADAline_NOR.train(X, y, 0.2, 100)
print('0 + 0 :=', ADAline_NOR.predict([0, 0]))
print('0 + 1 :=', ADAline_NOR.predict([0, 1]))
print('1 + 0 :=', ADAline_NOR.predict([1, 0]))
print('1 + 1 :=', ADAline_NOR.predict([1, 1]))
print('pesos: ', ADAline_NOR.W)

¡Neuron has been trainned!
0 + 0 := 1
0 + 1 := -1
1 + 0 := -1
1 + 1 := -1
pesos:  [ 0.49999865 -0.99999886 -0.99999886]


In [108]:
# NAND GATE
X = np.array([
     [0, 0],
     [0, 1],
     [1, 0],
     [1, 1]
    ])

y = np.array([1, 1, 1, -1])

ADAline_NAND = ADAline(umbral=0)
ADAline_NAND.train(X, y, 0.2, 100)
print('0 + 0 :=', ADAline_NAND.predict([0, 0]))
print('0 + 1 :=', ADAline_NAND.predict([0, 1]))
print('1 + 0 :=', ADAline_NAND.predict([1, 0]))
print('1 + 1 :=', ADAline_NAND.predict([1, 1]))
print('pesos: ', ADAline_NAND.W)

¡Neuron has been trainned!
0 + 0 := 1
0 + 1 := 1
1 + 0 := 1
1 + 1 := -1
pesos:  [ 1.49999804 -0.99999834 -0.99999834]


#**IRIS DATASET**

importamos a python el dataset *iris*.

In [109]:
df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data', header=None)
df.head()

Unnamed: 0,0,1,2,3,4
0,5.1,3.5,1.4,0.2,Iris-setosa
1,4.9,3.0,1.4,0.2,Iris-setosa
2,4.7,3.2,1.3,0.2,Iris-setosa
3,4.6,3.1,1.5,0.2,Iris-setosa
4,5.0,3.6,1.4,0.2,Iris-setosa


Observamos las *clases* del dataset importado: comprobamos que existen 3 clases, con 50 observaciones de los regresores de cada una.

In [110]:
print(df.shape)
df[4].value_counts()

(150, 5)


Iris-setosa        50
Iris-versicolor    50
Iris-virginica     50
Name: 4, dtype: int64

Dado que tenemos 3 clases; pero *Perceptrón* y *ADAline* solamente puede clasificar en las clases 1 y -1, entonces debemos implementar 3 clasificadores diferentes que determinen sí la entrada es de la clase, o no (es de alguna de las otras 2).

In [111]:
def test_classifier(local_X, local_y):
    X_train, X_test, y_train, y_test = train_test_split(local_X, local_y, 
                                                        test_size=0.11, 
                                                        random_state=42)
    our_Perceptron = Perceptron()
    our_Perceptron.train(X_train, y_train, 0.2, 100)
    absacc_perceptron = 0
    for i, x in enumerate(X_test):
        label = our_Perceptron.predict(x)
        if (label == y_test[i]):
            absacc_perceptron += 1

    our_ADAline = ADAline()
    our_ADAline.train(local_X, local_y, 0.2, 100)
    absacc_ADAline = 0
    for i, x in enumerate(X_test):
        label = our_ADAline.predict(x)
        if (label == y_test[i]):
            absacc_ADAline += 1

    print('Perceptron accuracy: ', absacc_perceptron/len(y_test))
    print('ADAline accuracy: ', absacc_ADAline/len(y_test))

def is_of_class(local_df, class_label):
    local_df[4] = local_df[4].apply(lambda x: 1 if x==class_label else -1)
    X = np.array(local_df.iloc[:, 0 : 3].values)
    y = np.array(local_df.iloc[:, 4].values)
    test_classifier(X, y)

Inicio de la ejecución, a continuación.

In [112]:
is_of_class(df.copy(), 'Iris-setosa')

¡Neuron has been trainned!
¡Neuron has been trainned!
Perceptron accuracy:  1.0
ADAline accuracy:  0.6470588235294118




In [113]:
is_of_class(df.copy(), 'Iris-versicolor')

¡Neuron has been trainned!
¡Neuron has been trainned!
Perceptron accuracy:  0.5882352941176471
ADAline accuracy:  0.5882352941176471




In [114]:
is_of_class(df.copy(), 'Iris-virginica')

¡Neuron has been trainned!
¡Neuron has been trainned!
Perceptron accuracy:  0.8823529411764706
ADAline accuracy:  0.7647058823529411




#**CONCLUSIONES**

Al implementar las compuertas lógicas *AND* y *OR*; cuando comparamos los pesos con los datos de la clase 1, para *Perceptrón* y *ADAline*, vemos que los pesos de *ADAline* tienden a converger a un valor fijo más rápido que los pesos de *Perceptron*: lógicamente, teniendo en cuenta que *ADAline* emplea Gradiente Descendente para la actualización de los pesos. 

Sin embargo, las pruebas posteriores con el dataset *iris* nos muestran que *Perceptron* es parcialmente "más preciso" que *ADAline*. Esto último sugiere que no se trata de la velocidad con la que los pesos convergen, si no de lo "ajustado" del valor al cual convergen. Recordemos que existen infinitas lineas que pueden ser *frontera de decisión*, pero algunas se ajustan mejor para soportar nuevos datos: unas podrián estar haciendo *Overfiting*, mientras que otras podrían estar "balanceando" mejor sus parámetros.