<a href="https://colab.research.google.com/github/EAFIT-BI/Business-Analytics---2025-I/blob/main/Perceptr%C3%B3n_y_ADALINE.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Perceptrón

Es la undidad más pequeña de una red neuronal. Usa una función de activación de tipo escalón. Un perceptrón de varias capas se llama MLP. El perceptrón en su forma más sencilla sólo es capaz de clasificar observaciones que sean linealmente separables.
En este caso, y a modo de ejemplo, usaremos una clasificación de un  monto contable. Clasificaremos las transacciones entre *Gastos* (0) e *Ingresos* (1), así

|Monto|Tipo|
|---|---|
|500|1|
|300|1|
|-200|0|
|-1500|0|

In [1]:
# Probaremos la implementación con Keras
# Cargamos librerías
import numpy as np
import tensorflow as tf
from tensorflow import keras

In [2]:
# Como tenemos tan pocos datos, haremos todas la implementación
# con un solo conjunto, sin embargo es importante resaltar
# que se debe hacer la partición train|test o train|dev|test

# Generamos el conjunto de datos tanto para la X como para la y
monto = np.array([[500], [300], [-200], [-1500]], dtype = np.float32) # Montos
tipo = np.array([[1], [1], [0], [0]], dtype = np.float32) # Ingresos o gastos (clase)

In [3]:
# Instanciamos nuestro modelo de perceptrón.
# units es el número de neuronas. El perceptrón en su forma
# básica solo tiene 1. La función de activación debe ser un escalón
# pero keras no la tiene. Usaremos la función mas parecida que es
# un sigmoide
modelo = keras.Sequential()
# Agregamos una capa de una neurona a la red.
modelo.add(keras.layers.Dense(units=1, activation='sigmoid'))

In [4]:
# Compilamos el modelo. En este paso, se determina el
# optimizador, la función de pérdida y la métrica.
# En este caso, tendremos como optimizador gradiente descendente
# estocástico, como función de pérdida la crossentropía binaria
# y como métrica el desempeño (accuracy)
modelo.compile(optimizer='sgd', loss='binary_crossentropy',
               metrics=['accuracy'])

In [5]:
# Entrenamos el modelo. Una época significa entrenar la
# red neuronal con todos los datos de entrada una vez. Un
# pase hacia adelante para el cálculo de la salida y un pase
# hacia atrás para calcular el error.
# A veces las épocas se componen por lotes, esta es otra
# estrategia para entrenar el modelo (batch)
modelo.fit(monto, tipo, epochs=10)

Epoch 1/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 653ms/step - accuracy: 1.0000 - loss: 0.0000e+00
Epoch 2/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 44ms/step - accuracy: 1.0000 - loss: 0.0000e+00
Epoch 3/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 59ms/step - accuracy: 1.0000 - loss: 0.0000e+00
Epoch 4/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 47ms/step - accuracy: 1.0000 - loss: 0.0000e+00
Epoch 5/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 139ms/step - accuracy: 1.0000 - loss: 0.0000e+00
Epoch 6/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 57ms/step - accuracy: 1.0000 - loss: 0.0000e+00
Epoch 7/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 59ms/step - accuracy: 1.0000 - loss: 0.0000e+00
Epoch 8/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 58ms/step - accuracy: 1.0000 - loss: 0.0000e+00
Epoch 9/10
[1m1/1[0m [32m━━

<keras.src.callbacks.history.History at 0x7a0917243bd0>

In [10]:
# Ahora calcularemos la métrica de desempeño
pred = modelo.predict(monto)
# Para corregir el no uso del escalo, tenemos que umbralizar
pred_clases = (pred >= 0.5).astype(int) # Fijamos un umbral de 0.5
# Imprimimos las clases
print(pred_clases)

# Calculamos el accuracy
# Comparamos la predicción con el valor verdadero del tipo
accuracy = np.mean(pred_clases.flatten() == tipo.flatten())
print(f'Accuracy: {accuracy}')


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 78ms/step
[[1]
 [1]
 [0]
 [0]]
Accuracy: 1.0


# ADALINE (ADAptive LInear NEuron)

ADALINE es similar al perceptrón, pero en lugar de usar una función de activación escalón, usa una función de activación lineal y minimiza el error cuadrático medio. Esto lo hace más adecuado para problemas de regresión y clasificación pero con gradiente descendente.

Para este caso, crearemos un conjunto de datos relacionado con la aprobación de créditos. Las características serán:
- Ingresos mensuales (en miles de dólares)
- Deuda actual (en miles de dólares)

|Ingresos|Deuda|Aprobado|
|---|---|---|
|5|2.0|1|
|3|1.5|0|
|4|1.0|1|
|2|2.5|0|
|6|1.2|1|
|3.5|2.2|0|

In [12]:
# Cargamos librerías y definimos los datos

import numpy as np
import tensorflow as tf
from tensorflow import keras

# Generamos el conjunto de datos tanto para la X como para la y
X = np.array([
      [5, 2.0],
      [3, 1.5],
      [4, 1.0],
      [2, 2.5],
      [6, 1.2],
      [3.5, 2.2]], dtype = np.float32)

y = np.array([1, 0, 1, 0, 1, 0], dtype = np.float32)


In [13]:
# Instanciamos el modelo
modelo_adaline = keras.Sequential()
# Agregamos una capa de una neurona a la red.
modelo_adaline.add(keras.layers.Dense(units=1, activation='linear'))

In [14]:
# Compilamos el modelo
modelo_adaline.compile(optimizer='sgd', loss='mean_squared_error',
                       metrics = ['mean_squared_error'])

In [15]:
# Entrenamos el modelo.
# Al establecer el parámetro 'verbose' determinamos qué tanto
# mensajes del entrenamiento queremos ver
modelo_adaline.fit(X, y, epochs=10, verbose=1)

Epoch 1/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 539ms/step - loss: 5.3992 - mean_squared_error: 5.3992
Epoch 2/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 56ms/step - loss: 2.0333 - mean_squared_error: 2.0333
Epoch 3/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 46ms/step - loss: 0.8581 - mean_squared_error: 0.8581
Epoch 4/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 45ms/step - loss: 0.4455 - mean_squared_error: 0.4455
Epoch 5/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 61ms/step - loss: 0.2986 - mean_squared_error: 0.2986
Epoch 6/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 76ms/step - loss: 0.2443 - mean_squared_error: 0.2443
Epoch 7/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 135ms/step - loss: 0.2223 - mean_squared_error: 0.2223
Epoch 8/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 81ms/step - loss: 0.2117 - mean_squa

<keras.src.callbacks.history.History at 0x7a09110f7d50>

In [16]:
# Revisamos la métrica de desempeño
mse = modelo_adaline.evaluate(X, y)
print(f'MSE: {mse}')

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 167ms/step - loss: 0.1955 - mean_squared_error: 0.1955
MSE: [0.195495143532753, 0.195495143532753]
