<a href="https://colab.research.google.com/github/jserrataylor/cursoAI/blob/main/Neurona_Simple_Perceptron.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Perceptrón

## **El Perceptrón: Una Introducción a las Redes Neuronales Artificiales**

El perceptrón, creado en 1957 por Frank Rosenblatt, es un modelo fundamental en el aprendizaje automático y un bloque básico en las redes neuronales artificiales. Este algoritmo simple para el aprendizaje supervisado de clasificadores binarios marca el inicio en el estudio de la inteligencia artificial, jugando un papel crucial en la comprensión de conceptos más avanzados.

![Grafica](https://miro.medium.com/v2/resize:fit:600/format:webp/0*k6nvli_G-bz3J2zB.jpg)

## **Comparación con la Neurona Biológica**

El perceptrón se asemeja a una neurona biológica en su estructura y función:

- **Estructura:**
  - Neurona Biológica: Compuesta por dendritas, cuerpo celular y axón.
  - Perceptrón: Incluye entradas (similares a dendritas), pesos (eficacia sináptica), función de suma (integración de señales) y función de activación (generación de potencial de acción).

- **Procesamiento de Información:**
  - Neurona Biológica: Suma analógica de señales y generación de potencial de acción.
  - Perceptrón: Suma ponderada de entradas y aplicación de una función de activación.

- **Aprendizaje:**
  - Neurona Biológica: Ajuste de conexiones sinápticas (plasticidad sináptica).
  - Perceptrón: Ajuste de pesos según un algoritmo de aprendizaje para minimizar errores.

- **Función y Limitaciones:**
  - Neurona Biológica: Funciones variadas en un sistema biológico complejo.
  - Perceptrón: Clasificación y predicción simples; limitado a problemas linealmente separables sin redes más complejas.

![Gráfica](https://d2f0ora2gkri0g.cloudfront.net/dd/db/dddb807b-a15b-457d-a21a-8a9e6f029a3e.png)

A pesar de sus diferencias, el perceptrón sigue siendo una herramienta poderosa, inspirada por la eficiencia y capacidad de procesamiento de las neuronas biológicas.

## **Representación Esquemática del Perceptrón**

Una representación típica del perceptrón incluye nodos de entrada, pesos, un sumador y una función de activación. Estas partes simulan el proceso de recepción, ponderación y procesamiento de señales en la neurona artificial.

![Gráfica](https://www.alexisalulema.com/wp-content/uploads/2022/09/image-2-1536x808.png)

## **Características Clave del Perceptrón**

1. **Estructura Básica**: Entradas múltiples con pesos ajustables, suma ponderada y función de activación binaria.

- **Nodos de entrada (x1, x2, x3, ..., xm)**: Estos círculos amarillos representan las neuronas de entrada, que reciben las señales a procesar. En este caso, hay m entradas, lo que sugiere que el perceptrón puede procesar m características diferentes.
- **Pesos (w1, w2, w3, ..., wm)**: Los círculos color salmón a la derecha de las entradas representan los pesos asignados a cada señal de entrada. Estos pesos son los factores que se ajustan durante el proceso de aprendizaje de la red neuronal y determinan la importancia de cada entrada en la salida del perceptrón.
- **Sumatoria (Σ)**: El círculo grande azul en el centro es el sumador. Su función es multiplicar cada entrada (xi) por su peso correspondiente (wi) y sumar todos estos productos. Esto se conoce como la suma ponderada de las entradas.
- **Función de activación**: El cuadro rojo en el extremo derecho representa la función de activación que se aplica a la suma ponderada de las entradas. La línea negra dentro del cuadro rojo es un gráfico de una función escalón, que es una función de activación común en los perceptrones. Esta función convierte la suma ponderada en una salida binaria, generalmente 0 o 1, que se utiliza para la clasificación.

2. **Proceso de Aprendizaje**: Entrenamiento con ejemplos y ajuste de pesos mediante la regla de aprendizaje del perceptrón.

3. **Limitaciones**: Solo clasifica datos linealmente separables y no resuelve problemas no lineales.
4. **Evolución y Uso**: Fundamento para redes neuronales más complejas y diversas aplicaciones en inteligencia artificial.

## **Referencias**

Sgantzos, K., Grigg, I., & Al Hemairy, M. (2022). Multiple Neighborhood Cellular Automata as a Mechanism for Creating an AGI on a Blockchain. Journal of Risk and Financial Management, 15(8). https://doi.org/10.3390/jrfm15080360

### **[Demostración del entrenamiento de un Perceptrón en una Hoja de Cálculo de Google Sheets](https://docs.google.com/spreadsheets/d/1tSarA8ixoJvTtZiYbjf9D8QtuRNind-Ei3mVr6Xz-1w/edit#gid=0)**


![Imagen Demostración de un **Perceptrón** en una Hoja de Cálculo](https://files.oaiusercontent.com/file-lWJ7Quv4trk2RCQldqCnCkze?se=2023-12-05T20%3A37%3A52Z&sp=r&sv=2021-08-06&sr=b&rscc=max-age%3D3599%2C%20immutable&rscd=attachment%3B%20filename%3Dimage.png&sig=3q9td8OgtLTLl3snvS3n7GPOw4oU9xAE%2Bx7xjAIzKk4%3D)


### Forward Pass en el Perceptrón:

1. **Calculo de la Suma Ponderada**: En cada época, para cada conjunto de entradas $ X_1 $ y $ X_2 $, calculas la suma ponderada. Esta suma es la combinación lineal de las entradas y sus respectivos pesos más el sesgo:
   $ Suma = X_1 \cdot W1 + X_2 \cdot W2 + Sesgo \cdot W0 $

2. **Aplicación de la Función de Activación**: Usas la función escalón para obtener el output $ F(X) $:

  **1**  si la Suma >= 0
  
  **0**  si la Suma < 0

  Esto convierte la salida del perceptrón en un valor binario (1 o 0).

### Backward Pass en el Perceptrón:

1. **Cálculo del Error**: Comparas la salida $ F(X) $ con la salida deseada (lo que quieres). El error es la diferencia entre estos dos valores.

2. **Ajuste de los Pesos**: Basándote en este error, ajustas los pesos $ W0, W1, W2 $. Los cambios propuestos en los pesos $ Cambio W0, Cambio W1, Cambio W2 $ se calculan en función de este error y se aplican para mejorar la precisión del modelo en la próxima iteración. El ajuste se hace generalmente usando una regla de aprendizaje simple como la Regla de Aprendizaje del Perceptrón.

   Por ejemplo, el ajuste del peso podría ser algo así:
   $ W_{nuevo} = W_{viejo} + (Coef. Aprendizaje \times Error \times Entrada)$

### Características del Perceptrón con Función de Activación Escalón:

- **Modelo Linealmente Separable**: El perceptrón con función de activación escalón es efectivo solo si los datos son linealmente separables, ya que produce una frontera de decisión lineal.

- **Actualizaciones de Peso Binarias**: Debido a la naturaleza de la función escalón, los ajustes de peso son binarios, basados en si hay un error o no, lo cual es diferente de modelos que usan funciones de activación como la Sigmoid o ReLU, donde los ajustes son más graduales.


Este perceptrón realiza tanto un forward pass como un backward pass en cada iteración o época, utilizando la función de activación escalón para generar predicciones binarias y ajustando los pesos en función del error observado.

## Propagación hacia Adelante (Forward Pass) y Retropropagación (Backward Pass)

Para entender el forward y backward pass en el contexto de tu tabla, primero definamos qué representa cada columna:

- **Sesgo (Sesgo)**: Valor constante añadido a la suma de las entradas y los pesos. Normalmente es 1.
- **X1, X2**: Entradas de la red.
- **W0, W1, W2**: Pesos asociados a cada entrada y al sesgo.
- **Suma**: Sumatoria de las entradas multiplicadas por sus respectivos pesos más el sesgo.
- **F(X)**: Función de activación aplicada a la suma.
- **Lo Que Queremos**: El valor deseado o etiqueta real para la entrada dada.
- **Cambio W0, Cambio W1, Cambio W2**: Ajustes que se deben realizar en los pesos.
- **Coef. Aprendizaje**: Tasa de aprendizaje utilizada para ajustar los pesos.

### Forward Pass (Propagación hacia Adelante)

El forward pass involucra calcular la salida de la red basada en las entradas actuales y los pesos. Para cada fila de tu tabla:

1. **Calcula la Suma**: Multiplica cada entrada por su peso correspondiente y súmalos junto con el sesgo.
   - Por ejemplo, para la primera fila: $ Suma = 41 \times W0 + 0 \times W1 + 0 \times W2 + Sesgo \times 1 $

2. **Aplica la Función de Activación (F(X))**: Esto podría ser una Sigmoid, ReLU, etc. En tu tabla, parece que se utiliza una función de activación que devuelve 1 siempre, lo que es inusual.

3. **Compara con lo Que Queremos**: Esto sería el valor esperado o la etiqueta real para la entrada dada.

### Backward Pass (Retropropagación)

El backward pass ajusta los pesos basándose en el error (la diferencia entre la salida actual y la deseada).

1. **Calcula el Error**: La diferencia entre "Lo Que Queremos" y "F(X)".

2. **Ajusta los Pesos (Cambio W0, W1, W2)**: Se utiliza el gradiente del error con respecto a cada peso. Este cálculo depende de la función de pérdida y de la función de activación.
   - Por ejemplo, para W0 en la primera fila, el ajuste sería: $ W0_{nuevo} = W0_{viejo} - Coef. Aprendizaje \times Cambio W0 $.

3. **Actualiza los Pesos**: Aplica los ajustes a los pesos para la siguiente época.

En tu tabla, cada fila representa una instancia de entrenamiento en una época. Los "Cambios W0, W1, W2" parecen ser los gradientes calculados para ajustar los pesos, y el "Coef. Aprendizaje" es la tasa a la cual se aplican estos ajustes.

Por último, tu tabla parece representar un aprendizaje muy simplificado y específico para un tipo particular de red neuronal, posiblemente una red con una sola neurona sin capas ocultas, dado que la función de activación siempre devuelve 1. En escenarios de aprendizaje profundo más complejos, estos procesos involucran cálculos más avanzados y se manejan de manera automatizada por bibliotecas especializadas como TensorFlow o PyTorch.

## **Ejercicios demostrativo del entrenamiento de un Perceptrón**

In [None]:
class SimpleNeuron:

    def __init__(self, learning_rate, initial_weights):
        """
        Inicializa la neurona con una tasa de aprendizaje y pesos iniciales.
        """
        self.learning_rate = learning_rate
        self.weights = initial_weights

    def activate(self, weighted_sum):
        """
        Función de activación: devuelve 1 si la suma ponderada es positiva y 0 en caso contrario.
        """
        return 1 if weighted_sum > 0 else 0

    def predict(self, inputs):
        """
        Realiza una predicción basada en las entradas y los pesos actuales.
        """
        weighted_sum = sum([i*w for i, w in zip(inputs, self.weights)])
        return self.activate(weighted_sum)

    def train(self, inputs, desired_output):
        """
        Entrena la neurona ajustando los pesos basados en el error entre la salida deseada y la predicción.
        """
        prediction = self.predict(inputs)
        error = desired_output - prediction
        self.weights = [w + self.learning_rate * error * i for w, i in zip(self.weights, inputs)]
        return error, self.weights

# Datos iniciales
initial_weights = [1.0, 1.0, 1.0]
learning_rate = 0.5
inputs_outputs = [
    ([1, 0, 0], 0),
    ([1, 1, 0], 0),
    ([1, 0, 1], 0),
    ([1, 1, 1], 1)
]

# Crear una neurona
neuron = SimpleNeuron(learning_rate, initial_weights)

# Simular la evolución de la neurona durante varias épocas
epochs = 6
for epoch in range(epochs):
    print(f"Época {epoch + 1}:")
    for inputs, desired_output in inputs_outputs:
        error, new_weights = neuron.train(inputs, desired_output)
        print(f"Entrada: {inputs[1:]} -> Pesos: {new_weights} -> Error: {error}")
    print("------")


Época 1:
Entrada: [0, 0] -> Pesos: [0.5, 1.0, 1.0] -> Error: -1
Entrada: [1, 0] -> Pesos: [0.0, 0.5, 1.0] -> Error: -1
Entrada: [0, 1] -> Pesos: [-0.5, 0.5, 0.5] -> Error: -1
Entrada: [1, 1] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
------
Época 2:
Entrada: [0, 0] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
Entrada: [1, 0] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
Entrada: [0, 1] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
Entrada: [1, 1] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
------
Época 3:
Entrada: [0, 0] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
Entrada: [1, 0] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
Entrada: [0, 1] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
Entrada: [1, 1] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
------
Época 4:
Entrada: [0, 0] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
Entrada: [1, 0] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
Entrada: [0, 1] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
Entrada: [1, 1] -> Pesos: [-0.5, 0.5, 0.5] -> Error: 0
------
Época 5:
Entrada: [0, 0] -> Pesos: [-0.5, 0.5, 0.5] -> 

In [None]:
import numpy as np

# Definir la tasa de aprendizaje
learning_rate = 0.5

# Inicializar los pesos, por ejemplo, a 1
weights = np.array([1.0, 1.0, 1.0])  # W0 es el sesgo, W1 y W2 son los pesos

# Definir la función de activación, usaremos una función escalón
def activation_function(x):
    return 1 if x >= 0 else 0

# Función para el entrenamiento del perceptrón
def train_perceptron(inputs, targets, epochs):
    global weights
    for epoch in range(epochs):
        epoch_errors = []
        for input, target in zip(inputs, targets):
            # Calcula la suma ponderada
            weighted_sum = np.dot(input, weights[1:]) + weights[0]  # W0 es el sesgo
            # Calcula la salida de la función de activación
            output = activation_function(weighted_sum)
            # Calcula el error
            error = target - output
            epoch_errors.append(error)
            # Actualiza los pesos y el sesgo
            weights[1:] += learning_rate * error * input
            weights[0] += learning_rate * error
        # Imprimir la información de la época
        epoch_accuracy = (np.array(epoch_errors) == 0).mean()
        print(f'Época {epoch+1} - Error: {np.sum(np.abs(epoch_errors))}, Precisión: {epoch_accuracy}')
        # Almacenar métricas de la época
        epoch_metrics.append((epoch+1, np.sum(np.abs(epoch_errors)), epoch_accuracy))

    return epoch_metrics

# Datos de entrenamiento
inputs = np.array([
    # X1, X2
    [0, 0],
    [1, 0],
    [0, 1],
    [1, 1],
])

# Etiquetas objetivo (Lo que queremos [1])
targets = np.array([0, 0, 0, 1])

# Lista para almacenar las métricas de cada época
epoch_metrics = []

# Entrenar el perceptrón
metrics = train_perceptron(inputs, targets, epochs=6)

# Imprimir los pesos finales y las métricas de cada época
weights, metrics


Época 1 - Error: 3, Precisión: 0.25
Época 2 - Error: 2, Precisión: 0.5
Época 3 - Error: 3, Precisión: 0.25
Época 4 - Error: 2, Precisión: 0.5
Época 5 - Error: 1, Precisión: 0.75
Época 6 - Error: 0, Precisión: 1.0


(array([-1.5,  0.5,  1. ]),
 [(1, 3, 0.25),
  (2, 2, 0.5),
  (3, 3, 0.25),
  (4, 2, 0.5),
  (5, 1, 0.75),
  (6, 0, 1.0)])

## **Red Neuronal**

![Gráfica](https://i0.wp.com/unaaldia.hispasec.com/wp-content/uploads/2021/07/nn-architecture.png?w=510&ssl=1)


![Grafica](https://www.researchgate.net/profile/Juan-Vasquez-Gomez/publication/334974413/figure/fig4/AS:788645715922947@1565039199504/Figura-29-Ejemplo-de-una-red-neuronal-convolucional-para-clasificacion-Goodfellow-et.ppm)