**Instituto Tecnológico de Costa Rica - TEC**

***Inteligencia Artificial***

*Docente: Kenneth Obando Rodríguez*

---
# Trabajo Corto 6: Red Neuronal
---
Estudiantes:
- Rolando Mora Cordero
- Esteban Guzmán

Link del Cuaderno (recuerde configurar el acceso a público):
- [Link de su respuesta](https://colab.research.google.com/drive/116PDV-WwkNgcNJaGoLzrAq2Roblf1m25?usp=sharing)

    **Nota:** Este trabajo tiene como objetivo promover la comprensión de la materia y su importancia en la elección de algoritmos. Los alumnos deben evitar copiar y pegar directamente información de fuentes externas, y en su lugar, demostrar su propio análisis y comprensión.

## Entrega
Debe entregar un archivo comprimido por el TecDigital, incluyendo un documento pdf con los resultados de los experimentos y pruebas. Fecha de Entrega domingo 10 de noviembre, 2024, a las 22:00 hrs.

## Actividad: Creación y Entrenamiento de una Red Neuronal desde Cero
Objetivo:

1. Comprender los fundamentos de las redes neuronales.
2. Implementar una red neuronal simple sin usar frameworks.
3. Entrenar la red neuronal para resolver un problema de clasificación.

### Descripción:

En esta actividad, los estudiantes implementarán una red neuronal simple con una capa oculta para clasificar datos. Se utilizará el lenguaje de programación Python y se evitarán frameworks de aprendizaje automático. La actividad se dividirá en los siguientes pasos:

In [1]:
import numpy as np

### Paso 1: Implementación de las funciones básicas

Función de activación: Implementar la función sigmoide como función de activación. En este caso implementa la función sigmoid

**Fórmula:**  σ(x) = 1 / (1 + exp(-x))

In [2]:
def sigmoid(x):
  return 1 / (1 + np.exp(-x))

2. **Derivada de la función de activación:** Implementar la derivada de la función sigmoide.

**Fórmula:** σ'(x) = σ(x) * (1 - σ(x))


In [3]:
def sigmoid_derivative(x):
  return sigmoid(x) * (1 - sigmoid(x))

**Paso 2: Inicialización de la red neuronal**

1. **Inicializar los pesos:**  Crear matrices de pesos aleatorios para las conexiones entre las capas de entrada, oculta y salida.
2. **Definir la arquitectura:** Establecer el número de neuronas en cada capa (entrada, oculta y salida).

In [5]:
# Inicializar pesos con valores aleatorios entre -1 y 1
def initialize_network(input_size, hidden_size, output_size):
  # matriz de tamaño (input_size, hidden_size) que contiene los pesos para las conexiones entre la capa de entrada y la capa oculta.
  input_hidden_weights = np.random.uniform(-1, 1, (input_size, hidden_size))
  #  matriz de tamaño (hidden_size, output_size) que contiene los pesos para las conexiones entre la capa oculta y la capa de salida.
  hidden_output_weights = np.random.uniform(-1, 1, (hidden_size, output_size))

  return input_hidden_weights, hidden_output_weights

**Paso 3: Propagación hacia adelante (Forward propagation)**

1. **Calcular la salida de la capa oculta:** Multiplicar las entradas por los pesos de la capa de entrada a la oculta y aplicar la función de activación.

**Fórmula:** hidden_output = σ(input * input_hidden_weights)

2. **Calcular la salida de la capa de salida:** Multiplicar la salida de la capa oculta por los pesos de la capa oculta a la salida y aplicar la función de activación.

   **Fórmula:** output = σ(hidden_output * hidden_output_weights)

In [28]:
def forward_propagation(inputs, input_hidden_weights, hidden_output_weights):
    # Calcula las entradas para la capa oculta multiplicando las entradas por los pesos de la capa de entrada a la capa oculta
    hidden_layer_input = np.dot(inputs, input_hidden_weights)
    
    # Aplica la función de activación sigmoide a las entradas de la capa oculta para obtener las salidas de esta capa
    hidden_layer_output = sigmoid(hidden_layer_input)

    # Calcula las entradas para la capa de salida multiplicando las salidas de la capa oculta por los pesos de la capa oculta a la capa de salida
    output_layer_input = np.dot(hidden_layer_output, hidden_output_weights)
    
    # Aplica la función de activación sigmoide a las entradas de la capa de salida para obtener las salidas finales de la red
    output_layer_output = sigmoid(output_layer_input)

    # Devuelve las salidas de la capa oculta y de la capa de salida (salida final de la red)
    return hidden_layer_output, output_layer_output

**Paso 4: Propagación hacia atrás (Backpropagation)**

1. **Calcular el error de la capa de salida:** Restar la salida deseada de la salida real.
2. **Calcular el error de la capa oculta:** Propagar el error de la capa de salida hacia atrás a través de los pesos y la derivada de la función de activación.
3. **Actualizar los pesos:** Ajustar los pesos de la red neuronal en función del error calculado.

   **Fórmula:**
      * hidden_output_weights += learning_rate * output_error * σ'(output) * hidden_output
      * input_hidden_weights += learning_rate * hidden_error * σ'(hidden_output) * input

In [29]:
def backpropagation(inputs, hidden_layer_output, output_layer_output, desired_output, input_hidden_weights, hidden_output_weights, learning_rate):
    # Calcular el error de la capa de salida como la diferencia entre la salida deseada y la salida de la red
    output_error = desired_output - output_layer_output
    
    # Calcular el delta de la capa de salida (gradiente) multiplicando el error por la derivada de la función sigmoide aplicada a la salida de la red
    output_delta = output_error * sigmoid_derivative(output_layer_output)

    # Calcular el error de la capa oculta propagando el delta de salida hacia atrás a través de los pesos de la capa oculta a la capa de salida
    hidden_error = np.dot(output_delta, hidden_output_weights.T)
    
    # Calcular el delta de la capa oculta multiplicando el error de la capa oculta por la derivada de la función sigmoide aplicada a la salida de la capa oculta
    hidden_delta = hidden_error * sigmoid_derivative(hidden_layer_output)

    # Asegurarse de que las dimensiones de las salidas y deltas de la capa oculta sean correctas para la multiplicación (transformarlas en vectores columna)
    hidden_layer_output = hidden_layer_output.reshape(-1, 1)
    output_delta = output_delta.reshape(-1, 1)

    # Actualizar los pesos de la capa oculta a la capa de salida utilizando la tasa de aprendizaje y el producto de la salida de la capa oculta con el delta de salida
    hidden_output_weights += learning_rate * np.dot(hidden_layer_output, output_delta.T)

    # Asegurarse de que las dimensiones de las entradas y deltas de la capa oculta sean correctas para la multiplicación (transformarlas en vectores columna)
    inputs = inputs.reshape(-1, 1)
    hidden_delta = hidden_delta.reshape(-1, 1)

    # Actualizar los pesos de la capa de entrada a la capa oculta utilizando la tasa de aprendizaje y el producto de las entradas con el delta de la capa oculta
    input_hidden_weights += learning_rate * np.dot(inputs, hidden_delta.T)

    # Retornar los pesos actualizados de ambas capas
    return input_hidden_weights, hidden_output_weights

**Paso 5: Preparación del conjunto de datos de ejemplo**

1. **Crear un conjunto de datos:**  Define un conjunto de datos de ejemplo para entrenar la red neuronal. Puedes usar un problema simple como la compuerta XOR.

In [30]:
# Datos de entrada para la compuerta XOR
inputs = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
# Salidas deseadas para la compuerta XOR
desired_outputs = np.array([[0], [1], [1], [0]])

**Paso 6: Entrenamiento de la red neuronal**

1. **Inicializar la red:** Define la arquitectura de la red (número de neuronas en cada capa) e inicializa los pesos.

In [31]:
# Inicializar la red
input_size = 2  # Dos entradas para la compuerta XOR
hidden_size = 3  # Tres neuronas en la capa oculta
output_size = 1  # Una salida para la compuerta XOR
learning_rate = 0.5  # Tasa de aprendizaje
epochs = 10000  # Número de épocas de entrenamiento

input_hidden_weights, hidden_output_weights = initialize_network(input_size, hidden_size, output_size)

2. **Iterar sobre el conjunto de datos de entrenamiento:** Presentar cada ejemplo de entrenamiento a la red neuronal y realizar la propagación hacia adelante y hacia atrás para ajustar los pesos. Repetir este proceso durante un número determinado de épocas. Reporta el error en cada epoch

In [32]:
# Iterar sobre el conjunto de datos de entrenamiento
for epoch in range(epochs):
    total_error = 0  # Inicializar el error total de cada época

    # Iterar sobre cada ejemplo de entrada en el conjunto de datos
    for i in range(len(inputs)):
        input_example = inputs[i]  # Obtener el ejemplo de entrada actual
        desired_output_example = desired_outputs[i]  # Obtener la salida deseada para el ejemplo actual

        # Paso de propagación hacia adelante para obtener las salidas de la capa oculta y la capa de salida
        hidden_layer_output, output_layer_output = forward_propagation(input_example, input_hidden_weights, hidden_output_weights)

        # Realizar retropropagación para ajustar los pesos de la red
        input_hidden_weights, hidden_output_weights = backpropagation(
            input_example, hidden_layer_output, output_layer_output, 
            desired_output_example, input_hidden_weights, hidden_output_weights, learning_rate
        )

        # Calcular el error cuadrático medio para este ejemplo de entrenamiento
        error = np.mean((desired_output_example - output_layer_output) ** 2)
        total_error += error  # Acumular el error para obtener el total de la época

    # Cada 1000 épocas, imprimir el error promedio de la época actual
    if epoch % 1000 == 0:
        print(f"Epoch {epoch}/{epochs}, Error: {total_error / len(inputs)}")

Epoch 0/10000, Error: 0.27461486832538934
Epoch 1000/10000, Error: 0.25323007939310815
Epoch 2000/10000, Error: 0.2504255228276692
Epoch 3000/10000, Error: 0.23699508752717988
Epoch 4000/10000, Error: 0.22378766747528553
Epoch 5000/10000, Error: 0.2145654938647764
Epoch 6000/10000, Error: 0.20624924069821549
Epoch 7000/10000, Error: 0.20112660386013323
Epoch 8000/10000, Error: 0.19833965111194432
Epoch 9000/10000, Error: 0.19650790385728217


**Paso 7: Evaluación de la red neuronal**

1. **Presentar nuevos datos a la red:**  Utiliza un conjunto de datos de prueba para evaluar el rendimiento de la red neuronal entrenada.

In [33]:
# Presentar nuevos datos a la red (usando los mismos datos de entrenamiento como ejemplo)
hidden_layer_output, test_outputs = forward_propagation(inputs, input_hidden_weights, hidden_output_weights)

# Imprimir las salidas de la red para los datos de prueba
print("Salidas de la red para los datos de prueba:")
print(test_outputs)

# Comparar las salidas de la red con las salidas deseadas
print("\nSalidas deseadas:")
print(desired_outputs)

Salidas de la red para los datos de prueba:
[[0.10470527]
 [0.49423583]
 [0.49395277]
 [0.5020758 ]]

Salidas deseadas:
[[0]
 [1]
 [1]
 [0]]
