<div style="color:#3c4d5a; border-top: 7px solid #42A5F5; border-bottom: 7px solid #42A5F5; padding: 5px; text-align: center; text-transform: uppercase"><h1>Implementación desde Cero de una Red Neuronal para la Función XOR de 4 Entradas con Capa de 8 Neuronas</h1> </div>

# **Red Neuronal desde Cero para Función XOR de 4 Entradas con Capa de 8 Neuronas**

**Desarrollado por:** Michael Israel Lata Zambrano , John Michael Franco Naulaguari  

**Correo:** mlataz@est.ups.edu.ec, jfrancon@est.ups.edu.ec

---

## **Estructura de la práctica**

1. **Introducción**
   - Descripción del problema XOR.
   - Objetivo: resolver el XOR de 4 bits con red neuronal desde cero usando NumPy.

2. **Fundamentos teóricos**
   - Red neuronal feedforward.
   - Limitación del perceptrón simple frente al XOR.
   - Arquitectura: 4-8-1 con activación sigmoide.

3. **Dataset**
   - Combinaciones binarias de 4 bits.
   - Etiquetado XOR (1 si número de unos es impar, 0 si es par).

4. **Implementación**
   - Inicialización de pesos.
   - Función sigmoide y su derivada.
   - Entrenamiento: forward, backpropagation, actualización.

5. **Evaluación**
   - Predicciones y comparación con valores reales.
   - Visualización en tabla de resultados.

6. **Conclusiones**
   - Resolución exitosa del problema XOR.
   - Demostración de capacidad de redes multicapa.
   - Sugerencias de mejora futura.

7. **Referencias**
   - Fuentes en formato APA.



### 1. **Introducción**
La función XOR (o “exclusive OR”) es un problema clásico en el estudio de redes neuronales. A diferencia de funciones lógicas lineales como AND o OR, la función XOR **no es linealmente separable**, lo que significa que no puede resolverse con un perceptrón simple. Este problema fue históricamente importante porque demostró la necesidad de redes neuronales con **capas ocultas** para resolver problemas complejos.

En este proyecto, se implementa una red neuronal **desde cero** utilizando únicamente la biblioteca NumPy. El objetivo es que la red aprenda a predecir correctamente la salida de una función XOR de **4 entradas**, utilizando una **capa de 8 neuronas** y una **neurona de salida**. Esta implementación incluye el proceso completo de entrenamiento: propagación hacia adelante, retropropagación del error y ajuste de pesos.


### 2. **Fundamentos teóricos**

#### ¿Qué es una red neuronal?
Una red neuronal artificial es un modelo computacional inspirado en el cerebro humano. Está compuesta por capas de nodos (neuronas) que transforman entradas en salidas mediante funciones de activación y pesos ajustables.

#### Arquitectura utilizada:
- **Capa de entrada**: 4 neuronas (una por cada bit de entrada).
- **Capa**: 8 neuronas con función de activación sigmoide.
- **Capa de salida**: 1 neurona que predice si la suma de los unos es impar (1) o par (0).

#### ¿Por qué XOR?
La función XOR devuelve 1 si el número de unos en la entrada es impar, y 0 si es par. Es un problema no lineal, lo que lo convierte en un excelente caso de estudio para redes neuronales multicapa.


### 3. **Preparación del dataset**
- Se importan las librerías necesarias: `numpy` para cálculos numéricos y `pandas` para mostrar resultados en formato de tabla.
- Se define `X` como un conjunto de entradas binarias de 4 bits. Son todas las combinaciones posibles de 0s y 1s para 4 dígitos (16 combinaciones en total).
- La salida `y` representa si el número de unos en cada combinación es **impar (1)** o **par (0)**. Esta es una tarea de clasificación binaria.


In [1]:
import numpy as np
import pandas as pd


In [2]:
# Entradas: combinaciones binarias de 4 bits
X = np.array([[0,0,0,0],
              [0,0,0,1],
              [0,0,1,0],
              [0,0,1,1],
              [0,1,0,0],
              [0,1,0,1],
              [0,1,1,0],
              [0,1,1,1],
              [1,0,0,0],
              [1,0,0,1],
              [1,0,1,0],
              [1,0,1,1],
              [1,1,0,0],
              [1,1,0,1],
              [1,1,1,0],
              [1,1,1,1]])

# Salidas: 1 si la suma de los unos es impar, 0 si es par
y = np.array([[0],
              [1],
              [1],
              [0],
              [1],
              [0],
              [0],
              [1],
              [1],
              [0],
              [0],
              [1],
              [0],
              [1],
              [1],
              [0]])


## 4. Implementación de la red neuronal

### Funciones auxiliares

- `sigmoid(z)`: función de activación que transforma los valores entre 0 y 1, útil para clasificación binaria.
- `derivada(fz)`: es la derivada de la sigmoide, utilizada durante el proceso de retropropagación para ajustar los pesos de manera eficiente.




In [3]:
def sigmoid(z):
    """Función sigmoide: aplana valores entre 0 y 1"""
    return 1 / (1 + np.exp(-z))

def derivada(fz):
    """Derivada de la sigmoide: usada para retropropagación"""
    return fz * (1 - fz)


### Inicialización

- Se establece una semilla aleatoria con `np.random.seed(1)` para asegurar que los resultados sean reproducibles.
- `syn0`: matriz de pesos entre la capa de entrada (4 neuronas) y la capa oculta (8 neuronas). Se inicializa con valores aleatorios.
- `syn1`: matriz de pesos entre la capa oculta (8 neuronas) y la capa de salida (1 neurona). También se inicializa con valores aleatorios.




In [4]:
np.random.seed(1)  # Semilla para reproducibilidad

# Pesos entre capa de entrada (4) y capa oculta (8)
syn0 = np.random.random((4, 8))

# Pesos entre capa oculta (8) y capa de salida (1)
syn1 = np.random.random((8, 1))


In [5]:
print(syn0)
print(syn1)

[[4.17022005e-01 7.20324493e-01 1.14374817e-04 3.02332573e-01
  1.46755891e-01 9.23385948e-02 1.86260211e-01 3.45560727e-01]
 [3.96767474e-01 5.38816734e-01 4.19194514e-01 6.85219500e-01
  2.04452250e-01 8.78117436e-01 2.73875932e-02 6.70467510e-01]
 [4.17304802e-01 5.58689828e-01 1.40386939e-01 1.98101489e-01
  8.00744569e-01 9.68261576e-01 3.13424178e-01 6.92322616e-01]
 [8.76389152e-01 8.94606664e-01 8.50442114e-02 3.90547832e-02
  1.69830420e-01 8.78142503e-01 9.83468338e-02 4.21107625e-01]]
[[0.95788953]
 [0.53316528]
 [0.69187711]
 [0.31551563]
 [0.68650093]
 [0.83462567]
 [0.01828828]
 [0.75014431]]


### Entrenamiento

- El entrenamiento se realiza durante 100,000 iteraciones (épocas).
- En cada iteración se realiza lo siguiente:
#### Propagación hacia adelante (forward propagation)

- `l0`: capa de entrada (`X`).
- `l1`: resultado de aplicar la sigmoide a la combinación lineal de entradas y pesos `syn0`. Es la salida de la capa oculta.
- `l2`: salida final de la red, calculada aplicando la sigmoide a la salida de la capa oculta multiplicada por los pesos `syn1`.

#### Cálculo del error

- `l2_error`: diferencia entre la salida real `y` y la salida predicha `l2`.

#### Retropropagación (backpropagation)

- `l2_delta`: error de la salida ajustado por la derivada de la sigmoide. Indica cuánto y en qué dirección ajustar los pesos de salida.
- `l1_error`: propagación del error hacia la capa oculta.
- `l1_delta`: error de la capa oculta ajustado por la derivada de la sigmoide.

#### Actualización de pesos

- `syn1` se actualiza sumando el producto de la transpuesta de `l1` con `l2_delta`.
- `syn0` se actualiza sumando el producto de la transpuesta de `l0` con `l1_delta`.

In [6]:
for j in range(100000):  # Número de épocas
    # Forward propagation
    l0 = X
    l1 = sigmoid(np.dot(l0, syn0))  # Capa oculta
    l2 = sigmoid(np.dot(l1, syn1))  # Capa de salida (predicción)

    # Cálculo del error
    l2_error = y - l2

    # Backpropagation
    l2_delta = l2_error * derivada(l2)
    l1_error = l2_delta.dot(syn1.T)
    l1_delta = l1_error * derivada(l1)

    # Actualización de pesos
    syn1 += l1.T.dot(l2_delta)
    syn0 += l0.T.dot(l1_delta)


### 5. **Evaluación del modelo**
- Se calcula la predicción final (`y_pred`) convirtiendo las salidas continuas de `l2` en clases binarias: 1 si ≥ 0.5, de lo contrario 0.
- Se crea un `DataFrame` con las columnas de entrada (`X1`, `X2`, `X3`, `X4`), la salida real (`Real`) y la predicción del modelo (`Predicción`).
- Finalmente, se imprimen los resultados para analizar el rendimiento del modelo.

In [7]:
# Clasificación binaria: 1 si >= 0.5, si no 0
y_pred = (l2 >= 0.5).astype("int32").flatten()
y_real = y.flatten()


In [14]:
# Crear DataFrame con entradas, salidas reales y predicciones
df = pd.DataFrame(X, columns=['X1', 'X2', 'X3', 'X4'])
df['Real'] = y_real
df['Predicción'] = y_pred

df_syn0 = pd.DataFrame(syn0, index=['X1', 'X2', 'X3', 'X4'], columns=[f'H{i+1}' for i in range(8)])

# Tabla de pesos capa 2
df_syn1 = pd.DataFrame(syn1, index=[f'H{i+1}' for i in range(8)], columns=['Salida'])

# Mostrar todo
print("Pesos capa 1 (input → hidden):")
print(df_syn0, end="\n\n")

print("Pesos capa 2 (hidden → output):")
print(df_syn1, end="\n\n")

print("Tabla de predicciones:")
print(df.head(16))

Pesos capa 1 (input → hidden):
          H1        H2        H3        H4        H5        H6        H7  \
X1  8.486319 -5.688182  5.086732 -4.737871 -4.826451 -8.098227 -3.692938   
X2 -0.203379  8.314844  2.779455  4.131548 -6.681350  6.576891 -0.765632   
X3 -3.483455 -3.998381 -7.062802 -6.606678  9.074959  6.841516  5.489078   
X4 -0.815659  8.174979 -6.994430 -2.105000 -6.242700  6.898812  5.141640   

          H8  
X1 -5.423394  
X2  7.259981  
X3  7.292005  
X4 -2.998088  

Pesos capa 2 (hidden → output):
       Salida
H1 -11.104165
H2 -12.395743
H3  16.815860
H4 -10.040266
H5 -11.924380
H6  22.352846
H7   0.719628
H8  -5.122922

Tabla de predicciones:
    X1  X2  X3  X4  Real  Predicción
0    0   0   0   0     0           0
1    0   0   0   1     1           1
2    0   0   1   0     1           1
3    0   0   1   1     0           0
4    0   1   0   0     1           1
5    0   1   0   1     0           0
6    0   1   1   0     0           0
7    0   1   1   1     1          

### 6. **Conclusiones**

- La red neuronal implementada fue capaz de **aprender correctamente** la lógica XOR de 4 entradas.
- Se demostró que una red con **una sola capa oculta** y una función de activación no lineal (sigmoide) puede resolver problemas no lineales.
- La implementación desde cero permitió comprender en profundidad el funcionamiento interno de una red neuronal, incluyendo:
  - Inicialización de pesos.
  - Propagación hacia adelante.
  - Retropropagación del error.
  - Ajuste de pesos mediante descenso de gradiente.
- Este ejercicio refuerza la importancia de las **capas ocultas** y la **no linealidad** en el aprendizaje profundo.

---

### 7. **Referencias**

- Goodfellow, I., Bengio, Y., & Courville, A. (2016). *Deep Learning*. MIT Press.
- Blog de referencia: http://tecdig2013g7.blogspot.com/2013/03/http2bpblogspotcom-dlcdju.html
- Documentación oficial de NumPy: https://numpy.org/doc/
- Documentación oficial de Pandas: https://pandas.pydata.org/docs/
