
# Fundamentos de Redes Neuronales

Las **redes neuronales artificiales (ANNs)** son modelos inspirados en el cerebro humano. Son capaces de aprender representaciones complejas a partir de datos y se utilizan ampliamente en clasificación, regresión, visión por computador, procesamiento de lenguaje natural y más.

---

## Objetivos del notebook:

- Entender la estructura básica de una red neuronal.
- Explorar diferentes tipos de capas.
- Analizar funciones de activación y pérdida.
- Comprender el entrenamiento mediante propagación hacia atrás.
- Usar técnicas modernas como callbacks, normalización y regularización.



## 1. El Perceptrón

El **perceptrón** es la unidad más básica de una red neuronal:

\[
y = f(\sum_{i=1}^{n} w_i x_i + b)
\]

Donde:
- \( w_i \): pesos
- \( x_i \): entradas
- \( b \): sesgo
- \( f \): función de activación (ej. step, sigmoid, ReLU)

Un perceptrón puede clasificar datos linealmente separables.


In [None]:

import numpy as np

def step_function(x):
    return 1 if x >= 0 else 0

def perceptron(x, w, b):
    return step_function(np.dot(x, w) + b)

# Ejemplo
x = np.array([1, 0])
w = np.array([0.5, -0.6])
b = 0.1

perceptron(x, w, b)



## 2. Arquitectura de una Red Neuronal

Una red neuronal típica tiene:

- **Capa de entrada**: recibe las características.
- **Capas ocultas**: transformaciones intermedias.
- **Capa de salida**: produce la predicción final.

### Tipos de capas:

| Tipo              | Descripción                                  |
|-------------------|----------------------------------------------|
| Densa (Dense)     | Cada neurona conectada con todas las anteriores. |
| Convolucional     | Detecta patrones espaciales (visión).        |
| Recurrente        | Procesa secuencias (texto, series temporales).|
| Normalización     | Acelera el entrenamiento.                    |
| Dropout           | Previene sobreajuste.                        |



## 3. Funciones de Activación

### Comunes:

| Función    | Fórmula                            | Uso típico         |
|------------|------------------------------------|---------------------|
| Sigmoid    | \( \frac{1}{1 + e^{-x}} \)      | Clasificación binaria |
| ReLU       | \( \max(0, x) \)               | Capas ocultas       |
| Tanh       | \( \tanh(x) \)                 | Capas ocultas       |
| Softmax    | \( \frac{e^{x_i}}{\sum e^{x_j}} \) | Clasificación multiclase |

Las funciones de activación permiten introducir no linealidad en la red.



## 4. Función de Costo y Propagación hacia Atrás

La **función de pérdida** mide qué tan lejos están las predicciones de los valores reales.

### Ejemplos:

- MSE (regresión): \( \frac{1}{n}\sum (y_i - \hat{y}_i)^2 \)
- CCE (clasificación): \( -\sum y_i \log(\hat{y}_i) \)

El entrenamiento consiste en:
1. Propagación hacia adelante (forward pass).
2. Cálculo de pérdida.
3. **Retropropagación** (backpropagation) con gradiente descendente.



## 5. Implementación en Keras

Vamos a construir una red neuronal simple con `Keras`.


In [None]:

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.datasets import make_moons
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Datos
X, y = make_moons(n_samples=500, noise=0.2, random_state=42)
X = StandardScaler().fit_transform(X)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# Modelo
model = Sequential([
    Dense(16, activation='relu', input_shape=(2,)),
    Dense(16, activation='relu'),
    Dense(1, activation='sigmoid')
])

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=50, validation_data=(X_test, y_test), verbose=0)
print("Evaluación:", model.evaluate(X_test, y_test))



## 6. Callbacks y Mejores Prácticas

### Callbacks comunes:
- `EarlyStopping`: detiene el entrenamiento si no mejora.
- `ModelCheckpoint`: guarda el mejor modelo.
- `TensorBoard`: visualiza métricas.

### Otras técnicas:
- Regularización (L1/L2)
- Dropout
- Batch Normalization
- Aumento de datos (data augmentation)

Estas estrategias ayudan a prevenir sobreajuste y mejorar la generalización.



## Ejercicio Final

1. Modifica la red para resolver `make_circles`.
2. Añade Dropout y observa cómo afecta el resultado.
3. Cambia la función de activación a `tanh`.
4. Usa `EarlyStopping` para mejorar el tiempo de entrenamiento.

Explora cómo los diferentes componentes afectan el desempeño de tu red.
