<a href="https://colab.research.google.com/github/ednavivianasegura/ERAP_CursoPython/blob/main/Modulo3_RedesNeuronales/RNN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**Autores:** Edna Viviana Segura Alvarado - Hans Mauricio Carrillo Hernández

**Institución:** Universidad de la Rioja

**Fecha:** Junio/2025

**Redes neuronales recurrentes (RNN)**


Nota: basado en [RNN_C](https://www.datacamp.com/es/tutorial/tutorial-for-recurrent-neural-networks)


#Redes Neuronales Recurrentes (RNN)  

Las **Redes Neuronales Recurrentes (RNN)** son un tipo de red neuronal artificial diseñada para trabajar con datos secuenciales (como texto, series temporales o audio). A diferencia de las redes neuronales tradicionales, las RNN mantienen una **memoria interna** que les permite recordar información de pasos anteriores, lo que las hace ideales para:  

- Predicción de valores financieros.  
- Generación de texto (traducción, resúmenes).  
- Procesamiento de voz (ej.: Siri, Google Voice Search).  

#### Características clave:  
1. **Dependencia secuencial**: la salida en el paso `t` depende de las entradas anteriores (`t-1`, `t-2`, ...).  
2. **Compartición de parámetros**: usan los mismos pesos en todas las capas (eficiencia computacional).  
3. **Ajuste durante el entrenamiento**: los pesos y sesgos se optimizan mediante backpropagation a través del tiempo (BPTT).  

#### vs. Redes Feed-Forward:  
| **RNN** | **Feed-Forward** |  
|---------|------------------|  
| Memoria interna (estado oculto) | Sin memoria |  
| Salidas dependientes | Salidas independientes |  
| Ideal para secuencias | Ideal para datos estáticos |  


<center>
 <img src="https://github.com/ednavivianasegura/AccesoImages/blob/main/RNN/1.png?raw=true" alt="1" width="50%" height="50%">  
</center>

## Funcionamiento de las Redes Neuronales Recurrentes (RNN)


Las RNN procesan información secuencial mediante bucles recurrentes, donde cada salida depende tanto de la entrada actual como de las anteriores. Este mecanismo les permite "recordar" patrones temporales, algo imposible en redes neuronales tradicionales.

**Arquitectura clave:**

<center>
 <img src="https://github.com/ednavivianasegura/AccesoImages/blob/main/RNN/2.png?raw=true" alt="2" width="50%" height="50%">  
</center>

* Capa de entrada (X): recibe los datos (ej.: palabras, valores temporales).

* Capa oculta (A):

comparte los mismos parámetros (pesos y sesgos) en todos los pasos de tiempo.

Usa funciones de activación (como tanh o ReLU) para transformar los datos.

* Bucle recurrente: el estado oculto se retroalimenta, combinando información nueva con la pasada.

### Entrenamiento: Backpropagation Through Time (BPTT)

Diferencias con backpropagation tradicional:

* BPTT calcula gradientes a lo largo de la secuencia temporal, sumando errores en cada paso.

* Optimiza parámetros compartidos, lo que reduce la complejidad computacional.

### Tipos de RNN y sus aplicaciones

Gracias a su flexibilidad en longitudes de entrada/salida, las RNN destacan en tareas secuenciales:

## Tabla Comparativa: Tipos de RNN y sus Aplicaciones

| Tipo de RNN        | Estructura          | Ejemplo de Aplicación      | Caso de Uso Concreto               | Framework Implementación |
|--------------------|---------------------|---------------------------|------------------------------------|--------------------------|
| **Uno-a-Uno**      | `x → h → y`         | Clasificación de imágenes | MNIST/CIFAR-10                     | `torch.nn.RNN`           |
| **Uno-a-Muchos**   | `x → h → [y₁...yₙ]` | Generación de música      | Composición de melodías MIDI       | `tf.keras.SimpleRNN`     |
| **Muchos-a-Uno**   | `[x₁...xₙ] → h → y` | Análisis de sentimiento   | Clasificación de reseñas en Amazon | `nn.RNN` (PyTorch)       |
| **Muchos-a-Muchos**| `[x₁...xₙ] → h → [y₁...yₙ]` | Traducción automática | Seq2Seq (Inglés-Español)          | `tf.keras.LSTM`          |

<center>
 <img src="https://github.com/ednavivianasegura/AccesoImages/blob/main/RNN/3.png?raw=true" alt="3" width="50%" height="50%">  
</center>