# Actividad en Grupo: Análisis de Comentarios de Clientes Utilizando Redes Neuronales Recurrentes (RNN)

## Escenario
Su equipo ha sido contratado por una empresa de turismo que desea categorizar automáticamente los comentarios de sus clientes en función de los sentimientos: positivos, neutrales o negativos. La empresa ha proporcionado un conjunto de datos de comentarios y clasificaciones (rating) de clientes para que su equipo lo analice.

## Objetivo
Utilizar Redes Neuronales Recurrentes (RNN) para crear un modelo de análisis de sentimientos. Su tarea también implica interpretar los resultados para obtener conocimientos empresariales accionables.

## Tareas

1. **Exploración de Datos**
   - Revise una muestra de comentarios. ¿Cuáles son los temas o patrones comunes?
   - Visualice la distribución de longitudes de los comentarios.
   - Visualice la distribución de las clasificaciones (positivo, neutro, negativo).

2. **Preprocesamiento de Datos**
   - Extraiga y Tokenice los comentarios.
   - Rellene secuencias para asegurar una longitud uniforme.
   - Convierta los valores de rating en sentimientos (positivo, neutro, negativo) y codifíquelo en valores numéricos.

3. **Construcción del Modelo RNN**
   - Cree un modelo secuencial.
   - Agregue capas de incrustación (embedding) para procesar las palabras tokenizadas.
   - Implemente capas LSTM o GRU para la parte recurrente.
   - Diseñe la capa de salida adecuada para un problema de clasificación de tres clases.

4. **Entrenamiento y Evaluación del Modelo**
   - Divida el conjunto de datos en entrenamiento, validación y prueba.
   - Entrene el modelo y valide su rendimiento.
   - Pruebe el modelo en el conjunto de prueba e interprete los resultados.

5. **Análisis y Recomendaciones Empresariales**
   - Analice las clasificaciones incorrectas. ¿Existen ciertos tipos de comentarios con los que el modelo tiene dificultades?
   - ¿Cómo puede la empresa utilizar los resultados del modelo para mejorar sus servicios o productos?
   - ¿Cuáles son las posibles limitaciones de confiar en este modelo para tomar decisiones comerciales?

6. **Presentación**
   - Prepare una presentación de su análisis, resultados y recomendaciones.
   - Asegúrese de interpretar los resultados en un contexto empresarial.

## Entregables
- Un cuaderno Jupyter que contenga todo su código, visualizaciones e interpretaciones, entregado antes del viernes 6 de septiembre a las 14:00 horas.
- Una presentación que resuma el trabajo realizado, hallazgos y recomendaciones, a realizarse el día 6 de septiembre al comienzo del segundo bloque (19:00 aprox.). La presentación no debe exceder los 20 minutos. Quiénes y cuántos miembros del equipo presentan queda a criterio del grupo, pero todos deben estar preparados para responder preguntas.

## Equipos de trabajo
Deberán formar equipos de 4 o 5 personas. La conformación de los grupos deberá ser informada por correo electrónico a más tardar el día viernes 30 de agosto.


# Rúbrica de Evaluación: Análisis de Comentarios de Clientes con RNN

## Entrega a Tiempo [10 puntos]:
- **10 puntos**: El cuaderno Jupyter se entregó en la fecha y hora especificadas.
- **0 puntos**: El cuaderno Jupyter se entregó después de la fecha y hora límite.

## Funcionalidad del Cuaderno [10 puntos]:
- **10 puntos**: El cuaderno Jupyter se ejecuta de principio a fin sin errores.
- **0 puntos**: El cuaderno Jupyter presenta errores al ejecutarse.

## Preprocesamiento de Datos [20 puntos]:
- **10 puntos**: Datos cargados correctamente.
- **5 puntos**: Comentarios tokenizados y secuencias rellenadas adecuadamente.
- **5 puntos**: Sentimientos codificados correctamente en formato numérico.

## Construcción del Modelo RNN [10 puntos]:
- **5 puntos**: Capas de incrustación y capas recurrentes implementadas adecuadamente.
- **5 puntos**: Selección adecuada de funciones de activación y otras configuraciones de capa.

## Compilación y Entrenamiento del Modelo [20 puntos]:
- **5 puntos**: Modelo compilado con optimizador, función de pérdida y métricas apropiadas.
- **10 puntos**: Modelo entrenado en datos de entrenamiento y validación, con gráficos que muestran el rendimiento a lo largo de las épocas.
- **5 puntos**: Uso de técnicas como callbacks (`EarlyStopping`, por ejemplo) si es necesario.

## Evaluación del Modelo [10 puntos]:
- **10 puntos**: Evaluación adecuada en el conjunto de datos de prueba, con métricas de rendimiento reportadas.

## Análisis y Recomendaciones [10 puntos]:
- **10 puntos**: Análisis claro y conciso de las clasificaciones incorrectas y las implicaciones comerciales.
- **0 puntos**: Falta de análisis o comprensión de los resultados.

## Presentación [20 puntos]:
- **5 puntos**: Estructura y organización clara de la presentación.
- **10 puntos**: Presentación efectiva de resultados y conclusiones.
- **5 puntos**: Reflexión sobre desafíos y posibles mejoras.

