
# Proyecto de Análisis y Modelado con RNN

Este notebook contiene el código completo de un proyecto de análisis de sentimientos y modelado de redes neuronales recurrentes (RNN). El código está organizado en diferentes secciones, cada una correspondiente a una funcionalidad específica del proyecto original.

## Secciones del Notebook

1. Análisis de Sentimientos
2. Comparación
3. Identificación de Temas
4. Visualización
5. Limpieza de Datos
6. División de Datos
7. Definición del Modelo RNN
8. Entrenamiento del Modelo RNN
9. Evaluación del Modelo RNN
10. Ejecución Principal


In [None]:

import sys
import os

# Ajusta la ruta a la carpeta raíz de tu proyecto
project_path = os.getcwd()
sys.path.append(project_path)

# Verifica que la ruta se añadió correctamente y lista el contenido del directorio
print(sys.path)
print(os.listdir(project_path))


# SECCION 1 ANALISIS DE SENTIMIENTOS


# Proyecto de Análisis y Modelado con RNN

Este notebook contiene el código completo de un proyecto de análisis de sentimientos y modelado de redes neuronales recurrentes (RNN). El código está organizado en diferentes secciones, cada una correspondiente a un archivo específico del proyecto original.

## Secciones del Notebook

1. Análisis de Sentimientos
2. Comparación
3. Identificación de Temas
4. Visualización
5. Limpieza de Datos
6. División de Datos
7. Definición del Modelo RNN
8. Entrenamiento del Modelo RNN
9. Evaluación del Modelo RNN
10. Ejecución Principal (`main.py`)

Cada sección contiene el código y las explicaciones necesarias para comprender y ejecutar el proyecto.


# SECCION 2 COMPARACION

# SECCION 1 ANALISIS DE SENTIMIENTOS

# SECCION 3 IDENTIFICACION DE TEMAS

In [1]:
import pandas as pd
from textblob import TextBlob
from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer

# Inicializar el analizador de sentimientos de VADER
analyzer = SentimentIntensityAnalyzer()

# Diccionario de emociones para clasificar
sentimientos = {
    'alegría': 0, 
    'enojo': 1, 
    'tristeza': 2, 
    'satisfacción': 3, 
    'insatisfacción': 4
}

# Palabras clave y frases específicas del dialecto ecuatoriano para emociones negativas
palabras_clave_negativas = [
    'sinvergüenza', 'charlatán', 'mañoso', 'corrupto', 'inútil', 'maldito', 'ladrón', 'hipócrita',
    'vergonzoso', 'mentiroso', 'desgraciado', 'canalla', 'ratero'
]

# Función para clasificar el sentimiento basado en el análisis de VADER y palabras clave específicas
def clasificar_sentimiento(comentario):
    analisis = TextBlob(comentario)
    vader_result = analyzer.polarity_scores(comentario)
    
    # Clasificación basada en el análisis de VADER
    if vader_result['compound'] >= 0.5:
        return 'alegría'
    elif vader_result['compound'] >= 0.1:
        return 'satisfacción'
    elif vader_result['compound'] <= -0.5:
        return 'enojo'
    elif vader_result['compound'] <= -0.1:
        return 'tristeza'
    
    # Clasificación adicional basada en palabras clave específicas
    for palabra in palabras_clave_negativas:
        if palabra in comentario:
            return 'enojo'
    
    return 'insatisfacción'

def analizar_sentimientos(df):
    emociones = {'alegría': [], 'enojo': [], 'tristeza': [], 'satisfacción': [], 'insatisfacción': []}
    
    aspectos = []
    sentim = []

    for index, row in df.iterrows():
        comentario = row['comment_limpio']
        sentimiento = clasificar_sentimiento(comentario)
        emociones[sentimiento].append(comentario)
        aspectos.append('positivo' if sentimiento in ['alegría', 'satisfacción'] else 'negativo' if sentimiento in ['enojo', 'tristeza'] else 'neutral')
        sentim.append(sentimiento)
    
    df['aspecto'] = aspectos
    df['sentimiento'] = sentim
    df['sentimiento_label'] = df['sentimiento'].map(sentimientos)
    
    return df, emociones


# SECCION 4 VISUALIZACION

# SECCION 2 COMPARACION

# SECCION 5 LIMPIEZA DE DATOS

In [2]:
import pandas as pd

def comparar_aspectos(df):
    # Implementación de la función para comparar aspectos
    pass  # Reemplaza con la lógica real


# SECCION 6 DIVISION DE DATOS

# SECCION 3 IDENTIFICACION DE TEMAS

# SECCION 7 DEFINICION DEL MODELO RNN

In [3]:
import pandas as pd

def identificar_temas(df):
    # Aquí va la lógica para identificar temas
    # Por ahora, simplemente devolvamos una lista vacía como ejemplo
    temas = []
    return temas


# SECCION 8 ENTRENAMIENTO DEL MODELO RNN

# SECCION 4 VISUALIZACION

# SECCION 9 EVALUACION DEL MODELO RNN

In [4]:
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
from sklearn.metrics import confusion_matrix, classification_report

def generar_matriz_confusion(y_true, y_pred, labels, ax):
    cm = confusion_matrix(y_true, y_pred)
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=labels, yticklabels=labels, ax=ax)
    ax.set_xlabel('Predicted')
    ax.set_ylabel('True')
    ax.set_title('Confusion Matrix')

def generar_visualizaciones(df, y_true, y_pred, labels):
    # Mapeo de los sentimientos para etiquetas comprensibles
    sentimiento_map = {0: 'alegría', 1: 'enojo', 2: 'tristeza', 3: 'satisfacción', 4: 'insatisfacción'}
    df['sentimiento_label'] = df['sentimiento'].map(sentimiento_map)

    # Crear figura con subplots
    fig, axes = plt.subplots(2, 2, figsize=(15, 10))
    fig.suptitle('Análisis de Sentimientos y Aspectos', fontsize=16)

    # Conteo de sentimientos
    sns.countplot(x='sentimiento_label', data=df, palette='viridis', ax=axes[0, 0])
    axes[0, 0].set_title('Distribución de Sentimientos')
    axes[0, 0].set_xlabel('Sentimientos')
    axes[0, 0].set_ylabel('Conteo')

    # Evolución temporal de los sentimientos
    df['timestamp'] = pd.to_datetime(df['timestamp'])
    df.resample('M', on='timestamp').size().plot(ax=axes[0, 1])
    axes[0, 1].set_title('Número de Comentarios por Mes')
    axes[0, 1].set_xlabel('Fecha')
    axes[0, 1].set_ylabel('Número de Comentarios')

    # Análisis de temas y aspectos
    if 'aspecto' in df.columns:
        sns.countplot(x='aspecto', data=df, palette='coolwarm', ax=axes[1, 0])
        axes[1, 0].set_title('Distribución de Aspectos')
        axes[1, 0].set_xlabel('Aspectos')
        axes[1, 0].set_ylabel('Conteo')

    # Matriz de confusión
    generar_matriz_confusion(y_true, y_pred, labels, axes[1, 1])

    plt.tight_layout(rect=[0, 0, 1, 0.95])
    plt.show()


# SECCION 10 EJECUCION PRINCIPAL

# SECCION 5 LIMPIEZA DE DATOS