# Analisis de Sentimientos 

En el dataset user_reviews se incluyen reseñas de juegos hechos por distintos usuarios.
Debemos crear la columna 'sentiment_analysis' aplicando análisis de sentimiento con NLP con la siguiente escala: debe tomar el valor '0' si es malo, '1' si es neutral y '2' si es positivo. Esta nueva columna debe reemplazar la de user_reviews.review para facilitar el trabajo de los modelos de machine learning y el análisis de datos. 
#De no ser posible este análisis por estar ausente la reseña escrita, debe tomar el valor de 1.

In [1]:
import pandas as pd
from nltk.sentiment import SentimentIntensityAnalyzer
import nltk
nltk.download('vader_lexicon')  # Descarga el léxico VADER de NLTK si aún no está descargado

# Cargo el archivo CSV de reseñas de usuarios
user_reviews =pd.read_csv('user_reviews.csv')

# Mostramos información sobre el DataFrame de reseñas de usuarios
user_reviews.info()


[nltk_data] Downloading package vader_lexicon to
[nltk_data]     C:\Users\CIN\AppData\Roaming\nltk_data...
[nltk_data]   Package vader_lexicon is already up-to-date!


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 48463 entries, 0 to 48462
Data columns (total 5 columns):
 #   Column     Non-Null Count  Dtype 
---  ------     --------------  ----- 
 0   user_id    48463 non-null  object
 1   posted     48463 non-null  int64 
 2   item_id    48463 non-null  int64 
 3   recommend  48463 non-null  bool  
 4   review     48463 non-null  object
dtypes: bool(1), int64(2), object(2)
memory usage: 1.5+ MB


In [2]:
# Iniciamos el analizador de sentimientos de NLTK
sia = SentimentIntensityAnalyzer()

In [4]:
# Función para asignar valores de sentimiento a las reseñas
def sentiment_analysis(text):
    """
    Realiza un análisis de sentimiento en un texto dado y devuelve un valor numérico que representa la polaridad del sentimiento.

    Argumentos:
    text (str): El texto a analizar.

    Retorna:
    int: Un valor numérico que representa la polaridad del sentimiento. 0 para negativo, 1 para neutral y 2 para positivo.
    """
    # Si la reseña está ausente, devolver 1 (neutral)
    if pd.isnull(text):
        return 1
    # Realizar análisis de sentimiento y asignar valores de acuerdo a la polaridad
    sentiment_score = sia.polarity_scores(text)['compound']
    if sentiment_score >= 0.05:
        return 2  # positivo
    elif sentiment_score <= -0.05:
        return 0  # negativo
    else:
        return 1  # neutral

# Aplicar la función de análisis de sentimiento a la columna de reseñas
user_reviews['sentiment_analysis'] = user_reviews['review'].apply(sentiment_analysis)

# Eliminar la columna original de reseñas si se desea
user_reviews.drop(columns=['review'], inplace=True)

# Guardar el DataFrame actualizado
user_reviews.to_csv('user_reviews_with_sentiment.csv', index=False)
