EJERCICIO PARA CATEGORIZAR OPINIONES

In [None]:
# ✅ Instalar librerías necesarias
!pip install -q nltk wordcloud matplotlib

# ✅ Importar librerías
import nltk
import matplotlib.pyplot as plt
from nltk.sentiment import SentimentIntensityAnalyzer
from wordcloud import WordCloud, STOPWORDS
import pandas as pd
from IPython.display import display
import ipywidgets as widgets

# ✅ Descargar recursos de NLTK
nltk.download('vader_lexicon')

# ✅ Crear una caja de texto para que el usuario pegue reseñas
text_box = widgets.Textarea(
    value='Paste each review here, one per line...',
    placeholder='Type something',
    description='Reseñas:',
    layout=widgets.Layout(width='100%', height='300px')
)

button = widgets.Button(description="Analizar")
output = widgets.Output()

display(text_box, button, output)

# ✅ Función de análisis al hacer clic
def on_button_click(b):
    output.clear_output()
    reviews_raw = text_box.value.strip().split('\n')
    if len(reviews_raw) < 1:
        with output:
            print("⚠️ Debes ingresar al menos una reseña.")
        return

    sia = SentimentIntensityAnalyzer()
    datos = []

    for review in reviews_raw:
        score = sia.polarity_scores(review)
        compound = score['compound']
        if compound >= 0.05:
            sentimiento = 'Positivo'
        elif compound <= -0.05:
            sentimiento = 'Negativo'
        else:
            sentimiento = 'Neutral'
        datos.append({'Reseña': review, 'Compound': compound, 'Sentimiento': sentimiento})

    df = pd.DataFrame(datos)

    # ✅ Mostrar tabla
    with output:
        display(df)

        # 📊 Gráfico de barras de sentimiento
        plt.figure(figsize=(6, 4))
        df['Sentimiento'].value_counts().plot(kind='bar', color='skyblue')
        plt.title('Distribución de Sentimientos')
        plt.ylabel('Cantidad')
        plt.xticks(rotation=0)
        plt.grid(axis='y')
        plt.show()

        # ☁️ Nube de palabras por sentimiento
        for sentimiento in ['Positivo', 'Neutral', 'Negativo']:
            textos = " ".join(df[df['Sentimiento'] == sentimiento]['Reseña'].values)
            if textos.strip():
                wc = WordCloud(width=600, height=300, background_color='white',
                               stopwords=STOPWORDS).generate(textos)
                plt.figure(figsize=(7, 4))
                plt.imshow(wc, interpolation='bilinear')
                plt.axis('off')
                plt.title(f'Nube de palabras - {sentimiento}')
                plt.show()

button.on_click(on_button_click)


[nltk_data] Downloading package vader_lexicon to /root/nltk_data...


Textarea(value='Paste each review here, one per line...', description='Reseñas:', layout=Layout(height='300px'…

Button(description='Analizar', style=ButtonStyle())

Output()