# Análise de Sentimentos com NLP

Neste notebook, treinamos um modelo simples para classificar sentimentos em avaliações de texto (positivas ou negativas).

In [None]:
# Instalar bibliotecas necessárias
!pip install pandas scikit-learn nltk wordcloud matplotlib seaborn

In [None]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
import matplotlib.pyplot as plt
import seaborn as sns
import nltk
from wordcloud import WordCloud
nltk.download('stopwords')
from nltk.corpus import stopwords
stop_words = set(stopwords.words('portuguese'))

In [None]:
# Criar dataset simulado
dados = pd.DataFrame({
    'texto': [
        'Eu adorei esse produto', 'O atendimento foi horrível',
        'Muito bom, recomendo', 'Não gostei, muito ruim',
        'Excelente qualidade', 'Péssimo, nunca mais compro',
        'Produto maravilhoso', 'Demorou demais para chegar'
    ],
    'sentimento': ['positivo', 'negativo', 'positivo', 'negativo', 'positivo', 'negativo', 'positivo', 'negativo']
})

In [None]:
# Vetorização com TF-IDF
vectorizer = TfidfVectorizer(stop_words=stop_words)
X = vectorizer.fit_transform(dados['texto'])
y = dados['sentimento']

# Separar dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=42)

# Treinar modelo
modelo = MultinomialNB()
modelo.fit(X_train, y_train)

# Avaliar modelo
y_pred = modelo.predict(X_test)
print("Acurácia:", accuracy_score(y_test, y_pred))
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))