In [32]:
# 0 - Libs
import pandas as pd
from nltk.corpus import stopwords
from nltk.stem import WordNetLemmatizer
from nltk.tokenize import word_tokenize
from nltk import NaiveBayesClassifier

# 1 - Carregar dataset
df = pd.read_csv("reviews_smartphone.csv", sep='\t', encoding='latin-1')
reviews = df['Reviews'].tolist()
print(f"1 - Lista de Reviews:\n{reviews}")

# 2 - Pré-processamento
stop_words = set(stopwords.words('portuguese'))
lemmatizer = WordNetLemmatizer()

def preprocessar_texto(texto):
    texto = texto.lower()

    # Tokenização
    palavras = word_tokenize(texto, language='portuguese')

    # Remoção de stopwords
    palavras = [p for p in palavras if p not in stop_words and p.isalnum()]

    # Lematização
    palavras_lemmatizadas = [lemmatizer.lemmatize(p) for p in palavras]
    return palavras_lemmatizadas

reviews_processadas = [preprocessar_texto(r) for r in reviews]
print(f"\n2 - Reviews Processadas:\n{reviews_processadas}")

# 3 - Criar dataset de treino
## Rótulos de sentimento (True: positivo, False: negativo)
sentimentos = [
    True, False, False, False, True, True, True, False, True, False,
    True, True, True, True, True, False, True, True, True, True,
    True, True, True, True, False, True, True, True, False, True,
    True, False, False, True, False, True, True, True, False, False,
    True, True, True, True, True, True, False, True, True, True,
    True, True, False, False, False, True, True, True, True, False,
    True, True, True, True, False, True, True, True, True, True,
    True, True, False, True, True, True, False, True, True, False,
    True, False, True, True, True, True, False, True, False, True,
    True, True, True, False, True, False, True, True, True, False,
    True, True, False, True, True
]

def get_features(palavras):
    return dict([(palavra, True) for palavra in palavras])

training_set = [(get_features(r), s) for r, s in zip(reviews_processadas, sentimentos)]
print(f"\n3 - Dataset de Treino:\n{training_set}\n")

# 4 - Treinar classificador
classifier = NaiveBayesClassifier.train(training_set)

# 5 - Testar classificador
## Classificar reviews
print(f"5 - Teste de classificação de reviews:")
for item, texto in enumerate(reviews_processadas):
    features_nova_frase = get_features(texto)
    sentimento_predito = classifier.classify(features_nova_frase)
    print(f"Sentimento predito para '{reviews[item]}': {'Positivo' if sentimento_predito else 'Negativo'}")

1 - Lista de Reviews:
['Vale cada centavo, superou minhas expectativas.', 'Não é ruim, mas esperava mais.', 'Regular, cumpre a função.', 'Aceitável para o preço que paguei.', 'Adorei o design e a velocidade do sistema.', 'Muito rápido e eficiente, recomendo!', 'Câmera incrível, fotos com ótima qualidade.', 'Design ok, desempenho dentro do esperado.', 'Tela com ótima resolução, muito satisfatória.', 'Regular, cumpre a função.', 'Muito rápido e eficiente, recomendo!', 'Tela com ótima resolução, muito satisfatória.', 'Melhor smartphone que já tive até hoje.', 'Tela com ótima resolução, muito satisfatória.', 'Melhor smartphone que já tive até hoje.', 'Esquenta demais durante o uso.', 'Vale cada centavo, superou minhas expectativas.', 'Atualizações constantes, ótimo suporte.', 'Muito rápido e eficiente, recomendo!', 'Adorei o design e a velocidade do sistema.', 'Câmera incrível, fotos com ótima qualidade.', 'Câmera incrível, fotos com ótima qualidade.', 'Muito rápido e eficiente, recomendo!

In [33]:
## Classificar nova frase
frases = ['Gostei muito da bateria!', 'A tela é muito ruim', 'funciona bem', 'é ok']
for frase in frases:
    nova_frase_processada = preprocessar_texto(frase)
    features_nova_frase = get_features(nova_frase_processada)
    sentimento_predito = classifier.classify(features_nova_frase)
    print(f"Teste de Frase nova:")
    print(f"Sentimento predito para '{frase}': {'Positivo' if sentimento_predito else 'Negativo'}\n")

Teste de Frase nova:
Sentimento predito para 'Gostei muito da bateria!': Positivo

Teste de Frase nova:
Sentimento predito para 'A tela é muito ruim': Positivo

Teste de Frase nova:
Sentimento predito para 'funciona bem': Positivo

Teste de Frase nova:
Sentimento predito para 'é ok': Negativo

