In [16]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import accuracy_score, classification_report

In [17]:
sentimentos = pd.read_csv('data/sentimentos.csv')

In [18]:
print(sentimentos.shape)
sentimentos = sentimentos.drop_duplicates(subset='frase')
print(sentimentos.shape)
sentimentos = sentimentos.dropna(subset='frase')
print(sentimentos.shape)
sentimentos['sentimento'] = sentimentos['sentimento'].str.strip()

(3311, 2)
(1607, 2)
(1607, 2)


In [19]:
x = sentimentos['frase']
y = sentimentos['sentimento']

In [22]:
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=42)

In [23]:
vectorizer = CountVectorizer()
x_train_counts = vectorizer.fit_transform(x_train)
x_test_counts = vectorizer.transform(x_test)

In [24]:
clf = MultinomialNB()
clf.fit(x_train_counts, y_train)
y_pred = clf.predict(x_test_counts)

In [25]:
print(f'Acurácia: {accuracy_score(y_test, y_pred)}')
print(classification_report(y_test, y_pred))


Acurácia: 0.9316770186335404
              precision    recall  f1-score   support

  felicidade       0.97      0.91      0.94       111
       raiva       0.88      0.97      0.92        88
    tristeza       0.94      0.93      0.93       123

    accuracy                           0.93       322
   macro avg       0.93      0.93      0.93       322
weighted avg       0.93      0.93      0.93       322



In [26]:
# Função de detectar emoção
def detectar_emocao(frase):
    frase_count = vectorizer.transform([frase])
    probabilidade = clf.predict_proba(frase_count)[0]
    maior_probabilidade = np.argmax(probabilidade)

    if probabilidade[maior_probabilidade] > 0.2:
        return clf.classes_[maior_probabilidade]
    else:
        return 'Emoção desconhecida'



In [27]:
print(detectar_emocao('Eu sinto sua falta'))
print(detectar_emocao('Não quero saber de nada, eu te odeio!'))
print(detectar_emocao('Ganhei um concurso de escrita e tecnologia!'))

tristeza
raiva
felicidade
