In [2]:
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.model_selection import train_test_split 
from sklearn.naive_bayes import MultinomialNB
import pandas as pd

In [15]:
arquivo = pd.read_csv('reviews.csv', usecols = [0, 1, 2])
arquivo = arquivo.iloc[:1000]

In [16]:
# Divive os dados em recursos (X) e rótulos de classe (y)
X = arquivo['Review']
y = arquivo['Rating']

# Vetoriza os textos (Reviews - X) usando CountVectorizer
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(X)

# Divide os dados em conjunto de treinamento e teste, sendo 20% para Teste e 80% para Treino
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Cria e ajusta o modelo Multinomial Naive Bayes
nb_classifier = MultinomialNB()
nb_classifier.fit(X_train, y_train)

# Faz previsões no conjunto de Teste (20% da Base)
y_pred = nb_classifier.predict(X_test)


In [17]:
# Desempenho do modelo - Relatório
accuracy = accuracy_score(y_test, y_pred)
report = classification_report(y_test, y_pred)

print(f'Acurácia: {accuracy}')
print('Relatório de Classificação:')
print(report)

Acurácia: 0.63
Relatório de Classificação:
              precision    recall  f1-score   support

           1       0.53      0.87      0.66        62
           2       0.00      0.00      0.00        16
           3       0.50      0.05      0.09        20
           4       0.70      0.25      0.37        28
           5       0.76      0.86      0.81        74

    accuracy                           0.63       200
   macro avg       0.50      0.41      0.39       200
weighted avg       0.60      0.63      0.57       200



In [18]:
class_names = ["Classe 1", "Classe 2", "Classe 3", "Classe 4", "Classe 5"]

# Gera a matriz de confusão
conf_matrix = confusion_matrix(y_test, y_pred)
confusion_df = pd.DataFrame(conf_matrix, columns=class_names, index=class_names)

# Exibindo a matriz de confusão
print(confusion_df)

          Classe 1  Classe 2  Classe 3  Classe 4  Classe 5
Classe 1        54         2         1         0         5
Classe 2        16         0         0         0         0
Classe 3        14         1         1         0         4
Classe 4        10         0         0         7        11
Classe 5         7         0         0         3        64
