# ANÁLISE DE SENTIMENTO EM REVIEWS DE TRÊS ESTRELAS: UMA PROPOSTA DE CLASSIFICAÇÃO MULTIRRÓTULO

# Aplicação de Modelos de Aprendizado de Máquina 


In [None]:
import pandas as pd
import numpy as np

#Importa Matplotlib e Seaborn para Plotagem e Visualização de Dados
import matplotlib.pyplot as plt
import seaborn as sns 

#Importa bibliotecas necessárias para Desenvolvimento dos Modelos de Aprendizado de Máquina
from sklearn.metrics import hamming_loss, accuracy_score
from skmultilearn.problem_transform import BinaryRelevance
from sklearn.svm import SVC #suport vector machine
from sklearn.naive_bayes import MultinomialNB #naive bayes
from sklearn.tree import DecisionTreeClassifier #arvore de decisão
from sklearn.metrics import accuracy_score,classification_report #metricas

#### Task 01: Testar o Método BR com Support Vector Machine (SVM)

In [None]:
classifier_svm = BinaryRelevance(
    classifier = SVC())

In [None]:
# Treina com TFIDF
classifier_svm.fit(X_train_tfidf, y_train)

# Faz a predição com TFIDF
predictions_tfidf_svm = classifier_svm.predict(X_test_tfidf)

# Treina com BOW
classifier_svm.fit(X_train_bow, y_train)

# Faz a predição com BOW
predictions_bow_svm = classifier_svm.predict(X_test_bow)

In [None]:
# Acurácia SVM com TFIDF
accuracy_score(y_test,predictions_tfidf_svm)

In [None]:
# Hamming Loss SVM com TFDIF
hamming_loss(y_test, predictions_tfidf_svm)

In [None]:
# Acurácia SVM com BOW
accuracy_score(y_test,predictions_bow_svm)

In [None]:
# Hamming Loss SVM com BOW
hamming_loss(y_test, predictions_bow_svm)

#### Task 02: Testar o Método BR com Naive Bayes (NB)

In [None]:
classifier_nb = BinaryRelevance(
    classifier = MultinomialNB())

In [None]:
# Treina com TFIDF
classifier_nb.fit(X_train_tfidf, y_train)

# Faz a predição com TFIDF
predictions_tfidf_nb = classifier_nb.predict(X_test_tfidf)

# Treina com BOW
classifier_nb.fit(X_train_bow, y_train)

# Faz a predição com BOW
predictions_bow_nb = classifier_nb.predict(X_test_bow)

In [None]:
# Acurácia NB com TFIDF
accuracy_score(y_test,predictions_tfidf_nb)

In [None]:
# Hamming Loss NB com TFDIF
hamming_loss(y_test, predictions_tfidf_nb)

In [None]:
# Acurácia NB com BOW
accuracy_score(y_test,predictions_bow_nb)

In [None]:
# Hamming Loss NB com BOW
hamming_loss(y_test, predictions_bow_nb)

#### Task 03: Testar o Método BR com Árvore de Decisão (AD)

In [None]:
classifier_ad = BinaryRelevance(
    classifier = DecisionTreeClassifier(criterion='entropy'))

In [None]:
# Treina com TFIDF
classifier_ad.fit(X_train_tfidf, y_train)

# Faz a predição com TFIDF
predictions_tfidf_ad = classifier_ad.predict(X_test_tfidf)

# Treina com BOW
classifier_ad.fit(X_train_bow, y_train)

# Faz a predição com BOW
predictions_bow_ad = classifier_ad.predict(X_test_bow)

In [None]:
# Acurácia AD com TFIDF
accuracy_score(y_test,predictions_tfidf_ad)

In [None]:
# Hamming Loss AD com TFDIF
hamming_loss(y_test, predictions_tfidf_ad)

In [None]:
# Acurácia AD com BOW
accuracy_score(y_test,predictions_bow_ad)

In [None]:
# Hamming Loss NB com BOW
hamming_loss(y_test, predictions_bow_ad)

### MÉTRICAS - Parte Visual


In [None]:
# Gráfico Barras Agrupadas - Acurácia
acuraciabow = [0.80, 0.77, 0.74]
acuraciatfidf = [0.78, 0.69, 0.73]
 
# Definindo a largura das barras
barWidth = 0.25

# Aumentando o gráfico
plt.figure(figsize=(12,7))

# Definindo a posição das barras
r1 = np.arange(len(acuraciabow))
r2 = [x + barWidth for x in r1]

 
# Criando as barras
plt.bar(r1, acuraciabow, color='#24376D', width=barWidth, label='Accuracy - BoW')
plt.bar(r2, acuraciatfidf, color='#6D5A24', width=barWidth, label='Accuracy - TF-IDF')
 
# Adiciando legendas as barras
plt.xlabel('Modelos')
plt.xticks([r + barWidth for r in range(len(acuraciabow))], ['SVM', 'NB', 'AD'])
plt.ylabel('Valores')
 
# Criando a legenda e exibindo o gráfico
plt.legend()
plt.show()

In [None]:
# Gráfico Barras Agrupadas - HammingLoss
hamminglossbow = [0.09, 0.11, 0.13]
hamminglosstfidf = [0.10, 0.15, 0.13]
 
# Definindo a largura das barras
barWidth = 0.25

# Aumentando o gráfico
plt.figure(figsize=(10,5))

# Definindo a posição das barras
r1 = np.arange(len(hamminglossbow))
r2 = [x + barWidth for x in r1]

 
# Criando as barras
plt.bar(r1, hamminglossbow, color='#5A246D', width=barWidth, label='Hamming Loss - BoW')
plt.bar(r2, hamminglosstfidf, color='#6495ED', width=barWidth, label='Hamming Loss - TF-IDF')
 
# Adiciando legendas as barras
plt.xlabel('Modelos')
plt.xticks([r + barWidth for r in range(len(hamminglossbow))], ['SVM', 'NB', 'AD'])
plt.ylabel('Valores')
 
# Criando a legenda e exibindo o gráfico
plt.legend()
plt.show()