# Modelo Naive Bayes

## Passo 1: Import dos dados

In [2]:
from sklearn import datasets
from sklearn.naive_bayes import GaussianNB, MultinomialNB
from sklearn.metrics import confusion_matrix, classification_report
from sklearn.model_selection import train_test_split

In [3]:
iris = datasets.load_iris()
data = iris.data
target = iris.target

iris.target_names

array(['setosa', 'versicolor', 'virginica'], dtype='<U10')

## Passo 2: Treino do modelo

In [4]:
data_train, data_test, target_train, target_test = train_test_split(data, target, test_size=0.2, random_state=0)

gnb = GaussianNB()
mnb = MultinomialNB()

target_pred_gnb = gnb.fit(data_train, target_train).predict(data_test)

Matriz de confusão:

In [5]:
cnf_matrix_gnb = confusion_matrix(target_test, target_pred_gnb)

print(cnf_matrix_gnb)

[[11  0  0]
 [ 0 13  0]
 [ 0  1  5]]


In [6]:
class_report = classification_report(target_test, target_pred_gnb)

print(class_report)

              precision    recall  f1-score   support

           0       1.00      1.00      1.00        11
           1       0.93      1.00      0.96        13
           2       1.00      0.83      0.91         6

    accuracy                           0.97        30
   macro avg       0.98      0.94      0.96        30
weighted avg       0.97      0.97      0.97        30



Vamos relembrar as definições:

- Precisão: é a razão `tp / (tp + fp)`, onde `tp` é o número de positivos verdadeiros e `fp` é o número de positivos falsos. Essa métrica indica a habilidade do modelo em não nomear uma amostra negativa como sendo positiva.
- Sensibilidade: é a razão `tp / (tp + fn)`, com `fn` sendo o número de negativos falsos, e mede a fração dos positivos que nosso modelo identificou.
- F1 score: é um indicador que relaciona a precisão e a sensibilidade, sendo calculada como `2 * p * r / (p + r)`, com `p` e `r` sendo a precisão e a sensibilidade, respectivamente.
- Acurácia: compara quantos rótulos de uma amostra foram previstos exatamente como os dados de teste.
- Média macro: calcula a média aritmética simples das métricas.
- Média peso: calcula a média aritmética ponderada das métricas, baseada nos suportes.