[Video Youtube](https://www.youtube.com/watch?v=MViaDNkSP88&t=18s)

Esse notebook foi baseado nos seguintes sites:

[ScikitLearn Classification Metrics](https://scikit-learn.org/stable/modules/model_evaluation.html#classification-metrics)

[Explicicação](https://medium.com/greyatom/performance-metrics-for-classification-problems-in-machine-learning-part-i-b085d432082b)

[Dataset](https://archive.ics.uci.edu/ml/datasets/Haberman%27s+Survival)

Attribute Information:
   1. Age of patient at time of operation (numerical)
   2. Patient's year of operation (year - 1900, numerical)
   3. Number of positive axillary nodes detected (numerical)
   4. Survival status (class attribute)   
     1 = the patient survived 5 years or longer     
     2 = the patient died within 5 year

In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn import metrics as mt

In [2]:
colunas = ["idade",
           "ano_operacao",
           "nos_positivos",
           "y"]

In [3]:
data = pd.read_csv('haberman.data', names=colunas)

In [4]:
data.head()

Unnamed: 0,idade,ano_operacao,nos_positivos,y
0,30,64,1,1
1,30,62,3,1
2,30,65,0,1
3,31,59,2,1
4,31,65,4,1


In [5]:
y = data['y']
X = data.drop('y', axis=1).values

In [6]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42, stratify=y)

In [7]:
Gnb = GaussianNB()

In [8]:
Gnb.fit(X_train, y_train)

GaussianNB(priors=None)

In [9]:
y_pred = Gnb.predict(X_test)

**True positive (TP)** : significa uma classificação correta da classe positive. Por exemplo, a classe real é Positivo e o modelo classificou como Positivo.

**True negative (TN)** : significa uma classificação correta da classe negative. Por exemplo, a classe real é Negativo e o modelo classificou como Negativo.

**False positive (FP)** : significa uma classificação errada da classe positive. Por exemplo, a classe real é Negativo e o modelo classificou como Positivo.

**False negative (FN)** : significa uma classificação errada da classe negative. Por exemplo, a classe real é Positivo e o modelo classificou como Negativo.

Accuracy é o número de previsões corretas feitas pelo modelo sobre todas as previsões feitas

accuracy = (TP + TN) / TOTAL

In [10]:
mt.accuracy_score(y_test, y_pred)

0.6612903225806451

Precision é uma medida que da o número de itens corretamente identificados como positivos do total de itens identificados como positivos 

precision = TP / (TP + FP)

In [37]:
mt.precision_score(y_test, y_pred)

0.7272727272727273

Recall or Sensitivity é uma medida que da o número de itens corretamente identificados como positivos do total de positivos verdadeiros

recall = TP / (TP + FN)

In [38]:
mt.recall_score(y_test, y_pred)

0.8695652173913043

F1 Score é uma média harmonica do Precision e Recall

F1 Score = 2 * Precision * Recall / (Precision + Recall) 


In [39]:
mt.f1_score(y_test, y_pred)

0.792079207920792