In [11]:
import numpy as np
import pandas as pd 
from sklearn.model_selection import train_test_split
from NaiveBayesGaussiano import NaiveBayesGaussiano
from metricas import matriz_confusao
from validacaocruzada import validacao_cruzada, calcular_estatisticas_metricas
from sklearn.preprocessing import MinMaxScaler
from KNN import KNN


In [2]:

data = pd.read_csv("breast.csv")


X = data.iloc[:, :-1].values
# Convertendo os nomes das espécies em valores numéricos
y = data.iloc[:, -1].values.reshape(-1,1)


In [3]:
X_treino, X_teste, y_treino, y_teste = train_test_split(X, y, test_size=0.2, random_state=42)


In [4]:
# Normalizar os dados de treinamento
escala = MinMaxScaler()
X_normalizado_treino = escala.fit_transform(X_treino)

# Normalizar os dados de teste
X_normalizado_teste = escala.transform(X_teste)

In [18]:


modelo = NaiveBayesGaussiano()
modelo.fit(X_normalizado_treino, y_treino.ravel())
predictions = modelo.predict(X_normalizado_teste)




In [19]:

acuracias, precisoes, revocacoes, f1_scores = validacao_cruzada(modelo, X_normalizado_treino, y_treino.ravel())

acuracia_media, acuracia_desvio_padrao = calcular_estatisticas_metricas(acuracias)
print("Acurácia média:", acuracia_media)
print("Desvio padrão das acurácias:", acuracia_desvio_padrao)

precisao_media, precisao_desvio_padrao = calcular_estatisticas_metricas(precisoes)
print("Precisão média:", precisao_media)
print("Desvio padrão das precisões:", precisao_desvio_padrao)

revocacao_media, revocacao_desvio_padrao = calcular_estatisticas_metricas(revocacoes)
print("Revocação média:", revocacao_media)
print("Desvio padrão das revocações:", revocacao_desvio_padrao)

f1_media, f1_desvio_padrao = calcular_estatisticas_metricas(f1_scores)
print("F1 médio:", f1_media)
print("Desvio padrão do F1:", f1_desvio_padrao)


Acurácia média: 0.9022222222222223
Desvio padrão das acurácias: 0.03325917677132393
Precisão média: 0.9952380952380953
Desvio padrão das precisões: 0.014285714285714301
Revocação média: 0.8479989958543908
Desvio padrão das revocações: 0.05123002430033393
F1 médio: 0.9150586253176651
Desvio padrão do F1: 0.033518761172390985


In [20]:
matriz_confusao1= matriz_confusao(y_teste, predictions, 2)
print("Matriz de Confusão:")
for row in matriz_confusao1:
    print(row)

Matriz de Confusão:
[45, 1]
[13, 55]


In [21]:
modelo2 = KNN()
modelo2.fit(X_normalizado_treino, y_treino.ravel())
previsao = modelo2.predict(X_normalizado_teste)


In [22]:

acuracias, precisoes, revocacoes, f1_scores = validacao_cruzada(modelo2, X_normalizado_treino, y_treino.ravel())

acuracia_media, acuracia_desvio_padrao = calcular_estatisticas_metricas(acuracias)
print("Acurácia média:", acuracia_media)
print("Desvio padrão das acurácias:", acuracia_desvio_padrao)

precisao_media, precisao_desvio_padrao = calcular_estatisticas_metricas(precisoes)
print("Precisão média:", precisao_media)
print("Desvio padrão das precisões:", precisao_desvio_padrao)

revocacao_media, revocacao_desvio_padrao = calcular_estatisticas_metricas(revocacoes)
print("Revocação média:", revocacao_media)
print("Desvio padrão das revocações:", revocacao_desvio_padrao)

f1_media, f1_desvio_padrao = calcular_estatisticas_metricas(f1_scores)
print("F1 médio:", f1_media)
print("Desvio padrão do F1:", f1_desvio_padrao)


Acurácia média: 0.968888888888889
Desvio padrão das acurácias: 0.028458329944145988
Precisão média: 0.9727811913295785
Desvio padrão das precisões: 0.030936999030051537
Revocação média: 0.9778181495923433
Desvio padrão das revocações: 0.045895955277765105
F1 médio: 0.974274466865784
Desvio padrão do F1: 0.02582558979804448


In [23]:
matriz_confusao2 = matriz_confusao(y_teste, previsao, 2)
print("Matriz de Confusão:")
for i in matriz_confusao2:
    print(i)




Matriz de Confusão:
[42, 4]
[0, 68]
