##### Importação dos dados processados

In [1]:
import pandas as pd

df = pd.read_csv('dados_preprocessados.csv')

In [2]:
print(df.columns)


Index(['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin',
       'BMI', 'DiabetesPedigreeFunction', 'Age', 'Outcome'],
      dtype='object')


##### Features e target

In [3]:
X = df.drop('Outcome', axis=1)
y = df['Outcome']


##### Importação de modelos e funções

In [4]:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
import numpy as np


##### Armazenamento de resultados

In [None]:
accuracies_lr = []   # Regressão Logistica
accuracies_dt = []   # Árbore de Decisão


In [6]:
# treino-teste 30 vezes

for i in range(30):
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=i)

    # Modelo 1: Regressão Logística
    lr = LogisticRegression(max_iter=1000)
    lr.fit(X_train, y_train)
    y_pred_lr = lr.predict(X_test)
    acc_lr = accuracy_score(y_test, y_pred_lr)
    accuracies_lr.append(acc_lr)

    # Modelo 2: Árvore de Decisão
    dt = DecisionTreeClassifier()
    dt.fit(X_train, y_train)
    y_pred_dt = dt.predict(X_test)
    acc_dt = accuracy_score(y_test, y_pred_dt)
    accuracies_dt.append(acc_dt)


In [7]:
#Média e desvio padrão

print("Regressão Logística:")
print("Média da acurácia:", np.mean(accuracies_lr))
print("Desvio padrão:", np.std(accuracies_lr))

print("\nÁrvore de Decisão:")
print("Média da acurácia:", np.mean(accuracies_dt))
print("Desvio padrão:", np.std(accuracies_dt))


Regressão Logística:
Média da acurácia: 0.7645021645021645
Desvio padrão: 0.026084421481670006

Árvore de Decisão:
Média da acurácia: 0.6930735930735932
Desvio padrão: 0.02395599705019633


##### Melhor modelo

In [8]:
import pickle

best_model = LogisticRegression(max_iter=1000)
best_model.fit(X, y)

with open('melhor_modelo.pkl', 'wb') as f:
    pickle.dump(best_model, f)
