In [1]:
import numpy as np
import pandas as pd
from sklearn.model_selection import KFold
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error

# Gera dados aleatórios
np.random.seed(42)
X = np.random.rand(100, 2)
y = np.round(X[:, 0] + X[:, 1] + np.random.randn(100))

# Cria DataFrame
df = pd.DataFrame({'caracteristica1': X[:, 0], 'caracteristica2': X[:, 1], 'classe': y})

# Configura validação cruzada com 5 folds
kfold = KFold(n_splits=5, shuffle=True, random_state=42)

# Inicializa modelo
model = LinearRegression()

# Armazena scores e desvios padrão
scores = []
std_devs = []

# Itera sobre os folds
for train_index, test_index in kfold.split(X):
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]


# Treina o modelo no conjunto de treinamento
    model.fit(X_train, y_train)

    # Faz previsões no conjunto de teste
    y_pred = model.predict(X_test)

    # Calcula o erro médio absoluto
    mae = mean_absolute_error(y_test, y_pred)

    # Armazena scores e desvios padrão
    scores.append(mae)
    std_devs.append(np.std(y_pred - y_test))


# Mostrando os resultados
print("Scores da validação cruzada:")
print(scores)

print("Desvios padrão:")
print(std_devs)

print("MAE médio:", np.mean(scores))
print("Desvio padrão do MAE:", np.std(scores))

Scores da validação cruzada:
[0.7029154837311256, 0.8057328871752519, 0.8751863699639845, 0.9727943328042411, 0.9007801035080109]
Desvios padrão:
[0.8005064919733853, 1.0539908019578184, 0.9273080028361886, 1.2565773623847523, 1.0770272650128445]
MAE médio: 0.8514818354365229
Desvio padrão do MAE: 0.09151379495537142
