## K-FOLD

Abaixo está um exemplo básico de como você pode implementar a validação cruzada K-Fold em Python usando a biblioteca scikit-learn.

Neste exemplo:

    X é o conjunto de características.
    y é o vetor de rótulos.
    n_folds é o número de folds desejado.
    KFold é usado para dividir o conjunto de dados.
    Um modelo de regressão logística é treinado em cada fold.
    A acurácia é calculada para cada fold, e a média é exibida no final.

Lembre-se de que este é um exemplo simples, e você pode substituir o modelo e o conjunto de dados pelos que estão sendo usados no seu caso específico.

In [6]:
from sklearn.model_selection import KFold
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
import numpy as np

# Exemplo de conjunto de dados fictício
X = np.array([[0, 2], [3, 5], [4, 6], [7, 9], [2, 4], [2, 6], [3, 9], [5, 7], [3, 7]])
y = np.array([0, 1, 0, 1, 0, 0, 1, 1, 1])

# Número de folds (K)
n_folds = 3

# Inicializa o objeto KFold
kf = KFold(n_splits=n_folds, shuffle=True, random_state=42)

# Inicializa um modelo (pode ser qualquer modelo de sua escolha)
model = LogisticRegression()

# Lista para armazenar as métricas de desempenho
accuracy_scores = []

# Loop sobre os folds
for train_index, test_index in kf.split(X):
    # Divisão dos dados
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]

    # Treina o modelo
    model.fit(X_train, y_train)

    # Realiza previsões no conjunto de teste
    predictions = model.predict(X_test)

    # Calcula a acurácia e armazena
    accuracy = accuracy_score(y_test, predictions)
    accuracy_scores.append(accuracy)

# Calcula a média das acurácias
average_accuracy = np.mean(accuracy_scores)
std_accuracy = np.std(accuracy_scores)

print(f'Acurácia média usando {n_folds}-fold: {average_accuracy}')
print(f'Desvio Padrão usando {n_folds}-fold: {std_accuracy}')

Acurácia média usando 3-fold: 0.7777777777777777
Desvio Padrão usando 3-fold: 0.15713484026367724


## Leave-One-Out
Aqui está um exemplo básico de como implementar a validação cruzada Leave-One-Out (LOO) em Python usando a biblioteca scikit-learn.

Neste exemplo:

    X é o conjunto de características.
    y é o vetor de rótulos.
    LeaveOneOut é usado para criar conjuntos de treino/teste com apenas uma instância no conjunto de teste em cada iteração.
    Um modelo de regressão logística é treinado em cada iteração.
    A acurácia é calculada para cada iteração, e a média é exibida no final.

Lembre-se de que o LOO pode ser computacionalmente caro para conjuntos de dados grandes, pois exige treinamento e avaliação do modelo para cada instância no conjunto de dados.

In [7]:
from sklearn.model_selection import LeaveOneOut
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
import numpy as np

# Exemplo de conjunto de dados fictício
X = np.array([[0, 2], [3, 5], [4, 6], [7, 9], [2, 4], [2, 6], [3, 9], [5, 7], [3, 7]])
y = np.array([0, 1, 0, 1, 0, 0, 1, 1, 1])

# Inicializa o objeto LeaveOneOut
loo = LeaveOneOut()

# Inicializa um modelo (pode ser qualquer modelo de sua escolha)
model = LogisticRegression()

# Lista para armazenar as métricas de desempenho
accuracy_scores = []

# Loop sobre os folds
for train_index, test_index in loo.split(X):
    # Divisão dos dados
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]

    # Treina o modelo
    model.fit(X_train, y_train)

    # Realiza previsões no conjunto de teste
    predictions = model.predict(X_test)

    # Calcula a acurácia e armazena
    accuracy = accuracy_score(y_test, predictions)
    accuracy_scores.append(accuracy)

# Calcula a média das acurácias
average_accuracy = np.mean(accuracy_scores)
std_accuracy = np.std(accuracy_scores)

print(f'Acurácia média usando Leave-One-Out: {average_accuracy}')
print(f'Acurácia média usando Leave-One-Out: {std_accuracy}')

Acurácia média usando Leave-One-Out: 0.6666666666666666
Acurácia média usando Leave-One-Out: 0.4714045207910317


In [None]:
## Stratified K-fold

Aqui está um exemplo básico de como implementar a validação cruzada Stratified K-Fold em Python usando a biblioteca scikit-learn
