## üìä T√©cnicas de Valida√ß√£o de Modelos

As **t√©cnicas de valida√ß√£o de modelos** s√£o m√©todos usados para **avaliar o desempenho de um modelo de machine learning** em dados **n√£o vistos**, ou seja, dados que n√£o foram usados durante o treinamento. O objetivo √© **estimar como o modelo se comportar√° no mundo real**, com dados novos.

### üß† Por que validar um modelo?

Quando criamos um modelo de machine learning, queremos ter certeza de que ele:

- **Aprendeu bem os padr√µes dos dados de treino** (sem memorizar),
- **Generaliza bem para dados novos** (n√£o caiu em overfitting),
- **Tem bom desempenho em situa√ß√µes reais**.

A valida√ß√£o nos ajuda a responder perguntas como:
> "Esse modelo vai performar bem quando eu coloc√°-lo em produ√ß√£o?"

### üß™ Exemplo Geral

Vamos usar o famoso conjunto de dados **Iris**, que √© perfeito para demonstra√ß√µes r√°pidas:

In [1]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# Carregando os dados
iris = load_iris()
X, y = iris.data, iris.target

Usaremos um modelo simples de classifica√ß√£o: **Random Forest**.

In [2]:
model = RandomForestClassifier(random_state=42)

### üîç Principais T√©cnicas de Valida√ß√£o

Vamos conhecer as t√©cnicas mais comuns, explicadas de forma simples:

#### 1. Holdout (Divis√£o treino/teste/valida√ß√£o)

- √â a t√©cnica mais simples.
- Divide os dados em duas partes:
  - **Treino** (ex: 70% dos dados) ‚Äì usado para treinar o modelo,
  - **Teste** (ex: 30%) ‚Äì usado para avaliar o modelo.

‚úÖ **Vantagem**: r√°pida e f√°cil  
‚ùå **Desvantagem**: pode ser imprecisa se a divis√£o for ruim (ex: dados desbalanceados)

- Exemplo: 

    ```python
    from sklearn.model_selection import train_test_split

    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
    X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.25)
    ```

In [3]:
# Divis√£o treino-teste (70% treino, 30% teste)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Treinando o modelo
model.fit(X_train, y_train)

# Fazendo previs√µes
y_pred = model.predict(X_test)

# Avaliando
print("Acur√°cia (Holdout):", accuracy_score(y_test, y_pred))

Acur√°cia (Holdout): 1.0


### 2. Valida√ß√£o Cruzada (k-fold)

- Divide os dados em **K partes (folds)** (por exemplo, K=5).
- O modelo √© treinado e testado **K vezes**, sempre usando uma parte diferente para teste e as demais para treino.
- No final, calcula-se a m√©dia das m√©tricas obtidas.
- Mais confi√°vel que o Holdout. Divide os dados em partes iguais.

‚úÖ **Vantagem**: uso mais eficiente dos dados, resultado mais confi√°vel  
‚ùå **Desvantagem**: mais lento que o Holdout

Exemplo comum: **K-Fold Cross Validation**

- Exemplo:
    ```python 
    from sklearn.model_selection import cross_val_score
    from sklearn.ensemble import RandomForestClassifier

    scores = cross_val_score(RandomForestClassifier(), X, y, cv=5)
    print("Acur√°cia m√©dia:", scores.mean())
    ```

In [4]:
from sklearn.model_selection import cross_val_score

# Valida√ß√£o cruzada com 5 folds
scores = cross_val_score(model, X, y, cv=5)

print("Acur√°cias em cada fold:", scores)
print("M√©dia da acur√°cia:", scores.mean())

Acur√°cias em cada fold: [0.96666667 0.96666667 0.93333333 0.96666667 1.        ]
M√©dia da acur√°cia: 0.9666666666666668


### 3. Leave-One-Out


- Uma varia√ß√£o extrema da valida√ß√£o cruzada.
- Cada amostra do conjunto de dados √© usada **uma vez como dado de teste**, enquanto o restante √© usado para treino.
- Muito custoso, mas √∫til em conjuntos pequenos.
- Muito precisa, mas custoso computacionalmente.

‚úÖ Muito precisa (com grandes conjuntos de dados)  
‚ùå Muito custosa computacionalmente


- Exemplo:
    ```python
    from sklearn.model_selection import LeaveOneOut

    loo = LeaveOneOut()
    scores = cross_val_score(model, X, y, cv=loo)
    ```

In [6]:
from sklearn.model_selection import LeaveOneOut

loo = LeaveOneOut()
scores = []

for train_index, test_index in loo.split(X):
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]
    model.fit(X_train, y_train)
    scores.append(model.score(X_test, y_test))

print("M√©dia da acur√°cia (LOO):", np.mean(scores))

M√©dia da acur√°cia (LOO): 0.9533333333333334



### 4. Valida√ß√£o Estratificada - Stratified K-Fold (para dados desbalanceados)

- Similar ao K-Fold, mas mant√©m a **distribui√ß√£o das classes** em cada fold.
- √ötil em problemas de classifica√ß√£o com dados **desbalanceados**.
- Garante distribui√ß√£o proporcional das classes nos folds.
- Mant√©m a propor√ß√£o das classes em cada fold. Ideal para classifica√ß√£o desbalanceada.

- Exemplo:
    ```python
    from sklearn.model_selection import StratifiedKFold

    skf = StratifiedKFold(n_splits=5)
    ```

In [5]:
from sklearn.model_selection import StratifiedKFold

# Dados artificiais desbalanceados para exemplo
import numpy as np
y_desbalanceado = np.array([0]*90 + [1]*10)  # 90 zeros e 10 uns
X_desbalanceado = X[:100]

# Stratified K-Fold
skf = StratifiedKFold(n_splits=5)
for train_index, test_index in skf.split(X_desbalanceado, y_desbalanceado):
    X_train, X_test = X_desbalanceado[train_index], X_desbalanceado[test_index]
    y_train, y_test = y_desbalanceado[train_index], y_desbalanceado[test_index]
    model.fit(X_train, y_train)
    print("Acur√°cia (Stratified K-Fold):", model.score(X_test, y_test))

Acur√°cia (Stratified K-Fold): 0.9
Acur√°cia (Stratified K-Fold): 0.9
Acur√°cia (Stratified K-Fold): 0.95
Acur√°cia (Stratified K-Fold): 0.7
Acur√°cia (Stratified K-Fold): 0.85


### 5. Valida√ß√£o Temporal (S√©ries Temporais)

- Espec√≠fica para **s√©ries temporais**.
- Garante que os dados de teste sempre sejam **posteriores aos de treino** (evita vazamento temporal).
- Importante para n√£o embaralhar dados dependentes do tempo.

- Exemplo:
    ```python

    from sklearn.model_selection import TimeSeriesSplit
    
    tscv = TimeSeriesSplit(n_splits=5)
    
```

In [8]:
import numpy as np
from sklearn.model_selection import TimeSeriesSplit
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import r2_score

# Dados simulados como s√©rie temporal
X_ts = np.sort(np.random.rand(100, 1), axis=0)
y_ts = np.sin(X_ts).ravel() + np.random.normal(0, 0.1, 100)

# Modelo de regress√£o
model = RandomForestRegressor(random_state=42)

# Valida√ß√£o para s√©ries temporais
tscv = TimeSeriesSplit(n_splits=5)

for train_index, test_index in tscv.split(X_ts):
    X_train, X_test = X_ts[train_index], X_ts[test_index]
    y_train, y_test = y_ts[train_index], y_ts[test_index]
    
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    
    print("R¬≤ Score (TimeSeriesSplit):", r2_score(y_test, y_pred))

R¬≤ Score (TimeSeriesSplit): -0.0022504496585205036
R¬≤ Score (TimeSeriesSplit): -1.9519367995995807
R¬≤ Score (TimeSeriesSplit): -2.1442985758350996
R¬≤ Score (TimeSeriesSplit): -3.389018509057993
R¬≤ Score (TimeSeriesSplit): -2.6420987245118335


### üìä M√©tricas Comuns Usadas na Valida√ß√£o

Dependendo do tipo de problema, usamos diferentes m√©tricas para avaliar o modelo:

| Tipo de Problema | M√©tricas Comuns |
|------------------|-----------------|
| Classifica√ß√£o    | Acur√°cia, F1 Score, Precision, Recall, ROC-AUC |
| Regress√£o        | MAE, MSE, RMSE, R¬≤ |
| Clusteriza√ß√£o    | Silhouette Score, Rand Index |

### üí° Dica: N√£o use apenas acur√°cia!

- Muitas vezes, a **acur√°cia** pode enganar (principalmente em dados desbalanceados). 
- Use outras m√©tricas como **F1-score** ou **ROC-AUC** para ter uma vis√£o mais completa do desempenho do seu modelo.

### ‚úÖ Resumo Final

| T√©cnica                | Quando usar?                             |
|------------------------|------------------------------------------|
| Holdout                | Quando tem muitos dados e pouco tempo    |
| K-Fold Cross Validation| Para estimativa mais robusta do desempenho |
| Stratified K-Fold      | Em classifica√ß√µes com classes desbalanceadas |
| Leave-One-Out          | Com poucos dados e alta necessidade de precis√£o |
| Time Series Split      | Em s√©ries temporais                      |