# **Lista de exercícios 3**: *Support Vector Machines*

Prof. Dr. Rodrigo Colnago Contreras <br />
contreras@unifesp.br

---

### Exercício 0: Definição de modelos supervisionados de SVM

Defina duas funções:

```python
def retorna_modelo_SVM(X, y, kernel_f, C):
```
e
```python
def retorna_modelo_SVR(X, y, kernel_f, C):
```

**Parâmetros de entrada:**
`X`: matriz de entrada de tamanho (`n_amostras, n_features`), contendo os vetores de características das amostras;

`y`: vetor de rótulos supervisionados;

`C`: parâmetro de penalização para margens suaves (quanto maior, menor a tolerância ao erro).

**Requisitos**:

Função `retorna_modelo_SVM`:

Deve construir um modelo de classificação binária com SVM com função de kernel `kernel_f`;

A saída da função deve ser um classificador que, dado um vetor `x`, retorne um rótulo em $\{−1, +1\}$;

Pressupõe-se que o vetor `y` já esteja codificado com os rótulos $−1$ e $+1$.

Função `retorna_modelo_SVR`:

Deve construir um modelo de regressão SVM (SVR) com função de kernel `kernel_f`;

A saída da função deve ser uma função preditiva capaz de retornar valores reais para novas amostras `x`.

---

#### **Observações**:

* Seu modelo deve utilizar **SVM/SVR implementado via otimização** (ex: com `cvxpy`), conforme feito em aula;
* Sempre use um kernel adequado (ex: RBF) e uma abordagem robusta de avaliação (ex: média do erro nos últimos dias antes da predição);
* Não é permitido o uso de bibliotecas prontas como `sklearn.svm.SVR`.

In [None]:
# Generalizar o código para aceitar qualquer função de kernel
import cvxpy as cp
import numpy as np

def treinar_svm_dual_generico(X, y, C=1.0, kernel_fn=None):
    """
    Treina uma SVM dual com cvxpy usando um kernel genérico.

    Retorna:
    - classificador (função que retorna -1 ou +1)
    - suporte_alphas, suporte_vetores, suporte_labels, bias
    """
    n = X.shape[0]
    y = y.astype(float)

    # Calcular matriz kernel
    K = kernel_fn(X, X)
    Q = np.outer(y, y) * K

    # Problema dual
    alpha = cp.Variable(n)
    objective = cp.Maximize(cp.sum(alpha) - 0.5 * cp.quad_form(alpha, cp.psd_wrap(Q)))
    constraints = [alpha >= 0, alpha <= C, cp.sum(cp.multiply(alpha, y)) == 0]
    problem = cp.Problem(objective, constraints)
    problem.solve()

    alpha_val = alpha.value
    support_indices = np.where(alpha_val > 1e-5)[0]
    support_alphas = alpha_val[support_indices]
    support_vectors = X[support_indices]
    support_labels = y[support_indices]

    # Função kernel entre vetor e base
    def kernel_vector(x, Y):
        return kernel_fn(Y, np.atleast_2d(x)).ravel()

    # Calcular bias b
    K_sv = kernel_fn(support_vectors, support_vectors)
    b_vals = support_labels - np.sum((support_alphas * support_labels)[:, None] * K_sv, axis=0)
    b = np.mean(b_vals)

    # Classificador
    def classificador(x):
        k_vals = kernel_vector(x, support_vectors)
        return np.sign(np.sum(support_alphas * support_labels * k_vals) + b)

    return classificador, support_alphas, support_vectors, support_labels, b


In [None]:
# Exemplo de uso:
# classificador, support_alphas, support_vectors, support_labels, b = treinar_svm_dual_generico(X_rbf, y_rbf, kernel_fn=lambda x, y: np.exp(-np.linalg.norm(x - y, axis=1)**2))

In [None]:
# Função generalizada para SVR dual com kernel arbitrário
def treinar_svr_dual(X, y, C=1.0, epsilon=0.1, kernel_fn=None):
    n = X.shape[0]
    y = y.astype(float)

    if kernel_fn is None:
        raise ValueError("É necessário fornecer uma função de kernel")

    K = kernel_fn(X, X)
    alpha = cp.Variable(n)
    alpha_star = cp.Variable(n)
    alpha_diff = alpha - alpha_star

    objective = cp.Maximize(
        -0.5 * cp.quad_form(alpha_diff, cp.psd_wrap(K)) -
        epsilon * cp.sum(alpha + alpha_star) +
        cp.sum(cp.multiply(y, alpha_diff))
    )

    constraints = [
        alpha >= 0,
        alpha <= C,
        alpha_star >= 0,
        alpha_star <= C,
        cp.sum(alpha_diff) == 0
    ]

    problem = cp.Problem(objective, constraints)
    problem.solve()

    alpha_val = alpha.value
    alpha_star_val = alpha_star.value
    alpha_diff_val = alpha_val - alpha_star_val

    # Calcular b
    inside_margin = (alpha_val > 1e-5) & (alpha_val < C - 1e-5)
    inside_margin |= (alpha_star_val > 1e-5) & (alpha_star_val < C - 1e-5)
    b_vals = []
    for i in np.where(inside_margin)[0]:
        b_i = y[i] - np.sum(alpha_diff_val * K[i, :])
        b_vals.append(b_i)
    b = np.mean(b_vals)

    def preditor(x):
        k = kernel_fn(X, np.atleast_2d(x)).ravel()
        return np.sum(alpha_diff_val * k) + b

    return preditor, alpha_val, alpha_star_val, alpha_diff_val, b


In [None]:
# Exemplo de uso:

# def rbf_kernel(X1, X2, gamma=1.0):
#     X1 = np.atleast_2d(X1)
#     X2 = np.atleast_2d(X2)
#     sq_dists = np.sum(X1**2, axis=1)[:, None] + np.sum(X2**2, axis=1) - 2 * X1 @ X2.T
#     return np.exp(-gamma * sq_dists)

# preditor, alpha_val, alpha_star_val, alpha_diff_val, b = treinar_svr_dual(X_rbf, y_rbf, kernel_fn=lambda x, y: rbf_kernel(x,y))

### Exercício 1: Sobreviventes do Titanic com SVM

Neste exercício, você irá utilizar a base de dados do Titanic para treinar e testar um classificador baseado em **Máquinas de Vetores de Suporte (SVM)**.

#### Etapas:

1. **Carregue os dados** da competição do Titanic (disponível em: https://www.kaggle.com/c/titanic/data e https://medium.com/@mdbaraujo/explora%C3%A7%C3%A3o-de-dados-dataset-titanic-machine-learning-c30bc06227d6).
   - Utilize apenas o arquivo `train.csv`.

2. **Reparta o dataset manualmente**:
   - Use as **primeiras 75% das linhas** como conjunto de **treinamento**;
   - Use as **últimas 25% das linhas** como conjunto de **teste**.

3. **Pré-processamento dos dados**:
   - Remova colunas não informativas (`PassengerId`, `Name`, `Ticket`, `Cabin`);
   - Converta variáveis categóricas em numéricas (ex: `Sex`, `Embarked`);
   - Preencha valores ausentes (`Age`, `Embarked`, etc.).

4. **Treine uma SVM**:
   - Use as funções discutidas em sala de aula;
   - Escolha um kernel (ex: `'linear'` ou `'rbf'`);
   - Treine o modelo sobre os dados de treino.

5. **Avalie o modelo**:
   - Aplique seu modelo ao conjunto de teste para estimar se um passageiro sobreviveu ou não;
   - Qual a porcentagem de acertos de seu modelo?

6. **Interpretação e Discussão**:
   - O desempenho foi satisfatório?
   - Qual kernel parece funcionar melhor?

In [None]:
# Solução:

### Exercício 2: Predição do Próximo Valor do Bitcoin com SVR

Neste exercício, você deve utilizar dados históricos do Bitcoin para construir um **modelo de regressão com SVM (SVR)** que seja capaz de **prever o próximo valor de fechamento diário** com base nos valores anteriores.

#### Etapas:

1. **Obtenha os dados históricos do Bitcoin**:
   - Você pode usar a biblioteca `yfinance`:
     ```python
     import yfinance as yf
     btc = yf.download("BTC-USD", start="2021-01-01", end="2023-01-01")
     ```
   - Use apenas a coluna `Close` como série temporal.

2. **Crie os dados para treino**:
   - Use observações anteriores para criar vetores de características e variáveis resposta (ex: utilize vetores de tamanho 50 do período sugerido para predizer a observação 51).

3. **Escreva uma função chamada `treinar_e_predizer_svr(X, y)` que**:
   - Treina um modelo de SVR com kernel RBF;
   - Retorna uma predição para o próximo valor com base na última janela disponível.

4. **Avalie o modelo**:
   - Separe os dados em treino e teste (ex: utilize vetores de tamanho 50 do período sugerido para predizer a observação 51);
   - Calcule o erro médio absoluto (MAE) da predição nos dados de teste.

---



In [None]:
# Solução:

### Exercício 3: Predição do Próximo Valor do Bitcoin com SVR utilizando janelas de BTC e ETH

Neste exercício, você deve construir um modelo de regressão baseado em SVM (SVR) para prever o **preço de fechamento do Bitcoin no dia 12 de abril de 2025**, utilizando dados dos 10 dias anteriores do próprio Bitcoin **e** também os 10 dias anteriores do Ethereum.

---

**Colher de chá**:

#### Objetivo:

Crie uma função chamada:

```python
def prever_btc_12abril2025():
```

Essa função deve:

1. Baixar os dados históricos de fechamento diário de **Bitcoin (BTC-USD)** e **Ethereum (ETH-USD)** usando `yfinance`;
2. Utilizar os **10 dias anteriores a 12/04/2025** para compor as variáveis preditoras:

   * 10 preços do Bitcoin (`BTC_{t-10}` até `BTC_{t-1}`);
   * 10 preços do Ethereum (`ETH_{t-10}` até `ETH_{t-1}`);
3. Treinar um modelo de **regressão SVM (SVR)** com os dados anteriores (de forma supervisionada);
4. Aplicar o modelo para prever o valor do **Bitcoin no dia 12/04/2025**;
5. Retornar o valor previsto.

---

#### Dicas:

* Utilize a biblioteca `yfinance` para obter os dados:

  ```python
  import yfinance as yf
  btc = yf.download("BTC-USD", start="2021-01-01")
  eth = yf.download("ETH-USD", start="2021-01-01")
  ```

---





In [None]:
# Solução:

### Exercício 4: Predição de $k$ Próximos Valores do Bitcoin com SVR utilizando janelas de BTC e ETH

Neste exercício, você deve construir um modelo de regressão baseado em SVM (SVR) para prever o **preço de fechamento do Bitcoin em $k$ dias a partir de um dia específico**, utilizando dados dos 10 dias anteriores do próprio Bitcoin **e** também os 10 dias anteriores do Ethereum.


In [None]:
# Solução:

### Exercício 5: Classificação Multiclasse com SVM

Nos exercícios anteriores, trabalhamos com **classificadores binários** (duas classes apenas) utilizando Máquinas de Vetores de Suporte (SVM).

Agora, seu desafio é **generalizar essa abordagem para problemas com múltiplas classes**.

#### Objetivo:

Implemente uma função chamada `treinar_svm_multiclasse(X, y, C=1.0)` que:

- Treina um modelo SVM **multiclasse** a partir de um conjunto de dados com `k > 2` classes;
- Utiliza apenas um classificador binário como base (ex: como nos exercícios anteriores);
- Retorna um modelo preditivo capaz de classificar **novas amostras** em uma entre `k` classes.

---

#### Dicas:

- Utilize a estratégia **One-vs-Rest (OvR)**:
  - Para cada classe `i`, treine um classificador binário para distinguir “classe `i`” contra “todas as outras”;
  - Para prever uma nova amostra, aplique todos os classificadores e escolha aquele com **maior confiança** (ex: valor do hiperplano mais distante de zero).

---

#### Exemplo de uso esperado:

```python
modelo = treinar_svm_multiclasse(X_train, y_train)
y_pred = modelo(X_test)  # Retorna um vetor com rótulos de múltiplas classes


### Exercício 6: Tipo de floresta com SVM

Repita o exercício 1 com o arquivo `covtype.csv` da base CoverType  (disponível em: https://www.kaggle.com/datasets/uciml/forest-cover-type-dataset/data?select=covtype.csv).