# TP02 - [`ESCREVA SEU NOME AQUI (RA)`]

Neste TP você implementará um algoritmo de regressão polinomial usando conceitos e notações que serão aproveitadas posteriormente em outros problemas.

**Instruções:**
- Use a versão Python 3.
- Evite sempre usar usar laços `for` e `while`, fazer contas no formato vetorial é sempre mais rápido.
- Não apague os comentários existentes, mas é claro que você pode adicionar outros comentários!

**Objetivos**
- Implementar código vetorizado
- Aplicar o algoritmo de aprendizado em modelos de diferentes capacidades
- Verificar na prática conceitos de generalização, overfitting e underfitting

## O Jupyter notebook

O Jupyter Notebook é um ambiente interativo de programação em uma página web. Nesse notebook você colocará o código entre os comentários `### SEU CÓDIGO COMEÇA AQUI ###` e `### FIM DO CÓDIGO ###`. Após escrever o código, você pode executar a célula com `Shift+Enter` ou no botão "Run" (com símbolo de "play") na barra de comandos acima.

Em alguns trechos será especificado "(≈ X linhas de código)" nos comentários para que você tenha uma ideia sobre o tamanho do código a ser desenvolvido naquele trecho. Lembrando que é só uma estimativa, o seu código pode ficar maior ou menor do que o especificado.

**Alguns atalhos úteis *no código*:**
- `Ctrl+Enter`: executa a célula e mantém o cursor na mesma célula
- `Shift+Enter`: executa a célula e move o cursor para a próxima célula
- `Ctrl+/`: comenta a linha de código
- `Shift+Tab`: quando o cursor estiver em uma função, mostra um HELP da função

**Alguns atalhos úteis *na célula*:**
- Cria nova célula `a`: acima, `b`: abaixo da céula selecionada
- `d` (2x): deleta célula selecionada
- `m`: define célula como texto (Markdown)
- `y`: define célula como código (Python)
- `l`: mostra numeração das linhas na célula de código
- `c`: copiar, `v`: colar, `x`: recortar célula selecionada
- `ctrl+shift+p`: mostra busca para todos comandos de célula

## Escreva o seu RA na variável abaixo
Atribua o número do seu RA, sem os zeros à esquerda, na variável `RA` abaixo.

In [None]:
### SEU CÓDIGO COMEÇA AQUI ### (≈ 1 linha de código)
RA = None
### FIM DO CÓDIGO ###

## Dados de treinamento e teste

Para testar modelos de redes neurais, usamos, pelo menos, dois conjuntos de dados:
- **Dados de Treinamento**: usado para ajustar os parâmetros do modelo
- **Dados de Teste (ou validação)**: usado para avaliar o desempenho do modelo em dados não treinados, para verificar se o modelo *generaliza* bem

A função abaixo gera dados sintéticos, simulando uma situação real em que teríamos dados de entrada (`x_train` e `x_test`) com os respectivos rótulos de saída (`y_train` e `y_test`). Neste problema, os dados de entrada e de saída são unidimensionais.


<mark>**Faça:** </mark>
1. Use a função `carregaDados(m, m_test)`, já implementada, para gerar dados de treinamento e de teste, com diferentes quantidades
1. Verifique as dimensões dos vetores de dados produzidos
1. Use a função com `10` dados de treinamento e `30` dados de teste e gere um gráfico mostrando os dados de treinamento e teste

In [None]:
import numpy as np, matplotlib.pyplot as plt

def carregaDados(m, m_test):
    """
    Função para carregar dados.
    Entradas
       - m: número de amostras de dados de treinamento (x_train, y_train)
       - m_test: número de amostras de dados de teste (x_test, y_test)
    Saídas
       - x_train, y_train: vetores de entrada e saída de treinamento
       - x_test, y_test: vetores de entrada e saída de teste
    """
    np.random.seed(RA%7)
    a, b, c, d = np.random.rand(4)
    x_train = np.random.uniform(-2, 2, m)
    x_test = np.random.uniform(-3, 3, m_test)
    y_train = 3*d*np.cos(1*x_train) + a/(.1*c + 1 + np.exp(-b*x_train))+np.random.normal(0,.25,m)
    y_test = 3*d*np.cos(1*x_test) + a/(.1*c + 1 + np.exp(-b*x_test))+np.random.normal(0,.05,m_test)
    return x_train, y_train, x_test, y_test

### SEU CÓDIGO COMEÇA AQUI ### (≈ 8 linhas de código)
None
### FIM DO CÓDIGO ###

**Saída esperada**

*Gráfico com os dados, semelhante ao gráfico abaixo. Atenção: o seu gráfico não será idêntico ao abaixo, pois há uma aleatoriedade na geração dos dados.*
![dados](TP02_dados.png)
___

## Modelo

Agora você vai criar o modelo. Esse modelo poderia ser uma SVM, uma rede neural, modelo RBF, entre outras. Mas, por enquanto, vamos começar com um modelo polinomial:
$$ \hat{y} = \theta_0 x^0 + \theta_1 x^1 + \theta_2 x^2 + \cdots + \theta_\ell x^\ell $$

em que $\ell$ é o grau do polinômio do modelo.

Apesar do problema original ter apenas uma entrada, consideraremos que cada termo $x^0$, $x^1$, $x^2$, ... do polinômio é uma entrada diferente. Ou seja, o nosso modelo terá o número de entradas (`input_size`) igual a
$$ n_x = \ell + 1 .$$

Usando a terminologia de redes neurais, o modelo possui um único neurônio, com função de ativação linear, e $\ell + 1$ entradas.

![dados](TP02_modelo.png)

Vamos implementar esse modelo definindo uma "classe" de modelos polinomiais. Procure na internet alguns exemplos de como implementamos classes e objetos em Python. Encontre alguns exemplos em http://pythonclub.com.br/introducao-classes-metodos-python-basico.html.

<mark>**Faça:** </mark>
- Crie uma classe chamada `polyModel`
- A classe deve ter dois atributos: `input_size`, com o número de entradas do modelo; e `w`, com o vetor de pesos do modelo.
- Na inicialização da instância da classe (método `__init__`), inicialize os pesos (`w`) de forma aleatória (distribuição normal, com média nula e desvio padrão pequeno). Além do `self` como primeiro parâmetro, este método deve receber também o número de entradas (`numEntradas`). O método vai ficar assim `__init__(self, numEntradas)`. O número de entradas recebido pelo método (`numEntradas`) deve atualizar o atributo `input_size` do objeto.
- Crie um método `setWeights(self, novo_w)` dentro da classe para definir os pesos, em que o parâmetro `novo_w` é o vetor de pesos a serem atribuidos.
- Crie uma função `forward(self, X)` dentro da classe para calcular a saída estimada ($\hat y$) para uma matriz de entrada $X$. Lembre-se que a dimensão da matriz $X$ será a mesma vista em sala de aula: dim$(X)=(n_x, m)$. Como saída, deve ser gerado um vetor com $m$ elementos.
- Deixe algum código de teste da sua classe, dos métodos e funções desenvolvidas.
- Verifique se funcionou seu código retirando os comentários do trecho indicado por `###### DESCOMENTE AQUI PARA TESTAR`.
- Confira se a saída gerada está igual ao gráfico mostrado em "Saída esperada" abaixo.

In [None]:
### SEU CÓDIGO COMEÇA AQUI ### (≈ 11 linhas de código)
None
### FIM DO CÓDIGO ###


# ###### DESCOMENTE AQUI PARA TESTAR
# m = 100 # quantidade de dados
# n_x = 4 # número de entradas (l-1)
# modelo = polyModel(n_x) # cria objeto chamado "modelo"
# modelo.setWeights(np.array((1,2,3,4))) # atribui alguns pesos específicos
# # Cria dados de Para gerar gráfico
# x = np.linspace(-5,5,m)
# X = np.array([x**p for p in np.arange(n_x)])
# # Usa o modelo para gerar saída
# yh = modelo.forward(X)
# plt.figure(figsize=(8,2))
# plt.plot(x, yh);
# plt.xlabel("entrada")
# plt.ylabel("saída do modelo");

**Saída esperada**

![dados](TP02_saidaModelo.png)
___

## Testando o modelo

Use a função `carregaDados` para gerar dados de treinamento e teste. Crie um modelo, usando a classe `polyModel` criada. Com os dados gerados, use os dados de *treinamento* para treinar o modelo. Para isso, faça o seguinte:
1. Arranje os dados de entrada numa matriz `X` com dimensões apropriadas (confira as dimensões!)
2. Implemente a solução de mínimos quadrados, conhecida como pseudo-inversa, usando a função disponível em `np.linalg.pinv` (confira as dimensões de todas as matrizes!)
3. Faça o treinamento do modelo, ou seja, ajuste os pesos do modelo criado com a solução de mínimos quadrados calculada.
4. Faça um gráfico comparando os dados de treinamento com a saída do modelo para os dados de treinamento.
4. Indique o RMSE obtido para os dados de treinamento no título do gráfico.
4. Faça um gráfico comparando os dados de teste com a saída do modelo para os dados de teste.
4. Indique o RMSE obtido para os dados de teste no título do gráfico.

Faça esse mesmo procedimento com 3 modelos diferentes: um de baixa ordem (entre 1 e 2), outro de grau médio (entre 3 e 5) e outro de alto grau (maior que 6). Gere dois gráficos para cada situação, indicando o erro nos dados de treinamento e o erro nos dados de teste.

#### Modelo de baixa capacidade (ordem)

In [None]:
### SEU CÓDIGO COMEÇA AQUI ### (≈ 20 linhas de código)
None
### FIM DO CÓDIGO ###

#### Modelo de média capacidade (ordem)

In [None]:
### SEU CÓDIGO COMEÇA AQUI ### (≈ 20 linhas de código)
None
### FIM DO CÓDIGO ###

#### Modelo de alta capacidade (ordem)

In [None]:
### SEU CÓDIGO COMEÇA AQUI ### (≈ 20 linhas de código)
None
### FIM DO CÓDIGO ###

**Saída esperada**
Para cada uma das 3 células, são esperados 2 gráficos (total de 6 gráficos), indicando o desempenho do modelo nos dados de treinamento (1º gráfico) e nos dados de teste (2º gráfico). O código deve gerar também o RMSE calculado nos dados de treinamento (colocar no título com o 1º gráfico) e nos dados de teste (colocar no título com o 2º gráfico).
___


# Conclusões

Escreva aqui as conclusões deste exercício. Deixo abaixo algumas perguntas motivadoras para a discussão.

Qual a relação entre o RMSE calculado nos dados de treinamento e o RMSE calculado nos dados de teste? Qual é maior? Um RMSE bom nos dados de treinamento implica, necessariamente, em um bom RMSE nos dados de teste? Por que? Quais informações são possíveis obter olhando apenas para esses dois valores de erro? O que esses erros tem a ver com a *capacidade de generalização* do modelo?
___

[`escreva aqui`]