# Importando elementos importantes

In [1]:
import torch
import matplotlib.pyplot as plt
import itertools

from nn.rbf import RBF
from sklearn.datasets import load_boston
from sklearn.metrics import mean_squared_error

# Carregando a base Boston Housing e Inicializando a RBF

In [2]:
x, y = load_boston(return_X_y=True)
rbf = RBF(x=x, y=y, c=5, gamma=1e-3)

# Treinamento com 80% das amostras (1a)

In [3]:
thetas = rbf.fit()
y_pred = rbf.predict(thetas=thetas)

# Erro quadratico medio

In [4]:
rbf.rmse(y_pred=y_pred).item()

8.836027564196336

# Definindo variacoes para o numero de centroides e para o gamma

In [5]:
cvalues = [c for c in range(3, 9)]
gvalues = [10**-g for g in range(1, 7)]

In [9]:
count = 0
for c, g in itertools.product(cvalues, gvalues):
    separator = '' if (count % 2) == 0 else '|\n'
    rbf.set_params(c=c, gamma=g, x=rbf.x_train)
    thetas = rbf.fit()
    y_pred = rbf.predict(thetas=thetas)
    rmse = rbf.rmse(y_pred=y_pred).item()
    print(f'| c = {c:02d} | gamma = {g:.6f} | RMSE = {rmse:07.4f} ', end=separator)
    count+=1


| c = 03 | gamma = 0.100000 | RMSE = 09.6938 | c = 03 | gamma = 0.010000 | RMSE = 09.9582 |
| c = 03 | gamma = 0.001000 | RMSE = 13.7807 | c = 03 | gamma = 0.000100 | RMSE = 12.1678 |
| c = 03 | gamma = 0.000010 | RMSE = 10.0535 | c = 03 | gamma = 0.000001 | RMSE = 08.6790 |
| c = 04 | gamma = 0.100000 | RMSE = 13.1454 | c = 04 | gamma = 0.010000 | RMSE = 10.5015 |
| c = 04 | gamma = 0.001000 | RMSE = 09.4167 | c = 04 | gamma = 0.000100 | RMSE = 23.0296 |
| c = 04 | gamma = 0.000010 | RMSE = 11.5323 | c = 04 | gamma = 0.000001 | RMSE = 11.7588 |
| c = 05 | gamma = 0.100000 | RMSE = 09.7619 | c = 05 | gamma = 0.010000 | RMSE = 09.7412 |
| c = 05 | gamma = 0.001000 | RMSE = 16.0636 | c = 05 | gamma = 0.000100 | RMSE = 10.2887 |
| c = 05 | gamma = 0.000010 | RMSE = 52.8315 | c = 05 | gamma = 0.000001 | RMSE = 11.1507 |
| c = 06 | gamma = 0.100000 | RMSE = 10.7105 | c = 06 | gamma = 0.010000 | RMSE = 23.4404 |
| c = 06 | gamma = 0.001000 | RMSE = 08.8299 | c = 06 | gamma = 0.000100 | RMSE 

# Conclusão
A definição de centróides para este problema é de suma relevância. Caso os valores escolhidos não sejam valores adequados, o modelo pode convergir para outro problema e caso haja centróides de mais, o modelo pode simplesmente se adaptar de mais (overfitting). Em comparação com o modelo linear feito no exercício anterior, este modelo se sai melhor quando tem seus parâmetros bem ajustados, pois sua conversão é mais rápida e mais precisa. (1b)

Acima podemos ver diversos testes com variações nos valores de C e de GAMMA. O melhor valor obtido foi c=3, gamma=1e-6.

# Autores
- **Christiano Machado** @ https://github.com/chrismachado
- **Vitor Veras** @ https://github.com/vitorverasm