# Modelos 03
### Sistema Não-Binário
#### Karla Pascoalini e Cauê Santos

## Proponente: 
Diana Didatolov (Diana é relativamente nova para a posição de prestígio que ocupa na Biblioteca Real. Isso aconteceu pois ela teve um papel importantíssimo durante a Guerra das Marretas Voadoras, o que resultou na sua promoção dentro da Biblioteca. A diretora anterior, que perdeu seu cargo, é sua arquirrival por conta disso).

## Objetivo:
Se informe sobre outros modelos lineares que existem. Escolha um desses modelos e faça um notebook didático mostrando como este modelo funciona e como ele se difere do modelo linear estudado em sala de aula. Em um conjunto de dados da sua escolha, treine um modelo linear múltiplo e compare o resultado com o modelo linear que você escolheu. Sua comparação deve levar em conta alguma métrica (como RMSE, por exemplo). Gráficos são muito bem-vindos!

### Comentários adicionais: 
O scikit-learn tem vários modelos lineares prontos, você pode conferir eles em https://scikit-learn.org/stable/modules/linear_model.html. A explicação aprofundada de cada modelo pode ser encontrada em livros e em vídeos.

### Modelo de Regressão Bayesiana Ridge

Diferente dos modelos que vimos anteriormente, este modelo não assume apenas um termo para levar em consideração a incerteza oriunda dos dados presentes, na verdade, vai até o final contabilizando que os dados terão valores diferentes. Entretanto, faz uma suposição importante para seu funcionamento: De que os dados seguem uma distribuição normal em sua diferença.

A regressão Bayesiana Ridge funciona assim:

- Primeiro, o modelo assume que os parâmetros da reta (a inclinação $\beta_1$ e o ponto de intercecção $\beta_0$) são distribuídos normalmente, ou seja, seguindo uma distribuição normal.
- Em segundo lugar, o modelo usa esses parâmetros para fazer uma previsão baseado no conjunto de dados fornecidos
- Em terceiro lugar, o modelo calcula a probabilidade de cada previsão estar correta.
- Finalmente, o modelo usa essas probabilidades para calcular a melhor linha possível.

Assim como vimos em probabilidade e estatística, o nome Bayesiana não é infundado, isso porque o modelo utiliza parte desse raciocínio para se "auto-ajustar" de certa forma. Quando ele calcula a probabilidade de sua previsão estar correta, é como se o modelo estivesse calculando a probabilidade do valor esperado, dado a previsão já feita.

O termo "Ridge" vem do fato de que o modelo adiciona um termo de penalidade à função de custo. Esse termo de penalidade faz com que os parâmetros do modelo sejam menores. Isso ajuda a reduzir o superajuste, pois faz com que o modelo seja menos sensível a pequenas flutuações nos dados.

Para esse modelo de aprendizado de máquina, utiliza-se a probabilidade como uma mira ou uma lente, capaz de focalizar melhor os esforços, afim de resultar em um melhor resultado no final. Também é possível adaptar os parâmetros enquanto estamos na fase de estimar os valores, além de que esse modelo pode ter um pouco mais de "molejo" com os dados, dada a sua natureza inerentemente probabilística.

A regressão Bayesiana Ridge é um modelo que pode ser usada para reduzir o "_overfitting_" em modelos de regressão linear. Ela é frequentemente usada em aplicações onde os dados são ruidosos ou não lineares.

In [28]:
import seaborn as sns

DATASET_NAME = "penguins"
FEATURES = ["bill_length_mm", "bill_depth_mm", "flipper_length_mm"]
TARGET = ["body_mass_g"]

df = sns.load_dataset(DATASET_NAME)

df = df.reindex(FEATURES + TARGET, axis=1)
df = df.dropna() 

X = df.reindex(FEATURES, axis=1)
y = df.reindex(TARGET, axis=1)

X = X.values
y = y.values.ravel()

In [29]:
from sklearn import linear_model
from sklearn.metrics import mean_squared_error
import pandas as pd
import matplotlib.pyplot as plt


reg = linear_model.BayesianRidge()
reg.fit(X, y)

# Realizar uma previsão
x = [
    [43, 20, 180],
    [39, 20.5, 170],
]
previsao = reg.predict(x)

previsao_correta = reg.predict(X)

MSE = mean_squared_error(y, previsao_correta)
RMSE = mean_squared_error(y, previsao_correta, squared = False)

print(previsao)
print(f'O MSE do modelo foi de {MSE} unidades de y ao quadrado')
print(f'O RMSE do modelo foi de {RMSE} unidades de y')

X.flatten()
y.flatten()

sns.residplot(x=X, y=y, data=df)
plt.show()

[3204.15220769 2696.41646713]
O MSE do modelo foi de 152998.96430792563 unidades de y ao quadrado
O RMSE do modelo foi de 391.15082041065136 unidades de y


ValueError: regplot inputs must be 1d

In [18]:
print(f'O R² desse modelo é de {reg.score(X,y)}')

O R² desse modelo é de 0.7614053386124096
