# Regressão Polinomial

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.stats.api as sms

In [None]:
dados = pd.read_csv('Regressao_Polinomial.csv')

In [None]:
dados.head()

In [None]:
X = dados['X'].values
Y = dados['Y'].values

In [None]:
plt.scatter(X,Y,label='Y(X)');
plt.xlabel('X');
plt.ylabel('Y');
plt.legend();

# Análise descritiva

In [None]:
pd.options.display.float_format = '{:.2f}'.format

In [None]:
dados.describe()

In [None]:
dados.info()

In [None]:
# Análise gráfica - Pairplot
import seaborn as sns
sns.pairplot(dados)
plt.suptitle("Análise Gráfica dos Dados", y=1.02)
plt.show()

In [None]:
# Correlação entre variáveis
correlation_matrix = dados.corr()
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, cmap="RdYlGn", fmt=".2f")
plt.title("Matriz de Correlação")
plt.show()

In [None]:
modelo2 = np.poly1d(np.polyfit(X, Y, 2))
modelo3 = np.poly1d(np.polyfit(X, Y, 3))
modelo4 = np.poly1d(np.polyfit(X, Y, 4))
modelo5 = np.poly1d(np.polyfit(X, Y, 5))

In [None]:
y2 = modelo2(X)
y3 = modelo3(X)
y4 = modelo4(X)
y5 = modelo5(X)

In [None]:
residuos2 = Y - y2
residuos3 = Y - y3
residuos4 = Y - y4
residuos5 = Y - y5

In [None]:
fig, ax = plt.subplots(2, 2)
ax[0,0].scatter(X,Y);
ax[0,0].plot(X,y2,color='red');
ax[0,0].set_title('Grau 2');

ax[0,1].scatter(X,Y);
ax[0,1].plot(X,y3,color='red');
ax[0,1].set_title('Grau 3');

ax[1,0].scatter(X,Y);
ax[1,0].plot(X,y4,color='red');
ax[1,0].set_title('Grau 4');

ax[1,1].scatter(X,Y);
ax[1,1].plot(X,y5,color='red');
ax[1,1].set_title('Grau 5');
plt.tight_layout();

### Verificando os pressupostos

### Teste de Normalidade dos resíduos

Ho = distribuição normal : p > 0.05

Ha = distribuição != normal : p <= 0.05

In [None]:
import scipy.stats as stats

In [None]:
# Calcular o teste de Shapiro-Wilk para cada conjunto de resíduos
estatistica2, p2 = stats.shapiro(residuos2)
estatistica3, p3 = stats.shapiro(residuos3)
estatistica4, p4 = stats.shapiro(residuos4)
estatistica5, p5 = stats.shapiro(residuos5)

# Imprimir os resultados
print('Resíduos do Modelo Polinomial de Grau 2:')
print('Estatística de teste: {}'.format(estatistica2))
print('p-valor: {}'.format(p2))
print()
print('Resíduos do Modelo Polinomial de Grau 3:')
print('Estatística de teste: {}'.format(estatistica3))
print('p-valor: {}'.format(p3))
print()
print('Resíduos do Modelo Polinomial de Grau 4:')
print('Estatística de teste: {}'.format(estatistica4))
print('p-valor: {}'.format(p4))
print()
print('Resíduos do Modelo Polinomial de Grau 5:')
print('Estatística de teste: {}'.format(estatistica5))
print('p-valor: {}'.format(p5))

In [None]:
# Definir os modelos polinomiais e calcular os resíduos para cada modelo
modelos = [y2, y3, y4, y5]
residuos = [residuos2, residuos3, residuos4, residuos5]

# Configurar a plotagem de subplots
fig, axs = plt.subplots(2, 2, figsize=(12, 10))

# Iterar sobre os modelos e resíduos para plotar os gráficos Q-Q
for i, (modelo, residuo) in enumerate(zip(modelos, residuos)):
    ax = axs[i//2, i%2]  # Selecionar o subplot correspondente
    stats.probplot(residuo, dist='norm', plot=ax)
    ax.set_title(f'Modelo Polinomial de Grau {i+2}')
    ax.set_xlabel('Quantis teóricos')
    ax.set_ylabel('Quantis observados')

# Ajustar o layout e mostrar os gráficos
plt.tight_layout()
plt.show()

### Análise da Homocedasticidade dos resíduos
(resíduos com variação constante)

**Teste Breusch-Pagan (Homocedasticidade ou heterocedasticidade)**

Ho = existe homocedasticidade : p > 0.05

Ha = não existe homocedasticidade : p <= 0.05

In [None]:
from statsmodels.stats.diagnostic import het_breuschpagan

In [None]:
import statsmodels.api as sm

# Adicionar uma coluna de 1s para representar a constante
X_with_constant = sm.add_constant(X)

# Calcular o teste de Breusch-Pagan para cada conjunto de resíduos
statistic2, p_value2, f_value2, f_p_value2 = het_breuschpagan(residuos2, X_with_constant)
statistic3, p_value3, f_value3, f_p_value3 = het_breuschpagan(residuos3, X_with_constant)
statistic4, p_value4, f_value4, f_p_value4 = het_breuschpagan(residuos4, X_with_constant)
statistic5, p_value5, f_value5, f_p_value5 = het_breuschpagan(residuos5, X_with_constant)

# Imprimir os resultados
print('Teste de Breusch-Pagan para o Modelo Polinomial de Grau 2:')
print('Estatística de teste:', statistic2)
print('Valor p:', p_value2)
print('Estatística F:', f_value2)
print('Valor p (F):', f_p_value2)
print()
print('Teste de Breusch-Pagan para o Modelo Polinomial de Grau 3:')
print('Estatística de teste:', statistic3)
print('Valor p:', p_value3)
print('Estatística F:', f_value3)
print('Valor p (F):', f_p_value3)
print()
print('Teste de Breusch-Pagan para o Modelo Polinomial de Grau 4:')
print('Estatística de teste:', statistic4)
print('Valor p:', p_value4)
print('Estatística F:', f_value4)
print('Valor p (F):', f_p_value4)
print()
print('Teste de Breusch-Pagan para o Modelo Polinomial de Grau 5:')
print('Estatística de teste:', statistic5)
print('Valor p:', p_value5)
print('Estatística F:', f_value5)
print('Valor p (F):', f_p_value5)


In [None]:
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score

In [None]:
MAE2 = mean_absolute_error(Y,y2)
MAE3 = mean_absolute_error(Y,y3)
MAE4 = mean_absolute_error(Y,y4)
MAE5 = mean_absolute_error(Y,y5)

MSE2 = np.sqrt(mean_squared_error(Y,y2))
MSE3 = np.sqrt(mean_squared_error(Y,y3))
MSE4 = np.sqrt(mean_squared_error(Y,y4))
MSE5 = np.sqrt(mean_squared_error(Y,y5))

r_squared2 = r2_score(Y,y2)
r_squared3 = r2_score(Y,y3)
r_squared4 = r2_score(Y,y4)
r_squared5 = r2_score(Y,y5)

# Imprimir as métricas
print("Métricas para o Modelo Polinomial de Grau 2:")
print("MAE (grau=2) = {:0.4f}".format(MAE2))
print("MSE (grau=2) = {:0.4f}".format(MSE2))
print("R² (grau=2) = {:0.4f}".format(r_squared2))
print()

print("Métricas para o Modelo Polinomial de Grau 3:")
print("MAE (grau=3) = {:0.4f}".format(MAE3))
print("MSE (grau=3) = {:0.4f}".format(MSE3))
print("R² (grau=3) = {:0.4f}".format(r_squared3))
print()

print("Métricas para o Modelo Polinomial de Grau 4:")
print("MAE (grau=4) = {:0.4f}".format(MAE4))
print("MSE (grau=4) = {:0.4f}".format(MSE4))
print("R² (grau=4) = {:0.4f}".format(r_squared4))
print()

print("Métricas para o Modelo Polinomial de Grau 5:")
print("MAE (grau=5) = {:0.4f}".format(MAE5))
print("MSE (grau=5) = {:0.4f}".format(MSE5))
print("R² (grau=5) = {:0.4f}".format(r_squared5))

# Regressão Polinomial - SciKit Learn

In [None]:
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression

# GRAU 2

In [None]:
caracteristicas_2= PolynomialFeatures(degree=2)
X = X.reshape(-1, 1)
X_Polinomio_2 = caracteristicas_2.fit_transform(X)

In [None]:
modelo2 = LinearRegression()
modelo2.fit(X_Polinomio_2, Y)
Y_Polinomio_2 = modelo2.predict(X_Polinomio_2)

In [None]:
plt.scatter(X,Y,label='Y(X)');
plt.plot(X,Y_Polinomio_2,color='red',label='Ajuste');
plt.xlabel('X');
plt.ylabel('Y');
plt.legend();

# Grau 3

In [None]:
caracteristicas_3= PolynomialFeatures(degree=3)
X = X.reshape(-1, 1)
X_Polinomio_3 = caracteristicas_3.fit_transform(X)

In [None]:
modelo3 = LinearRegression()
modelo3.fit(X_Polinomio_3, Y)
Y_Polinomio_3 = modelo3.predict(X_Polinomio_3)

In [None]:
plt.scatter(X,Y,label='Y(X)');
plt.plot(X,Y_Polinomio_3,color='red',label='Ajuste');
plt.xlabel('X');
plt.ylabel('Y');
plt.legend();

# Grau 4

In [None]:
caracteristicas_4= PolynomialFeatures(degree=4)
X = X.reshape(-1, 1)
X_Polinomio_4 = caracteristicas_4.fit_transform(X)

In [None]:
modelo4 = LinearRegression()
modelo4.fit(X_Polinomio_4, Y)
Y_Polinomio_4 = modelo4.predict(X_Polinomio_4)

In [None]:
plt.scatter(X,Y,label='Y(X)');
plt.plot(X,Y_Polinomio_4,color='red',label='Ajuste');
plt.xlabel('X');
plt.ylabel('Y');
plt.legend();

# Grau 5

In [None]:
caracteristicas_5= PolynomialFeatures(degree=5)
X = X.reshape(-1, 1)
X_Polinomio_5 = caracteristicas_5.fit_transform(X)

In [None]:
modelo5 = LinearRegression()
modelo5.fit(X_Polinomio_5, Y)
Y_Polinomio_5 = modelo5.predict(X_Polinomio_5)

In [None]:
plt.scatter(X,Y,label='Y(X)');
plt.plot(X,Y_Polinomio_5,color='red',label='Ajuste');
plt.xlabel('X');
plt.ylabel('Y');
plt.legend();

# Calculando erros

In [None]:
MAE2 = mean_absolute_error(Y,y2)
MAE3 = mean_absolute_error(Y,y3)
MAE4 = mean_absolute_error(Y,y4)
MAE5 = mean_absolute_error(Y,y5)

MSE2 = np.sqrt(mean_squared_error(Y,y2))
MSE3 = np.sqrt(mean_squared_error(Y,y3))
MSE4 = np.sqrt(mean_squared_error(Y,y4))
MSE5 = np.sqrt(mean_squared_error(Y,y5))

r_squared2 = r2_score(Y,y2)
r_squared3 = r2_score(Y,y3)
r_squared4 = r2_score(Y,y4)
r_squared5 = r2_score(Y,y5)

# Imprimir as métricas
print("Métricas para o Modelo Polinomial de Grau 2:")
print("MAE (grau=2) = {:0.4f}".format(MAE2))
print("MSE (grau=2) = {:0.4f}".format(MSE2))
print("R² (grau=2) = {:0.4f}".format(r_squared2))
print()

print("Métricas para o Modelo Polinomial de Grau 3:")
print("MAE (grau=3) = {:0.4f}".format(MAE3))
print("MSE (grau=3) = {:0.4f}".format(MSE3))
print("R² (grau=3) = {:0.4f}".format(r_squared3))
print()

print("Métricas para o Modelo Polinomial de Grau 4:")
print("MAE (grau=4) = {:0.4f}".format(MAE4))
print("MSE (grau=4) = {:0.4f}".format(MSE4))
print("R² (grau=4) = {:0.4f}".format(r_squared4))
print()

print("Métricas para o Modelo Polinomial de Grau 5:")
print("MAE (grau=5) = {:0.4f}".format(MAE5))
print("MSE (grau=5) = {:0.4f}".format(MSE5))
print("R² (grau=5) = {:0.4f}".format(r_squared5))