In [2]:
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score, mean_squared_error
from sklearn.feature_selection import f_regression

# Criando o dataframe
df = pd.DataFrame({
    "comércio": [0.8, 0.1, -0.8, 0, 0.9, -0.2, 0.8, -0.3, 0.2, -1.4, 2.5],
    "custo-por-metro-quadrado": [0.2, 0.27, 0.36, 0.39, 0.23, 0.18, 0.02, 0.14, 0.08, 0.26, 0.19],
    "industria": [1.2, -0.7, 0.4, 0, -0.4, 0.5, 0.2, 0, 0.6, 1.6, -1.6],
    "inpc": [0.64, 0.53, 0.36, -0.1, -0.09, 0.2, 0.11, 0.12, 0.1, 0.55, 0.57],
    "ipca": [0.71, 0.61, 0.23, -0.08, 0.12, 0.23, 0.26, 0.24, 0.28, 0.56, 0.42],
    "ipca-15": [0.69, 0.57, 0.51, 0.04, -0.07, 0.28, 0.35, 0.21, 0.33, 0.4, 0.31],
    "ipp": [-0.65, -0.35, -2.88, -2.72, -0.76, 0.75, 1.06, 1.07, -0.34, -0.2, -0.31],
    "servicos": [1.7, -2, 1.6, 0.4, 1, -1.4, -0.1, -0.2, 0.5, 0.7, 0.7],
    "pib-per-capita": [19938.6, 22259.91, 24278.35, 26657.54, 28648.74, 29466.85, 30558.75, 31843.95, 33593.82, 35161.7, 35935.69],
    "variação-do-pib": [1.7, 12.4, 4.2, 1.5, 1.5, 3.5, 4.3, 2.7, 4.2, 3.5, 2]
})

# Criando as variáveis explicativas
X = df[["comércio", "custo-por-metro-quadrado", "industria", "inpc", "ipca", "ipca-15", "ipp", "servicos", "pib-per-capita"]]

# Criando a variável dependente
y = df["variação-do-pib"]

# Criando e ajustando o modelo de regressão linear múltipla
modelo = LinearRegression()
modelo.fit(X, y)

# Obtendo os coeficientes de regressão e o intercepto
coefs = modelo.coef_
intercepto = modelo.intercept_

# Coeficiente de correlação (R²) e Erro médio quadrático (MSE)
r2 = r2_score(y, modelo.predict(X))
mse = mean_squared_error(y, modelo.predict(X))

# Teste F
f_statistic, pval = f_regression(X, y)

# Previsão para um novo conjunto de dados
x_novo = np.array([[10000, 80, 20, 0, 0, 0, 0, 0, 30000]])
y_predito = modelo.predict(x_novo)

# Imprimindo os resultados
print("Coeficientes:", coefs)
print("Intercepto:", intercepto)
print("Previsão para o novo conjunto de dados:", y_predito)
print("Coeficiente de correlação (R²):", r2)
print("Erro médio quadrático (MSE):", mse)
print("Teste F - Estatística F:", f_statistic)
print("Teste F - Valor p:", pval)

Coeficientes: [-3.55952354e+00 -5.39753867e+01 -2.69058451e+00  1.11009089e+01
  9.28615439e+00 -1.50448227e+01 -4.06489912e+00 -2.38442692e+00
 -3.20131375e-04]
Intercepto: 23.27341951592419
Previsão para o novo conjunto de dados: [-39953.40853995]
Coeficiente de correlação (R²): 0.9792963398760504
Erro médio quadrático (MSE): 0.17718910973518429
Teste F - Estatística F: [3.82419940e-01 7.50117629e-03 2.97097252e-01 9.73243036e-01
 1.72699678e+00 2.46778972e+00 1.22128582e-01 7.84333269e+00
 9.52822177e-01]
Teste F - Valor p: [0.5516381  0.93287834 0.59895313 0.34965041 0.22130045 0.15064934
 0.734775   0.02069251 0.35450767]


