In [15]:
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

In [16]:
# Dados fictícios
dados = {
    'metragem': [50, 80, 120, 70, 100, 60, 90, 110, 130, 75],
    'quartos': [2, 3, 4, 2, 3, 2, 3, 4, 4, 3],
    'localizacao': ['Centro', 'Bairro A', 'Bairro B', 'Centro', 'Bairro A', 'Bairro B', 'Centro', 'Bairro A', 'Bairro B', 'Centro'],
    'idade_imovel': [5, 10, 15, 7, 8, 20, 3, 6, 12, 9],
    'preco': [300000, 450000, 600000, 350000, 500000, 280000, 400000, 550000, 650000, 420000]
}

# Criando o DataFrame
df = pd.DataFrame(dados)

df


Unnamed: 0,metragem,quartos,localizacao,idade_imovel,preco
0,50,2,Centro,5,300000
1,80,3,Bairro A,10,450000
2,120,4,Bairro B,15,600000
3,70,2,Centro,7,350000
4,100,3,Bairro A,8,500000
5,60,2,Bairro B,20,280000
6,90,3,Centro,3,400000
7,110,4,Bairro A,6,550000
8,130,4,Bairro B,12,650000
9,75,3,Centro,9,420000


In [17]:
# ------------------------------
# 2. Configuração
# ------------------------------

colunas_numericas = ['metragem', 'quartos', 'idade_imovel'] # Altere conforme necessário
colunas_categoricas = ['localizacao'] # Altere conforme necessário
coluna_alvo = 'preco' # O que você quer prever (Y)

In [18]:
# ------------------------------
# 3. Codificação das variáveis categóricas
# ------------------------------

# Verifica se há colunas categóricas válidas
colunas_categoricas = [col for col in colunas_categoricas if col in df.columns]

# Só aplica get_dummies se tiver colunas categóricas válidas
if colunas_categoricas:
    dados_completo = pd.get_dummies(df, columns=colunas_categoricas, drop_first=True)
else:
    dados_completo = df.copy()

dados_completo


Unnamed: 0,metragem,quartos,idade_imovel,preco,localizacao_Bairro B,localizacao_Centro
0,50,2,5,300000,False,True
1,80,3,10,450000,False,False
2,120,4,15,600000,True,False
3,70,2,7,350000,False,True
4,100,3,8,500000,False,False
5,60,2,20,280000,True,False
6,90,3,3,400000,False,True
7,110,4,6,550000,False,False
8,130,4,12,650000,True,False
9,75,3,9,420000,False,True


In [19]:
# ------------------------------
# 4. Definir X e y
# ------------------------------

X = dados_completo.drop(columns=[coluna_alvo,])
y = dados_completo[coluna_alvo]

In [20]:
# ------------------------------
# 5. Treinar modelo
# ------------------------------

modelo = LinearRegression()
modelo.fit(X, y)

In [21]:
# ------------------------------
# 6. Resultados
# ------------------------------

coeficientes = pd.Series(modelo.coef_, index=X.columns)
intercepto = modelo.intercept_

print("\n📈 Resultados do modelo:")
print(f"- Intercepto: {intercepto:.2f}")

for var, coef in coeficientes.items():
    if var in colunas_numericas:
        print(f"🔹 Cada 1 unidade a mais em '{var}' aumenta o valor de '{coluna_alvo}' em {coef:.2f} unidades.")
    else:
        categoria = var.split('_')[-1]
        base = var.split('_')[0]
        efeito = "A MAIS" if coef > 0 else "A MENOS"
        print(f"🔹 Ser da categoria '{categoria}' em '{base}' contribui com {abs(coef):.2f} unidades {efeito} em '{coluna_alvo}' em comparação com a categoria base.")



📈 Resultados do modelo:
- Intercepto: -564.60
🔹 Cada 1 unidade a mais em 'metragem' aumenta o valor de 'preco' em 3357.78 unidades.
🔹 Cada 1 unidade a mais em 'quartos' aumenta o valor de 'preco' em 47655.79 unidades.
🔹 Cada 1 unidade a mais em 'idade_imovel' aumenta o valor de 'preco' em 2140.87 unidades.
🔹 Ser da categoria 'Bairro B' em 'localizacao' contribui com 28798.52 unidades A MENOS em 'preco' em comparação com a categoria base.
🔹 Ser da categoria 'Centro' em 'localizacao' contribui com 3161.63 unidades A MENOS em 'preco' em comparação com a categoria base.
