In [4]:
# ! pip install scikit-learn

import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.model_selection import train_test_split

# --- Exemplo de dados ---
dados = pd.DataFrame({
    'quartos': [2, 3, 1, 3, 2],
    'suites': [1, 2, 0, 1, 1],
    'vagas': [1, 2, 1, 2, 1],
    'area_m2': [65, 120, 45, 100, 80],
    'bairro': ['Centro', 'Jardim', 'Centro', 'Jardim', 'Industrial'],
    'preco': [550000, 950000, 420000, 850000, 600000]
})

# --- X (entradas) e y (alvo) ---
X = dados[['quartos', 'suites', 'vagas', 'area_m2', 'bairro']]
y = dados['preco']

# --- Codifica o bairro (variável categórica) ---
colunas_categoricas = ['bairro']
colunas_numericas = ['quartos', 'suites', 'vagas', 'area_m2']

preprocessador = ColumnTransformer([
    ('cat', OneHotEncoder(drop='first'), colunas_categoricas)
], remainder='passthrough')

# --- Divide treino/teste ---
X_treino, X_teste, y_treino, y_teste = train_test_split(X, y, test_size=0.2, random_state=42)

# --- Cria e treina o modelo ---
modelo = LinearRegression()
modelo.fit(preprocessador.fit_transform(X_treino), y_treino)

# --- Resultados ---
print("Coeficientes:", modelo.coef_)
print("Intercepto:", modelo.intercept_)
print("Score R² no teste:", modelo.score(preprocessador.transform(X_teste), y_teste))

# --- Predição de um novo imóvel ---
novo = pd.DataFrame({
    'quartos': [2],
    'suites': [1],
    'vagas': [1],
    'area_m2': [70],
    'bairro': ['Centro']
})

preco_previsto = modelo.predict(preprocessador.transform(novo))
print("Preço estimado:", preco_previsto)


Coeficientes: [-47633.13609467  28911.24260355  14366.86390533 -14544.37869822
  28911.24260355   6508.87573964]
Intercepto: 83822.48520710057
Score R² no teste: nan
Preço estimado: [582544.37869822]




In [12]:
data = pd.read_csv('out.csv')


dados = pd.DataFrame({
    'quartos': list(data.get('Quartos')),
    'suites': list(data.get('Suítes')),
    'area': list(data.get('Área Total')),
    'tipo': list(data.get('Tipo')),
    'bairro': list(data.get('Bairro')),   
    'preco': list(data.get('Preço'))
})
dados = dados.dropna()


X = dados[['quartos', 'suites', 'area', 'tipo', 'bairro']]
y = dados['preco']

colunas_categoricas = ['bairro','tipo']
colunas_numericas = ['quartos', 'suites', 'area']

preprocessador = ColumnTransformer([
    ('cat', OneHotEncoder(drop='first' ,handle_unknown='ignore'), colunas_categoricas)
], remainder='passthrough')

# --- Divide treino/teste ---
X_treino, X_teste, y_treino, y_teste = train_test_split(X, y, test_size=0.2, random_state=42)

# --- Cria e treina o modelo ---
modelo = LinearRegression()
modelo.fit(preprocessador.fit_transform(X_treino), y_treino)

# --- Resultados ---
print("Coeficientes:", modelo.coef_)
print("Intercepto:", modelo.intercept_)
print("Score R² no teste:", modelo.score(preprocessador.transform(X_teste), y_teste))

# --- Predição de um novo imóvel ---
novo = pd.DataFrame({
    'quartos': [2],
    'suites': [1],
    'tipo': ['Residencial'],
    'area': [70],
    'bairro': ['Centro']
})

preco_previsto = modelo.predict(preprocessador.transform(novo))
print("Preço estimado:", preco_previsto)



Coeficientes: [-7.39091198e+03 -4.36134760e+03  2.02409290e+04  6.50344837e+02
 -1.41395820e+03 -2.77159405e+03 -9.26802821e+03 -6.55389225e+05
 -6.76012938e+03  8.12003459e+03  2.77366079e+03  2.35835599e+04
  4.38241011e+03 -3.03840463e+03 -2.96372319e+03 -6.46553935e+03
 -4.63465269e+03 -3.66142097e+03  2.95926193e+02  1.28208366e+05
  1.99616106e+04 -4.74450865e+03  7.13048412e+01 -2.52177571e+03
 -3.77309363e+03 -1.27932979e+05 -2.36213920e+03 -6.05339565e+03
  3.71384694e+03 -5.77986335e+03 -3.07965767e+05  3.46400613e+02
  4.49698183e+02  4.96441893e+03 -6.23082956e+03 -6.99280265e+03
 -1.49065766e+03  1.41138458e+03  1.16250618e+04 -1.08903361e+04
  1.19564635e+03  6.62484528e+03 -1.75493270e+04 -2.32708434e+04
  6.27169016e+05  3.09150409e+03 -1.07859325e+03 -1.50522084e+01]
Intercepto: 22807.072396145715
Score R² no teste: -272.10592243227234
Preço estimado: [9308.50570827]


