In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np


In [None]:
import statsmodels.api as sm


In [None]:
df = pd.read_csv('dados/imoveis_sp.csv')
df.head()


In [None]:
df.info()
df.describe()
df.isnull().sum()


In [None]:
df = df[(df['Price'] > 0) & (df['Size'] > 0)]
df.dropna(subset=['Price', 'Size'], inplace=True)


In [None]:
plt.figure(figsize=(10,8))
sns.heatmap(df.corr(numeric_only=True), annot=True, cmap='coolwarm')
plt.title('Correlação entre Variáveis Numéricas')
plt.tight_layout()
plt.savefig('grafico-correlacao.png')  # Para colocar no site depois
plt.show()


In [None]:
import statsmodels.api as sm

# Garantir que os dados estão limpos
df['Size'] = pd.to_numeric(df['Size'], errors='coerce')
df['Price'] = pd.to_numeric(df['Price'], errors='coerce')
df.dropna(subset=['Size', 'Price'], inplace=True)

# Regressão
X = df['Size']
y = df['Price']

X = sm.add_constant(X)  # adiciona o intercepto
modelo = sm.OLS(y, X).fit()
print(modelo.summary())




In [None]:
sns.regplot(x='Size', y='Price', data=df, scatter_kws={"alpha":0.3})
plt.title('Regressão Linear: Área vs Preço')
plt.xlabel('Área útil (m²)')
plt.ylabel('Preço (R$)')
plt.savefig('grafico-regressao.png')
plt.show()


In [None]:

variaveis = ['Size', 'Rooms', 'Toilets', 'Suites', 'Parking']

df[variaveis + ['Price']] = df[variaveis + ['Price']].apply(pd.to_numeric, errors='coerce')

df.dropna(subset=variaveis + ['Price'], inplace=True)

X = df[variaveis]
y = df['Price']

X = sm.add_constant(X)

modelo_multiplo = sm.OLS(y, X).fit()

print(modelo_multiplo.summary())


In [None]:
# Gráfico 1 - Distribuição de preços
plt.figure(figsize=(10,6))
sns.histplot(df['Price'], bins=50, kde=True)
plt.title('Distribuição dos Preços dos Imóveis')
plt.xlabel('Preço (R$)')
plt.ylabel('Frequência')
plt.savefig('imagens/distribuicao-precos.png')
plt.show()

# Gráfico 2 - Dispersão por número de vagas
plt.figure(figsize=(10,6))
sns.scatterplot(x='Size', y='Price', hue='Parking', data=df, palette='viridis', alpha=0.6)
plt.title('Preço vs. Área (com Vagas)')
plt.xlabel('Área útil (m²)')
plt.ylabel('Preço (R$)')
plt.legend(title='Vagas')
plt.savefig('imagens/size-vs-price-parking.png')
plt.show()
