<a href="https://colab.research.google.com/github/patriciauemura/DataScience/blob/main/RealState.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Problema
O mercado imobiliário é altamente dinâmico e complexo, com preços de imóveis variando significativamente com base em diversos fatores como localização, tamanho, número de quartos, entre outros. A previsão precisa dos preços dos imóveis é crucial para compradores, vendedores e investidores. No entanto, métodos tradicionais de avaliação muitas vezes falham em capturar todas as nuances do mercado.
# Solução
Utilizar uma rede neural profunda (Deep Learning) para prever os preços dos imóveis com base em um conjunto de dados abrangente que inclui características dos imóveis e dados históricos de preços. A rede neural será treinada para identificar padrões complexos e relações não lineares entre as variáveis.
#Metodologia
**Coleta de Dados:** Reunir um conjunto de dados abrangente contendo informações sobre imóveis, como localização, tamanho, número de quartos, idade do imóvel, proximidade a serviços e dados históricos de preços.

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, OneHotEncoder
from sklearn.compose import ColumnTransformer

# Carregar o conjunto de dados
data = pd.read_csv('Brasile-real-estate-dataset.csv', encoding='latin1')

# Visualizar as primeiras linhas do conjunto de dados
print(data.head())



   Unnamed: 0 property_type       state     region       lat        lon  \
0           1     apartment  Pernambuco  Northeast -8.134204 -34.906326   
1           2     apartment  Pernambuco  Northeast -8.126664 -34.903924   
2           3     apartment  Pernambuco  Northeast -8.125550 -34.907601   
3           4     apartment  Pernambuco  Northeast -8.120249 -34.895920   
4           5     apartment  Pernambuco  Northeast -8.142666 -34.906906   

   area_m2  price_brl  
0     72.0  414222.98  
1    136.0  848408.53  
2     75.0  299438.28  
3    187.0  848408.53  
4     80.0  464129.36  


**Pré-processamento de Dados:** Limpar e normalizar os dados para garantir que estejam prontos para serem usados no modelo. Isso inclui lidar com valores ausentes, normalizar variáveis numéricas e codificar variáveis categóricas.

In [None]:
# Separar as variáveis independentes (X) e a variável dependente (y)
X = data.drop('price_brl', axis=1)
y = data['price_brl']

# Dividir o conjunto de dados em conjuntos de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Identificar colunas numéricas e categóricas
numerical_features = X_train.select_dtypes(include=['int64', 'float64']).columns
categorical_features = X_train.select_dtypes(include=['object']).columns

# Criar um transformador para pré-processar colunas numéricas e categóricas
preprocessor = ColumnTransformer(
    transformers=[
        ('num', StandardScaler(), numerical_features),
        ('cat', OneHotEncoder(sparse_output=False, handle_unknown='ignore'), categorical_features)])

# Ajustar e transformar os dados de treinamento
X_train = preprocessor.fit_transform(X_train)

# Transformar os dados de teste
X_test = preprocessor.transform(X_test)

**Divisão dos Dados:** Dividir o conjunto de dados em conjuntos de treinamento, validação e teste usando o método hold-out para garantir que o modelo seja avaliado de forma justa.

**Construção do Modelo:** Construir uma rede neural profunda com múltiplas camadas ocultas. Utilizar a função de ativação ReLU nas camadas ocultas e a função de ativação linear na camada de saída.

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# Construir a rede neural profunda
model = Sequential()
model.add(Dense(64, input_dim=X_train.shape[1], activation='relu'))
model.add(Dense(32, activation='relu'))
model.add(Dense(1, activation='linear'))

# Compilar o modelo
model.compile(optimizer='adam', loss='mean_squared_error')


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


**Treinamento do Modelo:** Treinar o modelo usando o algoritmo de backpropagation e o otimizador Adam. Ajustar os hiperparâmetros, como a taxa de aprendizado, para melhorar o desempenho do modelo.

In [None]:
# Treinar o modelo
history = model.fit(X_train, y_train, epochs=100, batch_size=32, validation_split=0.2)


Epoch 1/100
[1m257/257[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2ms/step - loss: 563351322624.0000 - val_loss: 555453579264.0000
Epoch 2/100
[1m257/257[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - loss: 559375581184.0000 - val_loss: 550016450560.0000
Epoch 3/100
[1m257/257[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - loss: 560145301504.0000 - val_loss: 535619272704.0000
Epoch 4/100
[1m257/257[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - loss: 540221014016.0000 - val_loss: 510019010560.0000
Epoch 5/100
[1m257/257[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - loss: 515428089856.0000 - val_loss: 472781684736.0000
Epoch 6/100
[1m257/257[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - loss: 473232048128.0000 - val_loss: 425099755520.0000
Epoch 7/100
[1m257/257[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - loss: 417050886144.0000 - val_loss: 369856249856.0000

**Avaliação do Modelo:** Avaliar o modelo no conjunto de teste usando métricas como o erro quadrático médio (MSE) e o coeficiente de determinação (R²) para medir a precisão das previsões.

In [None]:
# Avaliar o modelo no conjunto de teste
loss = model.evaluate(X_test, y_test)
print(f'Erro Quadrático Médio no conjunto de teste: {loss}')


[1m81/81[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - loss: nan
Erro Quadrático Médio no conjunto de teste: nan


**Implementação:** Implementar o modelo em um sistema de previsão de preços de imóveis que possa ser usado por compradores, vendedores e investidores para tomar decisões informadas.


In [None]:
# Fazer previsões com o modelo treinado
predictions = model.predict(X_test)

# Reset index of y_test to match predictions
y_test = y_test.reset_index(drop=True)

# Exibir algumas previsões
for i in range(5):
    predicted_price = float(predictions[i][0])  # Convert to float
    print(f'Preço Real: {y_test.iloc[i]}, Preço Previsto: {predicted_price}')

[1m81/81[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step
Preço Real: 787484.34, Preço Previsto: nan
Preço Real: 1347472.36, Preço Previsto: nan
Preço Real: 398252.92, Preço Previsto: nan
Preço Real: 389269.77, Preço Previsto: nan
Preço Real: 989403.42, Preço Previsto: nan


# Resultados Esperados
- Precisão: Espera-se que o modelo forneça previsões de preços de imóveis com alta precisão, reduzindo o erro em comparação com métodos tradicionais.
- Eficiência: O modelo deve ser capaz de processar grandes volumes de dados e fornecer previsões rápidas.
- Escalabilidade: A solução deve ser escalável para diferentes mercados imobiliários e adaptável a mudanças nas tendências do mercado.
# Desdobramentos
- Expansão de Funcionalidades: Adicionar novas funcionalidades ao sistema, como a previsão de tendências de mercado e a análise de investimentos.
- Integração com Outros Sistemas: Integrar o modelo com plataformas de listagem de imóveis e sistemas de gestão imobiliária para fornecer uma solução completa.
- Melhoria Contínua: Continuar a coletar dados e re-treinar o modelo periodicamente para garantir que ele se mantenha preciso e relevante.
