# Visualizando os dados do dataset

Você pode escolher se quer visualizar os dados antes ou depois do pré-processamento, e se quer visualizar os dados de

* Aluguel de imóveis residenciais
* Compra de imóveis residenciais
* Aluguel de imóveis comerciais
* Compra de imóveis comerciais

Também se quer focar nos "VALORES_PROMO" os valores finais para negociação ou os "VALORES", que são os valores "oficiais" da negociação.

## Passo-a-passo

* Vá executando as células na sua ordem.

* Importe os arquivos do seu google drive (ou acesse os nossos arquivos compartilhados). Escolha qual dos arquivos você quer importar trocando a variável "local indicado 1", na célula de importação dos arquivos.

* Informe se você quer graficar o atributo "VALORES" ou "VALORES_PROMO" no "local indicado 2", para graficar as características em relação a algum dos atributos.

* Mexa com os widgets interativos na última célula para filtrar o dataset e gerar as visualizações.

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.gridspec as gridspec
import seaborn as sns
from ipywidgets import interact, widgets

In [None]:
import matplotlib.gridspec as gridspecfrom google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


## Escolha se você quer analisar o dataset antes ou depois do pre-processamento e qual tipo e categoria de dataset você quer (tipos: residencial e comercial, categorias: alguel, compra)



In [2]:
# ARQUIVOS CRUS

# link = https://drive.google.com/file/d/1jkVgY6ytIVOmICvXqutJ2MYGCqily_IO/view?usp=drive_link  # Dataset_AP_Comprar_Residencial.txt
file_id_CR = '1jkVgY6ytIVOmICvXqutJ2MYGCqily_IO'
# link = https://drive.google.com/file/d/1YcqLlxb0Smi3zGYKGR3UafheVJUM8i7l/view?usp=drive_link # Dataset_AP_Alugar_Residencial.txt
file_id_AR = '1YcqLlxb0Smi3zGYKGR3UafheVJUM8i7l'
# link = https://drive.google.com/file/d/1wG36F80cYgNzW_KQSQi3En65CmI86QPQ/view?usp=drive_link # Dataset_AP_Alugar_Comercial.txt
file_id_AC = '1wG36F80cYgNzW_KQSQi3En65CmI86QPQ'
# link = https://drive.google.com/file/d/1vfXmXp2NcjbPlr1FAL0RuEpW1QAEaJJB/view?usp=drive_link # Dataset_AP_Comprar_Comercial.txt
file_id_CC = '1vfXmXp2NcjbPlr1FAL0RuEpW1QAEaJJB'

# ARQUIVOS PRE-PROCESSADOS

RC_id = '1-sl4yFkB8Q_KUEArLvUftWYWNSSwUiee' #RESIDENCIAL COMPRA
CC_id = '1-t001yat46m3O3sNOVA8a4JbYzOP7Cae' #COMERCIAL COMPRA
RA_id = '1-z1c-8AXv0EJkz1HAZqvIFkbZVXsjeCX' #RESIDENCIAL ALUGUEL
CA_id = '105Aem7lywXbkljbn-HEGKZOEHIIlXFwq' # Comercial Aluguel


## Importação dos arquivos:

In [17]:

# local indicado 1: troque a variável abaixo dentro dos parênteses por aquela que representa, na célula acima, o arquivo de interesse.
url = 'https://drive.google.com/uc?id={}'.format(RA_id)
data = pd.read_csv(url)

# Local indicado 2: troque a variável 'interesse' por "VALORES" ou "VALORES_PROMO" de acordo com seu interesse:
interesse = "VALORES_PROMO"

In [4]:
data.describe()

Unnamed: 0,VALORES,VALORES_PROMO,AREA,QUARTO,GARAGEM,BANHEIRO,KEY,EXCLUSIVO,MOBILIADO,ALTO_PADRAO,AVALIA_IMOVEL_NO_NEGOCIO,PRONTO_PARA_MORAR,ALUGA_RAPIDO_SEM_FIADOR_OU_GARANTIAS,AUXI_PLUS
count,2403.0,2403.0,2403.0,2403.0,2403.0,2403.0,2403.0,2403.0,2403.0,0.0,0.0,0.0,2403.0,2403.0
mean,25717.998335,2032.071993,71.151893,1.852268,0.611319,1.42114,369290.832293,0.187682,0.122763,,,,0.12526,0.019559
std,16007.948362,1338.250388,54.485213,0.80655,0.789442,0.716118,62454.337416,0.390539,0.328234,,,,0.331082,0.138507
min,4010.0,290.0,17.0,0.0,0.0,0.0,21879.0,0.0,0.0,,,,0.0,0.0
25%,14150.0,1100.0,42.0,1.0,0.0,1.0,327064.0,0.0,0.0,,,,0.0,0.0
50%,20810.0,1650.0,56.0,2.0,0.0,1.0,390963.0,0.0,0.0,,,,0.0,0.0
75%,32640.0,2550.0,76.0,2.0,1.0,2.0,419859.0,0.0,0.0,,,,0.0,0.0
max,102540.0,8300.0,598.0,8.0,8.0,8.0,438108.0,1.0,1.0,,,,1.0,1.0


# Criando widgets interativos

In [5]:
# Cria Widgets para a filtragem
banheiros_widget = widgets.FloatRangeSlider(
    value=(data['BANHEIRO'].min(), data['BANHEIRO'].max()),
    min=data['BANHEIRO'].min(),
    max=data['BANHEIRO'].max(),
    step=1,
    description='Banheiros:',
    continuous_update=False
)

quartos_widget = widgets.FloatRangeSlider(
    value=(data['QUARTO'].min(), data['QUARTO'].max()),
    min=data['QUARTO'].min(),
    max=data['QUARTO'].max(),
    step=1,
    description='Quartos:',
    continuous_update=False
)

vagas_widget = widgets.FloatRangeSlider(
    value=(data['GARAGEM'].min(), data['GARAGEM'].max()),
    min=data['GARAGEM'].min(),
    max=data['GARAGEM'].max(),
    step=1,
    description='Vagas:',
    continuous_update=False
)

area_widget = widgets.FloatRangeSlider(
    value=(data['AREA'].min(), data['AREA'].max()),
    min=data['AREA'].min(),
    max=data['AREA'].max(),
    step=1,
    description='Área:',
    continuous_update=False
)

valores_widget = widgets.FloatRangeSlider(
    value=(data['VALORES'].min(), data['VALORES'].max()),
    min=data['VALORES'].min(),
    max=data['VALORES'].max(),
    step=1000,
    description='Valores:',
    continuous_update=False
)

valores_promo_widget = widgets.FloatRangeSlider(
    value=(data['VALORES_PROMO'].min(), data['VALORES_PROMO'].max()),
    min=data['VALORES_PROMO'].min(),
    max=data['VALORES_PROMO'].max(),
    step=1000,
    description='Valores Promo:',
    continuous_update=False
)

bairro_widget = widgets.SelectMultiple(
    options=tuple(data['LOCATION'].unique()),
    value=tuple(data['LOCATION'].unique()),
    description='Bairros:'
)


In [6]:
def filter_data(banheiros, quartos, vagas, area, valores, valores_promo, bairros):
    filtered_data = data[
        (data['BANHEIRO'] >= banheiros[0]) & (data['BANHEIRO'] <= banheiros[1]) &
        (data['QUARTO'] >= quartos[0]) & (data['QUARTO'] <= quartos[1]) &
        (data['GARAGEM'] >= vagas[0]) & (data['GARAGEM'] <= vagas[1]) &
        (data['AREA'] >= area[0]) & (data['AREA'] <= area[1]) &
        (data['VALORES'] >= valores[0]) & (data['VALORES'] <= valores[1]) &
        (data['VALORES_PROMO'] >= valores_promo[0]) & (data['VALORES_PROMO'] <= valores_promo[1]) &
        (data['LOCATION'].isin(bairros))
    ]
    return filtered_data

# Selecione os limites de atributos de interesse:

In [18]:
# Dashboard interativo
@interact
def show_filtered_data(
    banheiros=banheiros_widget,
    quartos=quartos_widget,
    vagas=vagas_widget,
    area=area_widget,
    valores=valores_widget,
    valores_promo=valores_promo_widget,
    bairros=bairro_widget
):
    filtered_data = filter_data(banheiros, quartos, vagas, area, valores, valores_promo, bairros)

    # Visualizações
    fig = plt.figure(figsize=(16, 32))
    gs = gridspec.GridSpec(5, 1, figure=fig)
    fig.suptitle('Visualização de imóveis filtrados', fontsize=40)

    ax = fig.add_subplot(gs[0])
    sns.scatterplot(x='AREA', y=interesse, data=filtered_data, hue='LOCATION', palette='Set1')
    ax.set_title('Scatter Plot de AREA vs {}'.format(interesse))
    ax.set_xlabel('Área (m2)')
    ax.set_ylabel('Valores Promo (R$)')
    ax.legend(loc='upper right')


    ax = fig.add_subplot(gs[1])
    sns.boxplot(x='LOCATION', y='AREA', data=filtered_data, palette='Set1')
    ax.set_title('Boxplot de AREA por bairro')
    ax.set_xticklabels(ax.get_xticklabels(), rotation=90)
    ax.set_xlabel('Bairro')
    ax.set_ylabel('Área (m2)')

    ax = fig.add_subplot(gs[2])
    sns.countplot(x='LOCATION', data=filtered_data, palette='Set1')
    ax.set_title('Contagem de propriedades por bairro selecionado')
    ax.set_xticklabels(ax.get_xticklabels(), rotation=90)
    ax.set_xlabel('Bairro')
    ax.set_ylabel('Contagem')

    ax = fig.add_subplot(gs[3])
    sns.boxplot(x='LOCATION', y=interesse, data=filtered_data, palette='Set1')
    ax.set_title('Boxplot de {} por bairro'.format(interesse))
    ax.set_xticklabels(ax.get_xticklabels(), rotation=90)
    ax.set_xlabel('Bairro')
    ax.set_ylabel('Valores Promo (R$)')

    ax = fig.add_subplot(gs[4])
    sns.histplot(data=filtered_data, x='BANHEIRO', bins=30, legend=True, color='blue', label='Banheiros')
    sns.histplot(data=filtered_data, x='GARAGEM', bins=30, legend=True, color='green', label='Vagas de estacionamento')
    sns.histplot(data=filtered_data, x='QUARTO', bins=30, legend=True, color='red', label='Quartos')
    ax.legend(title='Legenda', labels=['Banheiros', 'Vagas', 'Quartos'])
    ax.set_xlabel('Número de ambientes')
    ax.set_ylabel('Contagem')
    ax.set_title('Histogramas de banheiros, vagas e quartos')

    fig.tight_layout()
    plt.subplots_adjust(top=0.95)
    plt.show()

interactive(children=(FloatRangeSlider(value=(0.0, 8.0), continuous_update=False, description='Banheiros:', ma…