In [1]:
import plotly.graph_objects as go
import plotly.express as px
import pandas as pd
import numpy as np

In [2]:
df = pd.read_excel('df_filtred_with_coordinates.xlsx')
print(int(df.shape[0]/3))

1263


In [3]:
df =  df.loc[(df['preco']>49999)&(df['area util por m²']>9)]
print(int(df.shape[0]/3))

1226


In [4]:
def scatter_mapbox(dataframe, zoom=12):
    center_lat = dataframe['latitude_origin'].mean()
    center_lon = dataframe['longitude_origin'].mean()
    
    fig = px.scatter_mapbox(dataframe.rename(columns={'count': 'Apartamentos à Venda'}),
        lat='latitude_origin', 
        lon='longitude_origin', 
        hover_name='bairro', 
        hover_data=['Apartamentos à Venda'],
        color='Apartamentos à Venda',
        size='Apartamentos à Venda',
        size_max=50, 
        zoom=zoom,
        height=800,
        mapbox_style="open-street-map",
        center={"lat": center_lat, "lon": center_lon})
    
    fig.update_layout(margin={"r":0, "t":0, "l":0, "b":0})
    fig.show()

def bar_plot(dataframe):
    fig = px.bar(dataframe.rename(columns={'count': 'Apartamentos à Venda', 'bairro':'Bairro'}).sort_values(by='Apartamentos à Venda', ascending=False), x='Bairro', y='Apartamentos à Venda', orientation='v')
    fig.update_layout(xaxis_title='Bairro', yaxis_title='Apartamentos à Venda')
    fig.show()

def pizza_plot(dataframe):
    fig = px.pie(data_frame=dataframe, values='count', names='Zona')
    fig.update_layout(
    margin=dict(l=0, r=0, t=0, b=0),  # Remove margens
    height=500,  # Altura do gráfico (ajuste conforme necessário)
    width=800    # Largura do gráfico (ajuste conforme necessário)
)
    fig.show()

In [None]:
to_chart

In [5]:
to_chart = df.loc[df['cep_dest']=='Centro'][['bairro','latitude_origin','longitude_origin']].reset_index(drop=True)

center_lat = to_chart['latitude_origin'].mean()
center_lon = to_chart['longitude_origin'].mean()

fig = px.scatter_mapbox(to_chart,
    lat='latitude_origin',
    lon='longitude_origin',
    hover_name='bairro',
    hover_data={'bairro': True},
    color_discrete_sequence=['red'],
    zoom=10,
    height=800,
    mapbox_style="open-street-map",
    center={"lat": center_lat+0.02, "lon": center_lon}
)

fig.update_layout(
    margin={"r":0, "t":0, "l":0, "b":0},
    title="Distribuição de Pontos de Origem"
)

fig.show()

# Overview Zonas

In [6]:
all_zonas = df.loc[df['cep_dest'] == 'Centro']['Zona'].value_counts()
df_all_zonas = df.loc[df['Zona'].isin(all_zonas.index)][['Zona']].drop_duplicates(subset='Zona').reset_index(drop=True)
df_all_zonas['count'] = df_all_zonas['Zona'].map(all_zonas)

fig = px.bar(df_all_zonas.rename(columns={'count':'Apartamentos à Venda'}).sort_values(by='Apartamentos à Venda', ascending=True), 
             x='Apartamentos à Venda', 
             y='Zona', orientation='h')

fig.update_xaxes(title_text='')
fig.update_yaxes(title_text='')

fig.update_layout(
    margin=dict(l=0, r=0, t=0, b=0),
    height=500,
    width=800  
)
fig.show()

In [7]:
all_zonas = df.loc[df['cep_dest'] == 'Centro']['Zona'].value_counts()

df_all_zonas = df.loc[df['Zona'].isin(all_zonas.index)][['Zona']].drop_duplicates(subset='Zona').reset_index(drop=True)
df_all_zonas['count'] = df_all_zonas['Zona'].map(all_zonas)

pizza_plot(df_all_zonas)

In [8]:
# Tabelas das zonas
# Colunas que devem ser criadas são: Preço Médio Área Útil Por M² Preço por M²
all_zonas = df.loc[df['cep_dest'] == 'Centro']

for zona in all_zonas['Zona'].unique():
    print('Zona:', zona)
    print('Quantidade de imoveis:', np.round(len(all_zonas.loc[all_zonas['Zona'] == zona]),2))
    print('Preço médio:', np.round(all_zonas.loc[all_zonas['Zona'] == zona]['preco'].mean(),2))
    print('area util por m2:', np.round(all_zonas.loc[all_zonas['Zona'] == zona]['area util por m²'].mean(),2))
    print('Preço por m2:', np.round(all_zonas.loc[all_zonas['Zona'] == zona]['preco'].mean(),2)/np.round(all_zonas.loc[all_zonas['Zona'] == zona]['area util por m²'].mean(),2))
    print('')

Zona: Sul
Quantidade de imoveis: 931
Preço médio: 721844.33
area util por m2: 92.18
Preço por m2: 7830.81286613148

Zona: Central
Quantidade de imoveis: 167
Preço médio: 828223.05
area util por m2: 150.94
Preço por m2: 5487.101166026236

Zona: Norte
Quantidade de imoveis: 51
Preço médio: 447215.69
area util por m2: 80.08
Preço por m2: 5584.611513486514

Zona: Extremo Sul
Quantidade de imoveis: 33
Preço médio: 526363.64
area util por m2: 190.73
Preço por m2: 2759.731767419913

Zona: Oeste
Quantidade de imoveis: 27
Preço médio: 434855.56
area util por m2: 92.89
Preço por m2: 4681.40338034234

Zona: Extremo Norte
Quantidade de imoveis: 15
Preço médio: 663420.0
area util por m2: 126.8
Preço por m2: 5232.018927444795

Zona: Rural
Quantidade de imoveis: 2
Preço médio: 499400.0
area util por m2: 109.5
Preço por m2: 4560.730593607306



# Overview Zona Sul

In [9]:
somente_zona_sul = df.loc[df['Zona'] == 'Sul']
all_bairros = somente_zona_sul.loc[somente_zona_sul['cep_dest'] == 'Centro']['bairro'].value_counts()
df_all_bairros = somente_zona_sul.loc[somente_zona_sul['bairro'].isin(all_bairros.index)][['bairro', 'latitude_origin', 'longitude_origin']].drop_duplicates(subset='bairro').reset_index(drop=True)
df_all_bairros['count'] = df_all_bairros['bairro'].map(all_bairros)

In [10]:
to_chart = df.loc[df['cep_dest']=='Centro'][['bairro','latitude_origin','longitude_origin']].loc[df['Zona'] == 'Sul'].reset_index(drop=True)

center_lat = to_chart['latitude_origin'].mean()
center_lon = to_chart['longitude_origin'].mean()

fig = px.scatter_mapbox(to_chart,
    lat='latitude_origin',
    lon='longitude_origin',
    hover_name='bairro',
    hover_data={'bairro': True},
    color_discrete_sequence=['red'],
    zoom=13.2,
    height=800,
    mapbox_style="open-street-map",
    center={"lat": center_lat+0.01, "lon": center_lon}
)

fig.update_layout(
    margin={"r":0, "t":0, "l":0, "b":0},
    title="Distribuição de Pontos de Origem"
)

fig.show()

In [11]:
to_chart = pd.DataFrame(to_chart['bairro'].value_counts()).reset_index()

fig = px.bar(to_chart.rename(columns={'count':'Apartamentos à Venda'}).sort_values(by='Apartamentos à Venda', ascending=True), 
             x='Apartamentos à Venda', 
             y='bairro', orientation='h')

fig.update_xaxes(title_text='')
fig.update_yaxes(title_text='')

fig.update_layout(
    margin=dict(l=0, r=0, t=0, b=0),
    height=500,
    width=800
)
fig.show()

## Descrição dos bairros da zona sul

In [12]:
somente_zona_sul = df.loc[df['Zona'] == 'Sul']
somente_zona_sul = somente_zona_sul.loc[somente_zona_sul['cep_dest'] == 'Centro']

for bairro in somente_zona_sul['bairro'].unique():
    print('Bairro:', bairro)
    print('Quantidade de imoveis:', np.round(len(somente_zona_sul.loc[somente_zona_sul['bairro'] == bairro]),2))
    print('Preço médio:', np.round(somente_zona_sul.loc[somente_zona_sul['bairro'] == bairro]['preco'].mean(),2))
    print('area util por m2:', np.round(somente_zona_sul.loc[somente_zona_sul['bairro'] == bairro]['area util por m²'].mean(),2))
    print('Preço por m2:', np.round(np.round(somente_zona_sul.loc[somente_zona_sul['bairro'] == bairro]['preco'].mean(),2)/np.round(somente_zona_sul.loc[somente_zona_sul['bairro'] == bairro]['area util por m²'].mean(),2),2))
    print('')

Bairro: Pontal
Quantidade de imoveis: 171
Preço médio: 882805.47
area util por m2: 94.2
Preço por m2: 9371.61

Bairro: Nossa Senhora da Vitória
Quantidade de imoveis: 331
Preço médio: 712184.49
area util por m2: 88.14
Preço por m2: 8080.15

Bairro: São Francisco
Quantidade de imoveis: 324
Preço médio: 651067.37
area util por m2: 94.23
Preço por m2: 6909.34

Bairro: Jardim Atlântico
Quantidade de imoveis: 88
Preço médio: 728391.38
area util por m2: 94.67
Preço por m2: 7694.0

Bairro: Ilhéus II
Quantidade de imoveis: 13
Preço médio: 644615.38
area util por m2: 89.62
Preço por m2: 7192.76

Bairro: Nelson Costa
Quantidade de imoveis: 3
Preço médio: 543333.33
area util por m2: 139.33
Preço por m2: 3899.61

Bairro: Hernani Sá
Quantidade de imoveis: 1
Preço médio: 290000.0
area util por m2: 98.0
Preço por m2: 2959.18



In [13]:
def pizza_plot(dataframe):
    fig = px.pie(data_frame=dataframe, values='count', names='bairro')
    fig.update_layout(
        margin=dict(l=0, r=0, t=0, b=0),
        height=500,
        width=800
    )
    fig.show()

all_bairros_zona_sul = somente_zona_sul['bairro'].value_counts().reset_index()
all_bairros_zona_sul.columns = ['bairro', 'count']

pizza_plot(all_bairros_zona_sul)

In [14]:
cols_caract_apt = somente_zona_sul[['bairro', 'quartos', 'banheiros', 'vagas garagem','custo condominio', 'iptu']].replace(-1, 0)

for bairro in cols_caract_apt['bairro'].unique():
    df_for_this_bairro = cols_caract_apt[cols_caract_apt['bairro'] == bairro]
    media_quartos = df_for_this_bairro['quartos'].mean()
    media_banheiros = df_for_this_bairro['banheiros'].mean()
    media_garagem = df_for_this_bairro['vagas garagem'].mean()
    media_condominio = df_for_this_bairro['custo condominio'].mean()
    media_iptu = df_for_this_bairro['iptu'].mean()
    
    print('Bairro:', bairro)
    print(f'Media quartos: {media_quartos}')
    print(f'Media banheiro: {media_banheiros}')
    print(f'Media garagem: {media_garagem}')
    print(f'Media custo condominio: {media_condominio}')
    print(f'Media iptu: {media_iptu}')
    print(' ')

Bairro: Pontal
Media quartos: 2.1871345029239766
Media banheiro: 2.087719298245614
Media garagem: 1.2105263157894737
Media custo condominio: 216.82456140350877
Media iptu: 195.953216374269
 
Bairro: Nossa Senhora da Vitória
Media quartos: 2.2205438066465257
Media banheiro: 1.9788519637462236
Media garagem: 1.1208459214501512
Media custo condominio: 117.41691842900302
Media iptu: 52.58006042296073
 
Bairro: São Francisco
Media quartos: 2.299382716049383
Media banheiro: 2.04320987654321
Media garagem: 1.1296296296296295
Media custo condominio: 88.90123456790124
Media iptu: 54.54320987654321
 
Bairro: Jardim Atlântico
Media quartos: 2.215909090909091
Media banheiro: 2.3068181818181817
Media garagem: 1.1477272727272727
Media custo condominio: 85.73863636363636
Media iptu: 56.84090909090909
 
Bairro: Ilhéus II
Media quartos: 2.4615384615384617
Media banheiro: 1.8461538461538463
Media garagem: 0.9230769230769231
Media custo condominio: 200.0
Media iptu: 0.0
 
Bairro: Nelson Costa
Media quart

In [15]:
cols_caract_cond = somente_zona_sul[['bairro', 'armários na cozinha', 'academia', 'piscina', 'varanda', 'portaria',
                                     'quarto de serviço', 'área de serviço', 'condomínio fechado', 'permitido animais', 
                                     'churrasqueira', 'elevador', 'mobiliado','armários no quarto', 'ar condicionado',
                                     'segurança 24h','salão de festas']]

final_result = {}
for bairro in cols_caract_cond['bairro'].unique():
    intermedian_result = dict()
    cols_to_sumarize = [cols for cols in cols_caract_cond if cols != 'bairro']
    for col in cols_to_sumarize:
        media = (cols_caract_cond.loc[cols_caract_cond['bairro'] == bairro][col].values.sum() /
                 len(cols_caract_cond.loc[cols_caract_cond['bairro'] == bairro])) * 100
        intermedian_result[col] = np.round(media,2)
    final_result[bairro] = intermedian_result

df_final_result_from_cols_caract_cond = pd.DataFrame(final_result)

In [16]:
fig = px.imshow(df_final_result_from_cols_caract_cond,
                labels=dict(x="Bairros", y="Características", color="Porcentagem"),
                x=df_final_result_from_cols_caract_cond.columns,
                y=df_final_result_from_cols_caract_cond.index,
                color_continuous_scale='Viridis',
                text_auto=True)

fig.update_xaxes(title_text='')
fig.update_yaxes(title_text='')

fig.update_layout(xaxis_nticks=36,
                  width=1000,
                  height=800)

fig.show()

In [17]:
nsv_e_sf = somente_zona_sul[somente_zona_sul['bairro'].isin(['Nossa Senhora da Vitória', 'São Francisco'])]

# Eliminar as linhas com as latitudes específicas
latitudes_a_excluir = [-14.82419, -14.8448122, -14.8168568]
nsv_e_sf = nsv_e_sf[~nsv_e_sf['latitude_origin'].isin(latitudes_a_excluir)]

# Cálculo da latitude e longitude médias
center_lat = nsv_e_sf['latitude_origin'].mean()
center_lon = nsv_e_sf['longitude_origin'].mean()

# Ajuste na latitude para centralizar o mapa
adjusted_center_lat = center_lat + 0.01  # Ajuste este valor conforme necessário

# Criação do gráfico de dispersão com o Mapbox
fig = px.scatter_mapbox(nsv_e_sf,
    lat='latitude_origin',
    lon='longitude_origin',
    hover_name='bairro',
    hover_data={'bairro': True},
    color='bairro',  # Diferenciação de cor baseada nos bairros
    size_max=15,  # Ajuste do tamanho máximo dos pontos
    zoom=13,
    height=600,
    width=800,
    mapbox_style="open-street-map",
    center={"lat": adjusted_center_lat, "lon": center_lon}
)

# Ajustar tamanho dos pontos
fig.update_traces(marker=dict(size=12))

# Configuração para colocar a legenda dentro do mapa
fig.update_layout(
    margin={"r":0, "t":0, "l":0, "b":0},
    title="Distribuição de Pontos de Origem",
    legend_title_text='Bairro',
    legend=dict(
        x=0.02,  # Posição horizontal da legenda
        y=0.98,  # Posição vertical da legenda
        traceorder="normal",
        bgcolor="rgba(255, 255, 255, 0.8)",  # Cor de fundo da legenda
        bordercolor="Black",  # Cor da borda da legenda
        borderwidth=1  # Largura da borda da legenda
    )
)

fig.show()


##  Descrição das ruas desses bairros

In [18]:
# Dentro desses 3 bairros, quais as ruas mais frequentes?
ruas_top_3_bairros = df[df['bairro'].isin(top_3_bairros.index)]['rua/avenida'].value_counts().head(10)
print(ruas_top_3_bairros)

NameError: name 'top_3_bairros' is not defined

In [None]:
preco_pontal = df[df['bairro']=='Pontal'][['preco','area util por m²']].drop_duplicates(keep='last')
preco_pontal['preco/m2'] = np.round(preco_pontal['preco']/preco_pontal['area util por m²'], 2)
preco_pontal = preco_pontal.sort_values(by='preco/m2', ascending=False)[:-5].reset_index(drop=True)
preco_pontal.describe()

In [None]:
preco_cidade_geral = df[['preco','area util por m²']].drop_duplicates(keep='last')
preco_cidade_geral['preco/m2'] = np.round(preco_cidade_geral['preco']/preco_cidade_geral['area util por m²'], 2)
preco_cidade_geral = preco_cidade_geral.sort_values(by='preco/m2', ascending=False)[:-10].reset_index(drop=True)
preco_cidade_geral.describe()

In [None]:
resultados = list()
descricao_dos_bairros_da_zona_sul_m2 = df.loc[df['Zona'] == 'Sul']
for bairro in descricao_dos_bairros_da_zona_sul_m2['bairro']:
    intermedian_resultado = {
        'bairro': bairro,
        'preco/m2': np.round(descricao_dos_bairros_da_zona_sul_m2.loc[descricao_dos_bairros_da_zona_sul_m2['bairro'] == bairro]['preco']/descricao_dos_bairros_da_zona_sul_m2.loc[descricao_dos_bairros_da_zona_sul_m2['bairro'] == bairro]['area util por m²'].mean(), 2),
        'quartos': np.round(descricao_dos_bairros_da_zona_sul_m2.loc[descricao_dos_bairros_da_zona_sul_m2['bairro'] == bairro]['quartos'].mean(), 2),
        'banheiros': np.round(descricao_dos_bairros_da_zona_sul_m2.loc[descricao_dos_bairros_da_zona_sul_m2['bairro'] == bairro]['banheiros'].mean(), 2),
        'vagas garagem': np.round(descricao_dos_bairros_da_zona_sul_m2.loc[descricao_dos_bairros_da_zona_sul_m2['bairro'] == bairro]['vagas garagem'].mean(), 2),
        'quartos': np.round(descricao_dos_bairros_da_zona_sul_m2.loc[descricao_dos_bairros_da_zona_sul_m2['bairro'] == bairro]['quartos'].mean(), 2),
    }
    resultados.append(intermedian_resultado)