# üìä Exemplo B√°sico - Carregamento e Visualiza√ß√£o

Este notebook demonstra como:
- Carregar dados de vit√≥ria (lotes) em formato Parquet
- Carregar dados de im√≥veis
- Criar visualiza√ß√µes b√°sicas com design minimalista (preto e branco)
- Explorar estat√≠sticas descritivas

In [None]:
import pandas as pd
import geopandas as gpd
import matplotlib.pyplot as plt
import seaborn as sns
from shapely import wkt
import numpy as np

# Configura√ß√£o de estilo minimalista preto e branco
plt.style.use('grayscale')
sns.set_palette("gray")

# Configura√ß√µes de plotagem
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 10
plt.rcParams['axes.grid'] = True
plt.rcParams['grid.alpha'] = 0.3
plt.rcParams['axes.facecolor'] = 'white'
plt.rcParams['figure.facecolor'] = 'white'

print("‚úì Bibliotecas importadas com sucesso")

## 1. Carregamento dos Dados de Vit√≥ria (Lotes)

In [None]:
# Carregar dados de lotes (vit√≥ria)
try:
    df_lotes = pd.read_parquet('../data/raw/vitoria_lotes.parquet')
    print(f"‚úì Dados carregados: {len(df_lotes)} lotes")
    print(f"\nColunas dispon√≠veis: {list(df_lotes.columns)}")
except FileNotFoundError:
    print("‚ö†Ô∏è Arquivo n√£o encontrado. Criando dados de exemplo...")
    # Criar dados de exemplo
    df_lotes = pd.DataFrame({
        'codLote': range(1, 101),
        'logradouro': [f'Rua {i%10}' for i in range(100)],
        'numero': np.random.randint(1, 1000, 100),
        'bairro': np.random.choice(['Centro', 'Praia do Canto', 'Jardim Camburi', 'Enseada do Su√°'], 100),
        'sigla_trat': np.random.choice(['R1', 'R2', 'COM', 'MISTO'], 100),
        'area_terreno': np.random.uniform(200, 2000, 100),
        'ca': np.random.uniform(1.0, 4.0, 100),
        'to': np.random.uniform(0.3, 0.8, 100),
        'limite_altura': np.random.choice([12, 18, 24, 30, 50], 100),
        'afast_frontal': np.random.uniform(3, 6, 100),
        'limite_embasamento': np.random.uniform(6, 12, 100),
        'gabarito': np.random.randint(4, 20, 100),
        'altura': np.random.uniform(12, 60, 100),
        'inscricaoImobiliaria': [f'IM{i:06d}' for i in range(100)],
        'tipoConstrucao': np.random.choice(['Residencial', 'Comercial', 'Misto'], 100),
        'numeroPavimentos': np.random.randint(1, 20, 100),
        'ocupacao': np.random.choice(['Ocupado', 'Vago'], 100)
    })
    print(f"‚úì Dados de exemplo criados: {len(df_lotes)} lotes")

# Exibir primeiras linhas
df_lotes.head()

## 2. Estat√≠sticas Descritivas dos Lotes

In [None]:
# Estat√≠sticas b√°sicas
print("üìä ESTAT√çSTICAS DOS LOTES\n" + "="*50)
print(f"\nTotal de lotes: {len(df_lotes):,}")
print(f"\n√Årea do terreno:")
print(f"  ‚Ä¢ M√©dia: {df_lotes['area_terreno'].mean():.2f} m¬≤")
print(f"  ‚Ä¢ Mediana: {df_lotes['area_terreno'].median():.2f} m¬≤")
print(f"  ‚Ä¢ M√≠nima: {df_lotes['area_terreno'].min():.2f} m¬≤")
print(f"  ‚Ä¢ M√°xima: {df_lotes['area_terreno'].max():.2f} m¬≤")

print(f"\nCoeficiente de Aproveitamento (CA):")
print(f"  ‚Ä¢ M√©dia: {df_lotes['ca'].mean():.2f}")
print(f"  ‚Ä¢ M√≠nimo: {df_lotes['ca'].min():.2f}")
print(f"  ‚Ä¢ M√°ximo: {df_lotes['ca'].max():.2f}")

print(f"\nTaxa de Ocupa√ß√£o (TO):")
print(f"  ‚Ä¢ M√©dia: {df_lotes['to'].mean():.2%}")
print(f"  ‚Ä¢ M√≠nima: {df_lotes['to'].min():.2%}")
print(f"  ‚Ä¢ M√°xima: {df_lotes['to'].max():.2%}")

## 3. Gr√°ficos de Distribui√ß√£o - Design Minimalista

In [None]:
# Criar figura com subplots
fig, axes = plt.subplots(2, 2, figsize=(14, 10))
fig.suptitle('Distribui√ß√£o das Caracter√≠sticas dos Lotes', fontsize=16, fontweight='bold', y=1.02)

# 1. Distribui√ß√£o de √Årea do Terreno
axes[0, 0].hist(df_lotes['area_terreno'], bins=30, color='black', alpha=0.7, edgecolor='white')
axes[0, 0].set_title('Distribui√ß√£o de √Årea do Terreno', fontweight='bold')
axes[0, 0].set_xlabel('√Årea (m¬≤)')
axes[0, 0].set_ylabel('Frequ√™ncia')
axes[0, 0].axvline(df_lotes['area_terreno'].mean(), color='gray', linestyle='--', linewidth=2, label='M√©dia')
axes[0, 0].legend()

# 2. Distribui√ß√£o de Coeficiente de Aproveitamento
axes[0, 1].hist(df_lotes['ca'], bins=20, color='black', alpha=0.7, edgecolor='white')
axes[0, 1].set_title('Distribui√ß√£o de Coeficiente de Aproveitamento (CA)', fontweight='bold')
axes[0, 1].set_xlabel('CA')
axes[0, 1].set_ylabel('Frequ√™ncia')
axes[0, 1].axvline(df_lotes['ca'].mean(), color='gray', linestyle='--', linewidth=2, label='M√©dia')
axes[0, 1].legend()

# 3. Distribui√ß√£o de Taxa de Ocupa√ß√£o
axes[1, 0].hist(df_lotes['to'], bins=20, color='black', alpha=0.7, edgecolor='white')
axes[1, 0].set_title('Distribui√ß√£o de Taxa de Ocupa√ß√£o (TO)', fontweight='bold')
axes[1, 0].set_xlabel('TO')
axes[1, 0].set_ylabel('Frequ√™ncia')
axes[1, 0].axvline(df_lotes['to'].mean(), color='gray', linestyle='--', linewidth=2, label='M√©dia')
axes[1, 0].legend()

# 4. Distribui√ß√£o de Altura
axes[1, 1].hist(df_lotes['altura'], bins=25, color='black', alpha=0.7, edgecolor='white')
axes[1, 1].set_title('Distribui√ß√£o de Altura das Edifica√ß√µes', fontweight='bold')
axes[1, 1].set_xlabel('Altura (m)')
axes[1, 1].set_ylabel('Frequ√™ncia')
axes[1, 1].axvline(df_lotes['altura'].mean(), color='gray', linestyle='--', linewidth=2, label='M√©dia')
axes[1, 1].legend()

plt.tight_layout()
plt.show()

print("‚úì Gr√°ficos de distribui√ß√£o gerados")

## 4. An√°lise por Bairro

In [None]:
# An√°lise por bairro
fig, axes = plt.subplots(1, 2, figsize=(14, 5))
fig.suptitle('An√°lise por Bairro', fontsize=16, fontweight='bold', y=1.02)

# Contagem de lotes por bairro
bairro_counts = df_lotes['bairro'].value_counts()
axes[0].barh(bairro_counts.index, bairro_counts.values, color='black', alpha=0.7, edgecolor='white')
axes[0].set_title('Quantidade de Lotes por Bairro', fontweight='bold')
axes[0].set_xlabel('Quantidade')
axes[0].invert_yaxis()

# √Årea m√©dia por bairro
area_media_bairro = df_lotes.groupby('bairro')['area_terreno'].mean().sort_values()
axes[1].barh(area_media_bairro.index, area_media_bairro.values, color='black', alpha=0.7, edgecolor='white')
axes[1].set_title('√Årea M√©dia do Terreno por Bairro', fontweight='bold')
axes[1].set_xlabel('√Årea M√©dia (m¬≤)')
axes[1].invert_yaxis()

plt.tight_layout()
plt.show()

print("\nüìä Resumo por Bairro:")
print(df_lotes.groupby('bairro')[['area_terreno', 'ca', 'to', 'altura']].mean().round(2))

## 5. Carregamento dos Dados de Im√≥veis

In [None]:
# Carregar dados de im√≥veis
try:
    df_imoveis = pd.read_parquet('../data/raw/imoveis.parquet')
    print(f"‚úì Dados carregados: {len(df_imoveis)} im√≥veis")
except FileNotFoundError:
    print("‚ö†Ô∏è Arquivo n√£o encontrado. Criando dados de exemplo...")
    # Criar dados de exemplo
    df_imoveis = pd.DataFrame({
        'Incorporador': np.random.choice(['Incorporadora A', 'Incorporadora B', 'Incorporadora C'], 200),
        'Empreendimento': [f'Empreendimento {i}' for i in range(200)],
        'Bairro': np.random.choice(['Centro', 'Praia do Canto', 'Jardim Camburi', 'Enseada do Su√°'], 200),
        'Endereco': [f'Rua {i%20}, {np.random.randint(1,500)}' for i in range(200)],
        'Cidade': ['Vit√≥ria'] * 200,
        'Dormitorios': np.random.choice([1, 2, 3, 4], 200),
        'Metragem Privativa': np.random.uniform(40, 200, 200),
        'Vagas': np.random.choice([0, 1, 2, 3], 200),
        'Preco Total': np.random.uniform(250000, 2000000, 200),
        'Status': np.random.choice(['Lan√ßamento', 'Em Constru√ß√£o', 'Pronto'], 200),
        'Unidades Total': np.random.randint(20, 200, 200),
        'Unidades Vendidas': np.random.randint(5, 150, 200),
        'Estoque Atual': np.random.randint(5, 100, 200)
    })
    print(f"‚úì Dados de exemplo criados: {len(df_imoveis)} im√≥veis")

# Calcular pre√ßo por m¬≤
df_imoveis['Preco_m2'] = df_imoveis['Preco Total'] / df_imoveis['Metragem Privativa']

# Calcular percentual vendido
df_imoveis['Perc_Vendido'] = (df_imoveis['Unidades Vendidas'] / df_imoveis['Unidades Total']) * 100

df_imoveis.head()

## 6. An√°lise de Pre√ßos dos Im√≥veis

In [None]:
fig, axes = plt.subplots(2, 2, figsize=(14, 10))
fig.suptitle('An√°lise de Pre√ßos dos Im√≥veis', fontsize=16, fontweight='bold', y=1.02)

# 1. Distribui√ß√£o de Pre√ßo por m¬≤
axes[0, 0].hist(df_imoveis['Preco_m2'], bins=30, color='black', alpha=0.7, edgecolor='white')
axes[0, 0].set_title('Distribui√ß√£o de Pre√ßo por m¬≤', fontweight='bold')
axes[0, 0].set_xlabel('Pre√ßo/m¬≤ (R$)')
axes[0, 0].set_ylabel('Frequ√™ncia')
axes[0, 0].axvline(df_imoveis['Preco_m2'].mean(), color='gray', linestyle='--', linewidth=2, label='M√©dia')
axes[0, 0].axvline(df_imoveis['Preco_m2'].median(), color='lightgray', linestyle=':', linewidth=2, label='Mediana')
axes[0, 0].legend()

# 2. Pre√ßo m√©dio por m¬≤ por Bairro
preco_bairro = df_imoveis.groupby('Bairro')['Preco_m2'].mean().sort_values()
axes[0, 1].barh(preco_bairro.index, preco_bairro.values, color='black', alpha=0.7, edgecolor='white')
axes[0, 1].set_title('Pre√ßo M√©dio/m¬≤ por Bairro', fontweight='bold')
axes[0, 1].set_xlabel('Pre√ßo/m¬≤ (R$)')
axes[0, 1].invert_yaxis()

# 3. Pre√ßo Total por Dormit√≥rios
preco_dorm = df_imoveis.groupby('Dormitorios')['Preco Total'].mean().sort_index()
axes[1, 0].bar(preco_dorm.index, preco_dorm.values, color='black', alpha=0.7, edgecolor='white', width=0.6)
axes[1, 0].set_title('Pre√ßo M√©dio por N√∫mero de Dormit√≥rios', fontweight='bold')
axes[1, 0].set_xlabel('Dormit√≥rios')
axes[1, 0].set_ylabel('Pre√ßo M√©dio (R$)')
axes[1, 0].set_xticks(preco_dorm.index)

# 4. Rela√ß√£o Metragem vs Pre√ßo
axes[1, 1].scatter(df_imoveis['Metragem Privativa'], df_imoveis['Preco Total'], 
                   c='black', alpha=0.5, edgecolors='white', s=50)
axes[1, 1].set_title('Rela√ß√£o Metragem vs Pre√ßo Total', fontweight='bold')
axes[1, 1].set_xlabel('Metragem Privativa (m¬≤)')
axes[1, 1].set_ylabel('Pre√ßo Total (R$)')

# Adicionar linha de tend√™ncia
z = np.polyfit(df_imoveis['Metragem Privativa'], df_imoveis['Preco Total'], 1)
p = np.poly1d(z)
axes[1, 1].plot(df_imoveis['Metragem Privativa'].sort_values(), 
                p(df_imoveis['Metragem Privativa'].sort_values()), 
                "--", color='gray', linewidth=2, label='Tend√™ncia')
axes[1, 1].legend()

plt.tight_layout()
plt.show()

print(f"\nüí∞ ESTAT√çSTICAS DE PRE√áOS")
print(f"Pre√ßo m√©dio/m¬≤: R$ {df_imoveis['Preco_m2'].mean():,.2f}")
print(f"Pre√ßo mediano/m¬≤: R$ {df_imoveis['Preco_m2'].median():,.2f}")
print(f"Pre√ßo total m√©dio: R$ {df_imoveis['Preco Total'].mean():,.2f}")

## 7. An√°lise de Vendas

In [None]:
fig, axes = plt.subplots(1, 2, figsize=(14, 5))
fig.suptitle('An√°lise de Desempenho de Vendas', fontsize=16, fontweight='bold', y=1.02)

# 1. Distribui√ß√£o de percentual vendido
axes[0].hist(df_imoveis['Perc_Vendido'], bins=20, color='black', alpha=0.7, edgecolor='white')
axes[0].set_title('Distribui√ß√£o de Percentual Vendido', fontweight='bold')
axes[0].set_xlabel('% Vendido')
axes[0].set_ylabel('Frequ√™ncia')
axes[0].axvline(df_imoveis['Perc_Vendido'].mean(), color='gray', linestyle='--', linewidth=2, label='M√©dia')
axes[0].legend()

# 2. Performance por Status
status_vendas = df_imoveis.groupby('Status')['Perc_Vendido'].mean().sort_values()
axes[1].barh(status_vendas.index, status_vendas.values, color='black', alpha=0.7, edgecolor='white')
axes[1].set_title('% M√©dio Vendido por Status do Empreendimento', fontweight='bold')
axes[1].set_xlabel('% Vendido')
axes[1].invert_yaxis()

plt.tight_layout()
plt.show()

print("\nüìà ESTAT√çSTICAS DE VENDAS")
print(f"Percentual m√©dio vendido: {df_imoveis['Perc_Vendido'].mean():.1f}%")
print(f"\nDesempenho por Status:")
print(df_imoveis.groupby('Status')['Perc_Vendido'].agg(['mean', 'count']).round(1))

## 8. Top Incorporadores

In [None]:
# An√°lise de incorporadores
incorporadores = df_imoveis.groupby('Incorporador').agg({
    'Empreendimento': 'count',
    'Unidades Total': 'sum',
    'Unidades Vendidas': 'sum',
    'Preco_m2': 'mean'
}).round(2)

incorporadores.columns = ['Empreendimentos', 'Total Unidades', 'Vendidas', 'Pre√ßo M√©dio/m¬≤']
incorporadores['% Vendido'] = (incorporadores['Vendidas'] / incorporadores['Total Unidades'] * 100).round(1)
incorporadores = incorporadores.sort_values('Empreendimentos', ascending=False)

fig, axes = plt.subplots(1, 2, figsize=(14, 5))
fig.suptitle('Performance dos Incorporadores', fontsize=16, fontweight='bold', y=1.02)

# Empreendimentos por incorporador
axes[0].barh(incorporadores.index, incorporadores['Empreendimentos'], 
             color='black', alpha=0.7, edgecolor='white')
axes[0].set_title('N√∫mero de Empreendimentos', fontweight='bold')
axes[0].set_xlabel('Quantidade')
axes[0].invert_yaxis()

# Performance de vendas
axes[1].barh(incorporadores.index, incorporadores['% Vendido'], 
             color='black', alpha=0.7, edgecolor='white')
axes[1].set_title('% M√©dio de Unidades Vendidas', fontweight='bold')
axes[1].set_xlabel('% Vendido')
axes[1].invert_yaxis()

plt.tight_layout()
plt.show()

print("\nüè¢ RANKING DE INCORPORADORES")
print(incorporadores)

## 9. Resumo Executivo

In [None]:
print("="*60)
print("üìã RESUMO EXECUTIVO - AN√ÅLISE IMOBILI√ÅRIA")
print("="*60)

print("\nüèóÔ∏è DADOS DE LOTES (VIT√ìRIA)")
print(f"  ‚Ä¢ Total de lotes analisados: {len(df_lotes):,}")
print(f"  ‚Ä¢ √Årea m√©dia dos terrenos: {df_lotes['area_terreno'].mean():.2f} m¬≤")
print(f"  ‚Ä¢ CA m√©dio: {df_lotes['ca'].mean():.2f}")
print(f"  ‚Ä¢ TO m√©dio: {df_lotes['to'].mean():.2%}")
print(f"  ‚Ä¢ Altura m√©dia: {df_lotes['altura'].mean():.2f} m")

print("\nüè¢ DADOS DE IM√ìVEIS")
print(f"  ‚Ä¢ Total de im√≥veis analisados: {len(df_imoveis):,}")
print(f"  ‚Ä¢ Pre√ßo m√©dio por m¬≤: R$ {df_imoveis['Preco_m2'].mean():,.2f}")
print(f"  ‚Ä¢ Pre√ßo total m√©dio: R$ {df_imoveis['Preco Total'].mean():,.2f}")
print(f"  ‚Ä¢ Metragem m√©dia: {df_imoveis['Metragem Privativa'].mean():.2f} m¬≤")
print(f"  ‚Ä¢ % m√©dio vendido: {df_imoveis['Perc_Vendido'].mean():.1f}%")

print("\nüìç BAIRROS MAIS VALIOSOS (pre√ßo/m¬≤)")
top_bairros = df_imoveis.groupby('Bairro')['Preco_m2'].mean().sort_values(ascending=False).head(3)
for i, (bairro, preco) in enumerate(top_bairros.items(), 1):
    print(f"  {i}. {bairro}: R$ {preco:,.2f}/m¬≤")

print("\n" + "="*60)

## 10. Exportar Dados Processados

In [None]:
# Salvar dados processados
df_lotes.to_parquet('../data/processed/lotes_processados.parquet')
df_imoveis.to_parquet('../data/processed/imoveis_processados.parquet')

print("‚úì Dados processados exportados com sucesso!")
print(f"  ‚Ä¢ lotes_processados.parquet ({len(df_lotes)} registros)")
print(f"  ‚Ä¢ imoveis_processados.parquet ({len(df_imoveis)} registros)")