# Exportar Dados para Web

Exporta os dados processados do ETL para formato JSON compat√≠vel com o site de visualiza√ß√£o.

**‚ö†Ô∏è IMPORTANTE: Este notebook exporta TODOS os crimes individuais, n√£o agregados!**

Objetivos:
- Carregar dados consolidados com coordenadas geogr√°ficas v√°lidas
- Manter cada crime como registro individual (n√£o agregar)
- Exportar TODAS as informa√ß√µes relevantes de cada crime
- Gerar arquivos JSON otimizados para visualiza√ß√£o web
- Criar estat√≠sticas gerais
- Gerar amostra estratificada para testes r√°pidos

Dados exportados por crime:
- Localiza√ß√£o: munic√≠pio, bairro, endere√ßo, coordenadas, tipo de local
- Crime: tipo, categoria, rubrica, natureza apurada
- Temporal: data, hora, dia da semana, per√≠odo do dia
- Registro: delegacia, n√∫mero do BO, ano
- Site exibe popup detalhado ao clicar em cada marcador

In [10]:
import pandas as pd
import json
from pathlib import Path

print("Bibliotecas importadas")

Bibliotecas importadas


## 1. Importar Bibliotecas

Importa√ß√£o das bibliotecas necess√°rias para exporta√ß√£o de dados para formato web. As bibliotecas utilizadas incluem:

- **pandas**: manipula√ß√£o e filtragem dos dados processados
- **json**: serializa√ß√£o dos dados para formato JSON compat√≠vel com JavaScript
- **pathlib**: gerenciamento de caminhos de arquivos multiplataforma

Este notebook converte dados processados em formato Parquet para JSON otimizado, pronto para consumo pela interface web de visualiza√ß√£o de criminalidade.

In [11]:
PROJECT_ROOT = Path().resolve().parent
DATA_PROCESSED_DIR = PROJECT_ROOT / 'data' / 'processed'
SITE_DIR = PROJECT_ROOT / 'site'

print(f"Diret√≥rio processados: {DATA_PROCESSED_DIR}")
print(f"Diret√≥rio site: {SITE_DIR}")

Diret√≥rio processados: C:\Users\jodes\OneDrive\Documentos\Projetos-GitHub\public-security-data\data\processed
Diret√≥rio site: C:\Users\jodes\OneDrive\Documentos\Projetos-GitHub\public-security-data\site


## 2. Configurar Diret√≥rios

Defini√ß√£o dos caminhos para os diret√≥rios do projeto:

- **data/processed/**: cont√©m os dados transformados em formato Parquet
- **site/**: destino dos arquivos JSON para a aplica√ß√£o web

Esta organiza√ß√£o mant√©m separa√ß√£o clara entre dados processados (backend) e recursos web (frontend), facilitando deploy e manuten√ß√£o da aplica√ß√£o de visualiza√ß√£o.

In [12]:
# Carregar dados transformados (ap√≥s filtragem no notebook 2)
arquivo_principal = DATA_PROCESSED_DIR / 'ocorrencias_criminais_2025_transformado.parquet'

if arquivo_principal.exists():
    df = pd.read_parquet(arquivo_principal)
    print(f"Dados carregados de: {arquivo_principal.name}")
    print(f"Registros totais: {len(df):,}")
    
    # Filtrar apenas registros v√°lidos
    # 1. Coordenadas v√°lidas e n√£o-zeradas
    df = df[
        (df['latitude'].notna()) & 
        (df['longitude'].notna()) & 
        (df['latitude'] != 0.0) & 
        (df['longitude'] != 0.0)
    ]
    print(f"Registros com coordenadas v√°lidas: {len(df):,}")
    
    # 2. Apenas dados de 2025 (redundante se notebook 2 foi executado, mas garante)
    if 'ano_bo' in df.columns:
        df = df[df['ano_bo'] >= 2025]
        print(f"Registros de 2025: {len(df):,}")
    
    print(f"\nColunas dispon√≠veis ({len(df.columns)}):")
    print(df.columns.tolist())
    print(f"\nAmostra dos dados:")
    display(df.head(3))
else:
    print("Arquivo n√£o encontrado. Execute os notebooks anteriores:")
    print("  1. 1_extracao.ipynb")
    print("  2. 2_transformacao.ipynb (com filtros de qualidade)")
    df = None

Dados carregados de: ocorrencias_criminais_2025_transformado.parquet
Registros totais: 878,585
Registros com coordenadas v√°lidas: 637,016
Registros de 2025: 637,016

Colunas dispon√≠veis (36):
['nome_departamento', 'nome_seccional', 'nome_delegacia', 'nome_municipio', 'num_bo', 'ano_bo', 'data_registro', 'data_ocorrencia_bo', 'hora_ocorrencia_bo', 'desc_periodo', 'descr_subtipolocal', 'bairro', 'logradouro', 'numero_logradouro', 'latitude', 'longitude', 'nome_delegacia_circunscricao', 'nome_departamento_circunscricao', 'nome_seccional_circunscricao', 'nome_municipio_circunscricao', 'rubrica', 'descr_conduta', 'natureza_apurada', 'mes_estatistica', 'ano_estatistica', 'cmd', 'btl', 'cia', 'aba_origem', 'ano_mes', 'ano_ocorrencia', 'mes_ocorrencia', 'dia_semana', 'dia_semana_nome', 'tipo_crime', 'categoria_crime']

Amostra dos dados:
Registros de 2025: 637,016

Colunas dispon√≠veis (36):
['nome_departamento', 'nome_seccional', 'nome_delegacia', 'nome_municipio', 'num_bo', 'ano_bo', 'data

Unnamed: 0,nome_departamento,nome_seccional,nome_delegacia,nome_municipio,num_bo,ano_bo,data_registro,data_ocorrencia_bo,hora_ocorrencia_bo,desc_periodo,...,btl,cia,aba_origem,ano_mes,ano_ocorrencia,mes_ocorrencia,dia_semana,dia_semana_nome,tipo_crime,categoria_crime
4,DIPOL - DEPTO DE INTELIGENCIA,DELEGACIA ELETRONICA,DELEGACIA ELETRONICA 1,S.PAULO,AA1448,2025,2025-01-01,2024-12-31,10:30:00,,...,7¬∫BPM/M,3¬™CIA 4¬™CIA,JAN_A_JUN_2025,NaT,2024.0,12.0,1.0,Tuesday,FURTO - OUTROS,Crimes Patrimoniais
5,DIPOL - DEPTO DE INTELIGENCIA,DELEGACIA ELETRONICA,DELEGACIA ELETRONICA 1,S.PAULO,AA1473,2025,2025-01-01,2024-12-31,23:30:00,,...,7¬∫BPM/M,3¬™CIA 4¬™CIA,JAN_A_JUN_2025,NaT,2024.0,12.0,1.0,Tuesday,FURTO - OUTROS,Crimes Patrimoniais
6,DIPOL - DEPTO DE INTELIGENCIA,DELEGACIA ELETRONICA,DELEGACIA ELETRONICA 1,S.PAULO,AA2036,2025,2025-01-01,2024-12-31,21:30:00,,...,7¬∫BPM/M,3¬™CIA 4¬™CIA,JAN_A_JUN_2025,NaT,2024.0,12.0,1.0,Tuesday,FURTO - OUTROS,Crimes Patrimoniais


## 3. Carregar Dados com Coordenadas

Carregamento dos dados transformados com filtros adicionais para garantir qualidade na visualiza√ß√£o web:

1. **Filtro de coordenadas**: remove registros sem geolocaliza√ß√£o ou com coordenadas (0.0, 0.0) inv√°lidas
2. **Filtro temporal**: mant√©m apenas dados de 2025, conforme escopo do projeto
3. **Valida√ß√£o de completude**: verifica disponibilidade das colunas necess√°rias

Estes filtros garantem que apenas crimes geolocalizados e relevantes sejam exibidos no mapa interativo, melhorando a experi√™ncia do usu√°rio e a utilidade das visualiza√ß√µes.

In [13]:
if df is not None:
    # Selecionar colunas relevantes para o site
    colunas_export = [
        'latitude', 'longitude',
        'rubrica', 'tipo_crime', 'categoria_crime',
        'nome_municipio_circunscricao', 'bairro',
        'logradouro', 'numero_logradouro',
        'data_ocorrencia_bo', 'hora_ocorrencia_bo',
        'desc_periodo', 'descr_subtipolocal',
        'nome_delegacia_circunscricao',
        'ano_bo', 'mes_estatistica',
        'dia_semana_nome', 'num_bo',
        'natureza_apurada'
    ]
    
    # Verificar quais colunas existem
    colunas_presentes = [col for col in colunas_export if col in df.columns]
    print(f"Colunas selecionadas para exporta√ß√£o: {len(colunas_presentes)}")
    print(colunas_presentes)
    
    # Criar DataFrame de exporta√ß√£o
    df_export = df[colunas_presentes].copy()
    
    # Renomear colunas para formato web-friendly
    rename_map = {
        'latitude': 'lat',
        'longitude': 'lng',
        'nome_municipio_circunscricao': 'municipio',
        'mes_estatistica': 'mes',
        'ano_bo': 'ano',
        'data_ocorrencia_bo': 'data_ocorrencia',
        'hora_ocorrencia_bo': 'hora_ocorrencia',
        'nome_delegacia_circunscricao': 'delegacia',
        'dia_semana_nome': 'dia_semana'
    }
    
    df_export = df_export.rename(columns={k: v for k, v in rename_map.items() if k in df_export.columns})
    
    # CORRE√á√ÉO: Substituir NaN e valores infinitos por None/null
    import numpy as np
    df_export = df_export.replace([np.inf, -np.inf], None)
    df_export = df_export.where(pd.notna(df_export), None)
    
    # Limpar valores nulos em campos de texto (converter None para string vazia)
    for col in df_export.select_dtypes(include=['object']).columns:
        df_export[col] = df_export[col].fillna('').astype(str)
        df_export[col] = df_export[col].replace('None', '')
        df_export[col] = df_export[col].replace('nan', '')
    
    # Converter datas para string
    if 'data_ocorrencia' in df_export.columns:
        df_export['data_ocorrencia'] = pd.to_datetime(df_export['data_ocorrencia']).dt.strftime('%Y-%m-%d')
    
    print(f"\nDados preparados para exporta√ß√£o")
    print(f"Total de crimes individuais: {len(df_export):,}")
    print(f"\nColunas finais: {list(df_export.columns)}")
    print(f"\nExemplo dos dados:")
    display(df_export.head(3))
else:
    print("Nenhum dado para processar")
    df_export = None

Colunas selecionadas para exporta√ß√£o: 19
['latitude', 'longitude', 'rubrica', 'tipo_crime', 'categoria_crime', 'nome_municipio_circunscricao', 'bairro', 'logradouro', 'numero_logradouro', 'data_ocorrencia_bo', 'hora_ocorrencia_bo', 'desc_periodo', 'descr_subtipolocal', 'nome_delegacia_circunscricao', 'ano_bo', 'mes_estatistica', 'dia_semana_nome', 'num_bo', 'natureza_apurada']

Dados preparados para exporta√ß√£o
Total de crimes individuais: 637,016

Colunas finais: ['lat', 'lng', 'rubrica', 'tipo_crime', 'categoria_crime', 'municipio', 'bairro', 'logradouro', 'numero_logradouro', 'data_ocorrencia', 'hora_ocorrencia', 'desc_periodo', 'descr_subtipolocal', 'delegacia', 'ano', 'mes', 'dia_semana', 'num_bo', 'natureza_apurada']

Exemplo dos dados:

Dados preparados para exporta√ß√£o
Total de crimes individuais: 637,016

Colunas finais: ['lat', 'lng', 'rubrica', 'tipo_crime', 'categoria_crime', 'municipio', 'bairro', 'logradouro', 'numero_logradouro', 'data_ocorrencia', 'hora_ocorrencia',

Unnamed: 0,lat,lng,rubrica,tipo_crime,categoria_crime,municipio,bairro,logradouro,numero_logradouro,data_ocorrencia,hora_ocorrencia,desc_periodo,descr_subtipolocal,delegacia,ano,mes,dia_semana,num_bo,natureza_apurada
4,-23.552842,-46.627423,Furto (art. 155),FURTO - OUTROS,Crimes Patrimoniais,S.PAULO,SE,AVENIDA PREFEITO PASSOS,57.0,2024-12-31,10:30:00,,Via P√∫blica,01¬∫ D.P. SE,2025,1,Tuesday,AA1448,FURTO - OUTROS
5,-23.556547,-46.629346,Furto (art. 155),FURTO - OUTROS,Crimes Patrimoniais,S.PAULO,LIBERDADE,RUA GLIC√âRIO,437.0,2024-12-31,23:30:00,,Via P√∫blica,01¬∫ D.P. SE,2025,1,Tuesday,AA1473,FURTO - OUTROS
6,-23.555854,-46.629199,Furto (art. 155),FURTO - OUTROS,Crimes Patrimoniais,S.PAULO,LIBERDADE,RUA GLIC√âRIO,368.0,2024-12-31,21:30:00,,Via P√∫blica,01¬∫ D.P. SE,2025,1,Tuesday,AA2036,FURTO - OUTROS


## 4. Preparar Dados para Exporta√ß√£o

Prepara√ß√£o dos dados para formato JSON compat√≠vel com a aplica√ß√£o web. Este processo inclui:

1. **Sele√ß√£o de colunas**: apenas campos relevantes para visualiza√ß√£o s√£o mantidos
2. **Renomea√ß√£o**: colunas recebem nomes simplificados e web-friendly (ex: `nome_municipio_circunscricao` vira `municipio`)
3. **Limpeza de valores nulos**: tratamento de NaN, infinitos e valores inv√°lidos que quebrariam o JSON
4. **Convers√£o de tipos**: datas convertidas para strings formatadas, coordenadas arredondadas
5. **Valida√ß√£o**: verifica√ß√£o de que todos os valores s√£o serializ√°veis em JSON

Esta prepara√ß√£o garante que o arquivo JSON gerado seja v√°lido, compacto e otimizado para carregamento r√°pido no navegador.

In [14]:
if df_export is not None and len(df_export) > 0:
    df_export_clean = df_export.copy()
    
    # Converter tipos de dados para JSON-friendly
    for col in ['lat', 'lng']:
        if col in df_export_clean.columns:
            df_export_clean[col] = df_export_clean[col].astype(float).round(6)
    
    for col in ['mes', 'ano']:
        if col in df_export_clean.columns:
            # Converter para int, mas manter None se for nulo
            df_export_clean[col] = df_export_clean[col].apply(lambda x: int(x) if pd.notna(x) else None)
    
    # Converter para lista de dicion√°rios (orient='records' j√° lida bem com None)
    dados_json = df_export_clean.to_dict('records')
    
    print(f"Dados convertidos para JSON")
    print(f"Total de crimes: {len(dados_json):,}")
    print(f"\nExemplo dos primeiros 2 registros:")
    for i, registro in enumerate(dados_json[:2], 1):
        print(f"\nCrime {i}:")
        print(json.dumps(registro, indent=2, ensure_ascii=False))
else:
    print("Nenhum dado para converter")
    dados_json = []

Dados convertidos para JSON
Total de crimes: 637,016

Exemplo dos primeiros 2 registros:

Crime 1:
{
  "lat": -23.552842,
  "lng": -46.627423,
  "rubrica": "Furto (art. 155)",
  "tipo_crime": "FURTO - OUTROS",
  "categoria_crime": "Crimes Patrimoniais",
  "municipio": "S.PAULO",
  "bairro": "SE",
  "logradouro": "AVENIDA PREFEITO PASSOS",
  "numero_logradouro": 57.0,
  "data_ocorrencia": "2024-12-31",
  "hora_ocorrencia": "10:30:00",
  "desc_periodo": "",
  "descr_subtipolocal": "Via P√∫blica",
  "delegacia": "01¬∫ D.P. SE",
  "ano": 2025,
  "mes": 1,
  "dia_semana": "Tuesday",
  "num_bo": "AA1448",
  "natureza_apurada": "FURTO - OUTROS"
}

Crime 2:
{
  "lat": -23.556547,
  "lng": -46.629346,
  "rubrica": "Furto (art. 155)",
  "tipo_crime": "FURTO - OUTROS",
  "categoria_crime": "Crimes Patrimoniais",
  "municipio": "S.PAULO",
  "bairro": "LIBERDADE",
  "logradouro": "RUA GLIC√âRIO",
  "numero_logradouro": 437.0,
  "data_ocorrencia": "2024-12-31",
  "hora_ocorrencia": "23:30:00",
  "de

## 5. Converter para JSON

Convers√£o do DataFrame preparado para estrutura de lista de dicion√°rios, formato ideal para serializa√ß√£o JSON. Cada registro representa um crime individual com todas suas propriedades. A convers√£o utiliza `to_dict('records')` que gera estrutura otimizada para JavaScript, onde cada objeto pode ser facilmente manipulado no frontend. Exemplos dos primeiros registros s√£o exibidos para valida√ß√£o visual da estrutura antes do salvamento.

In [15]:
if 'dados_json' in locals() and len(dados_json) > 0:
    json_path = SITE_DIR / 'dados_criminais.json'
    
    # Salvar com allow_nan=False para garantir que n√£o h√° NaN no JSON
    with open(json_path, 'w', encoding='utf-8') as f:
        json.dump(dados_json, f, ensure_ascii=False, indent=2, allow_nan=False)
    
    size_mb = json_path.stat().st_size / (1024 * 1024)
    
    print(f"Arquivo JSON salvo com sucesso")
    print(f"Caminho: {json_path}")
    print(f"Tamanho: {size_mb:.2f} MB")
    print(f"Registros: {len(dados_json):,}")
    
    if size_mb > 10:
        print(f"\nAviso: Arquivo grande ({size_mb:.2f} MB). Considere usar amostragem para o site.")
else:
    print("Nenhum dado para salvar")

ValueError: Out of range float values are not JSON compliant: nan

## 6. Salvar Arquivo JSON Completo

Persist√™ncia do arquivo JSON contendo todos os crimes geolocalizados. O arquivo √© salvo com:

- **Encoding UTF-8**: suporte completo a caracteres especiais e acentua√ß√£o
- **Indenta√ß√£o**: formato leg√≠vel para debugging (indent=2)
- **allow_nan=False**: valida√ß√£o rigorosa que impede valores inv√°lidos NaN
- **ensure_ascii=False**: preserva caracteres Unicode originais

O tamanho do arquivo √© reportado para monitoramento. Arquivos muito grandes (> 10 MB) podem impactar performance no navegador, justificando a cria√ß√£o de arquivos de amostra menores para testes.

In [None]:
if df_export is not None and len(df_export) > 0:
    # Gerar estat√≠sticas
    stats = {
        'total_crimes': int(len(df_export)),
        'data_geracao': pd.Timestamp.now().strftime('%Y-%m-%d %H:%M:%S')
    }
    
    # Estat√≠sticas por categoria
    if 'categoria_crime' in df_export.columns:
        stats['categorias'] = df_export['categoria_crime'].value_counts().to_dict()
    
    if 'tipo_crime' in df_export.columns:
        stats['tipos_crime_unicos'] = int(df_export['tipo_crime'].nunique())
        stats['top_crimes'] = df_export['tipo_crime'].value_counts().head(15).to_dict()
    
    if 'municipio' in df_export.columns:
        stats['municipios_unicos'] = int(df_export['municipio'].nunique())
        stats['top_municipios'] = df_export['municipio'].value_counts().head(15).to_dict()
    
    if 'bairro' in df_export.columns:
        bairros = df_export[df_export['bairro'] != '']['bairro']
        if len(bairros) > 0:
            stats['top_bairros'] = bairros.value_counts().head(15).to_dict()
    
    if 'ano' in df_export.columns and 'mes' in df_export.columns:
        stats['periodo'] = {
            'ano_inicio': int(df_export['ano'].min()),
            'ano_fim': int(df_export['ano'].max()),
            'mes_inicio': int(df_export['mes'].min()),
            'mes_fim': int(df_export['mes'].max())
        }
    
    if 'dia_semana' in df_export.columns:
        stats['crimes_por_dia_semana'] = df_export['dia_semana'].value_counts().to_dict()
    
    # Salvar estat√≠sticas
    stats_path = SITE_DIR / 'estatisticas.json'
    with open(stats_path, 'w', encoding='utf-8') as f:
        json.dump(stats, f, indent=2, ensure_ascii=False)
    
    print(f"Estat√≠sticas salvas: {stats_path}")
    print(f"Tamanho: {stats_path.stat().st_size / 1024:.1f} KB")
    print(f"\nResumo:")
    print(f"  Total de crimes: {stats['total_crimes']:,}")
    if 'tipos_crime_unicos' in stats:
        print(f"  Tipos de crime: {stats['tipos_crime_unicos']}")
    if 'municipios_unicos' in stats:
        print(f"  Munic√≠pios: {stats['municipios_unicos']}")
else:
    print("Nenhum dado para gerar estat√≠sticas")

Estat√≠sticas salvas: C:\Users\jodes\OneDrive\Documentos\Projetos-GitHub\public-security-data\site\estatisticas.json
Tamanho: 1.9 KB

Resumo:
  Total de crimes: 637,016
  Tipos de crime: 22
  Munic√≠pios: 643


## 7. Criar Estat√≠sticas para o Site

Gera√ß√£o de arquivo separado contendo estat√≠sticas agregadas para exibi√ß√£o na interface web. Este arquivo `estatisticas.json` inclui:

- Total de crimes e timestamp de gera√ß√£o
- Distribui√ß√£o por categorias de crime
- Top 15 tipos de crime mais frequentes
- Top 15 munic√≠pios com mais ocorr√™ncias
- Top 15 bairros (quando dispon√≠vel)
- Per√≠odo temporal coberto pelos dados
- Crimes por dia da semana

Estas estat√≠sticas pr√©-computadas melhoram drasticamente a performance do site, evitando c√°lculos pesados no navegador do usu√°rio.

In [None]:
if df_export is not None and len(df_export) > 0:
    # Criar amostra estratificada para testes r√°pidos
    sample_size = min(5000, len(df_export))
    
    # Se houver tipo_crime, fazer amostragem estratificada
    if 'tipo_crime' in df_export.columns:
        # Amostra proporcional por tipo de crime
        df_sample = df_export.groupby('tipo_crime', group_keys=False).apply(
            lambda x: x.sample(min(len(x), max(1, int(sample_size * len(x) / len(df_export)))))
        ).reset_index(drop=True)
    else:
        # Amostra aleat√≥ria simples
        df_sample = df_export.sample(n=sample_size, random_state=42)
    
    dados_sample_json = df_sample.to_dict('records')
    
    sample_path = SITE_DIR / 'dados_criminais_sample.json'
    # Salvar com allow_nan=False para garantir que n√£o h√° NaN no JSON
    with open(sample_path, 'w', encoding='utf-8') as f:
        json.dump(dados_sample_json, f, ensure_ascii=False, indent=2, allow_nan=False)
    
    print(f"Arquivo de amostra criado")
    print(f"Caminho: {sample_path}")
    print(f"Crimes na amostra: {len(dados_sample_json):,}")
    print(f"Tamanho: {sample_path.stat().st_size / (1024*1024):.2f} MB")
    print(f"\nCrit√©rio: Amostra estratificada por tipo de crime")
    
    if 'tipo_crime' in df_sample.columns:
        print(f"\nDistribui√ß√£o na amostra:")
        print(df_sample['tipo_crime'].value_counts().head(10))
else:
    print("Nenhum dado para criar amostra")

Arquivo de amostra criado
Caminho: C:\Users\jodes\OneDrive\Documentos\Projetos-GitHub\public-security-data\site\dados_criminais_sample.json
Crimes na amostra: 4,996
Tamanho: 3.12 MB

Crit√©rio: Amostra estratificada por tipo de crime

Distribui√ß√£o na amostra:
tipo_crime
FURTO - OUTROS                                     2389
ROUBO - OUTROS                                      820
FURTO DE VE√çCULO                                    424
LES√ÉO CORPORAL DOLOSA                               418
LES√ÉO CORPORAL CULPOSA POR ACIDENTE DE TR√ÇNSITO     398
TR√ÅFICO DE ENTORPECENTES                            209
ROUBO DE VE√çCULO                                    132
PORTE DE ENTORPECENTES                               67
APREENS√ÉO DE ENTORPECENTES                           31
HOMIC√çDIO CULPOSO POR ACIDENTE DE TR√ÇNSITO           22
Name: count, dtype: int64


  df_sample = df_export.groupby('tipo_crime', group_keys=False).apply(


## 8. Criar Arquivo de Amostra

Gera√ß√£o de arquivo JSON reduzido contendo amostra estratificada de 5.000 crimes para testes e desenvolvimento. A amostragem estratificada garante que:

- A propor√ß√£o de cada tipo de crime √© mantida
- Todos os tipos principais est√£o representados
- O arquivo √© suficientemente pequeno para carregamento r√°pido
- A amostra √© reprodut√≠vel (random_state fixo)

Este arquivo `dados_criminais_sample.json` √© carregado por padr√£o na aplica√ß√£o web, permitindo testes r√°pidos sem impactar performance. Para visualizar todos os crimes, o usu√°rio pode alternar para o arquivo completo atrav√©s da interface.

In [None]:
print("="*70)
print("RESUMO DA EXPORTA√á√ÉO")
print("="*70)

print("\nArquivos gerados no diret√≥rio site/:")

if SITE_DIR.exists():
    for file in sorted(SITE_DIR.glob('*.json')):
        size = file.stat().st_size
        if size > 1024*1024:
            size_str = f"{size/(1024*1024):.2f} MB"
        else:
            size_str = f"{size/1024:.2f} KB"
        print(f"  {file.name:<40} ({size_str})")

if df_export is not None:
    print(f"\n{'='*70}")
    print("INFORMA√á√ïES DOS DADOS EXPORTADOS")
    print(f"{'='*70}")
    print(f"\nTotal de crimes individuais: {len(df_export):,}")
    print(f"Campos exportados por crime: {len(df_export.columns)}")
    print(f"\nCampos dispon√≠veis em cada crime:")
    for col in df_export.columns:
        print(f"  ‚Ä¢ {col}")

print("\n" + "="*70)
print("EXPORTA√á√ÉO CONCLU√çDA COM SUCESSO")
print("="*70)

print("\nüó∫Ô∏è VISUALIZAR O MAPA:")
print(f"  1. Abra o arquivo: {SITE_DIR / 'main.html'}")
print("  2. Use um navegador web moderno (Chrome, Firefox, Edge)")
print("  3. Clique nos marcadores para ver TODOS os detalhes de cada crime")

print("\nüìä RECURSOS DO SITE:")
print("  ‚Ä¢ Cada marcador = 1 crime individual")
print("  ‚Ä¢ Popups com informa√ß√µes completas:")
print("    - Tipo e categoria do crime")
print("    - Localiza√ß√£o detalhada (munic√≠pio, bairro, endere√ßo)")
print("    - Data, hora e dia da semana")
print("    - Delegacia e n√∫mero do boletim")
print("    - Coordenadas geogr√°ficas")
print("  ‚Ä¢ Filtros por tipo de crime e munic√≠pio")
print("  ‚Ä¢ Clustering autom√°tico para melhor visualiza√ß√£o")

print("\nüí° DICA:")
print("  O site carrega 'dados_criminais_sample.json' por padr√£o (5.000 crimes)")
print("  Para carregar todos os crimes, altere no leaflet.js:")
print("    toggleDataSource(false) // carrega dados_criminais.json")

print("\n" + "="*70)

RESUMO DA EXPORTA√á√ÉO

Arquivos gerados no diret√≥rio site/:
  dados_criminais.json                     (393.13 MB)
  dados_criminais_sample.json              (3.12 MB)
  estatisticas.json                        (1.93 KB)

INFORMA√á√ïES DOS DADOS EXPORTADOS

Total de crimes individuais: 637,016
Campos exportados por crime: 19

Campos dispon√≠veis em cada crime:
  ‚Ä¢ lat
  ‚Ä¢ lng
  ‚Ä¢ rubrica
  ‚Ä¢ tipo_crime
  ‚Ä¢ categoria_crime
  ‚Ä¢ municipio
  ‚Ä¢ bairro
  ‚Ä¢ logradouro
  ‚Ä¢ numero_logradouro
  ‚Ä¢ data_ocorrencia
  ‚Ä¢ hora_ocorrencia
  ‚Ä¢ desc_periodo
  ‚Ä¢ descr_subtipolocal
  ‚Ä¢ delegacia
  ‚Ä¢ ano
  ‚Ä¢ mes
  ‚Ä¢ dia_semana
  ‚Ä¢ num_bo
  ‚Ä¢ natureza_apurada

EXPORTA√á√ÉO CONCLU√çDA COM SUCESSO

üó∫Ô∏è VISUALIZAR O MAPA:
  1. Abra o arquivo: C:\Users\jodes\OneDrive\Documentos\Projetos-GitHub\public-security-data\site\main.html
  2. Use um navegador web moderno (Chrome, Firefox, Edge)
  3. Clique nos marcadores para ver TODOS os detalhes de cada crime

üìä RECURSOS D

## 9. Resumo da Exporta√ß√£o

Sum√°rio executivo final do processo de exporta√ß√£o para web, consolidando todas as informa√ß√µes relevantes:

### Arquivos Gerados

Lista completa dos arquivos JSON criados no diret√≥rio `site/`, incluindo tamanhos

### Estrutura dos Dados

Documenta√ß√£o dos campos dispon√≠veis em cada registro de crime, facilitando integra√ß√£o frontend

### Instru√ß√µes de Uso

Orienta√ß√µes claras para visualizar a aplica√ß√£o web:
- Como abrir o mapa interativo
- Recursos dispon√≠veis (filtros, clustering, popups detalhados)
- Altern√¢ncia entre arquivo completo e amostra

Este resumo serve como documenta√ß√£o final do pipeline completo, desde extra√ß√£o at√© visualiza√ß√£o web, encerrando o ciclo ETL do projeto de seguran√ßa p√∫blica de S√£o Paulo.