### M√©todo de interpola√ß√£o dasim√©trica

A coluna `peso_dom` representa a propor√ß√£o de domic√≠lios do setor censit√°rio que est√£o dentro daquele hex√°gono.

Para analisar as vari√°veis do Censo 2022 por hex√°gono, o c√≥digo de an√°lise ser√°:

$$ValorNoHexagono = ValorNoSetor \times peso\_dom$$

#### Exemplo: 

Se  o `Setor X` tem 1000 domic√≠lios, e o `Hex√°gono A` (dentro do `Setor X`) tem um `peso_dom` de $0,15$, o c√°lculo ser√°: $1000 \times 0.15 = 150$. Ou seja, haver√° 150 domic√≠lios estimados no Hex√°gono A.

In [None]:
import pandas as pd
import os

# Caminhos
path_v1 = '../data/raw/h3_past/br_h3_res9_v1.parquet'
chunks_dir = '../data/raw/h3_past/chunks_uf_cnefe_domicilios'
output_path = '../data/raw/h3/br_h3_res9.parquet'

print("üöÄ Iniciando consolida√ß√£o com c√°lculo de peso...")

# 1. Carregar a MALHA BASE primeiro (ela cont√©m o v√≠nculo H3 <-> SETOR)
cols_base = ['h3_id', 'cd_setor', 'cd_mun', 'nm_mun', 'cd_uf', 'nm_uf']
df_base = pd.read_parquet(path_v1, columns=cols_base)
print(f"‚úÖ Malha base carregada: {len(df_base)} hex√°gonos.")

# 2. Carregar e consolidar os DOMIC√çLIOS (CNEFE)
list_domicilios = []
for file_name in os.listdir(chunks_dir):
    if file_name.endswith('.parquet'):
        temp_df = pd.read_parquet(os.path.join(chunks_dir, file_name))
        # Renomeia para o padr√£o curto que voc√™ pediu
        temp_df = temp_df.rename(columns={'qtd_domicilios': 'qtd_dom'})
        list_domicilios.append(temp_df)

df_dom = pd.concat(list_domicilios, ignore_index=True)
print(f"‚úÖ Domic√≠lios carregados: {len(df_dom)} registros.")

# 3. CRUZAMENTO (Merge) - Unir a contagem de domic√≠lios √† malha que tem os setores
# Usamos inner para j√° manter apenas o que tem correspond√™ncia e domic√≠lios
df_final = pd.merge(df_base, df_dom, on='h3_id', how='inner')

# 4. AGORA SIM: Calcular o peso_dom (L√≥gica Dasim√©trica)
# Agora o df_final tem 'cd_setor' e 'qtd_dom' juntos!
print("‚öñÔ∏è Calculando pesos dasim√©tricos...")

# Soma de domic√≠lios por setor
df_final['total_dom_setor'] = df_final.groupby('cd_setor')['qtd_dom'].transform('sum')

# Peso = fra√ß√£o do setor dentro do hex√°gono
df_final['peso_dom'] = df_final['qtd_dom'] / df_final['total_dom_setor']

# 5. Limpeza Final
# Se o total_dom_setor for 0 (evitar divis√£o por zero), preenchemos peso com 0
df_final['peso_dom'] = df_final['peso_dom'].fillna(0)
df_final = df_final.drop(columns=['total_dom_setor'])

# Remover hex√°gonos com 0 domic√≠lios (opcional, conforme sua regra)
df_final = df_final[df_final['qtd_dom'] > 0]

# 6. Salvar
df_final.to_parquet(output_path, index=False, compression='snappy')

print(f"\n‚ú® Sucesso! Arquivo gerado: {output_path}")
print(f"üìä Colunas: {df_final.columns.tolist()}")
print(f"üìç Total de hex√°gonos habitados: {len(df_final)}")

üöÄ Iniciando consolida√ß√£o com c√°lculo de peso...
‚úÖ Malha base carregada: 4572203 hex√°gonos.
‚úÖ Domic√≠lios carregados: 4576063 registros.
‚öñÔ∏è Calculando pesos dasim√©tricos...

‚ú® Sucesso! Arquivo gerado: ../data/raw/h3/br_h3_res9.parquet
üìä Colunas: ['h3_id', 'cd_setor', 'cd_mun', 'nm_mun', 'cd_uf', 'nm_uf', 'qtd_dom', 'peso_dom']
üìç Total de hex√°gonos habitados: 4573444
