In [1]:
import geopandas as gpd
from folium import (
    LayerControl,
    Element,
    TileLayer,
)
import plotly.express as px




from core.downloads.geosampa import get_capabilities, get_features

# Promoção da Sustentabilidade Ambiental, Gestão de risco

## Formulário 7

O formulário associado a este notebook solicita os dados sobre 
`áreas de risco (hidrológico e deslizamentos)`. A justificativa para estes dados é a seguinte:

> As áreas de risco estão relacionadas à construção de moradias, em sua maioria em condições precárias, em locais com geológico-geotécnicas frágeis, não recomendadas para ocupação. O impacto de chuvas concentradas intensas, características de eventos climáticos extremos deve ser monitorado pelo Município, através de políticas públicas de gestão de risco e promoção da resiliência climática.

## Carregando as camadas de risco hidrológico e geológico

In [None]:
get_capabilities('hidrológico')

In [None]:
get_capabilities('deslizamento')

Como o formulário cita apenas a camada `proteção e defesa civil/mapeamento de areas de risco`, assumirei que a referência a deslizamentos seja sobre a camada de risco geológico.

In [None]:
df_hid = get_features('geoportal:risco_hidrologico')
df_hid.head()

In [None]:
df_geo = get_features('geoportal:area_risco_geologico')
df_geo.head()

Além dos dados de riscos hidrogeológicos, também precisaremos dos dados do Censo de 2022 para a estimativa populacional. Os dados básicos, como número de domicílios e população, são disponibilizados diretamente no geopackage com as geometrias de setores censitários.

In [None]:
df_censo = gpd.read_file('https://ftp.ibge.gov.br/Censos/Censo_Demografico_2022/Agregados_por_Setores_Censitarios/malha_com_atributos/setores/gpkg/UF/SP/SP_setores_CD2022.gpkg')
df_censo.head()

In [None]:
df_censo = df_censo.loc[df_censo['CD_MUN']=='3550308']
df_censo.head()

## Carregando a camada de cobertura vegetal

In [None]:
get_capabilities('veg')

In [None]:
df_veg = get_features('geoportal:cobertura_vegetal')
df_veg.head()


## Carregando a camada de quadras viárias

In [None]:
get_capabilities('viaria')

In [None]:
df_quadras = get_features('geoportal:quadra_viaria_editada')
df_quadras.head()


## Ajustando as projeções

Vamos revisar os sistemas de coordenadas de todos os geodataframes para garantir que estão na mesma projeção.

In [None]:
for gdf in [df_geo, df_hid, df_censo, df_veg, df_quadras]:
    print(gdf.columns[:5])
    print(gdf.crs)

Como o geodataframe do censo está em outro crs, precisamos convertê-lo para o `epsg:31983`.

In [13]:
df_censo = df_censo.to_crs('EPSG:31983')

# Calculando a população de cada área de risco

Primeiro, vamos inspecionar visualmente os geodataframes.

In [None]:
df_geo.explore()

In [None]:
df_censo.iloc[:500].explore()

In [None]:
df_veg.iloc[:500].explore()

## Calculando as interseções

1. Remover as áreas de vegetação dos setores censitarios;
1. Calcular a interseção com as quadras viárias (para remover as ruas);
1. Calcular a área de cada setor censitário ajustado (nova área total);
1. Calcular a interseção com as áreas de risco;
1. Calcular o peso da interseção em relação ao setor ajustado;
1. Calcular a população e moradias com base no peso;
1. Agregar população e moradia por área de risco;

In [None]:
df_censo['NM_DIST'].value_counts()

In [None]:
df_censo_filtrado = df_censo[df_censo['NM_DIST']=='Grajaú']
df_censo_filtrado

In [None]:
df_veg_filtrada = df_veg[df_veg.intersects(df_censo_filtrado.union_all())]

df_veg_filtrada

Primeiro, vamos filtrar a área de vegetação para os tipos mais adequados para o ajuste dos setores censitários.

Depois, calculamos a diferença entre os setores censitários e a vegetação, para remover as área não povoadas.

In [None]:
ol1 = gpd.overlay(df_censo_filtrado, df_veg_filtrada,
                  how='difference',
                  keep_geom_type=True)

ol1.head()

In [None]:
tooltip_columns = ['CD_SETOR', 'v0001', 'v0002', 'v0003', 'v0004', 'v0005', 'v0006', 'v0007']

m = df_censo_filtrado.explore(
    tiles='CartoDB positron',
    color='blue',  # Cor dos setores censitários
    style_kwds={'fillOpacity': 0.2},  # Transparência do preenchimento
    name='Setores Censitários Originais',
    tooltip=tooltip_columns
)
m = ol1.explore(
    m=m,
    color='purple',  # Cor das interseções
    style_kwds={'fillOpacity': 0.5},  # Transparência do preenchimento
    name='Setores Censitários Ajustados',
    tooltip=tooltip_columns
)

# Adicionar camada de satélite
TileLayer(
    tiles='https://mt1.google.com/vt/lyrs=s&x={x}&y={y}&z={z}',
    attr='Google Satellite',
    name='Google Satellite'
).add_to(m)

# Adicionar controle de camadas
LayerControl().add_to(m)

# Criar a legenda personalizada
legend_html = """
<div style="position: fixed; 
            bottom: 50px; left: 50px; width: 200px; height: 120px; 
            background-color: white; z-index:1000; padding: 10px; 
            border: 2px solid grey; border-radius: 5px;">
    <h4>Legenda</h4>
    <i style="background: blue; width: 10px; height: 10px; display: inline-block;"></i> Setores Censitários Originais<br>
    <i style="background: purple; width: 10px; height: 10px; display: inline-block;"></i> Setores Censitários Ajustados<br>
</div>
"""
m.get_root().html.add_child(Element(legend_html))

m

Depois, precisaremos calcular a interseção de cada um dos dataframes de risco com os setores censitários.

In [None]:
ol2 = gpd.overlay(df_geo, df_censo,
            how='intersection',
            keep_geom_type=True)
ol2.head()

Vamos avaliar visualmente o resultado da interseção com base na primeira área de risco.

In [None]:
id_area = ol2.loc[:, 'id'].iloc[0]
id_area

In [None]:
cd_setor_list = ol2.loc[ol2['id']==id_area, 'CD_SETOR'].tolist()
ol2.loc[ol2['id']=='area_risco_geologico.1', ['id', 'CD_SETOR']]

In [None]:
m = df_censo[df_censo['CD_SETOR'].isin(
    cd_setor_list)].explore(name='setor censitário')

m = df_geo[df_geo['id'] == 'area_risco_geologico.1'].explore(
    m=m, color='orange', name='area de risco')

filtered_ol2 = ol2.loc[ol2['id'] == 'area_risco_geologico.1', [
    'id', 'CD_SETOR', 'geometry']]
m = filtered_ol2.explore(m=m, color='purple', name='interseção')

LayerControl().add_to(m)

m

Na inspeção visual, nota-se que algumas interseções não aparentam representar áreas com moradias, mas simplesmente leves discrepâncias no desenho dos polígonos sobre áreas não populadas (ruas,  canteiros, etc.).

Por isso, precisaremos limpar essas interseções da nossa base. Podemos utilizar um buffer negativo nos polígonos, de modo que polígonos com altura/largura menor do que a metade do valor aplicado no buffer se tornarão vazios.

In [None]:
ol2['area_intersecao'] = ol2.area
df_censo['AREA_KM2']

## Removendo interseções não significantes

In [None]:
# Assumindo que um terreno com 8m ou menos de largura não possui uma casa
buffer = -1*(8/2)

ol3 = ol2.copy()
ol3['debuffed'] = ol3.buffer(buffer)
ol3 = ol3[~ol3['debuffed'].is_empty]
ol3.head()

In [None]:
m = df_censo[df_censo['CD_SETOR'].isin(
    cd_setor_list)].explore(name='setor censitário')

m = df_geo[df_geo['id'] == 'area_risco_geologico.1'].explore(
    m=m, color='orange', name='area de risco')

filtered_ol3 = ol3.loc[ol3['id'] == 'area_risco_geologico.1', [
    'id', 'CD_SETOR', 'geometry']]
m = filtered_ol3.explore(m=m, color='purple', name='interseção')

LayerControl().add_to(m)

m

Vimos que as inteseções indesejadas sumiram do resultado, então podemos continuar os cálculos.

## Calculando a proporção das áreas

O primeiro passo é calcular a proporção entre a área da interseção e a área do setor censitário.

In [None]:
ol3['inter_area'] = ol3['geometry'].area
ol3.head()

In [None]:
df_censo_area = df_censo[['CD_SETOR', 'geometry']]
df_censo_area['area_setor'] = df_censo_area['geometry'].area
df_censo_area

In [None]:
ol3 = ol3.merge(df_censo_area[['CD_SETOR', 'area_setor']], how='left',
          on='CD_SETOR')
ol3.head()

In [None]:
ol3['prop_setor'] = ol3['inter_area']/ol3['area_setor']
ol3.head()

Sabendo que a proporção da interseção não deve ser maior do que 1, vamos conferir os valores de interseção.

In [None]:
ol3['prop_setor'].hist()

Como a distribuição apresenta muitos valores abaixo de 0.2, vamos analisar esses casos visualmente para confirmar que fazem sentido.

In [33]:
filtro_intersecoes_pequenas = ol3['prop_setor']<=0.2
setores_02 = ol3.loc[filtro_intersecoes_pequenas, 'CD_SETOR'].tolist()
areas_risco_02 = ol3.loc[filtro_intersecoes_pequenas, 'id'].tolist()

In [None]:
# Criar o mapa com as camadas
m = df_censo[df_censo['CD_SETOR'].isin(setores_02)].explore(name='Setor Censitário')

m = df_geo[df_geo['id'].isin(areas_risco_02)].explore(
    m=m, color='orange', name='Área de Risco')

filtered_ol3 = ol3.loc[filtro_intersecoes_pequenas, ['id', 'CD_SETOR', 'geometry', 'prop_setor']]
m = filtered_ol3.explore(m=m, color='purple', name='Interseção')

LayerControl().add_to(m)

# Adicionar a legenda personalizada
legend_html = """
<div style="position: fixed; 
            bottom: 50px; left: 50px; width: 200px; height: 120px; 
            background-color: white; z-index:1000; padding: 10px; 
            border: 2px solid grey; border-radius: 5px;">
    <h4>Legenda</h4>
    <i style="background: orange; width: 10px; height: 10px; display: inline-block;"></i> Área de Risco<br>
    <i style="background: purple; width: 10px; height: 10px; display: inline-block;"></i> Interseção<br>
    <i style="background: blue; width: 10px; height: 10px; display: inline-block;"></i> Setor Censitário
</div>
"""
m.get_root().html.add_child(Element(legend_html))

m

A inspeção visual mostra que as interseções aparentam ser significativas, mas se tratam de interseções pequenas em comparação com os setores censitários, ocorrendo principalmente em setores sensitários maiores. Portanto, a eliminação das interseções e o cálculo da proporção da população parece ter funcionado corretamente.

Porém, um ponto notado durante a inspeção visual e oportuno de destaque é um possível viés de superestimação em áreas pouco povoadas, como no entorno de parques. Por se tratarem de áreas de baixa densidade demográfica, estão mais sujeitas a estarem incluídas em setores censitários maiores e a uma distribuição heterogênea da população dentro do seu território. Um exemplo desse caso pode ser visto nas áreas de risco de cd_identificador 1227 a 1230.

## Calculando a população

O primeiro passo é calcular a população correspondente a cada interseção.

In [None]:
ol3['pop_estimada'] = ol3['v0001']*ol3['prop_setor']

(
    ol3
    .loc[:, ['id','CD_SETOR','v0001', 'prop_setor', 'pop_estimada']]
    .sort_values('pop_estimada', ascending=False)
)

Depois, calculamos a população agregada por área de risco.

In [None]:
area_risco_pop = (
    ol3
    .loc[:, ['id', 'pop_estimada']]
    .groupby('id')
    .sum()
    .round(0)
    .reset_index()
)

area_risco_pop['pop_estimada'] = area_risco_pop['pop_estimada'].astype(int)
area_risco_pop

Finalmente, trazemos a coluna de população para o dataframe original.

In [None]:
df_geo_pop = df_geo.merge(
    area_risco_pop,
    how='left'
)

df_geo_pop

# Visualizando a população

Para visualizar o resultado, vamos criar algumas visualizações. Primeiro, vamos criar dois *treemaps* por tipo de processo e grau de risco, alterando a ordem da hierarquia.

In [None]:
df_tree = (
    df_geo_pop
    .groupby(['tx_tipo_processo_geologico', 'tx_grau_de_risco_geologico'], as_index=False)
    ['pop_estimada']
    .sum()
)

df_tree

In [None]:
# Criar o gráfico do tipo treeview
fig = px.treemap(
    df_tree,
    path=['tx_grau_de_risco_geologico', 'tx_tipo_processo_geologico'],  # Caminho hierárquico
    values='pop_estimada',               # Valores para o tamanho das caixas
    title='Somatório de População Estimada por Tipo de Processo Geológico'
)

# Exibir o gráfico
fig.show()

In [None]:
# Criar o gráfico do tipo treeview
fig = px.treemap(
    df_tree,
    path=['tx_tipo_processo_geologico', 'tx_grau_de_risco_geologico'],  # Caminho hierárquico
    values='pop_estimada',               # Valores para o tamanho das caixas
    title='Somatório de População Estimada por Tipo de Processo Geológico'
)

# Exibir o gráfico
fig.show()

Por último, vamos criar um mapa coroplético das áreas de risco, adicionando as camadas de setores censitários envolvidos, interseções envolvidas (e população atribuida) e adicionar também uma camada de satelite.

In [None]:

# Filtrar os setores censitários presentes em ol3
setores_presentes = df_censo[df_censo['CD_SETOR'].isin(ol3['CD_SETOR'].unique())]
# Adicionar os setores censitários ao mapa com apenas o contorno
m = setores_presentes.explore(
    color=None,  # Remove o preenchimento
    style_kwds={'fill': False, 'color': 'skyblue'},  # Define apenas o contorno azul
    name='Setores Censitários',
    tiles='CartoDB positron'  # Mapa base
)

# Criar o mapa base
m = df_geo_pop.explore(
    m=m,
    column='pop_estimada',  # Coluna para o mapa coroplético
    cmap='YlOrRd',          # Paleta de cores
    legend=True,            # Adicionar legenda
    legend_kwds={
        'caption': 'População total',
        'position': 'bottomright',  # Alterar posição da legenda
        'frameon': True             # Adicionar quadro de fundo
    },
    tooltip=['tx_grau_de_risco_geologico', 'tx_tipo_processo_geologico', 'pop_estimada'],  # Informações no tooltip
    name='Áreas de Risco'   # Nome da camada
)

# Adicionar as interseções ao mapa
m = ol3.explore(
    m=m,
    column='pop_estimada',  # Coluna para o mapa coroplético
    cmap='YlOrRd',          # Paleta de cores
    legend=True,            # Adicionar legenda
    legend_kwds={
        'caption': 'População parcial',
        'position': 'bottomright',  # Alterar posição da legenda
        'frameon': True             # Adicionar quadro de fundo
    },
    tooltip=['CD_SETOR', 'pop_estimada'],  # Informações no tooltip
    name='Interseções'      # Nome da camada
)

# Adicionar outra camada base (Google Satellite)
TileLayer(
    tiles='https://mt1.google.com/vt/lyrs=s&x={x}&y={y}&z={z}',
    attr='Google Satellite',
    name='Google Satellite'
).add_to(m)

# Adicionar controle de camadas
LayerControl(position='bottomleft').add_to(m)

# Exibir o mapa
m


In [42]:
m.save('plots/população em áreas de risco.html')