# 💧 Workshop de Análise de Dados de Saneamento na Região Amazônica

Neste notebook, vamos analisar dados públicos sobre saneamento básico em municípios da região amazônica brasileira. Exploraremos os dados com gráficos e mapas interativos usando Pydeck.


In [1]:
!pip install pydeck geopandas matplotlib seaborn pandas


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m23.0.1[0m[39;49m -> [0m[32;49m25.0.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


In [2]:
import pandas as pd

df = pd.read_csv("cities7.csv")
df.head()

Unnamed: 0,Cidade,Estado,ID,Latitude,Longitude,Amazonia,População,População com acesso à água,População sem acesso à água,População com coleta de esgoto,...,Parcela das moradias sem banheiro,Incidência de internações por diarreia,Taxa de óbitos por doenças de veiculação hídrica,Consumo per capita de água,Perdas na distribuição,Índice de esgoto tratado referido à água consumida,Tarifa de água,Custo com energia elétrica,Incidência de internações totais por doenças de veiculação hídrica,Moradias sem banheiro
0,Cruzeiro do Sul,Acre,120020,-7.636248,-72.669165,Sim,91888.0,46566.0,45322.0,0.0,...,0.1996,4.135,0.109,60.0,0.695,0.0,2.63,5221845.92,26.445,5337.0
1,Rio Branco,Acre,120040,-9.976536,-67.822078,Sim,364756.0,195152.0,169604.0,75383.0,...,0.0413,1.206,0.055,97.57,0.566,0.007,2.94,15725116.3,2.604,5116.0
2,Arapiraca,Alagoas,270030,-9.754866,-36.661471,Não,,,,,...,,,,,,,,,,
3,Barra de Santo Antônio,Alagoas,270050,-9.40381,-35.511769,Não,,,,,...,,,,,,,,,,
4,Barra de São Miguel,Alagoas,270060,-9.826136,-35.883778,Não,,,,,...,,,,,,,,,,


In [3]:
df.info()
df.describe()
df.columns

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 839 entries, 0 to 838
Data columns (total 28 columns):
 #   Column                                                              Non-Null Count  Dtype  
---  ------                                                              --------------  -----  
 0   Cidade                                                              839 non-null    object 
 1   Estado                                                              839 non-null    object 
 2   ID                                                                  839 non-null    int64  
 3   Latitude                                                            839 non-null    float64
 4   Longitude                                                           839 non-null    float64
 5   Amazonia                                                            839 non-null    object 
 6   População                                                           119 non-null    float64
 7   População com ace

Index(['Cidade', 'Estado', 'ID', 'Latitude', 'Longitude', 'Amazonia',
       'População', 'População com acesso à água',
       'População sem acesso à água', 'População com coleta de esgoto',
       'População sem coleta de esgoto',
       'Parcela da população sem acesso à água',
       'Parcela da população com acesso à água',
       'Parcela da população sem coleta de esgoto',
       'Parcela da população com coleta de esgoto', 'Densidade demográfica',
       'Área do município', 'Receita direta e indireta total',
       'Parcela das moradias sem banheiro',
       'Incidência de internações por diarreia',
       'Taxa de óbitos por doenças de veiculação hídrica',
       'Consumo per capita de água', 'Perdas na distribuição',
       'Índice de esgoto tratado referido à água consumida', 'Tarifa de água',
       'Custo com energia elétrica',
       'Incidência de internações totais por doenças de veiculação hídrica',
       'Moradias sem banheiro'],
      dtype='object')

In [4]:
df_amazonia = df[df['Amazonia'] == 'Sim'].copy()
df_amazonia.shape
df_amazonia.head()

Unnamed: 0,Cidade,Estado,ID,Latitude,Longitude,Amazonia,População,População com acesso à água,População sem acesso à água,População com coleta de esgoto,...,Parcela das moradias sem banheiro,Incidência de internações por diarreia,Taxa de óbitos por doenças de veiculação hídrica,Consumo per capita de água,Perdas na distribuição,Índice de esgoto tratado referido à água consumida,Tarifa de água,Custo com energia elétrica,Incidência de internações totais por doenças de veiculação hídrica,Moradias sem banheiro
0,Cruzeiro do Sul,Acre,120020,-7.636248,-72.669165,Sim,91888.0,46566.0,45322.0,0.0,...,0.1996,4.135,0.109,60.0,0.695,0.0,2.63,5221845.92,26.445,5337.0
1,Rio Branco,Acre,120040,-9.976536,-67.822078,Sim,364756.0,195152.0,169604.0,75383.0,...,0.0413,1.206,0.055,97.57,0.566,0.007,2.94,15725116.3,2.604,5116.0
21,Macapá,Amapá,160030,0.040153,-51.056959,Sim,442933.0,240857.0,202076.0,35660.0,...,0.0229,1.806,0.0,65.7,0.714,0.222,3.33,7663301.09,2.28,2828.0
22,Santana,Amapá,160060,-0.030707,-51.178967,Sim,107618.0,48518.0,59100.0,1415.0,...,0.0368,8.549,0.279,90.82,0.584,0.0,2.45,2220334.47,9.664,1060.0
23,Careiro da Várzea,Amazonas,130115,-3.197024,-59.82591,Sim,19637.0,549.0,19088.0,0.0,...,0.213,2.037,0.0,20.93,0.7,0.0,0.56,95088.35,2.037,1231.0


In [27]:
import pydeck as pdk

df_mapa = df_amazonia[
    ['Cidade', 'Latitude', 'Longitude', 'Parcela da população com acesso à água']
].dropna()

layer = pdk.Layer(
    "ScatterplotLayer",
    data=df_mapa,
    get_position='[Longitude, Latitude]',
    get_fill_color='[255, 100 * Parcela da população com acesso à água, 100, 180]',
    get_radius=10000,
    pickable=True
)

view_state = pdk.ViewState(latitude=-4.5, longitude=-60, zoom=4.2)

deck = pdk.Deck(
    layers=[layer],
    initial_view_state=view_state,
    tooltip={"text": "{Cidade}\nAcesso à água: {Parcela da população com acesso à água}%"}
)

deck.show()

In [None]:
import pydeck as pdk

# 2014 locations of car accidents in the UK
UK_ACCIDENTS_DATA = ('https://raw.githubusercontent.com/uber-common/'
                     'deck.gl-data/master/examples/3d-heatmap/heatmap-data.csv')

# Define a layer to display on a map
layer = pdk.Layer(
    'HexagonLayer',
    UK_ACCIDENTS_DATA,
    get_position=['lng', 'lat'],
    auto_highlight=True,
    elevation_scale=50,
    pickable=True,
    elevation_range=[0, 3000],
    extruded=True,                 
    coverage=1)

# Set the viewport location
view_state = pdk.ViewState(
    longitude=-1.415,
    latitude=52.2323,
    zoom=6,
    min_zoom=5,
    max_zoom=15,
    pitch=40.5,
    bearing=-27.36)

# Render
r = pdk.Deck(layers=[layer], initial_view_state=view_state)
r.to_html('demo.html')

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

plt.figure(figsize=(10, 6))
sns.histplot(df_amazonia['Parcela da população sem coleta de esgoto'], bins=20, kde=True)
plt.title('Distribuição da população sem coleta de esgoto (%)')
plt.xlabel('Parcela da população sem coleta de esgoto (%)')
plt.ylabel('Número de Municípios')
plt.grid(True)
plt.show()

In [None]:
plt.figure(figsize=(10, 6))
sns.scatterplot(
    data=df_amazonia,
    x='Parcela da população sem coleta de esgoto',
    y='Incidência de internações por diarreia',
    hue='Estado'
)
plt.title('Internações por diarreia vs. Falta de Coleta de Esgoto')
plt.xlabel('Parcela da população sem coleta de esgoto (%)')
plt.ylabel('Internações por diarreia (por 10 mil hab.)')
plt.legend(loc='upper right')
plt.grid(True)

## 🔍 Atividade

Escolha uma variável que você acha relevante para a qualidade do saneamento básico (ex: **Moradias sem banheiro**, **Perdas na distribuição**, **Tarifa de água**) e:

1. Crie um gráfico com `seaborn` ou `matplotlib` para analisar sua distribuição.
2. Crie um mapa com `pydeck` para visualizar espacialmente essa variável.
3. Compartilhe com os colegas suas descobertas.
