# 💧 Workshop de Análise de Dados de Saneamento na Região Amazônica

Neste notebook, vamos analisar dados públicos sobre saneamento básico em municípios da região amazônica brasileira. Exploraremos os dados com gráficos e mapas interativos usando Pydeck.


In [None]:
!pip install pydeck geopandas matplotlib seaborn pandas

In [None]:
import pandas as pd

df = pd.read_csv("cities7.csv")
df.head()

In [None]:
df.info()
df.describe()
df.columns

In [None]:
df_amazonia = df[df['Amazonia'] == 'Sim'].copy()
df_amazonia.shape
df_amazonia.head()

In [None]:
import pydeck as pdk

df_mapa = df_amazonia[
    ['Cidade', 'Latitude', 'Longitude', 'Parcela da população com acesso à água']
].dropna()

layer = pdk.Layer(
    "ScatterplotLayer",
    data=df_mapa,
    get_position='[Longitude, Latitude]',
    get_fill_color='[255, 100 * Parcela da população com acesso à água, 100, 180]',
    get_radius=10000,
    pickable=True
)

view_state = pdk.ViewState(latitude=-4.5, longitude=-60, zoom=4.2)

deck = pdk.Deck(
    layers=[layer],
    initial_view_state=view_state,
    tooltip={"text": "{Cidade}\nAcesso à água: {Parcela da população com acesso à água}%"}
)

deck.show()

In [None]:
import pydeck as pdk

# 2014 locations of car accidents in the UK
UK_ACCIDENTS_DATA = ('https://raw.githubusercontent.com/uber-common/'
                     'deck.gl-data/master/examples/3d-heatmap/heatmap-data.csv')

# Define a layer to display on a map
layer = pdk.Layer(
    'HexagonLayer',
    UK_ACCIDENTS_DATA,
    get_position=['lng', 'lat'],
    auto_highlight=True,
    elevation_scale=50,
    pickable=True,
    elevation_range=[0, 3000],
    extruded=True,                 
    coverage=1)

# Set the viewport location
view_state = pdk.ViewState(
    longitude=-1.415,
    latitude=52.2323,
    zoom=6,
    min_zoom=5,
    max_zoom=15,
    pitch=40.5,
    bearing=-27.36)

# Render
r = pdk.Deck(layers=[layer], initial_view_state=view_state)
r.to_html('demo.html')

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

plt.figure(figsize=(10, 6))
sns.histplot(df_amazonia['Parcela da população sem coleta de esgoto'], bins=20, kde=True)
plt.title('Distribuição da população sem coleta de esgoto (%)')
plt.xlabel('Parcela da população sem coleta de esgoto (%)')
plt.ylabel('Número de Municípios')
plt.grid(True)
plt.show()

In [None]:
plt.figure(figsize=(10, 6))
sns.scatterplot(
    data=df_amazonia,
    x='Parcela da população sem coleta de esgoto',
    y='Incidência de internações por diarreia',
    hue='Estado'
)
plt.title('Internações por diarreia vs. Falta de Coleta de Esgoto')
plt.xlabel('Parcela da população sem coleta de esgoto (%)')
plt.ylabel('Internações por diarreia (por 10 mil hab.)')
plt.legend(loc='upper right')
plt.grid(True)


## 🌍 Visualizações Interativas com Pydeck

A seguir, visualizações em 3D com Pydeck que destacam relações espaciais e estruturais dos indicadores de saneamento básico e saúde pública na região Amazônica.


In [None]:

import pydeck as pdk

# Exemplo de visualização 3D: Acesso à água vs internações por diarreia

df_plot = df.copy()
df_plot = df_plot.dropna(subset=["Latitude", "Longitude", "Parcela da população com acesso à água", "Incidência de internações por diarreia"])

layer = pdk.Layer(
    "ColumnLayer",
    data=df_plot,
    get_position='[Longitude, Latitude]',
    get_elevation="`Incidência de internações por diarreia` * 100",
    elevation_scale=1,
    radius=3000,
    get_fill_color="[255 - `Parcela da população com acesso à água` * 2, `Parcela da população com acesso à água` * 2, 100]",
    pickable=True,
    auto_highlight=True,
)

view_state = pdk.ViewState(
    longitude=df_plot["Longitude"].mean(),
    latitude=df_plot["Latitude"].mean(),
    zoom=4,
    pitch=45,
)

r = pdk.Deck(layers=[layer], initial_view_state=view_state, tooltip={"text": "Cidade: {Cidade}\nAcesso à água: {Parcela da população com acesso à água}%\nInternações por diarreia: {Incidência de internações por diarreia}"})
r.show()


In [None]:

# Exemplo de visualização 3D: Coleta de esgoto vs densidade demográfica

df_plot = df.copy()
df_plot = df_plot.dropna(subset=["Latitude", "Longitude", "Parcela da população com coleta de esgoto", "Densidade demográfica"])

layer = pdk.Layer(
    "ColumnLayer",
    data=df_plot,
    get_position='[Longitude, Latitude]',
    get_elevation="`Densidade demográfica` * 10",
    elevation_scale=1,
    radius=3000,
    get_fill_color="[255 - `Parcela da população com coleta de esgoto` * 2, `Parcela da população com coleta de esgoto` * 2, 120]",
    pickable=True,
    auto_highlight=True,
)

view_state = pdk.ViewState(
    longitude=df_plot["Longitude"].mean(),
    latitude=df_plot["Latitude"].mean(),
    zoom=4,
    pitch=50,
)

r = pdk.Deck(layers=[layer], initial_view_state=view_state, tooltip={"text": "Cidade: {Cidade}\nColeta de esgoto: {Parcela da população com coleta de esgoto}%\nDensidade demográfica: {Densidade demográfica}"})
r.show()


## 🔍 Atividade

Escolha uma variável que você acha relevante para a qualidade do saneamento básico (ex: **Moradias sem banheiro**, **Perdas na distribuição**, **Tarifa de água**) e:

1. Crie um gráfico com `seaborn` ou `matplotlib` para analisar sua distribuição.
2. Crie um mapa com `pydeck` para visualizar espacialmente essa variável.
3. Compartilhe com os colegas suas descobertas.
