# üìä Explora√ß√£o Inicial dos Dados - Projeto SentinelaMSF Yanomami

Este notebook apresenta a explora√ß√£o inicial dos dados utilizados no monitoramento de enchentes e riscos de mal√°ria na regi√£o Yanomami.

---

## Objetivos

- Carregar os dados hist√≥ricos de mal√°ria, enchentes e alertas clim√°ticos.
- Realizar uma an√°lise explorat√≥ria dos principais indicadores.
- Visualizar padr√µes espaciais e temporais.

In [None]:
# Importa√ß√£o das Bibliotecas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Para visualiza√ß√£o em mapas 
import folium

ModuleNotFoundError: No module named 'folium'

## Carregamento dos Dados

Nesta etapa, vamos carregar os arquivos CSV contendo os dados hist√≥ricos de mal√°ria

In [None]:
# Carregar dados de mal√°ria
malaria_df = pd.read_csv('/content/serie_historica_malaria_2013_2023.csv')


## Leitura e Visualiza√ß√£o dos Dados de Vulnerabilidade a Inunda√ß√µes

Vamos carregar e visualizar o shapefile `Brasil_vulnerabilidade_inundacoes`, extra¬¥dos do ANA que cont√©m informa√ß√µes geogr√°ficas sobre √°reas vulner√°veis a enchentes no Brasil. Esses dados s√£o fundamentais para analisar a sobreposi√ß√£o entre regi√µes de risco de inunda√ß√£o e casos de mal√°ria.

In [None]:
# Leitura do shapefile de vulnerabilidade a inunda√ß√µes
import geopandas as gpd

# Caminho para o arquivo shapefile (.shp)
shapefile_path = 'content/Brasil_vulnerabilidade_inundacoes.shp'

# Carregar o shapefile como GeoDataFrame
gdf = gpd.read_file(shapefile_path)
gdf.head()

### Visualiza√ß√£o Interativa das √Åreas Vulner√°veis

Podemos visualizar as √°reas vulner√°veis a inunda√ß√µes em um mapa interativo usando o m√©todo `.explore()` do GeoPandas.

In [None]:
!pip install folium matplotlib mapclassify
# Visualiza√ß√£o interativa das √°reas vulner√°veis
gdf.explore()

## Destaque das √Åreas de Roraima e Amazonas

Vamos filtrar e visualizar apenas as regi√µes de vulnerabilidade a inunda√ß√µes localizadas nos estados de Roraima (RR) e Amazonas (AM), onde se encontra o territ√≥rio Yanomami.

In [None]:
# Filtrar e visualizar √°reas de Roraima e Amazonas

# Verifique o nome das colunas dispon√≠veis
print(gdf.columns)

# Filtrar √°reas de Roraima e Amazonas pela coluna 'UF'
gdf_rr_am = gdf[gdf['UF'].isin(['RR', 'AM'])]

# Remover 'geometry' da lista de colunas para tooltip/popup
cols = [col for col in gdf_rr_am.columns if col != 'geometry']

# Visualiza√ß√£o interativa apenas dessas √°reas
gdf_rr_am.explore(
    style_kwds={'fillColor': 'red', 'color': 'black', 'weight': 1, 'fillOpacity': 0.5},
    tooltip=cols,
    popup=True
)

## Consulta e Armazenamento de Alertas Clim√°ticos (WeatherAPI)

As c√©lulas abaixo permitem consultar alertas clim√°ticos em tempo real (opcional), salvar os resultados em arquivo e carregar os dados salvos para garantir reprodutibilidade das an√°lises.

In [None]:
import os
import requests
import pandas as pd

API_KEY = os.getenv("WEATHER_API_KEY")  # Agora est√° correto!

lat, lon = -0.5, -64.5  # Aproximado para regi√£o Yanomami

url = f"http://api.weatherapi.com/v1/alerts.json?key={API_KEY}&q={lat},{lon}"
response = requests.get(url)
data = response.json()

# Extrair alertas
if 'alerts' in data and 'alert' in data['alerts']:
    alertas = data['alerts']['alert']
    if alertas:
        df_alertas = pd.DataFrame(alertas)
        display(df_alertas)
    else:
        print("Nenhum alerta ativo para esta regi√£o.")
else:
    print("Nenhum alerta retornado pela API.")

In [None]:
# Salvar alertas em arquivo CSV/JSON
if 'df_alertas' in locals():
    df_alertas.to_csv('alertas_climaticos_atuais.csv', index=False)
    df_alertas.to_json('alertas_climaticos_atuais.json', orient='records', force_ascii=False)
    print("Alertas salvos em 'alertas_climaticos_atuais.csv' e 'alertas_climaticos_atuais.json'.")
else:
    print("Nenhum alerta para salvar. Execute a c√©lula de consulta primeiro se desejar dados atualizados.")

In [None]:
# Carregar alertas salvos de arquivo (reprodut√≠vel)
import pandas as pd

try:
    df_alertas = pd.read_csv('alertas_climaticos_atuais.csv')
    display(df_alertas)
except FileNotFoundError:
    print("Arquivo de alertas n√£o encontrado. Execute a c√©lula de consulta e salvamento primeiro, se necess√°rio.")

## Dados sint√©ticos 
Devido √† indisponibilidade de dados reais de enchentes e alertas clim√°ticos no momento, optou-se por utilizar dados simulados (sint√©ticos) para viabilizar a an√°lise explorat√≥ria e o treinamento dos modelos.

In [None]:
import pandas as pd
import numpy as np

# Gerar 20 registros fict√≠cios de enchentes
enchentes_df = pd.DataFrame({
    'municipio': np.random.choice(['Alto Alegre', 'Boa Vista', 'Mucaja√≠'], 20),
    'data': pd.date_range('2024-01-01', periods=20, freq='15D'),
    'area_alagada_km2': np.random.uniform(0.5, 10, 20),
    'imagem_path': [None]*20,
    'latitude': np.random.uniform(-3.5, -2.5, 20),
    'longitude': np.random.uniform(-63.5, -61.5, 20)
})

In [None]:
alertas_df = pd.DataFrame({
    'tipo': np.random.choice(['Alerta de chuva', 'Alerta de vento', 'Alerta de calor'], 10),
    'descricao': np.random.choice(['Chuva intensa', 'Vento forte', 'Alta temperatura'], 10),
    'data_inicio': pd.date_range('2024-01-01', periods=10, freq='7D'),
    'data_fim': pd.date_range('2024-01-02', periods=10, freq='7D'),
    'municipio': np.random.choice(['Alto Alegre', 'Boa Vista', 'Mucaja√≠'], 10),
    'uf': ['RR']*10
})

## Visualiza√ß√£o Inicial dos Dados

Vamos inspecionar as primeiras linhas de cada conjunto de dados para entender sua estrutura.

In [None]:
# Visualizar as primeiras linhas dos dados
display(malaria_df.head())
display(enchentes_df.head())
display(alertas_df.head())

## Padronizar nomes de coluna para facilitar o restante do c√≥digo


In [None]:
if 'data_inicio' in alertas_df.columns:
    alertas_df = alertas_df.rename(columns={'data_inicio': 'data'})
if 'Ano' in malaria_df.columns:
    malaria_df = malaria_df.rename(columns={'Ano': 'data'})

# Agora, o restante do c√≥digo pode usar .head() e manipular a coluna 'data' normalmente
display(malaria_df.head())
display(enchentes_df.head())
display(alertas_df.head())

## An√°lise Explorat√≥ria

Aqui, vamos analisar a distribui√ß√£o dos casos de mal√°ria ao longo do tempo, a frequ√™ncia de enchentes e os principais tipos de alertas clim√°ticos.

In [None]:
print(enchentes_df.columns)
print(alertas_df.columns)
print(malaria_df.columns)

In [None]:
# Evolu√ß√£o dos casos de mal√°ria
malaria_df['data'] = pd.to_datetime(malaria_df['data'])
malaria_agg = malaria_df.groupby('data')['√Årea Ind√≠gena'].sum()
malaria_agg.plot(figsize=(12,6), title='Evolu√ß√£o dos casos de mal√°ria')
plt.xlabel('Data')
plt.ylabel('√Årea Ind√≠gena')
plt.show()

In [None]:
# Frequ√™ncia de enchentes por munic√≠pio
enchentes_df['data'] = pd.to_datetime(enchentes_df['data'])
floods_count = enchentes_df['municipio'].value_counts()
sns.barplot(x=floods_count.values, y=floods_count.index)
plt.title('Frequ√™ncia de enchentes detectadas por munic√≠pio')
plt.xlabel('N√∫mero de enchentes')
plt.ylabel('Munic√≠pio')
plt.show()

In [None]:
# Tipos de alertas clim√°ticos mais comuns
alert_types = alertas_df['tipo'].value_counts()
sns.barplot(x=alert_types.values, y=alert_types.index)
plt.title('Tipos de alertas clim√°ticos mais frequentes')
plt.xlabel('Quantidade')
plt.ylabel('Tipo de Alerta')
plt.show()

## Visualiza√ß√£o Espacial 

Visualizar a localiza√ß√£o das enchentes em um mapa interativo.

In [None]:
# Mapa interativo das enchentes detectadas (ajuste lat/lon conforme seus dados)
m = folium.Map(location=[-3.5, -63.0], zoom_start=5)
for _, row in enchentes_df.iterrows():
    folium.CircleMarker(
        location=[row['latitude'], row['longitude']],
        radius=6,
        popup=f"{row['municipio']} - {row['data']}",
        color="blue",
        fill=True,
        fill_color="blue"
    ).add_to(m)
m

## Conclus√£o

Devido ao pouco tempo √°bil para busca e √† indisponibilidade de dados reais de enchentes e alertas clim√°ticos no momento, optou-se por utilizar dados simulados (sint√©ticos) para viabilizar a an√°lise explorat√≥ria e o treinamento dos modelos. Essa abordagem permite validar o pipeline de dados e garantir que, assim que os dados reais estiverem dispon√≠veis, o c√≥digo estar√° pronto para ingest√£o, an√°lise e visualiza√ß√£o sem necessidade de grandes ajustes. Recomenda-se substituir os dados sint√©ticos pelos reais assim que poss√≠vel, para obter resultados mais precisos e relevantes para a tomada de decis√£o. Esta an√°lise inicial permite identificar tend√™ncias e padr√µes importantes para o desenvolvimento dos pr√≥ximos m√≥dulos do projeto, como o modelo preditivo e as visualiza√ß√µes em tempo real na plataforma Streamlit.