In [71]:
import pandas as pd
import geopandas as gpd
import folium
import geopy
from geopy.distance import geodesic
from shapely.geometry import Point
import branca.colormap as cm
from ipywidgets import interact_manual, widgets, VBox, HBox
import ipywidgets as widgets
from sklearn.preprocessing import MinMaxScaler


In [72]:
estacoes = pd.read_parquet("estacoes_reestruturadas.parquet")
### Ocorrencias eh criterios fisicos
ocorrencias_2013 = gpd.read_file("./ocorrencias/SIRGAS_SHP_riscoocorrencia_2013.shp")


# Funções de Estações

In [73]:
## Prepara o dataframe de estações para as outras análises
## Retorna o dataframe tratado
def tratar_df_estacoes(df_estacoes):
    ## Cria uma geometria "Point"
    df_estacoes = gpd.GeoDataFrame(df_estacoes, geometry = gpd.points_from_xy(df_estacoes['lon'], df_estacoes['lat']))
    ## Define crs
    df_estacoes = df_estacoes.set_crs("EPSG:4326")
    return df_estacoes

## Cria circles (geometry Polygon) em volta de cada estação (geometry Point)
## Retorna o dataframe com a geometria "circles"
def criar_circulos_estacao(data, radius_km):
    circles = []
    for _, row in data.iterrows():
        circle_points = []
        center = (row['lat'], row['lon'])
        ## Dizemos que é aproximadamente um círculo, pois é um polígono regular com 360 vértices
        for angle in range(0,360, 1): 
            destination = geopy.distance.distance(kilometers = radius_km).destination(center, angle)
            circle_points.append(Point(destination.longitude, destination.latitude))
        circle = gpd.GeoSeries(circle_points).unary_union.convex_hull
        circles.append(circle)
    data.rename(columns = {'geometry':'point'}, inplace = True)
    circles_gdf = gpd.GeoDataFrame(data, geometry = circles)
    circles_gdf.rename(columns = {'geometry':'circle'}, inplace = True)
    return circles_gdf

## Adiciona os círculos no mapa, usa como base a função "criar_circulos_estacao"
## Retorna o Mapa com os círculos (geometry polygon) e pontos (geometry point) adicionados
def adicionar_estacoes_com_circulos_mapa(mapa, df_estacoes, radius_km):
    ## Definição dos layers para controle do usuário por camadas
    layer_estacoes =  folium.FeatureGroup(name = "Estações")
    layer_circulos_estacoes = folium.FeatureGroup(name = f"Redondezas {radius_km} km") 
    ## Se o df_estacoes já tem os circles, não precisa criá-los
    if "circle" not in df_estacoes:
        data = criar_circulos_estacao(df_estacoes, radius_km)
    else:
        data = df_estacoes.copy()
    ## Define "circle" como geometria a ser usada, pois há mais de uma em uso
    data.set_geometry("circle", inplace = True)
    ## Adiciona Circlemarkers ao layer
    for _, row in data.iterrows():
        folium.CircleMarker(
                    location=[row['lat'],row['lon']],
                    color = "blue",
                    radius= 5,
                    tooltip= row['name'],
                    fill=True,
                    fill_opacity=1,
                    fill_color="blue",
                ).add_to(layer_estacoes)
    ## Adiciona os Circles ao layer
    for _, row in data.iterrows():
        folium.GeoJson(
            row['circle'].__geo_interface__, 
            tooltip = row['name'],
            style_function=lambda x:{'fillColor': 'gray', 'color': 'gray', 'fillOpacity': 0.0},
        ).add_to(layer_circulos_estacoes)
        layer_estacoes.add_to(mapa)
        layer_circulos_estacoes.add_to(mapa)
        folium.LayerControl().add_to(mapa)
    return mapa

# Funções de Mapa

In [74]:
## Define cores para mapas
def get_color(valor):
    if valor == 1:
        return "yellow"
    elif valor == 2:
        return "orange"
    elif valor == 3:
        return "red"
    elif valor == 4:
        return "darkred"
    else:
        return "black" # error

## Cria um mapa centrado em São Paulo
def criar_mapa_sp():
    mapa_sp = folium.Map(location = [-23.550520, -46.633308], zoom_start = 12)
    return mapa_sp

## Plota Circlemarkers de 1 cor, dado 1 df com Lat e Lon
def plot_circlemarkers_one_color(data, color, radius, name, pontuacao, layer):
    for _, row in data.iterrows():
        folium.CircleMarker(
                location = [row['lat'], row['lon']],
                color = color, 
                radius = radius,
                tooltip = row[name] + " " + str(row[pontuacao]), 
                popup = row[name] + " " + str(row[pontuacao]), 
                fill = True,
                fill_opacity = 1,
                fill_color = color,
        ).add_to(layer)

## Plota Circlemarkers de várias cores, dado 1 df com Lat e Lon e um Colormap branca
def plot_circlemarkers_multi_color(data, radius, name, pontuacao, layer, colormap):
    for _, row in data.iterrows():
        folium.CircleMarker(
                location = [row['lat'], row['lon']],
                color = colormap(row[pontuacao]), 
                radius = radius,
                tooltip = row[name] + " " + str(row[pontuacao]), 
                popup =  row[name] + " " + str(row[pontuacao]), 
                fill = True,
                fill_opacity = 1,
                fill_color = colormap(row[pontuacao]),
        ).add_to(layer)
        
    


## Funções de Outliers

In [75]:
## Plota os Circlemarkers outliers dado um out_lower, out_upper e non_outliers, separados pela função "identificar_outliers"
def plot_circlemarkers_outliers(out_lower, out_upper, non_outliers, color_lower, color_upper, radius, 
                                name, pontuacao, layer, colormap):
    plot_circlemarkers_one_color(out_lower, color_lower, radius, name, pontuacao, layer)
    plot_circlemarkers_one_color(out_upper, color_upper, radius, name, pontuacao, layer)
    plot_circlemarkers_multi_color(non_outliers, radius, name, pontuacao, layer, colormap)

def identificar_outliers(df, coluna):
    """
    Identifica outliers em uma coluna de um DataFrame usando o método IQR.

    Parâmetros:
        df (pd.DataFrame): DataFrame contendo os dados.
        coluna (str): Nome da coluna para identificar os outliers.

    Retorna:
        outliers_lower (pd.DataFrame): DataFrame contendo os outliers inferiores.
        outliers_upper (pd.DataFrame): DataFrame contendo os outliers superiores.
        non_outliers (pd.DataFrame): DataFrame contendo os dados não-outliers.
    """
    Q1 = df[coluna].quantile(0.25) 
    Q3 = df[coluna].quantile(0.75)
    IQR = Q3 - Q1
    lowerbound = Q1 - 1.5 * IQR
    upperbound = Q3 + 1.5 * IQR

    outliers_lower = df[df[coluna] < lowerbound]
    outliers_upper = df[df[coluna] > upperbound]
    non_outliers = df[(df[coluna] >= lowerbound) & (df[coluna] <= upperbound)]

    return outliers_lower, outliers_upper, non_outliers 


# Funções de Ocorrências

In [82]:
## Prepara o dataframe de ocorrencias para as outras análises
## Retorna o dataframe tratado
def tratar_df_ocorrencias(df_ocorrencias):
    ocorrencias_totais = df_ocorrencias.copy()
    for year in range(2014, 2025):
       df_year = gpd.read_file(f"./ocorrencias/SIRGAS_SHP_riscoocorrencia_{year}.shp")
       ocorrencias_totais = pd.concat([ocorrencias_totais, df_year])
    ocorrencias_totais['subprefeitura'] = ocorrencias_totais.apply(
        lambda row: row['subprefeit'] if not pd.isnull(row['subprefeit']) else row['subpreit'], axis=1
    )
    ocorrencias_totais = ocorrencias_totais.drop(columns = ['subpreit', 'subprefeit'])
    ocorrencias_totais = ocorrencias_totais.set_crs("EPSG:31983")  # Define o CRS, se ainda não estiver definido
    ocorrencias_totais = ocorrencias_totais.to_crs("EPSG:4326")
    ocorrencias_totais

    substituicoes = {
        'QUEDA DE ARVORE': 1,
        'ALAGAMENTO': 2,
        'INUNDACAO': 3,
        'DESLIZAMENTO': 4
    }
    
    ocorrencias_totais.rename(columns = {'name':'ID'}, inplace = True)
    # Substituindo valores
    ocorrencias_totais['ocorrencia_num'] = ocorrencias_totais['ocorrencia'].replace(substituicoes)
    ocorrencias_totais['latitude'] = ocorrencias_totais.geometry.y
    ocorrencias_totais['longitude'] = ocorrencias_totais.geometry.x
    return ocorrencias_totais
    
def analise_ocorrencias(df_ocorrencias, df_estacoes, radius_km):
    mapa = criar_mapa_sp()
    df_estacoes_circulo = criar_circulos_estacao(df_estacoes, radius_km)
    df_estacoes_circulo.set_geometry("circle", inplace=True)  
    
    cruzamentos =  gpd.sjoin(df_estacoes_circulo, df_ocorrencias, how="inner", predicate="intersects")

    cruzamentos = cruzamentos.merge(
        df_ocorrencias[["ID", "geometry"]],  # Apenas as colunas relevantes
        on="ID",  # A coluna para equivalência
        how="left"  # Tipo de junção (left mantém todos os dados de cruzamentos)
    )
    # return cruzamentos
    ocorrencias_necessarias_para_plot = cruzamentos.copy()
    # return cruzamentos
     ## Criação de Layers para mapa
    layer_ocorrencias = folium.FeatureGroup(name = "Ocorrencias")
    layer_estacoes =  folium.FeatureGroup(name = "Estações")
    layer_circulos_estacoes = folium.FeatureGroup(name = f"Redondezas {radius_km} km") 
    
    for _, row in ocorrencias_necessarias_para_plot.iterrows():
        color = get_color(row['ocorrencia_num'])
        folium.CircleMarker(
                location = [row['latitude'], row['longitude']],
                color = color, 
                radius = 5,
                tooltip = row['ocorrencia'],
                popup = row['ocorrencia'],
                fill = True,
                fill_opacity = 1,
                fill_color = color,
        ).add_to(layer_ocorrencias)

    layer_ocorrencias.add_to(mapa)
    layer_estacoes.add_to(mapa)
    layer_circulos_estacoes.add_to(mapa)
    folium.LayerControl().add_to(mapa)
    return mapa

In [None]:
df_ocorrencias = tratar_df_ocorrencias(ocorrencias_2013)
df_estacoes = tratar_df_estacoes(estacoes)

In [None]:
analise_ocorrencias(df_ocorrencias, df_estacoes, 1)

In [None]:
df_estacoes.head()

In [None]:
df_ocorrencias.head()

In [None]:
df_ocorrencias['ocorrencia'].value_counts()