In [5]:
import dash
from dash import dcc, html, Input, Output, dash_table
import dash_bootstrap_components as dbc
import pandas as pd
import numpy as np
import sqlite3
from sklearn.cluster import DBSCAN
import folium
from folium.plugins import HeatMap

# Função para carregar dados do banco de dados SQLite para DataFrame
def carregar_dados():
    with sqlite3.connect('dados_onibus.db') as conn:
        query = "SELECT * FROM onibus_buffer"
        df = pd.read_sql_query(query, conn)
    return df

# Função para filtrar e processar atrasos
def filtrar_e_processar_atrasos(df):
    df_atrasados = df[df['SITUACAO'] == 'ATRASADO'].reset_index(drop=True)

    # Remover duplicatas consecutivas com base em 'COD' e 'SENT'
    indices_to_drop = [
        i + 1 for i in range(len(df_atrasados) - 1)
        if (df_atrasados['COD'].iloc[i] == df_atrasados['COD'].iloc[i + 1]) and
           (df_atrasados['SENT'].iloc[i] == df_atrasados['SENT'].iloc[i + 1])
    ]
    df_atrasados.drop(indices_to_drop, inplace=True)
    df_atrasados.reset_index(drop=True, inplace=True)

    # Remover registros com valores nulos de latitude e longitude
    df_atrasados = df_atrasados.dropna(subset=['LAT_IN_TIME', 'LON_IN_TIME'])

    return df_atrasados

# Função para aplicar DBSCAN e gerar clusters
def aplicar_dbscan(df):
    coords = df[['LAT_IN_TIME', 'LON_IN_TIME']].values
    kms_per_radian = 6371.0088
    epsilon = 0.5 / kms_per_radian

    db = DBSCAN(eps=epsilon, min_samples=5, algorithm='ball_tree', metric='haversine').fit(np.radians(coords))
    df['cluster'] = db.labels_

    return df[df['cluster'] != -1]

# Função para criar e salvar o mapa Folium
def criar_mapa(df_clusters):
    latitude_media = df_clusters['LAT_IN_TIME'].mean()
    longitude_media = df_clusters['LON_IN_TIME'].mean()

    mapa = folium.Map(location=[latitude_media, longitude_media], zoom_start=13)
    heat_data = [[row['LAT_IN_TIME'], row['LON_IN_TIME']] for _, row in df_clusters.iterrows()]
    HeatMap(heat_data).add_to(mapa)

    # Salvar o mapa como HTML
    mapa.save('mapa_atrasos.html')

# Carregar dados iniciais
df = carregar_dados()

# Inicializar o app Dash
app = dash.Dash(__name__, external_stylesheets=[dbc.themes.BOOTSTRAP])

# Layout do dashboard
app.layout = dbc.Container([
    html.H1("Dashboard de Ônibus em Tempo Real", className="text-center my-4"),

    dbc.Row([
        dbc.Col([
            html.H5("Filtros"),
            dcc.Dropdown(
                id='filtro-linha',
                options=[{'label': linha, 'value': linha} for linha in df['CODIGOLINHA'].unique()],
                placeholder="Selecione uma linha de ônibus",
                multi=True
            ),
            dcc.Interval(
                id='interval-atualizacao',
                interval=60 * 1000,  # Atualiza a cada minuto
                n_intervals=0
            )
        ], width=4),

        dbc.Col([
            html.Iframe(
                id='mapa-atrasos',
                srcDoc=open('mapa_atrasos.html', 'r').read(),
                width='100%',
                height='500'
            )
        ], width=8)
    ], className="my-4"),

    dbc.Row([
        dbc.Col([
            html.H5("Tabela de Ônibus Processados"),
            dash_table.DataTable(
                id='tabela-onibus',
                columns=[{"name": i, "id": i} for i in df.columns],
                data=df.to_dict('records'),
                page_size=10,
                style_table={'overflowX': 'auto'},
                style_cell={'textAlign': 'left'},
            )
        ], width=12)
    ])
], fluid=True)

# Callback para atualizar o mapa, gráficos e tabela
@app.callback(
    [Output('mapa-atrasos', 'srcDoc'), Output('tabela-onibus', 'data')],
    [Input('filtro-linha', 'value'), Input('interval-atualizacao', 'n_intervals')]
)
def atualizar_dashboard(linhas_selecionadas, n_intervals):
    df_atualizado = carregar_dados()

    # Filtrar por linhas selecionadas
    if linhas_selecionadas:
        df_atualizado = df_atualizado[df_atualizado['CODIGOLINHA'].isin(linhas_selecionadas)]

    # Processar atrasos e clusters
    df_atrasados = filtrar_e_processar_atrasos(df_atualizado)
    df_clusters = aplicar_dbscan(df_atrasados)

    # Criar e salvar o mapa atualizado
    criar_mapa(df_clusters)

    # Atualizar a tabela
    tabela_data = df_atualizado.to_dict('records')

    # Ler o mapa HTML atualizado
    with open('mapa_atrasos.html', 'r') as f:
        mapa_html = f.read()

    return mapa_html, tabela_data

# Executar o app
if __name__ == '__main__':
    app.run_server(debug=True)



A module that was compiled using NumPy 1.x cannot be run in
NumPy 2.1.2 as it may crash. To support both 1.x and 2.x
versions of NumPy, modules must be compiled with NumPy 2.0.
Some module may need to rebuild instead e.g. with 'pybind11>=2.12'.

If you are a user of the module, the easiest solution will be to
downgrade to 'numpy<2' or try to upgrade the affected module.
We expect that some modules will need time to support NumPy 2.

Traceback (most recent call last):  File "/usr/lib/python3.10/runpy.py", line 196, in _run_module_as_main
    return _run_code(code, main_globals, None,
  File "/usr/lib/python3.10/runpy.py", line 86, in _run_code
    exec(code, run_globals)
  File "/home/felipe/.local/lib/python3.10/site-packages/ipykernel_launcher.py", line 18, in <module>
    app.launch_new_instance()
  File "/home/felipe/.local/lib/python3.10/site-packages/traitlets/config/application.py", line 1075, in launch_instance
    app.start()
  File "/home/felipe/.local/lib/python3.10/site-pac

AttributeError: _ARRAY_API not found

ImportError: numpy.core.multiarray failed to import

In [8]:
#source meu_ambiente/bin/activate
import pandas as pd
import numpy as np
from sklearn.cluster import DBSCAN
import folium
from folium.plugins import HeatMap
import sqlite3

# Carregar dados do banco (ou DataFrame 'dados')
def carregar_dados_atualizados(nome_banco, nome_tabela):
    conn = sqlite3.connect(nome_banco)
    try:
        df = pd.read_sql_query(f"SELECT * FROM {nome_tabela}", conn)
    finally:
        conn.close()
    return df

# Função para filtrar e processar os atrasos
def filtrar_e_processar_atrasos(dados):
    # Filtrar as linhas onde a situação é "ATRASADO"
    df_atrasados = dados.loc[dados['SITUACAO'] == 'ATRASADO'].reset_index(drop=True)

    # Remover registros com valores nulos de latitude e longitude
    df_atrasados = df_atrasados.dropna(subset=['LAT_IN_TIME', 'LON_IN_TIME'])

    return df_atrasados

# Função para aplicar DBSCAN e agrupar atrasos por clusters
def aplicar_dbscan_e_gerar_clusters(df_atrasados):
    # Extrair coordenadas de latitude e longitude
    coords = df_atrasados[['LAT_IN_TIME', 'LON_IN_TIME']].values

    # Configurar DBSCAN com distância haversine
    kms_per_radian = 6371.0088
    epsilon = 0.5 / kms_per_radian  # Distância máxima para um ponto fazer parte do cluster
    db = DBSCAN(eps=epsilon, min_samples=5, algorithm='ball_tree', metric='haversine').fit(np.radians(coords))

    # Adicionar rótulos de clusters ao DataFrame
    df_atrasados['cluster'] = db.labels_

    # Filtrar clusters válidos (excluindo ruídos)
    df_clusters = df_atrasados[df_atrasados['cluster'] != -1]

    # Agrupar por clusters e calcular centroide e contagem de atrasos
    atrasos_por_cluster = df_clusters.groupby('cluster').agg({
        'LAT_IN_TIME': 'mean',
        'LON_IN_TIME': 'mean',
        'cluster': 'size'
    }).rename(columns={'cluster': 'count'}).reset_index()

    return atrasos_por_cluster, df_clusters

# Função para criar o mapa com clusters de atrasos
def criar_mapa_de_atrasos(atrasos_por_cluster, df_atrasados):
    # Criar um mapa centrado no ponto médio dos atrasos
    latitude_media = df_atrasados['LAT_IN_TIME'].mean()
    longitude_media = df_atrasados['LON_IN_TIME'].mean()
    mapa = folium.Map(location=[latitude_media, longitude_media], zoom_start=13)
    
    # Preparar os dados para o mapa de calor
    heat_data = df_atrasados[['LAT_IN_TIME', 'LON_IN_TIME']].values.tolist()
    
    # Adicionar o HeatMap ao mapa
    HeatMap(heat_data).add_to(mapa)
    
    # Adicionar marcadores para cada cluster
    for _, cluster in atrasos_por_cluster.iterrows():
        folium.Marker(
            location=[cluster['LAT_IN_TIME'], cluster['LON_IN_TIME']],
            popup=f'Cluster {cluster["cluster"]}: {cluster["count"]} atrasos',
            icon=folium.Icon(color='blue', icon='info-sign')
        ).add_to(mapa)

    return mapa

# Pipeline de execução
def main():
    # Carregar dados do banco
    dados = carregar_dados_atualizados('dados_onibus.db', 'onibus_buffer')

    # Filtrar e processar atrasos
    df_atrasados = filtrar_e_processar_atrasos(dados)

    # Aplicar DBSCAN e gerar clusters
    atrasos_por_cluster, df_clusters = aplicar_dbscan_e_gerar_clusters(df_atrasados)

    # Criar o mapa de atrasos
    mapa = criar_mapa_de_atrasos(atrasos_por_cluster, df_atrasados)

    # Exibir o mapa no Jupyter Notebook
    return mapa

# Executar o pipeline e mostrar o mapa
mapa = main()
mapa


In [3]:
dados = carregar_dados_atualizados('dados_onibus.db', 'onibus_buffer')
dados

Unnamed: 0,COD,REFRESH,LAT_IN_TIME,LON_IN_TIME,CODIGOLINHA,ADAPT,TIPO_VEIC,TABELA,SITUACAO,SITUACAO2,SENT,TCOUNT,SENTIDO_IN_TIME,HORA,FLAG_PROCES
0,BI863,13:40,-25.377100,-49.223415,214,1,7,1,NO HORÁRIO,REALIZANDO ROTA,IDA,1,819-TERMINAL CABRAL (14:05),2024-10-26 13:40:40,
1,GB302,13:40,-25.450471,-49.279128,11,0,15,1,ATRASADO,REALIZANDO ROTA,CIRCULAR,1,,2024-10-26 13:40:40,
2,JB304,13:39,-25.432505,-49.295026,11,0,15,,,,,1,sem tabela,2024-10-26 13:40:40,
3,HB303,13:40,-25.415808,-49.270155,10,0,15,2-2,ATRASADO,REALIZANDO ROTA,CIRCULAR,1,1463-P.U.C. (SENTIDO HORARIO) (14:00),2024-10-26 13:40:40,
4,BA027,13:40,-25.369236,-49.243983,226,1,1,1,NÃO CONFORMIDADE,INDETERMINADA,IDA,1,810-TERMINAL BOA VISTA (14:00),2024-10-26 13:40:41,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
452,MT013,13:38,-25.428686,-49.268418,979,0,3,5,NO HORÁRIO,REALIZANDO ROTA,CIRCULAR,1,1564-MEMORIAL ARABE (13:41),2024-10-26 13:40:48,
453,BT010,13:40,-25.388941,-49.267500,979,0,3,2,ATRASADO,REALIZANDO ROTA,CIRCULAR,1,634-PARQUE TANGUA (13:42),2024-10-26 13:40:48,
454,BT007,13:38,-25.413221,-49.322545,979,0,3,11,ATRASADO,REALIZANDO ROTA,CIRCULAR,1,1020-TORRE PANORAMICA (13:43),2024-10-26 13:40:48,
455,BT004,13:40,-25.385730,-49.278926,979,0,3,12,ATRASADO,REALIZANDO ROTA,CIRCULAR,1,655-PORTAL ITALIANO (13:46),2024-10-26 13:40:48,
