In [38]:
import geopy
import requests
import pandas as pd
from datetime import datetime
from geopy.distance import geodesic
import logging
import pytz
import threading
import time
import threading
import time
import os
from nbclient import NotebookClient
from nbformat import read
import sqlite3

# Função para criar a tabela no banco de dados SQLite (se ainda não existir)
def busca_pontos_linha(linha):
    url = f'https://transporteservico.urbs.curitiba.pr.gov.br/getPontosLinha.php?linha={linha:03}&c=821f0'
    
    try:
        response = requests.get(url, timeout=10)
        response.raise_for_status()
        dados_json = response.json()

        # Verificar se os dados estão vazios
        if not dados_json:
            return None

        # Criar DataFrame a partir dos dados
        df = pd.DataFrame.from_records(dados_json)

        # Substituir vírgulas por pontos e converter tipos
        df['Latitude'] = df['LAT'].str.replace(',', '.').astype(float)
        df['Longitude'] = df['LON'].str.replace(',', '.').astype(float)
        df['SEQ'] = df['SEQ'].astype(int)
        df['ID_do_Itinerario'] = df['ITINERARY_ID'].astype(int)
        
        # Adicionar coluna COD
        df['COD'] = linha

        return df[['NOME', 'NUM', 'Latitude', 'Longitude', 'SEQ', 'GRUPO', 'SENTIDO', 'TIPO', 'ID_do_Itinerario', 'COD']]

    except requests.RequestException as e:
        pass
        #logging.error(f"Erro na requisição para a linha {linha}: {e}")
    except Exception as e:
        pass
        #logging.error(f"Erro ao processar a linha {linha}: {e}")
    return None

def criar_tabela():
    with sqlite3.connect('dados_processados.db') as conn:
        conn.execute('''
            CREATE TABLE IF NOT EXISTS onibus (
                COD TEXT,
                REFRESH TEXT,
                LAT_IN_TIME REAL,
                LON_IN_TIME REAL,
                CODIGOLINHA TEXT,
                ADAPT INTEGER,
                TIPO_VEIC INTEGER,
                TABELA INTEGER,
                SITUACAO TEXT,
                SITUACAO2 TEXT,
                SENT TEXT,
                TCOUNT INTEGER,
                SENTIDO_IN_TIME TEXT,
                HORA TEXT,
                FLAG_PROCES INTEGER,
                PARADA_MAIS_PROXIMA TEXT,
                DISTANCIA_MINIMA REAL,
                SEQ INTEGER,
                SEQ_MAX INTEGER,
                ITINERARIO INTEGER
            )
        ''')
        conn.commit()
def gravar_no_banco_pontos(df_result):
    try:
        with sqlite3.connect('dados_pontos.db') as conn:
            df_result.to_sql('onibus', conn, if_exists='append', index=False)
    except Exception as e:
        logging.error(f"Erro ao gravar no banco de dados: {e}")
def gravar_no_banco_processado(df_result):
    try:
        with sqlite3.connect('dados_processados.db') as conn:
            df_result.to_sql('onibus', conn, if_exists='append', index=False)
    except Exception as e:
        logging.error(f"Erro ao gravar no banco de dados: {e}")
def carregar_tabela_para_dataframe(nome_tabela, banco_de_dados):
    conn = sqlite3.connect(banco_de_dados)
    
    try:
        # Verificar se a tabela existe
        cursor = conn.cursor()
        cursor.execute("""
            SELECT name FROM sqlite_master WHERE type='table' AND name=?;
        """, (nome_tabela,))
        
        resultado = cursor.fetchone()

        if resultado:
            # Se a tabela existe, carregar seus dados para um DataFrame
            df = pd.read_sql_query(f"SELECT * FROM {nome_tabela}", conn)
            return df
        else:
            # Retornar um DataFrame vazio se a tabela não existir
            return pd.DataFrame()  
    finally:
        conn.close()  # Garantir que a conexão seja fechada

def reseta_index(df):
    df = df.reset_index(drop=True)
    return df

def calcular_distancia(lat1, lon1, lat2, lon2):
    try:
        if pd.isna(lat1) or pd.isna(lon1) or pd.isna(lat2) or pd.isna(lon2):
            raise ValueError("Coordenadas não podem ser NaN.")

        coords_1 = (lat1, lon1)
        coords_2 = (lat2, lon2)
        distancia = geodesic(coords_1, coords_2).meters
        return distancia
    except Exception as e:
        logging.error("Erro ao calcular distancia: %s", e)
        return None


def atribuir_parada(df_onibus, df_pontos):
    try:
        # Percorre todo o DataFrame df_onibus
        for i in range(df_onibus.shape[0]):
            # Obter as coordenadas da linha de ônibus atual
            lat_onibus = df_onibus['LAT_IN_TIME'].iloc[i]
            lon_onibus = df_onibus['LON_IN_TIME'].iloc[i]
            codigo_atual = df_onibus['CODIGOLINHA'].iloc[i]  # Código da linha atual
            itinerario_atual = df_onibus['ITINERARIO'].iloc[i]  # Itinerário da linha atual
            #print(lat_onibus, lon_onibus)
            df_pontos_itinerario = df_pontos[df_pontos['ID_do_Itinerario'] == itinerario_atual].reset_index(drop=True)
            if not df_pontos_itinerario.empty: 
                
                # Calcular distâncias para todas as paradas
                distancias = df_pontos_itinerario.apply(
                    lambda row: calcular_distancia(
                        lat_onibus,
                        lon_onibus,
                        row['Latitude'],
                        row['Longitude']
                    ),
                    axis=1
                )
    
                if not distancias.empty:  # Verifica se a série de distâncias não está vazia
                    index_parada_mais_proxima = distancias.idxmin()
                    distancia_minima = distancias.min()
                    nome_parada_mais_proxima = df_pontos_itinerario.loc[index_parada_mais_proxima, 'NOME']
                    mapeamento = dict(zip(df_pontos_itinerario['NOME'], df_pontos_itinerario['SEQ']))
                    
    
                    # Atualiza as informações diretamente no DataFrame df_onibus
                    df_onibus.at[i, 'PARADA_MAIS_PROXIMA'] = nome_parada_mais_proxima
                    df_onibus.at[i, 'SEQ'] = mapeamento[nome_parada_mais_proxima]
                    df_onibus.at[i, 'SEQ_MAX'] = df_pontos_itinerario['SEQ'].max()
                    df_onibus.at[i, 'DISTANCIA_MINIMA'] = distancia_minima
                else:
                    pass
    except Exception as e:
        logging.error("Erro ao atribuir paradas: %s", e)

    return df_onibus  # Retorna o DataFrame atualizado

def retorna_df_itinerario(df_onibus, df_pontos):
    try:
        if df_pontos.empty:
            logging.warning("O DataFrame df_pontos está vazio.")
            return None
        if df_onibus.empty:
            logging.warning("O DataFrame df_onibus está vazio.")
            return None

        if 'PARADA_MAIS_PROXIMA' not in df_onibus.columns:
            df_onibus['PARADA_MAIS_PROXIMA'] = 'inicializado'
        if 'DISTANCIA_MINIMA' not in df_onibus.columns:
            df_onibus['DISTANCIA_MINIMA'] = 0.0
        if 'SEQ' not in df_onibus.columns:
            df_onibus['SEQ'] = -1
        if 'SEQ_MAX' not in df_onibus.columns:
            df_onibus['SEQ_MAX'] = -1
        if 'ITINERARIO' not in df_onibus.columns:
            df_onibus['ITINERARIO'] = 0
        
        df_itinerario = carregar_tabela_para_dataframe('onibus','dados_itinerario.db')
        dicionario_itinerario = df_itinerario.set_index(['CODIGOLINHA', 'SENT'])['ITINERARIO'].to_dict()
        
        df_onibus['ITINERARIO'] = df_onibus.set_index(['CODIGOLINHA', 'SENT']).index.map(dicionario_itinerario)
        df_onibus = atribuir_parada(df_onibus, df_pontos)
        return df_onibus
    except Exception as e:
        logging.error("Erro ao retornar DataFrame do itinerário: %s", e)
        return None
        
def retorna_onibus():
    try:
        # Carregar o DataFrame de ônibus do banco de dados
        df_onibus = carregar_tabela_para_dataframe('onibus', 'dados_onibus.db')
        
        # Filtrar os ônibus com FLAG_PROCES igual a 0
        df_onibus = df_onibus[df_onibus['FLAG_PROCES'] == 0]
        df_onibus = df_onibus[df_onibus['SENT'] != '']
        # Resetar o índice
        df_onibus = df_onibus.reset_index(drop=True)

        # Atualizar o FLAG_PROCES para 1 indicando que os dados serão processados
        with sqlite3.connect('dados_onibus.db') as conn:
            conn.execute("UPDATE onibus SET FLAG_PROCES = 1 WHERE FLAG_PROCES = 0")
            conn.commit()

        return df_onibus
    except Exception as e:
        logging.error("Erro ao retornar DataFrame de ônibus: %s", e)
        return None



# Criar a tabela se não existir
criar_tabela()



df_pontos = carregar_tabela_para_dataframe('onibus', 'dados_pontos.db')
df_onibus = retorna_onibus()
# Verificar se os DataFrames não estão vazios
if not df_onibus.empty and not df_pontos.empty:
    

    # Remover valores nulos
    df_onibus = df_onibus.dropna(subset=['LAT_IN_TIME', 'LON_IN_TIME'])
    df_pontos = df_pontos.dropna(subset=['Latitude', 'Longitude'])

    df = retorna_df_itinerario(df_onibus, df_pontos)

    # Salvar as alterações no banco
    gravar_no_banco_processado(df_onibus)
else:
    print("Erro: Um ou ambos os DataFrames estão vazios.")

In [67]:
df = carregar_tabela_para_dataframe('onibus', 'dados_processados.db')
#df[df['CODIGOLINHA'] == '500']
a = df[df['COD'] == 'GE704']
a.head(30)

Unnamed: 0,COD,REFRESH,LAT_IN_TIME,LON_IN_TIME,CODIGOLINHA,ADAPT,TIPO_VEIC,TABELA,SITUACAO,SITUACAO2,SENT,TCOUNT,SENTIDO_IN_TIME,HORA,FLAG_PROCES,PARADA_MAIS_PROXIMA,DISTANCIA_MINIMA,SEQ,SEQ_MAX,ITINERARIO
259,GE704,16:23,-25.51732,-49.230391,500,0,5,2,ATRASADO,REALIZANDO ROTA,IDA,1,661-PRACA CARLOS GOMES (16:43),2024-10-23 16:23:30,0,Terminal Boqueirão - 500 - Ligeirão Boqueirão,53.415374,1,6,713.0
1015,GE704,16:23,-25.51621,-49.230531,500,0,5,2,ATRASADO,REALIZANDO ROTA,IDA,1,661-PRACA CARLOS GOMES (16:43),2024-10-23 16:23:55,0,Terminal Boqueirão - 500 - Ligeirão Boqueirão,83.929083,1,6,713.0
1846,GE704,16:24,-25.514715,-49.231103,500,0,5,2,ATRASADO,REALIZANDO ROTA,IDA,1,661-PRACA CARLOS GOMES (16:43),2024-10-23 16:24:41,0,Terminal Boqueirão - 500 - Ligeirão Boqueirão,258.759483,1,6,713.0
2288,GE704,16:24,-25.513418,-49.231661,500,0,5,2,ATRASADO,REALIZANDO ROTA,IDA,1,661-PRACA CARLOS GOMES (16:43),2024-10-23 16:25:02,0,Terminal Boqueirão - 500 - Ligeirão Boqueirão,413.002333,1,6,713.0
2524,GE704,16:25,-25.510166,-49.23323,500,0,5,2,ATRASADO,REALIZANDO ROTA,IDA,1,661-PRACA CARLOS GOMES (16:43),2024-10-23 16:25:24,0,Terminal Boqueirão - 500 - Ligeirão Boqueirão,806.13205,1,6,713.0
4647,GE704,16:26,-25.502098,-49.237263,500,0,5,2,ATRASADO,REALIZANDO ROTA,IDA,1,661-PRACA CARLOS GOMES (16:43),2024-10-23 16:26:51,0,Terminal Carmo - 500 - Ligeirão Boqueirão,76.120826,2,6,713.0
5108,GE704,16:27,-25.501691,-49.237506,500,0,5,2,ATRASADO,REALIZANDO ROTA,IDA,1,661-PRACA CARLOS GOMES (16:43),2024-10-23 16:27:21,0,Terminal Carmo - 500 - Ligeirão Boqueirão,25.007006,2,6,713.0
5472,GE704,16:27,-25.501301,-49.237751,500,0,5,2,ATRASADO,REALIZANDO ROTA,IDA,1,661-PRACA CARLOS GOMES (16:43),2024-10-23 16:27:54,0,Terminal Carmo - 500 - Ligeirão Boqueirão,25.38064,2,6,713.0
5865,GE704,16:28,-25.499978,-49.23826,500,0,5,2,ATRASADO,REALIZANDO ROTA,IDA,1,661-PRACA CARLOS GOMES (16:43),2024-10-23 16:28:22,0,Terminal Carmo - 500 - Ligeirão Boqueirão,179.348901,2,6,713.0
7002,GE704,16:29,-25.495106,-49.240656,500,0,5,2,ATRASADO,REALIZANDO ROTA,IDA,1,661-PRACA CARLOS GOMES (16:43),2024-10-23 16:29:24,0,Terminal Carmo - 500 - Ligeirão Boqueirão,770.298857,2,6,713.0
