In [13]:
import geopy
import requests
import pandas as pd
from datetime import datetime
from geopy.distance import geodesic
import logging
import pytz
import threading
import time

# Função para buscar e processar os dados de uma linha de ônibus
def buscar_e_processar_dados(linha):
    url_base = f'https://transporteservico.urbs.curitiba.pr.gov.br/getVeiculos.php?linha={linha:03}&c=821f0'
    
    try:
        # Definir o timeout para 10 segundos
        response = requests.get(url_base, timeout=30)
        response.raise_for_status()

        timezone_sp = pytz.timezone('America/Sao_Paulo')
        hora_online = datetime.now(timezone_sp).strftime("%Y-%m-%d %H:%M:%S")
        dados_json = response.json()

        # Verificar se a resposta é uma lista (caso não haja dados)
        if isinstance(dados_json, list):
            return None

        # Processar os dados e criar o DataFrame
        codigos_onibus = [{
            "COD": valor['COD'],
            "REFRESH": valor['REFRESH'],
            "LAT_IN_TIME": valor['LAT'],
            "LON_IN_TIME": valor['LON'],
            "CODIGOLINHA": int(valor['CODIGOLINHA']),
            "ADAPT": int(valor['ADAPT']),
            "TIPO_VEIC": int(valor['TIPO_VEIC']),
            "TABELA": valor['TABELA'],
            "SITUACAO": valor['SITUACAO'],
            "SITUACAO2": valor['SITUACAO2'],
            "SENT": valor['SENT'],
            "TCOUNT": valor['TCOUNT'],
            "SENTIDO_IN_TIME": valor['SENTIDO']
        } for chave, valor in dados_json.items()]

        df_codigos_onibus = pd.DataFrame(codigos_onibus)

        # Adicionar a hora online se houver dados
        if not df_codigos_onibus.empty:
            df_codigos_onibus['HORA'] = hora_online
        else:
            logging.warning("Nenhum ônibus encontrado em operação para a linha %s", linha)
            return None

        return df_codigos_onibus

    except requests.Timeout:
        logging.error("Timeout: A conexão para a linha %s demorou mais de 10 segundos", linha)
        return None
    except requests.RequestException as e:
        logging.error("Falha ao acessar a página para a linha %s: %s", linha, e)
        return None
    except Exception as e:
        logging.error("Erro ao processar dados para a linha %s: %s", linha, e)
        return None


# Função que será executada por cada thread para processar as linhas
def processar_linha(linha, df_linhas, result_list):
    df_result = buscar_e_processar_dados(linha)
    if df_result is not None:
        # Filtrar o DataFrame de linhas para a linha específica
        df_linha_atual = df_linhas[df_linhas['COD'] == linha]
        result_list.append(df_result)

######################################################################################################################

# Carregar os dados dos pontos da linha
df_linhas = pd.read_csv('df_pontos.csv')

# Obter os códigos únicos das linhas
linhas_unicas = df_linhas['COD'].unique()

# DataFrame final que irá armazenar todos os resultados concatenados
df_concatenado = pd.DataFrame()

# Função para gerenciar threads e processamento de dados
def processar_linhas_com_threads(linhas_unicas, df_linhas):
    i = 0
    while True:
        result_list = []
        
        # Criar threads para cada linha
        threads = [threading.Thread(target=processar_linha, args=(linha, df_linhas, result_list)) for linha in linhas_unicas]

        # Iniciar todas as threads
        for thread in threads:
            thread.start()

        # Esperar todas as threads terminarem
        for thread in threads:
            thread.join()

        # Concatenar os resultados de todas as threads em um DataFrame
        if result_list:
            global df_concatenado
            df_concatenado = pd.concat([df_concatenado] + result_list, ignore_index=True)

        # Log da iteração atual
        logging.info('Número atual da iteração: %s', i)
        i += 1
        break
        # Espera 60 segundos antes da próxima iteração
        time.sleep(60)

# Inicializando o processo com threads
processar_linhas_com_threads(linhas_unicas, df_linhas)


ERROR:root:Timeout: A conexão para a linha 546 demorou mais de 10 segundos
ERROR:root:Timeout: A conexão para a linha 548 demorou mais de 10 segundos
ERROR:root:Timeout: A conexão para a linha 547 demorou mais de 10 segundos
ERROR:root:Timeout: A conexão para a linha 536 demorou mais de 10 segundos
ERROR:root:Timeout: A conexão para a linha 614 demorou mais de 10 segundos
ERROR:root:Timeout: A conexão para a linha 549 demorou mais de 10 segundos
ERROR:root:Timeout: A conexão para a linha 552 demorou mais de 10 segundos
ERROR:root:Timeout: A conexão para a linha 603 demorou mais de 10 segundos
ERROR:root:Timeout: A conexão para a linha 607 demorou mais de 10 segundos
ERROR:root:Timeout: A conexão para a linha 550 demorou mais de 10 segundos
ERROR:root:Timeout: A conexão para a linha 600 demorou mais de 10 segundos
ERROR:root:Timeout: A conexão para a linha 561 demorou mais de 10 segundos
ERROR:root:Timeout: A conexão para a linha 553 demorou mais de 10 segundos
ERROR:root:Timeout: A con

In [15]:
df_concatenado

Unnamed: 0,COD,REFRESH,LAT_IN_TIME,LON_IN_TIME,CODIGOLINHA,ADAPT,TIPO_VEIC,TABELA,SITUACAO,SITUACAO2,SENT,TCOUNT,SENTIDO_IN_TIME,HORA
0,EB609,21:35,-25.426071,-49.299401,21,1,4,2,NO HORÁRIO,REALIZANDO ROTA,CIRCULAR,1,827-TERMINAL CAMPINA DO SIQUEIRA (21:39),2024-10-15 21:36:39
1,GB601,21:35,-25.387705,-49.267651,21,1,4,8-2,NO HORÁRIO,REALIZANDO ROTA,CIRCULAR,1,827-TERMINAL CAMPINA DO SIQUEIRA (22:00),2024-10-15 21:36:39
2,GB602,21:34,-25.411448,-49.247345,21,1,4,6-2,NO HORÁRIO,REALIZANDO ROTA,CIRCULAR,1,819-TERMINAL CABRAL (21:46),2024-10-15 21:36:39
3,EB603,21:35,-25.481028,-49.298403,21,1,4,3,NO HORÁRIO,REALIZANDO ROTA,CIRCULAR,1,833-TERMINAL CAPAO RASO (21:42),2024-10-15 21:36:39
4,BB608,21:35,-25.445036,-49.221438,21,1,4,1,NO HORÁRIO,REALIZANDO ROTA,CIRCULAR,1,832-TERMINAL CAPAO DA IMBUIA (21:43),2024-10-15 21:36:39
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
285,GB606,21:35,-25.530065,-49.298846,545,1,4,1,NO HORÁRIO,REALIZANDO ROTA,IDA,1,1081-T.S.CERCADO SENT.BOQUEIRAO (21:50),2024-10-15 21:36:42
286,MI003,21:35,-25.389485,-49.298291,924,1,1,7,NO HORÁRIO,REALIZANDO ROTA,IDA,1,1569-CRUZ DO PILARZINHO/STA.CANDIDA (21:40),2024-10-15 21:36:42
287,BI019,21:30,-25.377548,-49.22415,924,1,1,6-2,ADIANTADO,REALIZANDO ROTA,VOLTA,1,1570-CRUZ DO PILARZINHO/STA.FELICID (21:58),2024-10-15 21:36:42
288,MI004,21:35,-25.392143,-49.31873,924,1,1,1,ADIANTADO,REALIZANDO ROTA,VOLTA,1,881-TERMINAL SANTA FELICIDADE (21:50),2024-10-15 21:36:42


In [19]:
from geopy.geocoders import Nominatim

def obter_bairro(lat, lon):
    geolocator = Nominatim(user_agent="meu_app")
    location = geolocator.reverse((lat, lon), exactly_one=True)
    
    if location and 'suburb' in location.raw['address']:
        return location.raw['address']['suburb']
    else:
        return "Bairro não encontrado"

# Exemplo de coordenadas
lat =  -25.4297
lon = -49.2719

bairro = obter_bairro(lat, lon)
print(f"O ônibus está no bairro: {bairro}")


O ônibus está no bairro: Centro
