# Algoritmo - Identificação da programação em trecho de interesse 
### _Autor: Antônio Claudio Dutra Batista_
### _Orientador: Francisco Moraes de Oliveria Neto_
### _Metodologia: Integração dos dados do GTFS com infomações das paradas programadas_

# 1.0 Integração dos dados do formato GTFS
    ''' Mesclagem dos dados de localização das paradas, horarios previstos e viagens programadas em uma unica base '''

In [None]:
# Importando base com locais previstos de parada
import pandas as pd 
stops_paradas = pd.read_csv('stops_2024', sep= ',')

In [None]:
# Removendo colunas desnecessárias do df com paradas 
stops_paradas.drop(columns= ['stop_code', 'stop_desc', 'zone_id', 'stop_url', 'location_type', 'parent_station', 
                             'stop_timezone', 'wheelchair_boarding'], inplace=True)

In [None]:
stops_paradas

In [None]:
# Importando base com horarios previstos de parada  
stop_times = pd.read_csv('stop_times_2024', sep= ',')

# Importando dados com viagens programadas de cada linha 
trips = pd.read_csv('trips_2024', sep=",")

In [None]:
# Removendo colunas desnecessárias do df com paradas 
stop_times.drop(columns= ['stop_headsign', 'pickup_type', 'drop_off_type', 'shape_dist_traveled'], inplace=True)

In [None]:
# Removendo informações desnecessárias do df de dados das viagens
trips_tratado = trips.drop(columns=['service_id', 'trip_headsign', 'trip_short_name', 'direction_id', 'block_id',
                                    'wheelchair_accessible'])

In [None]:
stop_times

In [None]:
# Juunção dos dados das paradas pela mesmo stop_id no df de tempos previstos de passagem
merge_pardas_time = pd.merge(stop_times, stops_paradas, left_on='stop_id', right_on='stop_id')

In [None]:
merge_pardas_time

In [None]:
# MESCLANDO BASE COM INFORMAÇÕES DAS PARADAS E TEMPOS DE PASSAGENS COM OS DADOS DAS VIAGENS PROGRAMADAS E AS RESPECTIVAS LINHAS
merge_paradas_time_trips = pd.merge(merge_pardas_time, trips_tratado, left_on='trip_id', right_on='trip_id')

In [None]:
merge_paradas_time_trips

# 2.0 Filtragem em trecho de interesse 
    '''A partir da base integrada é possivel verificar para uma determinada linha, os locais programados de passagem '''

In [None]:
# Filtrando no trecho de interesse
''' (A PARTIR DA ESTAÇÃO DO NORTHSHOPING E 120 METROS APOS A ULTIMA ESTAÇÃO) '''
trecho = merge_paradas_time_trips[(merge_paradas_time_trips.stop_lat>=-3.736013)
    & (merge_paradas_time_trips.stop_lon>=-38.566300) & (merge_paradas_time_trips.stop_lon<=-38.542240) 
                                & (merge_paradas_time_trips.stop_lat<=-3.731021)]

In [None]:
# TODAS AS LINHAS QUE POSSUEM VIAGENS PROGRAMDAS NESSA REGIÃO 
trecho['route_id'].unique()

In [None]:
# Filtrando linha no trecho de interesse 
linha = trecho[trecho.route_id==28]

In [None]:
linha

In [None]:
# Verificando as paradas programadas presentes 
linha['stop_name'].unique()

# ----------------------------------------------------------------