### Comando para rodar o GraphHopper no terminal - atenção para o PBF a ser carregado:

PBF da Rede 2024; custom model ajustado (LTS) com priority para cycleways e lcn

clear && cd /home/livre/Desktop/Base_GtsRegionais/GitLab/yellow_src/graphhopper/ && rm -rf graph-cache/ && java -Ddw.graphhopper.datareader.file=/home/livre/Desktop/Base_GtsRegionais/GitLab/yellow_dados/07_graphhopper/03_PBFs_SP_rede_2019/20220216_sao_paulo_edited_20230521_A_infraciclo_atual.osm.pbf -jar graphhopper/web/target/graphhopper-web-*.jar server graphhopper/config-example_LTS_priority_cycleway_lcn.yml

In [1]:
suppressPackageStartupMessages(library('tidyverse'))
suppressPackageStartupMessages(library('tidylog'))
suppressPackageStartupMessages(library('httr'))
suppressPackageStartupMessages(library('jsonlite'))
# Aplicar funcoes em paralelo
library('future.apply')

Carregando pacotes exigidos: future



In [2]:
# Checando: Jupyter suporta multicore?
future::supportsMulticore()

In [3]:
# https://stackoverflow.com/questions/40536067/how-to-adjust-future-global-maxsize
# For 850MB: 850*1024^2 = 891289600
# For +1.3GB: 1500*1024^2 = 1572864000
# options(future.globals.maxSize = 891289600)
options(future.globals.maxSize = 5e6) # 5 MB
options(future.globals.maxSize = 50*1024^2) # 50 MB
parallelly::availableCores()

In [4]:
# Estrutura de pastas
pasta_dados        <- "../../yellow_dados"
pasta_orig_vs_mod  <- sprintf('%s/10_rotas_originais_vs_modeladas', pasta_dados)
pasta_orig_way_ids <- sprintf("%s/01_osm_way_ids_rotas_modeladas", pasta_orig_vs_mod)
# Pasta para novos testes com modelo de priority
pasta_aop_2024_2028  <- sprintf("%s/14_aop_2024_2028", pasta_dados)
pasta_lts_priority   <- sprintf("%s/02_teste_lts_priority", pasta_aop_2024_2028)
pasta_osm_way_ids  <- sprintf("%s/01_osm_way_ids_rotas_modeladas", pasta_lts_priority)
pasta_rotas_modalt <- sprintf("%s/02_rotas_modeladas_alternatives", pasta_lts_priority)
dir.create(pasta_osm_way_ids, recursive = TRUE, showWarnings = FALSE)
dir.create(pasta_rotas_modalt, recursive = TRUE, showWarnings = FALSE)

In [5]:
# ------------------------------------------------------------------------------
# Routing a partir de dois pontos com rotas alternativas (até 3 por par OD)
# ------------------------------------------------------------------------------

# Faz query de routing no GraphHopper e retorna resultados principais em dataframe,
# com rotas até 3 alternativas por par OD - aceita um dataframe de uma linha como
# entrada
gh_route_alt <- function(tripid, out_file, route_options) {
  # url <- 'http://localhost:8989/route/?point=-23.5314933121698%2C-46.634354542765&point=-23.5390199310058%2C-46.6376369484305&profile=bike&instructions=false&calc_points=true&details=average_speed'
  # url <- ods_vgs %>% slice(1) %>% select(url) %>% pull()
  # Estação Vila Madalena: -23.546258,-46.690898
  # IME: -23.559007,-46.73208
  # CCSP: -23.571498,-46.639806
  
  # df_line$url <- paste('http://localhost:8989/route/?point=', 
  # '-23.541504', '%2C', '-46.685779', '&point=', 
  # '-23.571498', '%2C', '-46.639806', route_options,
  # sep = '')
  
  # df_line <- ods_vgs %>% slice(1)
  df_line <- ods_vgs %>% filter(trip_id == tripid)
  
  # Fazer a GET de roteamento no Grahphopper
  # print(df_line$url)
  gh_response <- GET(df_line$url)
  
  # Mensagem tem que ser "Success: (200) OK"
  if (http_status(gh_response)$message == 'Success: (200) OK') {
    
    # Resposta da query, já colapsada e transformada em dataframe
    # Remover aviso de 'No encoding supplied: defaulting to UTF-8' na linha fromJSON()
    suppressMessages(
      response_text <- 
        # Ignorar aviso 'argument is not an atomic vector; coercing'
        suppressWarnings(str_c(content(gh_response, 'text'), collapse = ", ")) %>% 
        # Concatenar toda a string de resultados
        str_c("[", ., "]") %>% 
        # Transformar em dataframe
        fromJSON() %>% 
        as.data.frame()
    )
    
    # Nos interessa a coluna de 'paths', como um novo dataframe
    paths <- response_text$paths %>% as.data.frame()
    
    # Puxar osm_way_ids dos resultados de cada alternativa e gravar em pasta separada
    for (i in seq(1, length(paths$details$osm_way_id))) {
      osm_ways <- paths$details$osm_way_id[i] %>% as.data.frame()
      
      if (nrow(osm_ways) > 0) {
        # TODO: Inserir número da rota alternativa aqui
        osm_ways <- osm_ways %>% mutate(index = row_number()) %>% select(index, osm_way_id = X3)
        
        # Gravar resultados
        osm_way_out <- sprintf('%s/%s_%i.csv', pasta_osm_way_ids, df_line$trip_id, i)
        write_delim(osm_ways, osm_way_out, delim = ';')
        
      } else {
        # Se não há osm_way_ids, é porque os pontos estão muito próximos uns dos
        # outros, mesmo que seja um osm_way_id diferente entre a origem e o 
        # destino. A distância e a velocidade calculadas vão ser zero também - 
        # pular este registro, que vai ser vazio
        return(sprintf('Pulando: %s não tem osm_way_ids (provavelmente tem distância = 0)', tripid))
      }
      
    }
    
    
    # Isolar colunas de interesse
    paths <- 
      paths %>% 
      # Calcular tempo em segundos e velocidade média
      mutate(time = time / 1000,
             speed = distance / time * 3.6) %>% 
      # Descartar colunas extras - a coluna poly é o shape da rota traçada
      select(distance, weight, time, speed, poly = points)
    
    # Testar polyline:
    # https://valhalla.github.io/demos/polyline/?unescape=true&polyline6=false#%0A
    
    # Adicionar colunas de informação vindas do dataframe original
    paths <- 
      paths %>% 
      mutate(trip_id   = df_line$trip_id,
             qgis_id.x = df_line$qgis_id.x,
             qgis_id.y = df_line$qgis_id.y,
             .before = 'distance') %>% 
      mutate(lon.x     = df_line$lon.x,
             lat.x     = df_line$lat.x,
             lon.y     = df_line$lon.y,
             lat.y     = df_line$lat.y,
             .after = 'poly')
    
  } else {
    
    # Se a query no GraphHopper não deu resultados, guardar como dataframe vazio
    paths <- data.frame(trip_id   = df_line$trip_id,
                        qgis_id.x = df_line$qgis_id.x,
                        qgis_id.y = df_line$qgis_id.y,
                        distance  = NA,
                        weight    = NA,
                        time      = NA,
                        speed     = NA,
                        poly      = NA,
                        lon.x     = df_line$lon.x,
                        lat.x     = df_line$lat.x,
                        lon.y     = df_line$lon.y,
                        lat.y     = df_line$lat.y
                        )
    
  }
  
  # Guardar resultados temporários
  tmp_file <- sprintf('%s/%s_%i_modalt.csv', pasta_rotas_modalt, df_line$trip_id, i)
  write_delim(paths, tmp_file, delim = ';')
  
}


In [6]:
# ------------------------------------------------------------------------------
# Routing a partir de dois pontos
# ------------------------------------------------------------------------------

# Abrir origens e destinos das rotas iniciais da Yellow - são consideradas aqui
# (pelos scripts anteriores) as rotas que (a) tiveram algum trecho considerado
# no modelo; (b) que não foram divididas em trechos menores; e (c) em que o
# trecho único considerado é o inicial (possui trip_id com _00)
ods_vgs <- sprintf('%s/03_rotas_originais_infraciclo_detour_carac_viagens.csv', pasta_orig_vs_mod)
ods_vgs <- read_delim(ods_vgs, delim = ';', col_types = 'cccdddddccccdddddddd')
# Remover viagens com origem e destino no mesmo qgis_id
ods_vgs <- ods_vgs %>% filter(qgis_id.x != qgis_id.y)
ods_vgs <- ods_vgs %>% select(trip_id, qgis_id.x, qgis_id.y, lon.x, lat.x, lon.y, lat.y)
# head(ods_vgs)

# Criar coluna com URL para GET no GraphHopper
route_options <- '&profile=bike&instructions=false&calc_points=true&algorithm=alternative_route&details=osm_way_id'

ods_vgs <- 
  ods_vgs %>% 
  mutate(url = paste('http://localhost:8989/route/?point=', 
                     lat.x, '%2C', lon.x, '&point=', 
                     lat.y, '%2C', lon.y, route_options,
                     sep = ''))

head(ods_vgs, 3)

filter: no rows removed
select: dropped 13 variables (via_comum, infra_ciclo, ciclo_expressa, ciclo_comum, ciclofaixa, …)
mutate: new variable 'url' (character) with 129,026 unique values and 0% NA


trip_id,qgis_id.x,qgis_id.y,lon.x,lat.x,lon.y,lat.y,url
<chr>,<chr>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>,<chr>
000135_00,271157,104168,-46.7166,-23.56869,-46.72109,-23.57161,http://localhost:8989/route/?point=-23.56869%2C-46.716596&point=-23.571614%2C-46.721093&profile=bike&instructions=false&calc_points=true&algorithm=alternative_route&details=osm_way_id
000138_00,161929,161977,-46.68779,-23.57601,-46.69842,-23.57327,http://localhost:8989/route/?point=-23.576007%2C-46.687787&point=-23.573271%2C-46.698423&profile=bike&instructions=false&calc_points=true&algorithm=alternative_route&details=osm_way_id
000139_00,31336,143030,-46.69835,-23.57297,-46.68893,-23.56802,http://localhost:8989/route/?point=-23.572974%2C-46.698347&point=-23.568022%2C-46.688926&profile=bike&instructions=false&calc_points=true&algorithm=alternative_route&details=osm_way_id


In [7]:
# Para cada linha de origem e destino, gerar rotas modeladas com alternativas
detach("package:tidylog")

# Criar ttmatrix a partir do GrahHopper - melhor rodar no Jupyter se for AOP;
# se forem só as rotas originais, é ok rodar no RStudio
# for (tripid in ods_vgs$trip_id) { gh_route_alt(tripid) }
# Rodar função para todos os arquivos- multi thread (Jupyter)
(start = Sys.time())
future::plan(future::multicore)
invisible(future.apply::future_lapply(X   = ods_vgs$trip_id, 
                                      FUN = gh_route_alt,
                                      future.seed = TRUE))
Sys.time()
Sys.time() - start

[1] "2025-03-04 22:41:37 -03"

[1] "2025-03-04 23:04:50 -03"

Time difference of 23.20426 mins

In [8]:
# ------------------------------------------------------------------------------
# Juntar todos os resultados
# ------------------------------------------------------------------------------

# Arquivo de saída
out_file <- sprintf('%s/01_ttmatrix_rotas_modeladas_de_viagens_originais_com_alternativas.csv', pasta_lts_priority)

# Listar todos os arquivos de resultados em um dataframe único
arqs_resultados <- data.frame(arq = list.files(pasta_rotas_modalt, recursive = FALSE, full.names = TRUE))

for (arq in arqs_resultados$arq) {
  # Abrir arquivo de resultados
  arq <- read_delim(arq, delim = ';', col_types = cols(.default = "c"))
  
  # Guardar resultados 
  if (file.exists(out_file)) {
    write_delim(arq, out_file, delim = ';', append = TRUE)
  } else {
    write_delim(arq, out_file, delim = ';', append = FALSE)
  }
  
}

In [9]:
resultados_final <- read_delim(out_file, delim = ';', col_types = cols(.default = "c"))
resultados_final <- resultados_final %>% arrange(trip_id, weight)
head(resultados_final)

trip_id,qgis_id.x,qgis_id.y,distance,weight,time,speed,poly,lon.x,lat.x,lon.y,lat.y
<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>
000135_00,271157,104168,779.082,252.274255,252.275,11.117610544049151,jgznCvic|G|@gENYROdNtb@,-46.716596,-23.56869,-46.721093,-23.571614
000138_00,161929,161977,1569.142,414.717662,517.355,10.918829817050188,`u{nCtu}{GGMsNjHsMnHHr@JEJC`ApCCNhClG~BlFHFF@BDAJ@JnEzJ`@dAH^A\Sx@iBrBy@dAMPEJ,-46.687787,-23.576007,-46.698423,-23.573271
000138_00,161929,161977,1596.709,476.185662,504.696,11.3893361548338,`u{nCtu}{GGMkExBFNnGvNdC`FyGlDMYeJdFcClAK@BDAJ@JnEzJ`@dAH^A\Sx@iBrBy@dAMPEJ,-46.687787,-23.576007,-46.698423,-23.573271
000139_00,31336,143030,1544.93,528.952145,579.601,9.595821953378271,bb{nCtw_|GCHM[QoAMsAd@u@rAIXQZEBAv@_ABI?Q^YoE{JAK@KCEGAIG_CmFiCmGBOaAqCKBKDIs@i@XC[MFa@T_B|@yC{GiBmE{C~AOy@,-46.698347,-23.572974,-46.688926,-23.568022
000139_00,31336,143030,1460.355,546.551121,554.978,9.472948477236937,bb{nCtw_|GCHM[QoAMsAK?iAH_A@QIIKW}ECWWqEA[Ag@m@{IU_HAcADw@KDIs@i@XC[MFa@T_B|@yC{GiBmE{C~AOy@,-46.698347,-23.572974,-46.688926,-23.568022
000140_00,143030,255789,1223.188,376.308685,405.574,10.85739421166051,|bznC`|}{GKk@FQDAp@c@rBuANSt@e@LIFFFENXrBhFdBxDx@dBXv@FVDZZQHr@JEJC`ApCCNhClG~BlFHFF@BDAJ@JdCrF,-46.688804,-23.567988,-46.695715,-23.573713


In [10]:
write_delim(resultados_final, out_file, delim = ';')

In [11]:
Sys.time() - start

Time difference of 37.73923 mins