In [5]:
suppressPackageStartupMessages(library('tidyverse'))
suppressPackageStartupMessages(library('tidylog'))
suppressPackageStartupMessages(library('sf'))
# suppressPackageStartupMessageslibrary(('mapview'))
suppressPackageStartupMessages(library('googlePolylines'))

In [6]:
# Aplicar funcoes em paralelo
library('future.apply')
# Checando: Jupyter suporta multicore?
future::supportsMulticore()

Loading required package: future



In [7]:
# https://stackoverflow.com/questions/40536067/how-to-adjust-future-global-maxsize
# For 850MB: 850*1024^2 = 891289600
# For +1.3GB: 1500*1024^2 = 1572864000
# options(future.globals.maxSize = 891289600)
options(future.globals.maxSize = 5e6) # 5 MB
options(future.globals.maxSize = 320*1024^2) # 320 MB
parallelly::availableCores()

In [8]:
# Estrutura de pastas
pasta_dados        <- "../../yellow_dados"
pasta_osm_sp       <- sprintf("%s/02_osm_simplificado_sp", pasta_dados)
pasta_map_matching <- sprintf("%s/05_map_matching", pasta_dados)
pasta_graphhopper  <- sprintf("%s/07_graphhopper", pasta_dados)
pasta_gh_pbfs      <- sprintf("%s/03_PBFs_SP_rede_2019", pasta_graphhopper)
pasta_orig_vs_mod  <- sprintf('%s/10_rotas_originais_vs_modeladas', pasta_dados)
pasta_orig_modalt  <- sprintf("%s/11_rotas_modeladas_com_alternativas", pasta_dados)
pasta_osm_way_ids  <- sprintf("%s/01_osm_way_ids_rotas_modeladas", pasta_orig_modalt)
# pasta_rotas_modalt <- sprintf("%s/02_rotas_modeladas_alternatives", pasta_orig_modalt)
pasta_rotas_modalc <- sprintf("%s/03_rotas_modeladas_alter_carac", pasta_orig_modalt)
dir.create(pasta_rotas_modalc, recursive = TRUE, showWarnings = FALSE)

In [9]:
# ------------------------------------------------------------------------------
# Funções
# ------------------------------------------------------------------------------

# Transforma linha de polyline para dataframe com latlongs
polyline_to_latlong <- function(polyline, trip_id){
  # polyline <- viagem$poly; trip_id <- viagem$trip_id
  this <- as.data.frame(decode(as.character(polyline)))
  this <- this %>% 
    # Formatação dos pontos está fora do lugar: 
    # de -235.641 para -23.5641 - ajeitar
    mutate(trip_id  = trip_id,
           lat = str_replace(lat, '\\.', ''),
           lon = str_replace(lon, '\\.', ''),
           lat = as.double(str_replace(lat, '-23', '-23.')),
           lon = as.double(str_replace(lon, '-46', '-46.')))
  
  return(this)
}


# Transforma dataframe com várias linhas de latlon em sf
df_latlong_to_sf <- function(df, trip_id, st_type = 'LINESTRING'){
  # df <- this
  this <- df %>% 
    # Transformar em sf
    st_as_sf(coords = c("lon", "lat"), crs = 4326) %>% 
    # Transformar pontos em linha - ver possíveis erros em
    # https://github.com/r-spatial/sf/issues/321
    # # Modo 1 - Com st_coordinates, retorna matriz
    # Retrieve coordinates in matrix form 
    # st_coordinates() %>%
    # st_linestring()
    # Modo 2 - Com summarize, retorna sf
    # Aqui, o summarize pode ser qualquer coisa, o 
    # importante é o 'do_union=FALSE'
    group_by(trip_id) %>% 
    summarize(m = n(), do_union = FALSE) %>% 
    select(-m) %>% 
    st_cast(st_type)
  
  return(this)
}


# Insere as distâncias calculadas em vias comuns ou infra cicloviária no df original
calcular_dist_ciclo <- function(trip_id_alt) {
  # trip_id_alt <- rotas_m$tmp_id[3]
  line <- rotas_m %>% filter(tmp_id == trip_id_alt)
  
  # Puxar osm_ids da rota modelada
  trip_id_alt <- list.files(pasta_osm_way_ids, pattern = trip_id_alt, recursive = FALSE, full.names = TRUE)
  trip_id_alt <- read_delim(trip_id_alt, delim = ';', col_types = 'cc')
  # trip_way_ids <- paste0("'", trip_id_alt$osm_way_id, "'", collapse = ",")
  
  # Filtrar osm_ids da rota modelada do viário completo de SP
  viario_rota <- viario_sp %>% filter(osm_id %in% trip_id_alt$osm_way_id)
  # mapview(viario_rota)
  
  # Transformar o polyline da rota modelada em shapefile
  shape_rota <- polyline_to_latlong(line$poly, line$trip_id)
  shape_rota <- df_latlong_to_sf(shape_rota, line$trip_id)
  shape_rota <- shape_rota %>% st_transform(31983) %>% mutate(dist = round(st_length(.), 4))
  # mapview(shape_rota)
  
  
  # ----------------------------------------------------------------------------
  # Calcular detour
  # ----------------------------------------------------------------------------
  
  # Adicionar extensão da linha do shapefile da rota modelada e calcular detour
  line <- line %>% mutate(dist_linha_modalt = as.double(shape_rota$dist),
                          detour_modalt = dist_linha_modalt / dist_reta, 
                          .after = 'detour_mm')
  # line %>% select(trip_id, dist_total, dist_reta, dist_linha, detour_mm, dist_linha_modalt, detour_modalt)
  
  
  # ----------------------------------------------------------------------------
  # Calcular extensões percorridas em vias comuns e infra cicloviária
  # ----------------------------------------------------------------------------
  
  # A partir de um pequeno buffer criado no polyline da rota modelada, fazer uma 
  # interseção nos osm_ids originais - isso porque os osm_ids podem ter várias 
  # quadras e o segmento percorrido ser só um trechinho dele
  buffer_rota <- st_buffer(shape_rota, 2)
  viario_rota_cropped <- suppressWarnings(st_intersection(viario_rota, buffer_rota))
  # mapview(viario_rota_cropped) + mapview(buffer_rota)
  
  # Recaulcular as extensões dos arcos (no caso, as extensões percorridas dentro
  # daquele osm_id), transformar em dataframe e isolar colunas de interesse
  viario_rota_cropped <- viario_rota_cropped %>% mutate(new_ext = as.double(st_length(.)), .after = 'length_m')
  viario_rota_cropped <- viario_rota_cropped %>% st_drop_geometry() %>% select(osm_id, new_ext)
  
  # Juntar com dados da infraestrutura cicloviária
  viario_rota_cropped <- 
    viario_rota_cropped %>% 
    left_join(infra_ciclo, by = 'osm_id') %>% 
    mutate(infra_ciclo = ifelse(is.na(infra_ciclo), 'via_comum', infra_ciclo))
  
  # Fator de ajuste para as distâncias - vamos aplicar um proporcional geral a partir
  # da diferença entre a extensão total da rota modelada e a calculada agora
  fator_correcao <- line$distance / sum(viario_rota_cropped$new_ext)
  viario_rota_cropped <- viario_rota_cropped %>% mutate(ext_rev = new_ext * fator_correcao)
  
  # Agrupar extensões por tipo de viário percorrido
  viario_rota_cropped <- 
    viario_rota_cropped %>% 
    group_by(infra_ciclo) %>% 
    summarise(ext = sum(ext_rev)) %>% 
    ungroup() %>% 
    mutate(trip_id = line$trip_id) %>% 
    pivot_wider(id_cols = trip_id,
                names_from = 'infra_ciclo',
                values_from = ext)
  
  # Checar se todas as colunas de tipo de viário estão como colunas - se não, inserir
  for (i in c('ciclo_expressa', 'ciclo_comum', 'ciclofaixa', 'via_comum')) {
    if (!i %in% names(viario_rota_cropped)) {
      # Inserir nova coluna como NA (NA_real_, NA_character_)
      viario_rota_cropped <- viario_rota_cropped %>% mutate(!!i := 0)
    }
    
  }
  
  # Somar extensões percorridas em infra cicloviária
  viario_rota_cropped <- viario_rota_cropped %>% mutate(infra_ciclo = ciclo_expressa + ciclo_comum + ciclofaixa,
                                                        .after = 'via_comum')
  
  # Juntar todas as infos ao dataframe original e reordenar colunas
  trip_out <- 
    line %>% 
    left_join(viario_rota_cropped, by = 'trip_id') %>% 
    relocate(c(via_comum, infra_ciclo, ciclo_expressa, ciclo_comum, ciclofaixa), 
             .before = 'vg_contramao')
  
  
  # ----------------------------------------------------------------------------
  # Calcular acurácia da rota modelada - por pontos
  # ----------------------------------------------------------------------------
  
  # Aplicar buffer de 50 metros - a distância está sendo definida pela 
  # literatura, mas poderia ser menor até
  buffer <- st_buffer(shape_rota, 50)
  # mapview(buffer)
  
  # Abrir arquivo com latlon da viagem original - as coordenadas que serão
  # consideradas são as resultantes do map matching
  that <- mm_files %>% filter(str_detect(arq, line$trip_id)) %>% pull()
  that <- read_delim(that, delim = ';', col_types = "cidddddddicddcccddd")
  that <- that %>% select(trip_id, lat = matched_points.lat, lon = matched_points.lon)
  that <- that %>% distinct()
  that <- df_latlong_to_sf(that, trip, st_type = 'POINT')
  that <- st_transform(that, 31983) %>% add_column(idx = 1:nrow(.))
  # mapview(that, cex = 3, zcol = 'idx') + mapview(buffer)
  
  # Quantos pontos do map matching estão dentro do buffer considerado?
  those <- filter(that, st_intersects(that, buffer, sparse = FALSE))
  # mapview(those)
  
  # Guardar resultados em um dataframe
  resultado <- data.frame(trip_id      = line$trip_id,
                          pts_intsct   = nrow(those),
                          pts_viagem   = nrow(that),
                          acuracia_pontos  = nrow(those) / nrow(that) * 100)
  
  # Juntar todas as infos ao dataframe original e reordenar colunas
  trip_out <- 
    trip_out %>% 
    left_join(resultado, by = 'trip_id') %>% 
    relocate(c(pts_intsct, pts_viagem, acuracia_pontos), .after = 'speed')
  
  
  # ----------------------------------------------------------------------------
  # Calcular acurácia da rota modelada - por extensão
  # ----------------------------------------------------------------------------
  
  # Transformar pontos da rota original (map matching) em linestring
  this <- df_latlong_to_sf(that, line$trip_id)
  # mapview(this)
  
  # Quanto das linhas da rota original está dentro do buffer considerado?
  thou <- suppressWarnings(st_intersection(this, buffer))
  # mapview(thou) + mapview(buffer)
  
  # Calcular extensão dos trechos que estão dentro do buffer
  thou <- thou %>% mutate(ext_linhas = as.double(st_length(.)))
  thou <- thou %>% st_drop_geometry() %>% select(trip_id = trip_id.1 , ext_linhas)
  
  # Calcular acurácia das linhas - se a extensão das linhas for maior do que
  # a distância da rota, acurácia vai ser 100%
  thou <- thou %>% mutate(acuracia_linhas = ifelse(line$distance >= ext_linhas,
                                                   ext_linhas / line$distance * 100,
                                                   100))
  
  
  # Juntar todas as infos ao dataframe original e reordenar colunas
  trip_out <- 
    trip_out %>% 
    left_join(thou, by = 'trip_id') %>% 
    relocate(c(ext_linhas, acuracia_linhas), .after = 'speed')
  
  
  # Gravar resultados
  out_file <- sprintf('%s/%s_modalt_c.csv', pasta_rotas_modalc, line$tmp_id)
  write_delim(trip_out, out_file, delim = ';')
  
}

In [10]:
# ------------------------------------------------------------------------------
# Rede cicloviária 2019
# ------------------------------------------------------------------------------

# Abrir arquivo com osm_ids de ciclovias expressas em 2019 - a classificação que
# está no dataframe de atributos do viário, acima, contém osm_ids das vias 
# próximas, já que o map matching foi feito no modo 'pedestrian' e ao passar
# por essas vias, o osm_id que ia ser considerado era o do viário
ciclo_expressas <- sprintf('%s/00_atributos_ciclovias_expressas_2019.csv', pasta_gh_pbfs)
ciclo_expressas <- read_delim(ciclo_expressas, delim = ';', col_types = 'c') %>% distinct()
ciclo_expressas <- ciclo_expressas %>% mutate(infra_ciclo = 'ciclo_expressa')

# Abrir o arquivo com osm_ids de vias com ciclofaixa em 2019
ciclo_ciclofx <- sprintf('%s/02_atributos_ciclofaixas_lcn.csv', pasta_gh_pbfs)
ciclo_ciclofx <- read_delim(ciclo_ciclofx, delim = ';', col_types = 'c') %>% distinct()
ciclo_ciclofx <- ciclo_ciclofx %>% mutate(infra_ciclo = 'ciclofaixa')

# Abrir o arquivo com osm_ids de ciclovias comuns (não expressas) em 2019
ciclo_comuns <- sprintf('%s/01_atributos_ciclovias_comuns_2019.csv', pasta_gh_pbfs)
ciclo_comuns <- read_delim(ciclo_comuns, delim = ';', col_types = 'c') %>% distinct()

# Abrir arquivo de trechos de ciclovias comuns em que não há semáforos ou interseções
ciclo_ciclov_semsem <- sprintf('%s/03_atributos_ciclovias_comuns_sem_semaforo.csv', pasta_gh_pbfs)
ciclo_ciclov_semsem <- read_delim(ciclo_ciclov_semsem, delim = ';', col_types = 'c') %>% distinct()

# Ciclovias comuns serão ciclo_comuns + ciclovias sem semáforos ou interseções
ciclo_comuns <- rbind(ciclo_comuns, ciclo_ciclov_semsem)
ciclo_comuns <- ciclo_comuns %>% mutate(infra_ciclo = 'ciclo_comum')


# Juntar tudo em um único dataframe
infra_ciclo <- rbind(ciclo_expressas, ciclo_ciclofx, ciclo_comuns)
rm(ciclo_expressas, ciclo_ciclofx, ciclo_comuns, ciclo_ciclov_semsem)


# ------------------------------------------------------------------------------
# Bases de dados a serem utilizadas
# ------------------------------------------------------------------------------

# Puxar listagem de viagens originais (latlon virá do map matching)
pasta_mm_1 <- sprintf('%s/201811/viagens_processadas_csv', pasta_map_matching)
pasta_mm_2 <- sprintf('%s/201812/viagens_processadas_csv', pasta_map_matching)
pasta_mm_3 <- sprintf('%s/201901/viagens_processadas_csv', pasta_map_matching)
mm_files1 <- list.files(pasta_mm_1, pattern = '^([0-9]{6})_([0-9]{2}).csv', recursive = FALSE, full.names = TRUE) %>% as.data.frame()
mm_files2 <- list.files(pasta_mm_2, pattern = '^([0-9]{6})_([0-9]{2}).csv', recursive = FALSE, full.names = TRUE) %>% as.data.frame()
mm_files3 <- list.files(pasta_mm_3, pattern = '^([0-9]{6})_([0-9]{2}).csv', recursive = FALSE, full.names = TRUE) %>% as.data.frame()
mm_files <- rbind(mm_files1, mm_files2, mm_files3) %>% rename(arq = '.')
rm(mm_files1, mm_files2, mm_files3, pasta_mm_1, pasta_mm_2, pasta_mm_3)
# head(mm_files)


# Abrir origens e destinos das rotas iniciais da Yellow - são consideradas aqui
# (pelos scripts anteriores) as rotas que (a) tiveram algum trecho considerado
# no modelo; (b) que não foram divididas em trechos menores; e (c) em que o
# trecho único considerado é o inicial (possui trip_id com _00)
ods_vgs <- sprintf('%s/03_rotas_originais_infraciclo_detour_carac_viagens.csv', pasta_orig_vs_mod)
ods_vgs <- read_delim(ods_vgs, delim = ';', col_types = 'cccdddddccccdddddddd')
# Remover viagens com origem e destino no mesmo qgis_id
ods_vgs <- ods_vgs %>% filter(qgis_id.x != qgis_id.y)
# Remover colunas de uso de infraestrutura cicloviária das rotas originais (map
# matching). Dados de latlong já vão estar presentes nas rotas modeladas
ods_vgs <- ods_vgs %>% select(-c(via_comum, infra_ciclo, ciclo_expressa, ciclo_comum, ciclofaixa,
                                 lat.x, lon.x, lat.y, lon.y))
head(ods_vgs)


# Abrir viário de SP com osm_ids
viario_sp <- read_sf(sprintf('%s/sao_paulo_osm_filtrado_com_qgis_id.gpkg', pasta_osm_sp))
# Nos interessam os osm_ids e, talvez, a extensão original dos arcos da rede
viario_sp <- viario_sp %>% select(osm_id, length_m)
head(viario_sp)

distinct: removed 19 rows (46%), 22 rows remaining

mutate: new variable 'infra_ciclo' (character) with one unique value and 0% NA

distinct: removed 64 rows (2%), 2,767 rows remaining

mutate: new variable 'infra_ciclo' (character) with one unique value and 0% NA

distinct: removed 29 rows (4%), 768 rows remaining

distinct: no rows removed

mutate: new variable 'infra_ciclo' (character) with one unique value and 0% NA

rename: renamed one variable (arq)

filter: no rows removed

select: dropped 9 variables (via_comum, infra_ciclo, ciclo_expressa, ciclo_comum, ciclofaixa, …)



trip_id,qgis_id.x,qgis_id.y,vg_contramao,vg_loop,vg_exper,vg_parques,dist_total,dist_reta,dist_linha,detour_mm
<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>
000135_00,271157,104168,não,não,não,não,821.4461,562.5676,802.6903,1.426834
000138_00,161929,161977,não,não,não,não,1585.3999,1127.1086,1559.4857,1.383616
000139_00,31336,143030,sim,não,não,não,1846.2487,1108.0927,1791.8481,1.617056
000140_00,143030,255789,sim,não,não,não,1190.0806,950.4632,1125.3632,1.184015
000141_00,255788,264853,não,não,não,não,679.3713,525.754,658.433,1.25236
000142_00,264853,31336,não,não,não,não,1042.3894,784.4423,1027.3345,1.309637


select: dropped 3 variables (name, highway, qgis_id)

“rgeos: versions of GEOS runtime 3.9.1-CAPI-1.14.2
and GEOS at installation 3.9.1dev-CAPI-1.14.1differ”
Registered S3 method overwritten by 'geojsonsf':
  method        from   
  print.geojson geojson



osm_id,length_m,geom
<chr>,<dbl>,<LINESTRING [m]>
1000285228,416.696,LINESTRING (325675.3 737227...
1000285229,71.38,LINESTRING (325658.4 737217...
1000285230,83.966,LINESTRING (330455.7 738652...
1000532754,24.138,LINESTRING (330332.6 740090...
1000623723,4.19,LINESTRING (326335.7 738146...
1000623724,3.883,"LINESTRING (326339 7381463,..."


In [11]:
# ------------------------------------------------------------------------------
# Calcular acurácia das rotas modeladas e distâncias percorridas em infra ciclo
# ------------------------------------------------------------------------------

# Abrir rotas modeladas com alternativas
rotas_m <- sprintf('%s/01_ttmatrix_rotas_modeladas_de_viagens_originais_com_alternativas.csv', pasta_orig_modalt)
rotas_m <- read_delim(rotas_m, delim = ';', col_types = 'cccddddcdddd')
rotas_m <- rotas_m %>% select(-c(qgis_id.x, qgis_id.y))

# Remover rotas com origem muito perto do destino (qgis_id diferente, mas 
# distance igual a zero)
# rotas_m <- rotas_m %>% filter(distance != 0)

# Juntar com dados das viagens originais
rotas_m <- left_join(ods_vgs, rotas_m, by = 'trip_id')
rotas_m <- rotas_m %>% relocate(c(distance, weight, time, speed), .after = 'qgis_id.y')
head(rotas_m)

# Adicionar identificação da rota alternativa no dataframe, conforme o trip_id
# https://stackoverflow.com/questions/28647954/add-an-index-or-counter-to-a-dataframe-by-group-in-r
rotas_m <- rotas_m %>% group_by(trip_id) %>% mutate(alt = row_number(trip_id), .after = 'trip_id') %>% ungroup()
rotas_m <- rotas_m %>% mutate(tmp_id = str_c(trip_id, alt, sep = '_'), .before = 'trip_id')
head(rotas_m)

select: dropped 2 variables (qgis_id.x, qgis_id.y)

left_join: added 9 columns (distance, weight, time, speed, poly, …)

           > rows only in x         0

           > rows only in y  (      0)

           > matched rows     196,555    (includes duplicates)


           > rows total       196,555

relocate: columns reordered (trip_id, qgis_id.x, qgis_id.y, distance, weight, …)



trip_id,qgis_id.x,qgis_id.y,distance,weight,time,speed,vg_contramao,vg_loop,vg_exper,vg_parques,dist_total,dist_reta,dist_linha,detour_mm,poly,lon.x,lat.x,lon.y,lat.y
<chr>,<chr>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>,<chr>,<chr>,<chr>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>
000135_00,271157,104168,779.082,252.2742,252.275,11.117611,não,não,não,não,821.4461,562.5676,802.6903,1.426834,jgznCvic|G|@gENYROdNtb@,-46.7166,-23.56869,-46.72109,-23.57161
000138_00,161929,161977,1569.142,476.926,476.628,11.851824,não,não,não,não,1585.3999,1127.1086,1559.4857,1.383616,`u{nCtu}{GGMsNjHsMnHHr@JEJC`ApCCNhClG~BlFHFF@BDAJ@JnEzJ`@dAH^A\Sx@iBrBy@dAMPEJ,-46.68779,-23.57601,-46.69842,-23.57327
000138_00,161929,161977,1531.061,485.7508,483.74,11.394178,não,não,não,não,1585.3999,1127.1086,1559.4857,1.383616,`u{nCtu}{GFCZx@Nr@iAl@{BlAtElKdC`FlEhKZv@?`@uHtDuDtB_CdBq@h@_Az@_AdAiBrBy@dAMPEJ,-46.68779,-23.57601,-46.69842,-23.57327
000139_00,31336,143030,1458.244,552.7571,552.576,9.500374,sim,não,não,não,1846.2487,1108.0927,1791.8481,1.617056,bb{nCtw_|GCHM[QoAMsAK?iAH_A@QIIKW}ECWWqEA[Ag@m@{IU_HAcADw@KDIs@E[IFQHYNa@T_B|@yC{GiBmE{C~AOy@,-46.69835,-23.57297,-46.68893,-23.56802
000139_00,31336,143030,1599.44,555.3088,554.334,10.387211,sim,não,não,não,1846.2487,1108.0927,1791.8481,1.617056,bb{nCtw_|GCHM[QoAMsAK?iAH_A@QIIKW}ECWWqEA[Kg@I}@Y{Ds@yLQaBUeA_AaC}AoDIUQy@]gAiAmC]XDJ`AxBqH|DOy@,-46.69835,-23.57297,-46.68893,-23.56802
000140_00,143030,255789,1223.188,413.8767,397.798,11.06963,sim,não,não,não,1190.0806,950.4632,1125.3632,1.184015,|bznC`|}{GKk@FQDAp@c@rBuANSt@e@LIFFFENXrBhFdBxDx@dBXv@FVDZZQHr@JEJC`ApCCNhClG~BlFHFF@BDAJ@JdCrF,-46.6888,-23.56799,-46.69571,-23.57371


group_by: one grouping variable (trip_id)

mutate (grouped): new variable 'alt' (integer) with 3 unique values and 0% NA

ungroup: no grouping variables

mutate: new variable 'tmp_id' (character) with 196,555 unique values and 0% NA



tmp_id,trip_id,alt,qgis_id.x,qgis_id.y,distance,weight,time,speed,vg_contramao,⋯,vg_parques,dist_total,dist_reta,dist_linha,detour_mm,poly,lon.x,lat.x,lon.y,lat.y
<chr>,<chr>,<int>,<chr>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>,<chr>,⋯,<chr>,<dbl>,<dbl>,<dbl>,<dbl>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>
000135_00_1,000135_00,1,271157,104168,779.082,252.2742,252.275,11.117611,não,⋯,não,821.4461,562.5676,802.6903,1.426834,jgznCvic|G|@gENYROdNtb@,-46.7166,-23.56869,-46.72109,-23.57161
000138_00_1,000138_00,1,161929,161977,1569.142,476.926,476.628,11.851824,não,⋯,não,1585.3999,1127.1086,1559.4857,1.383616,`u{nCtu}{GGMsNjHsMnHHr@JEJC`ApCCNhClG~BlFHFF@BDAJ@JnEzJ`@dAH^A\Sx@iBrBy@dAMPEJ,-46.68779,-23.57601,-46.69842,-23.57327
000138_00_2,000138_00,2,161929,161977,1531.061,485.7508,483.74,11.394178,não,⋯,não,1585.3999,1127.1086,1559.4857,1.383616,`u{nCtu}{GFCZx@Nr@iAl@{BlAtElKdC`FlEhKZv@?`@uHtDuDtB_CdBq@h@_Az@_AdAiBrBy@dAMPEJ,-46.68779,-23.57601,-46.69842,-23.57327
000139_00_1,000139_00,1,31336,143030,1458.244,552.7571,552.576,9.500374,sim,⋯,não,1846.2487,1108.0927,1791.8481,1.617056,bb{nCtw_|GCHM[QoAMsAK?iAH_A@QIIKW}ECWWqEA[Ag@m@{IU_HAcADw@KDIs@E[IFQHYNa@T_B|@yC{GiBmE{C~AOy@,-46.69835,-23.57297,-46.68893,-23.56802
000139_00_2,000139_00,2,31336,143030,1599.44,555.3088,554.334,10.387211,sim,⋯,não,1846.2487,1108.0927,1791.8481,1.617056,bb{nCtw_|GCHM[QoAMsAK?iAH_A@QIIKW}ECWWqEA[Kg@I}@Y{Ds@yLQaBUeA_AaC}AoDIUQy@]gAiAmC]XDJ`AxBqH|DOy@,-46.69835,-23.57297,-46.68893,-23.56802
000140_00_1,000140_00,1,143030,255789,1223.188,413.8767,397.798,11.06963,sim,⋯,não,1190.0806,950.4632,1125.3632,1.184015,|bznC`|}{GKk@FQDAp@c@rBuANSt@e@LIFFFENXrBhFdBxDx@dBXv@FVDZZQHr@JEJC`ApCCNhClG~BlFHFF@BDAJ@JdCrF,-46.6888,-23.56799,-46.69571,-23.57371


In [26]:
# suppressPackageStartupMessages(library('tidylog'))

# # Listar todos os arquivos de resultados em um dataframe único
# arqs_resultados <- data.frame(arq = list.files(pasta_rotas_modalc, recursive = FALSE, full.names = TRUE))
# arqs_resultados <- arqs_resultados %>% mutate(tmp_id = str_sub(arq, -24, -14))
# # head(arqs_resultados)

# # Remover arquivos que já foram executados
# rotas_m <- rotas_m %>% filter(!tmp_id %in% arqs_resultados$tmp_id)
# rm(arqs_resultados)
# head(rotas_m)

mutate: new variable 'tmp_id' (character) with 196,554 unique values and 0% NA

filter: removed 5 rows (83%), one row remaining



tmp_id,trip_id,alt,qgis_id.x,qgis_id.y,distance,weight,time,speed,vg_contramao,⋯,vg_parques,dist_total,dist_reta,dist_linha,detour_mm,poly,lon.x,lat.x,lon.y,lat.y
<chr>,<chr>,<int>,<chr>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>,<chr>,⋯,<chr>,<dbl>,<dbl>,<dbl>,<dbl>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>
323082_00_1,323082_00,1,71935,125019,3734.246,1174.126,1173.754,11.45324,não,⋯,não,3491.539,2466.613,3397.031,1.377205,~rznCji~{GkAp@g@XkB`AGN?PzDqBrBkAh@YrMoHrNkH~CaB|HkEjDgB~CqAnHgDlAo@CYh@IR?VNzFmBlGcBjBc@~@c@H@FJzAe@bM}BhJeBvKyBDPrAUbDpQ}@R}Ct@aDr@dApF,-46.69094,-23.57056,-46.68561,-23.59217


In [25]:
# Inserir cálculos de extensões percorridas em vias comuns ou infra cicloviária
# para cada uma das rotas calculadas
detach("package:tidylog")
# for (tmpid in rotas_m$tmp_id) { 
#   calcular_dist_ciclo(tmpid) 
#  }

# Rodar função para todos os arquivos- multi thread (Jupyter)
(start = Sys.time())
future::plan(future::multicore)
invisible(future.apply::future_lapply(X   = rotas_m$tmp_id, 
                                      FUN = calcular_dist_ciclo,
                                      future.seed = TRUE))
Sys.time()
Sys.time() - start

[1] "2024-05-01 12:33:05 -03"

“Unnamed `col_types` should have the same length as `col_names`. Using smaller of the two.”


ERROR: Error: Can't subset columns that don't exist.
[31m✖[39m Column `trip_id` doesn't exist.


In [31]:
# ------------------------------------------------------------------------------
# Juntar todos os resultados
# ------------------------------------------------------------------------------

# Arquivo de saída
out_file <- sprintf('%s/02_ttmatrix_rotas_modeladas_alternativas_acuracia_infraciclo_carac_viagens.csv', pasta_orig_modalt)

# Listar todos os arquivos de resultados em um dataframe único
arqs_resultados <- data.frame(arq = list.files(pasta_rotas_modalc, recursive = FALSE, full.names = TRUE))

# Resultados já vão estar ordenados conforme o nome, o que significa 
# que já estarão ordenados com relação ao trip_id e à coluna alt
for (arq in arqs_resultados$arq) {
  # Abrir arquivo de resultados
  arq <- read_delim(arq, delim = ';', col_types = cols(.default = "c"))
  
  # Guardar resultados 
  if (file.exists(out_file)) {
    write_delim(arq, out_file, delim = ';', append = TRUE)
  } else {
    write_delim(arq, out_file, delim = ';', append = FALSE)
  }
  
}