## Gera tabela que agrupa a lentidao por data e corredor

Cria tabela "lentidao_por_data_e_corredor"

### Importando as bibliotecas

In [1]:
import pandas as pd
import os
import numpy as np
arcpy.env.overwriteOutput = True

### Abrindo dados de lentidão da CET

In [2]:
lentidao_cet = pd.read_csv(r"D:\Trabalho\faculdade\TCC\dados\lentidao\baixados\lentidaotrechos2019.csv",sep=';',encoding='latin-1')[['data','corredor','tamanho']]
lentidao_cet['corredor'] = lentidao_cet['corredor'].str.strip()
lentidao_cet.head(3)

Unnamed: 0,data,corredor,tamanho
0,1/1/19 19:30,Marginal Pinheiros,3592
1,1/1/19 19:30,Marginal Pinheiros,1567
2,1/1/19 20:00,Marginal Pinheiros,2101


### Agrupando os dados

In [5]:
#Agrupando os dados de lentidao por data e corredor
correspondencia_lentidao = pd.read_csv(r"D:\Trabalho\faculdade\TCC\outputs\preprocessamento\georreferenciamento\correspondencia_lentidao_e_classeiviariacet_mod.txt", sep=',').drop_duplicates(subset='vias_correspondentes',keep='first')
lentidao_por_data_e_corredor = pd.merge(lentidao_cet,correspondencia_lentidao,on='corredor')
lentidao_cet_groupby_data_e_corredor = lentidao_por_data_e_corredor.groupby(['data','corredor','vias_correspondentes']).agg('sum').reset_index().drop('corredor_id',axis=1)
#lentidao_cet_groupby_data_e_corredor.to_csv(r"D:\Trabalho\faculdade\TCC\outputs\preprocessamento\georreferenciamento\lentidao_por_data_e_corredor.csv")
lentidao_cet_groupby_data_e_corredor.head(5)

Unnamed: 0,data,corredor,vias_correspondentes,tamanho
0,1/1/19 19:30,Marginal Pinheiros,AV ALCIDES SANGIRARDI,5159
1,1/1/19 19:30,Marginal Pinheiros,AV DAS NACOES UNIDAS,5159
2,1/1/19 19:30,Marginal Pinheiros,AV DRA RUTH CARDOSO,5159
3,1/1/19 19:30,Marginal Pinheiros,AV ENG BILLINGS,5159
4,1/1/19 19:30,Marginal Pinheiros,AV GUIDO CALOI,5159


## Cria shp com arruamento válido

Cria tabela "arruamento_valido", com ruas que estão presentes tanto no shp de arruamento da CET quanto na base de lentidão

### Abrindo dados de correspondencia entre corredores de lentidão e shp de arruamento da CET

In [24]:
#Abrindo dados da correspondencia entre oc corredores de lentidao e as ruas da CET
correspondencia_corredores = pd.read_csv(r"D:\Trabalho\faculdade\TCC\outputs\preprocessamento\georreferenciamento\correspondencia_lentidao_e_classeiviariacet_mod.txt", sep=',').drop_duplicates(subset='vias_correspondentes',keep='first')
correspondencia_corredores.head(3)

Unnamed: 0,corredor_id,corredor,vias_correspondentes
0,0,Marginal Pinheiros,AV MARGINAL PINHEIROS
1,0,Marginal Pinheiros,AV ENG BILLINGS
2,0,Marginal Pinheiros,AV ALCIDES SANGIRARDI


### Definindo variáveis importantes

In [3]:
outputs_gdb = r'D:\Trabalho\faculdade\TCC\gis\outputs.gdb'
arruamento_gdb = r'D:\Trabalho\faculdade\TCC\gis\arruamento.gdb'
processamento_gdb = r'D:\Trabalho\faculdade\TCC\gis\Analise.gdb'
chuva_gdb = r'D:\Trabalho\faculdade\TCC\gis\rain.gdb'
alagamentos_gdb = r'D:\Trabalho\faculdade\TCC\gis\alagamentos.gdb'
preprocessamento_dir = r'D:\Trabalho\faculdade\TCC\outputs\preprocessamento\georreferenciamento'

### Gerando shp com as ruas validas 

In [None]:
#Cria cópia do shp de arruamento da CET
shp_arruamento_cet = arcpy.management.CopyFeatures(os.path.join(arruamento_gdb, "ruas_cet_sp"), os.path.join(processamento_gdb, "ruas_cet_sp_CopyFeatures"), '', None, None, None)
#Faz um dissolve do shp de arruamento da CET, para juntar ruas em apenas uma feature
shp_arruamento_cet = arcpy.management.Dissolve(shp_arruamento_cet, os.path.join(processamento_gdb, "arruamento_valido_tmp"), "cvc_nomelg", None, "MULTI_PART", "DISSOLVE_LINES")

#Função que remove os espaços em branco de uma string
def remove_espacos_em_branco(string):
    return ' '.join([x for x in string.split(' ') if len(x)>0])

#Obtendo os nomes unicos de vias em que houve correspondecia entre o shp de arruamento e os dados de lentidão
vias_nomes_unicos = list(correspondencia_corredores['vias_correspondentes'].unique())
#Varrendo as linhas do shp de arruamento da CET
with arcpy.da.UpdateCursor(shp_arruamento_cet,['cvc_nomelg'] ) as cursor:
    for row in cursor:
        row[0] = remove_espacos_em_branco(row[0])
        #Se a via atual não é uma via em que houve match com os dados de lentidão, delete.
        if row[0] not in vias_nomes_unicos:
            cursor.deleteRow()
        else:
            #corrigindo o nome do campo
            cursor.updateRow(row)
del row
#Altera o nome das colunas do shp de ruas válidas 
arcpy.management.AlterField(shp_arruamento_cet, "cvc_nomelg", "via_cet", "via (CET)", "TEXT", 180, "NULLABLE", "DO_NOT_CLEAR")
# "copia" o shp de arruamento válido, para que o *OBJECTID seja restaurado, e assim seja possível realizar o join one to many. Nesse caso, copiei
#Tanto para a gdb de processamento quanto para a de output. APararentemente o add join one to many so funciona quando as 2 tabelas estao na mesma gdb
arcpy.conversion.FeatureClassToFeatureClass(shp_arruamento_cet, outputs_gdb, "arruamento_valido", '', 'via_cet "via (CET)" true true false 180 Text 0 0,First,#,arruamento_valido,via_cet,0,180;Shape_Length "Shape_Length" false true true 8 Double 0 0,First,#,arruamento_valido,Shape_Length,-1,-1', '')
arruamento_valido_tmp = arcpy.conversion.FeatureClassToFeatureClass(shp_arruamento_cet, processamento_gdb, "arruamento_valido", '', 'via_cet "via (CET)" true true false 180 Text 0 0,First,#,arruamento_valido,via_cet,0,180;Shape_Length "Shape_Length" false true true 8 Double 0 0,First,#,arruamento_valido,Shape_Length,-1,-1', '')

### Juntando o shp de arruamento da CET com os dados de lentidão

In [5]:
#Exporta o csv de lentidao_por_data_e_corredor como uma tabela do ArcGIS para que o join possa ser feito
tabela_lentidao_por_data_e_corredor = arcpy.conversion.TableToTable(os.path.join(preprocessamento_dir,"lentidao_por_data_e_corredor.csv"),processamento_gdb , "lentidao_por_data_e_corredor_tmp", '', 'data "data" true true false 8 Date 0 0,First,#,lentidao_por_data_e_corredor.csv,data,-1,-1;corredor "corredor" true true false 8000 Text 0 0,First,#,lentidao_por_data_e_corredor.csv,corredor,0,8000;via_cet "via (CET)" true true false 8000 Text 0 0,First,#,lentidao_por_data_e_corredor.csv,vias_correspondentes,0,8000;lentidao "lentidao" true true false 4 Long 0 0,First,#,lentidao_por_data_e_corredor.csv,tamanho,-1,-1', '')
#Faz um join (temporario) entre o shp de arruamento valido e os dados de lentidão por data e corredor
arcpy.management.AddJoin(arruamento_valido_tmp, "via_cet", tabela_lentidao_por_data_e_corredor, "via_cet", "KEEP_COMMON", "NO_INDEX_JOIN_FIELDS")
#Copiando a feature para fazer com que o join seja permanente
ruas_validas_join_lentidao = arcpy.management.CopyFeatures(arruamento_valido_tmp,os.path.join(processamento_gdb, 'join_lentidao_tmp'), '', None, None, None)
#Dissolvendo o shp com base no corredor (de lentidao). Nesse processo, calculo a lentidao media.
arruamento_valido_e_lentidao = arcpy.analysis.PairwiseDissolve(ruas_validas_join_lentidao,  os.path.join(outputs_gdb, "arruamento_valido_e_lentidao"), "lentidao_por_data_e_corredor_tmp_corredor;lentidao_por_data_e_corredor_tmp_data", "lentidao_por_data_e_corredor_tmp_lentidao MEAN", "MULTI_PART")
#Alterando os nomes da coluna de lentidao
arcpy.management.AlterField("arruamento_v_join_lent_Dissolve", "MEAN_lentidao_por_data_e_corredor_tmp_lentidao", '', "lentidao", "TEXT", 8000, "NULLABLE", "DO_NOT_CLEAR")
#Alterando os nomes da coluna de data

ExecuteError: Failed to execute. Parameters are not valid.
ERROR 000728: Field lentidao_por_data_e_corredor_tmp_data does not exist within table
ERROR 000369: Invalid input field(s)
Failed to execute (PairwiseDissolve).


### Adicionando dados de chuva (radar)

In [None]:
shp_arruamento_valido_e_lentidao = os.path.join(outputs_gdb, 'arruamento_valido_e_lentidao')
shp_chuva_radar = os.path.join(chuva_gdb, 'rain_radar_2019')

#Faz o join da chuva com lentidao com base na distancia e horario
arruamento_lentidao_chuva = arcpy.gapro.JoinFeatures(shp_arruamento_valido_e_lentidao, shp_chuva_radar, os.path.join(processamento_gdb, "arruamento_valido_lentidao_chuva"), "JOIN_ONE_TO_MANY", "NEAR", "1 Kilometers", "NEAR_AFTER", "3 Hours", None, None, '', None)
#Remove colunas desnecessárias
arcpy.management.DeleteField(arruamento_lentidao_chuva, "OBJECTID;pointid;DATE1;join_OBJECTID", "DELETE_FIELDS")

#Mudando o nome de algumas colunas
arcpy.management.AlterField(arruamento_lentidao_chuva, "lentidao_por_data_e_corredor_tmp_data", "data_medicao", "data medicao", "DATE", 8, "NULLABLE", "DO_NOT_CLEAR")
arcpy.management.AlterField(arruamento_lentidao_chuva, "lentidao_por_data_e_corredor_tmp_corredor", "corredor", "corredor", "TEXT", 10485758, "NULLABLE", "DO_NOT_CLEAR")
arcpy.management.AlterField(arruamento_lentidao_chuva, "data", "data_chuva", "data chuva", "DATE", 8, "NULLABLE", "DO_NOT_CLEAR")

#Dissolvendo com base no corredor e na data da medição da lentidão
arruamento_lentidao_chuva_dissolve = arcpy.analysis.PairwiseDissolve(arruamento_lentidao_chuva, os.path.join(outputs_gdb, 'join_chuva'), "corredor;data_lentidao", "lentidao MEAN;precipitacao SUM", "MULTI_PART")
#mudando nome de algumas colunas
arcpy.management.AlterField(arruamento_lentidao_chuva_dissolve, "MEAN_lentidao", "lentidao", "lentidao", "DOUBLE", 8, "NULLABLE", "DO_NOT_CLEAR")
arcpy.management.AlterField(arruamento_lentidao_chuva_dissolve, "SUM_precipitacao", "precipitacao", "precipitacao", "DOUBLE", 8, "NULLABLE", "DO_NOT_CLEAR")

### Adicionando dados de alagamento 

#### Gerando shape de alagamentos 2019

In [None]:
alagamentos_2019_csv = os.path.join(r'D:\Trabalho\faculdade\TCC\dados\alagamentos\2019','ocorrencias_2019.csv')
#Criando fc a patir do csv
alagamentos_2019_tmp = arcpy.management.XYTableToPoint(alagamentos_2019_csv, os.path.join(processamento_gdb, 'alagamentos_2019_tmp'), "LONG,N,16,6", "LAT,N,16,6", None, 'GEOGCS["GCS_WGS_1984",DATUM["D_WGS_1984",SPHEROID["WGS_1984",6378137.0,298.257223563]],PRIMEM["Greenwich",0.0],UNIT["Degree",0.0174532925199433]];-400 -400 1000000000;-100000 10000;-100000 10000;8.98315284119521E-09;0.001;0.001;IsHighPrecision')

#Alterando o nome de algumas colunas
arcpy.management.AlterField(alagamentos_2019_tmp, "DATA_D", "dia", "dia", "DATE", 8, "NULLABLE", "DO_NOT_CLEAR")
arcpy.management.AlterField(alagamentos_2019_tmp, "H_INICIO_C_254", "hora_inicio", "hora inicio", "TEXT", 8000, "NULLABLE", "DO_NOT_CLEAR")
arcpy.management.AlterField(alagamentos_2019_tmp, "H_FIM_C_254", "hora_fim", "hora fim", "TEXT", 8000, "NULLABLE", "DO_NOT_CLEAR")
arcpy.management.AlterField(alagamentos_2019_tmp, "DUR_H_N_7_2", "duracao", "duracao", "DOUBLE", 8, "NULLABLE", "DO_NOT_CLEAR")
#Criando colunas de data de inicio e fim
arcpy.management.AddField(alagamentos_2019_tmp, "data_inicio", "DATE", None, None, None, "data inicio", "NULLABLE", "NON_REQUIRED", '')
arcpy.management.AddField(alagamentos_2019_tmp, "data_fim", "DATE", None, None, None, "data fim", "NULLABLE", "NON_REQUIRED", '')

#Populando os campos de data de inicio e fim
with arcpy.da.UpdateCursor('ocorrencias_2019_tmp',['dia','hora_inicio','hora_fim','data_inicio','data_fim']) as cursor:
    for row in cursor:
        ano = row[0].year
        mes = row[0].month
        dia = row[0].day
        hora_inicio = row[1]
        hora_fim = row[2]
        data_inicio = f'{dia}/{mes}/{ano} {hora_inicio}'
        data_fim = f'{dia}/{mes}/{ano} {hora_fim}'
        if None in [ano,mes,dia,hora_inicio,hora_fim]:
            row[3] = None
            row[4] = None
        else:
        #Atualizando as colunas
            row[3] = data_inicio
            row[4] = data_fim
            cursor.updateRow(row)
            
#Reprojetando
alagamentos_2019_tmp_proj = arcpy.management.Project(alagamentos_2019_tmp, 'alagamentos_2019_tmp_project', 'PROJCS["SIRGAS_2000_UTM_Zone_23S",GEOGCS["GCS_SIRGAS_2000",DATUM["D_SIRGAS_2000",SPHEROID["GRS_1980",6378137.0,298.257222101]],PRIMEM["Greenwich",0.0],UNIT["Degree",0.0174532925199433]],PROJECTION["Transverse_Mercator"],PARAMETER["False_Easting",500000.0],PARAMETER["False_Northing",10000000.0],PARAMETER["Central_Meridian",-45.0],PARAMETER["Scale_Factor",0.9996],PARAMETER["Latitude_Of_Origin",0.0],UNIT["Meter",1.0]]', "SIRGAS_2000_To_WGS_1984_1", 'GEOGCS["GCS_WGS_1984",DATUM["D_WGS_1984",SPHEROID["WGS_1984",6378137.0,298.257223563]],PRIMEM["Greenwich",0.0],UNIT["Degree",0.0174532925199433]]', "NO_PRESERVE_SHAPE", None, "NO_VERTICAL")
#Exportando apenas as colunas necessárias
alagamentos_2019 = arcpy.conversion.FeatureClassToFeatureClass(alagamentos_2019_tmp_proj, r"D:\Trabalho\faculdade\TCC\gis\alagamentos.gdb", "alagamentos_2019", '', f'data_inicio "data inicio" true true false 8 Date 0 0,First,#,{alagamentos_2019_tmp_proj},data_inicio,-1,-1;data_fim "data fim" true true false 8 Date 0 0,First,#,{alagamentos_2019_tmp_proj},data_fim,-1,-1;duracao "duracao" true true false 8 Double 0 0,First,#,{alagamentos_2019_tmp_proj},duracao,-1,-1', '')

#### Juntando shape de alagementos 2019 com shape de lentidao

In [None]:
#Fazendo join dos dados de lentidao com os de alagamento
join_alagamentos_tmp = arcpy.gapro.JoinFeatures(os.path.join(processamento_gdb,"arruamento_valido_e_lentidao"), alagamentos_2019,os.path.join(outputs_gdb,'join_alagamentos'), "JOIN_ONE_TO_MANY", "NEAR", "500 Meters", "DURING", None, None, None, '', None)

#Inserindo campo de duracao do alagamento ate a data da medicao da lentidao
arcpy.management.AddField(join_alagamentos_tmp, "duracao_alagamento", "FLOAT", None, None, None, "duracao alagamento", "NULLABLE", "NON_REQUIRED", '')

#Populando o campo de duracao do alagamento

with arcpy.da.UpdateCursor(join_alagamentos_tmp, ['data_inicio','DATE','duracao_alagamento']) as cursor:
    for row in cursor:
        data_inicio_alagamento = row[0]
        data_medicao_lentidao = row[1]
        #tempo alagado ate a data da medição da lentidao
        duracao = (data_medicao_lentidao - data_inicio_alagamento)
        dias, segundos = duracao.days, duracao.seconds
        horas = dias * 24 + segundos // 3600
        minutos = (segundos % 3600) // 60
        duracao_alagamento = round(horas + minutos/60, 3)
        row[2] = duracao_alagamento
        cursor.updateRow(row)

#Dissolvendo com base na data de medição de lentidão e no corredor
join_alagamentos = arcpy.analysis.PairwiseDissolve(join_alagamentos_tmp, os.path.join(outputs_gdb,'join_alagamentos'), "DATE;lentidao_por_data_e_corredor_tmp_corredor", "lentidao MEAN;duracao_alagamento SUM;OBJECTID1 COUNT", "MULTI_PART")

#Alterando os nomes das colunas
arcpy.management.AlterField(join_alagamentos, "DATE", "data_medicao", "data medicao", "DATE", 8, "NULLABLE", "DO_NOT_CLEAR")
arcpy.management.AlterField(join_alagamentos, "MEAN_lentidao", "lentidao", "lentidao", "DOUBLE", 8, "NULLABLE", "DO_NOT_CLEAR")
arcpy.management.AlterField(join_alagamentos, "SUM_duracao_alagamento", "soma_duracoes_alagamentos", "soma duracoes alagementos", "DOUBLE", 8, "NULLABLE", "DO_NOT_CLEAR")
arcpy.management.AlterField(join_alagamentos, "COUNT_OBJECTID1", "quantidade_alagamentos", "quantidade alagamentos", "LONG", 4, "NULLABLE", "DO_NOT_CLEAR")

### Fazer um join do shape e os dados de lentidao 2019, como base na distancia enter o ponto de alagamento e o corredor (300m) e o horário do alagamento e medição da lentidão

### Adicionando dados de acidente

#### Gerando e limpando dado

In [2]:
import datetime

#Gerando shp a partir do csv de acidentes
acidentes_csv = r"D:\Trabalho\faculdade\TCC\dados\acidentes\acidentes_2014a2021.csv"
shp_acidentes = arcpy.management.XYTableToPoint(acidentes_csv, os.path.join(processamento_gdb,'acidentes_tmp'), "LONG_(GEO)", "LAT_(GEO)", None, 'GEOGCS["GCS_WGS_1984",DATUM["D_WGS_1984",SPHEROID["WGS_1984",6378137.0,298.257223563]],PRIMEM["Greenwich",0.0],UNIT["Degree",0.0174532925199433]];-400 -400 1000000000;-100000 10000;-100000 10000;8.98315284119521E-09;0.001;0.001;IsHighPrecision')

#Adicionando campo vazio de data
arcpy.management.AddField(shp_acidentes, "data", "DATE", None, None, None, '', "NULLABLE", "NON_REQUIRED", '')
with arcpy.da.UpdateCursor(shp_acidentes,['Data_do_Acidente', 'Hora_do_Acidente', 'data_acidente']) as cursor:
    for row in cursor:
        dia = row[0]
        hora = row[1]
        if not hora:
            row[2] = None
        else:
            row[2] = f'{dia.strftime(r"%d/%m/%Y")} {hora[:5]}'
        
        cursor.updateRow(row)
#Removendo colunas desnecessárias
arcpy.management.DeleteField(shp_acidentes, "Field1;Administração;Jurisdição;Logradouro;Mês_do_Acidente;Hora_do_Acidente;ID;Município;Região_Administrativa;Dia_do_Acidente;Turno;Ano_do_Acidente;Ano_Mês_do_Acidente;Conservação;Data_do_Acidente;Iluminação;Superfície_da_via;Tipo_de_pista;LAT__GEO_;LONG__GEO_", "DELETE_FIELDS")
#Projetando e salvando na pasta correta
arcpy.management.Project(shp_acidentes, os.path.join(acidentes_gdb,'acidentes'), 'PROJCS["SIRGAS_2000_UTM_Zone_23S",GEOGCS["GCS_SIRGAS_2000",DATUM["D_SIRGAS_2000",SPHEROID["GRS_1980",6378137.0,298.257222101]],PRIMEM["Greenwich",0.0],UNIT["Degree",0.0174532925199433]],PROJECTION["Transverse_Mercator"],PARAMETER["False_Easting",500000.0],PARAMETER["False_Northing",10000000.0],PARAMETER["Central_Meridian",-45.0],PARAMETER["Scale_Factor",0.9996],PARAMETER["Latitude_Of_Origin",0.0],UNIT["Meter",1.0]]', "SIRGAS_2000_To_WGS_1984_1", 'GEOGCS["GCS_WGS_1984",DATUM["D_WGS_1984",SPHEROID["WGS_1984",6378137.0,298.257223563]],PRIMEM["Greenwich",0.0],UNIT["Degree",0.0174532925199433]]', "NO_PRESERVE_SHAPE", None, "NO_VERTICAL")

#### Juntando com dado de lentidao

In [None]:
join_acidentes_tmp = arcpy.gapro.JoinFeatures(os.path.join(outputs_gdb,'arruamento_valid_e_lentidao'), os.path.join(acidentes_gdb,'acidentes'), os.path.join(processamento_gdb,'join_acidentes_tmp'), "JOIN_ONE_TO_MANY", "NEAR", "300 Meters", "NEAR_AFTER", "1 Hours", None, None, '', None)
#Dissolvendo com base na data de medição da lentidao e corredor 
join_acidentes = arcpy.analysis.PairwiseDissolve(join_acidentes_tmp, os.path.join(outputs_gdb,'join_acidentes'), "lentidao_por_data_e_corredor_tmp_data;lentidao_por_data_e_corredor_tmp_corredor", "lentidao MEAN;OBJECTID1 COUNT", "MULTI_PART")

#ALterando nome das colunas
arcpy.management.AlterField(join_alagamentos, "MEAN_lentidao", "lentidao", "lentidao", "DOUBLE", 8, "NULLABLE", "DO_NOT_CLEAR")
arcpy.management.AlterField(join_alagamentos, "COUNT_OBJECTID1", "quantidade_acidentes", "quantidade acidentes", "LONG", 4, "NULLABLE", "DO_NOT_CLEAR")