# Análise dos coeficientes retornados pelo modelo

In [108]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import warnings
warnings.filterwarnings('ignore')
pd.set_option('display.max_columns', None)
import os

pasta_dados = '../dados/'
pasta_resultados = './resultados_modelo/'

df_resultados_mortes = pd.read_csv(os.path.join(pasta_resultados, 'geral_total_mortes.csv'))
df_resultados_feridos = pd.read_csv(os.path.join(pasta_resultados, 'geral_total_feridos.csv'))

In [109]:
def processa_resultados(df_resultados_parametro):
    """
    Processa o DataFrame de resultados dos coeficientes do modelo, separando-os em
    resultados válidos e não válidos, de acordo com o p-valor,
    e ainda divide os resultados válidos em negativos e positivos, de acordo com o coeficiente.
    Parâmetros:
    df_resultados (pd.DataFrame): DataFrame contendo os resultados a serem processados.

    Retorna:
    df_resultados_validos_negativos (pd.DataFrame): DataFrame contendo os resultados válidos e negativos.
    df_resultados_validos_positivos (pd.DataFrame): DataFrame contendo os resultados válidos e positivos.
    df_resultados_nao_validos (pd.DataFrame): DataFrame contendo os resultados não válidos.
    """
    df_resultados = df_resultados_parametro.copy()
    df_resultados[df_resultados.columns[1:]] = df_resultados[df_resultados.columns[1:]].apply(pd.to_numeric)
    df_resultados.set_index(df_resultados.columns[0], inplace=True)
    
    # ordena resultados de acordo com o impacto - os que precisam de menos investimento para efeito
    coluna_investimento_impacto = 'Investimento para 1 de impacto'
    df_resultados[coluna_investimento_impacto] = 1/df_resultados['Parameter']
    df_resultados = df_resultados.reindex(df_resultados[coluna_investimento_impacto].abs().sort_values().index)

    df_resultados_nao_validos = df_resultados[df_resultados['P-value'] > 0.05]
    df_resultados_validos = df_resultados[df_resultados['P-value'] < 0.05]
    df_resultados_validos_negativos = df_resultados_validos[df_resultados_validos['Parameter'] < 0]
    df_resultados_validos_positivos = df_resultados_validos[df_resultados_validos['Parameter'] >= 0]
    return df_resultados_validos_negativos, df_resultados_validos_positivos, df_resultados_nao_validos

In [110]:
df_resultados_mortes_validos_negativos, df_resultados_mortes_validos_positivos, df_resultados_mortes_nao_validos = processa_resultados(df_resultados_mortes)
df_resultados_feridos_validos_negativos, df_resultados_feridos_validos_positivos, df_resultados_feridos_nao_validos = processa_resultados(df_resultados_feridos)

## Mortes

In [111]:
df_resultados_mortes_validos_negativos

Unnamed: 0_level_0,Parameter,Std. Err.,T-stat,P-value,Lower CI,Upper CI,Investimento para 1 de impacto
total_mortes,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
vlr_investimento_per_capita,-0.0175,0.0018,-9.5369,0.0,-0.0211,-0.0139,-57.14286
aux_emp_refrota_vlr_investimento,-3.343e-06,1.483e-07,-22.552,0.0,-3.634e-06,-3.053e-06,-299132.5
aux_emp_ciclovia_vlr_investimento,-4.824e-07,7.864e-08,-6.1335,0.0,-6.365e-07,-3.282e-07,-2072968.0
aux_emp_drenagem_vlr_investimento,-1.927e-07,4.555e-08,-4.2298,0.0,-2.82e-07,-1.034e-07,-5189414.0
aux_emp_metro_vlr_investimento,-1.105e-08,2.308e-09,-4.7878,0.0,-1.557e-08,-6.526e-09,-90497740.0


In [112]:
df_resultados_mortes_validos_positivos

Unnamed: 0_level_0,Parameter,Std. Err.,T-stat,P-value,Lower CI,Upper CI,Investimento para 1 de impacto
total_mortes,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
const,8.5601,0.2869,29.836,0.0,7.9978,9.1225,0.1168211
aux_emp_sarjeta_vlr_investimento,1.675e-06,4.064e-07,4.1224,0.0,8.788e-07,2.472e-06,597014.9
aux_emp_terminal_vlr_investimento,6.067e-07,3.505e-08,17.311,0.0,5.38e-07,6.754e-07,1648261.0
aux_emp_ponte_vlr_investimento,4.748e-07,6.355e-08,7.4715,0.0,3.502e-07,5.994e-07,2106150.0
aux_emp_pavimentacao_vlr_investimento,4.396e-07,2.381e-08,18.465,0.0,3.929e-07,4.862e-07,2274795.0
aux_emp_aeroporto_vlr_investimento,2.092e-07,9.489e-09,22.052,0.0,1.906e-07,2.278e-07,4780115.0
aux_emp_ferrovia_vlr_investimento,1.648e-07,4.269e-09,38.599,0.0,1.564e-07,1.732e-07,6067961.0
aux_emp_rapido_vlr_investimento,1.591e-07,9.196e-09,17.301,0.0,1.411e-07,1.771e-07,6285355.0
aux_emp_onibus_vlr_investimento,1.532e-07,1.841e-08,8.32,0.0,1.171e-07,1.893e-07,6527415.0
aux_emp_calcadas_vlr_investimento,5.882e-08,2.069e-08,2.8424,0.0045,1.826e-08,9.939e-08,17001020.0


In [113]:
df_resultados_mortes_nao_validos

Unnamed: 0_level_0,Parameter,Std. Err.,T-stat,P-value,Lower CI,Upper CI,Investimento para 1 de impacto
total_mortes,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
aux_emp_parque_vlr_investimento,8.843e-07,7.077e-07,1.2495,0.2115,-5.029e-07,2.271e-06,1130838.0
aux_emp_asfalto_vlr_investimento,2.945e-07,1.582e-07,1.861,0.0628,-1.568e-08,6.047e-07,3395586.0
aux_emp_sinalizacao_vlr_investimento,1.813e-07,9.83e-08,1.8446,0.0651,-1.135e-08,3.74e-07,5515720.0
aux_emp_praca_vlr_investimento,1.761e-07,1.502e-07,1.1726,0.241,-1.182e-07,4.704e-07,5678592.0
aux_emp_calcamento_vlr_investimento,1.734e-07,6.516e-07,0.2661,0.7902,-1.104e-06,1.451e-06,5767013.0
aux_emp_revitalizacao_vlr_investimento,1.395e-07,2.067e-07,0.675,0.4997,-2.657e-07,5.447e-07,7168459.0
aux_emp_recapeamento_vlr_investimento,1.116e-07,8.659e-08,1.2886,0.1976,-5.815e-08,2.813e-07,8960573.0
aux_emp_vlt_vlr_investimento,2.114e-08,1.092e-08,1.9357,0.0529,-2.658e-10,4.254e-08,47303690.0


## Feridos

In [114]:
df_resultados_feridos_validos_negativos

Unnamed: 0_level_0,Parameter,Std. Err.,T-stat,P-value,Lower CI,Upper CI,Investimento para 1 de impacto
total_feridos,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
vlr_investimento_per_capita,-0.1249,0.0135,-9.2316,0.0,-0.1515,-0.0984,-8.006405
aux_emp_drenagem_vlr_investimento,-2.008e-06,3.243e-07,-6.1927,0.0,-2.644e-06,-1.373e-06,-498008.0
aux_emp_ciclovia_vlr_investimento,-1.726e-06,5.596e-07,-3.0849,0.002,-2.823e-06,-6.294e-07,-579374.3
aux_emp_calcadas_vlr_investimento,-6.138e-07,1.471e-07,-4.1726,0.0,-9.022e-07,-3.255e-07,-1629195.0


In [115]:
df_resultados_feridos_validos_positivos

Unnamed: 0_level_0,Parameter,Std. Err.,T-stat,P-value,Lower CI,Upper CI,Investimento para 1 de impacto
total_feridos,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
const,41.074,2.6523,15.486,0.0,35.875,46.273,0.0243463
aux_emp_revitalizacao_vlr_investimento,1.44e-05,1.47e-06,9.7991,0.0,1.152e-05,1.728e-05,69444.44
aux_emp_sarjeta_vlr_investimento,7.2e-06,2.965e-06,2.4282,0.0152,1.388e-06,1.301e-05,138888.9
aux_emp_recapeamento_vlr_investimento,3.116e-06,6.187e-07,5.0364,0.0,1.903e-06,4.329e-06,320924.3
aux_emp_ponte_vlr_investimento,2.569e-06,4.517e-07,5.688,0.0,1.684e-06,3.455e-06,389256.5
aux_emp_sinalizacao_vlr_investimento,1.979e-06,7.004e-07,2.8248,0.0047,6.057e-07,3.352e-06,505305.7
aux_emp_terminal_vlr_investimento,1.857e-06,2.498e-07,7.4318,0.0,1.367e-06,2.347e-06,538503.0
aux_emp_pavimentacao_vlr_investimento,1.656e-06,1.695e-07,9.7702,0.0,1.324e-06,1.988e-06,603864.7
aux_emp_ferrovia_vlr_investimento,6.628e-07,3.044e-08,21.774,0.0,6.031e-07,7.225e-07,1508751.0
aux_emp_vlt_vlr_investimento,6.493e-07,7.773e-08,8.3533,0.0,4.969e-07,8.016e-07,1540120.0


In [116]:
df_resultados_feridos_nao_validos 

Unnamed: 0_level_0,Parameter,Std. Err.,T-stat,P-value,Lower CI,Upper CI,Investimento para 1 de impacto
total_feridos,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
aux_emp_parque_vlr_investimento,6.846e-06,5.06e-06,1.3529,0.1761,-3.072e-06,1.676e-05,146070.7
aux_emp_calcamento_vlr_investimento,-3.293e-06,4.688e-06,-0.7024,0.4824,-1.248e-05,5.897e-06,-303674.5
aux_emp_refrota_vlr_investimento,8.249e-07,1.057e-06,0.7801,0.4353,-1.248e-06,2.897e-06,1212268.0
aux_emp_praca_vlr_investimento,-1.902e-07,1.067e-06,-0.1782,0.8585,-2.282e-06,1.902e-06,-5257624.0
aux_emp_asfalto_vlr_investimento,-1.286e-07,1.132e-06,-0.1137,0.9095,-2.347e-06,2.09e-06,-7776050.0
aux_emp_corredor_vlr_investimento,1.098e-07,8.309e-08,1.3217,0.1863,-5.305e-08,2.727e-07,9107468.0
aux_emp_onibus_vlr_investimento,8.013e-08,1.312e-07,0.6107,0.5414,-1.771e-07,3.373e-07,12479720.0
aux_emp_metro_vlr_investimento,-2.671e-08,1.641e-08,-1.6273,0.1037,-5.887e-08,5.462e-09,-37439160.0


A coluna 'Parameter' diz que a cada aumento unitário em na linha correspondente, espera-se um aumento de x (valor do coeficiente) na variável dependente (o nome da primeira coluna), mantendo todas as outras variáveis constantes.

Na coluna 'Investimento para 1 de impacto', calculamos, com base no coeficiente, o investimento necessário, em reais, para o impacto de uma morte ou um ferido.

A seguir, vamos criar uma função, que dado o dataframe de resultados válidos e um dicionário contendo o investimento em diferentes categorias, retorna a variação correspondente no número de acidentes com a soma desses investimento, de acordo com o modelo. Embora essa interpretação não implique em uma causalidade direta de investimento para diminuições ou aumentos dos acidentes, isso pode ser um indicador de como interpretar os resultados e comparar as categorias entre si.

In [117]:
def calcular_impacto_total(df_resultados_validos, variaveis_valores):
    """
    Calcula o impacto total no número de acidentes de um conjunto de investimentos
    com base nos coeficientes de variáveis explicativas.

    Parâmetros:
    df_resultados_validos (pandas.DataFrame): Um dataframe que contém os resultados válidos. 
                                              Espera-se que este dataframe tenha uma coluna chamada 'Parameter' 
                                              que contém os coeficientes das variáveis explicativas.

    variaveis_valores (dict): Um dicionário onde as chaves são as variáveis explicativas e os valores 
                              são os respectivos valores de investimento.

    Retorna:
    impacto_total (float): O impacto total calculado como a soma dos produtos do coeficiente de cada 
                           variável explicativa e seu respectivo valor de investimento.
    """
    impacto_total = 0
    for variavel_explicativa, valor_investimento in variaveis_valores.items():
        coeficiente = df_resultados_validos.loc[variavel_explicativa, 'Parameter']
        impacto = coeficiente * valor_investimento
        impacto_total += impacto
    return impacto_total

In [118]:
df_resultados_mortes_validos = pd.concat([df_resultados_mortes_validos_positivos, df_resultados_mortes_validos_negativos])

In [119]:
variaveis_valores = {
    'aux_emp_ciclovia_vlr_investimento': 30_000_000
}

impacto_total = calcular_impacto_total(df_resultados_mortes_validos, variaveis_valores)

print(f'O impacto total na variável dependente é {impacto_total}')


O impacto total na variável dependente é -14.472000000000001


In [120]:
variaveis_valores = {
    'aux_emp_ciclovia_vlr_investimento': 30_000_000,
    'aux_emp_pavimentacao_vlr_investimento': 30_000_000,
    'aux_emp_metro_vlr_investimento': 30_000_000,
}


impacto_total = calcular_impacto_total(df_resultados_mortes_validos, variaveis_valores)

print(f'O impacto total na variável dependente é {impacto_total}')


O impacto total na variável dependente é -1.6155000000000008
