In [1]:
# @title INSTALAÇÃO DOS MÓDULOS NECESSÁRIOS

# Remver comentário da linha abaixo, caso seja necessário instalar o Pandas
#!pip install pandas -q

In [2]:
# @title IMPORTAÇÃO DAS BIBLIOTECAS

import sqlite3 as sq
import pandas as pd
import json

In [3]:
# @title CONEXÃO COM A BASE DE DADOS SQLITE

BASE = "datatran"
conn = sq.connect(f"{BASE}.db", check_same_thread=False)

In [4]:
# @title CONSULTA DOS NOMES DE ESTADOS

query = f"SELECT * FROM estados"
lista_estados = pd.read_sql(query, conn)['estado'].to_list()
lista_estados

['Acre',
 'Alagoas',
 'Amapá',
 'Amazonas',
 'Bahia',
 'Ceará',
 'Distrito Federal',
 'Espírito Santo',
 'Goiás',
 'Maranhão',
 'Mato Grosso',
 'Mato Grosso do Sul',
 'Minas Gerais',
 'Pará',
 'Paraíba',
 'Paraná',
 'Pernambuco',
 'Piauí',
 'Rio Grande do Norte',
 'Rio Grande do Sul',
 'Rio de Janeiro',
 'Rondônia',
 'Roraima',
 'Santa Catarina',
 'São Paulo',
 'Sergipe',
 'Tocantins']

In [50]:
# @title CONSULTA DOS CÓDIGOS DE UF

query = f"SELECT * FROM estados"
lista_ufs = pd.read_sql(query, conn)['uf'].to_list()
lista_ufs

['AC',
 'AL',
 'AP',
 'AM',
 'BA',
 'CE',
 'DF',
 'ES',
 'GO',
 'MA',
 'MT',
 'MS',
 'MG',
 'PA',
 'PB',
 'PR',
 'PE',
 'PI',
 'RN',
 'RS',
 'RJ',
 'RO',
 'RR',
 'SC',
 'SP',
 'SE',
 'TO']

In [5]:
# @title CONSULTA POR ESTADO: NÚMEROS DE ACIDENTES

query = f"""
    SELECT e.estado, COUNT(*)
    FROM estados AS e
        INNER JOIN ocorrencias AS o
            ON e.cod = o.cod_estado 
        INNER JOIN acidentes AS a 
            ON a.cod = o.cod_acidente
    GROUP BY e.estado
    ORDER BY COUNT(*) DESC;
    """
df = pd.read_sql_query(query, con=conn)
df.columns = ['Estado','Acidentes']

dict_acidentes = {}
dados = zip(df['Estado'], df['Acidentes'])
for estado, acidentes in dados:
    dict_acidentes[estado] = acidentes
    
dict_acidentes

{'Minas Gerais': 8290,
 'Santa Catarina': 7589,
 'Paraná': 7377,
 'Rio Grande do Sul': 4929,
 'Rio de Janeiro': 4704,
 'São Paulo': 4385,
 'Bahia': 3440,
 'Goiás': 3112,
 'Pernambuco': 2746,
 'Espírito Santo': 2278,
 'Mato Grosso': 2175,
 'Mato Grosso do Sul': 1638,
 'Paraíba': 1474,
 'Rondônia': 1378,
 'Ceará': 1373,
 'Rio Grande do Norte': 1287,
 'Piauí': 1114,
 'Maranhão': 1084,
 'Distrito Federal': 922,
 'Pará': 831,
 'Alagoas': 595,
 'Tocantins': 568,
 'Sergipe': 511,
 'Roraima': 229,
 'Acre': 224,
 'Amapá': 180,
 'Amazonas': 114}

In [6]:
# @title CONSULTA POR ESTADO: NÚMEROS DE MORTES

query = f"""
    SELECT e.estado, sum(a.mortos)
    FROM estados AS e
        INNER JOIN ocorrencias AS o
            ON e.cod = o.cod_estado 
        INNER JOIN acidentes AS a 
            ON a.cod = o.cod_acidente
    GROUP BY e.estado
    ORDER BY sum(a.mortos) DESC;
    """
df = pd.read_sql_query(query, con=conn)
df.columns = ['Estado','Fatalidades']

dict_fatalidades = {}
dados = zip(df['Estado'], df['Fatalidades'])
for estado, fatalidades in dados:
    dict_fatalidades[estado] = fatalidades

dict_fatalidades

{'Minas Gerais': 701,
 'Paraná': 571,
 'Bahia': 528,
 'Santa Catarina': 350,
 'Rio Grande do Sul': 334,
 'Pernambuco': 305,
 'Goiás': 291,
 'Mato Grosso': 263,
 'Rio de Janeiro': 257,
 'São Paulo': 223,
 'Maranhão': 211,
 'Pará': 183,
 'Mato Grosso do Sul': 167,
 'Espírito Santo': 154,
 'Ceará': 148,
 'Piauí': 137,
 'Paraíba': 129,
 'Rio Grande do Norte': 94,
 'Rondônia': 86,
 'Tocantins': 81,
 'Alagoas': 54,
 'Sergipe': 47,
 'Distrito Federal': 44,
 'Roraima': 24,
 'Amapá': 20,
 'Amazonas': 19,
 'Acre': 18}

In [46]:
# @title CONSULTA POR ESTADO: VIA MAIS LETAL
#for estado in lista_estados:

dict_via = {}
for estado in lista_estados:
    query = f"""
        SELECT e.estado, a.rodovia, sum(a.mortos)
        FROM estados AS e
        INNER JOIN ocorrencias AS o
            ON e.cod = o.cod_estado
        INNER JOIN acidentes AS a 
            ON a.cod = o.cod_acidente
        WHERE e.estado = '{estado}'
        GROUP BY e.estado, a.rodovia
        ORDER BY sum(a.mortos) DESC; 
    """
        
    df = pd.read_sql_query(query, con=conn)
    rodovia = df['rodovia'][1]
    dict_via[estado] = int(rodovia)
dict_via

{'Acre': 364,
 'Alagoas': 101,
 'Amapá': 210,
 'Amazonas': 230,
 'Bahia': 116,
 'Ceará': 116,
 'Distrito Federal': 251,
 'Espírito Santo': 262,
 'Goiás': 20,
 'Maranhão': 316,
 'Mato Grosso': 364,
 'Mato Grosso do Sul': 262,
 'Minas Gerais': 40,
 'Pará': 316,
 'Paraíba': 361,
 'Paraná': 376,
 'Pernambuco': 101,
 'Piauí': 316,
 'Rio Grande do Norte': 101,
 'Rio Grande do Sul': 285,
 'Rio de Janeiro': 116,
 'Rondônia': 435,
 'Roraima': 432,
 'Santa Catarina': 282,
 'São Paulo': 381,
 'Sergipe': 235,
 'Tocantins': 226}

In [39]:
# @title CONSULTA POR ESTADO: PRINCIPAL CAUSA DE ACIDENTE

dict_causa = {}
for estado in lista_estados:
    query = f"""
            SELECT e.estado, c.descricao, count(*)
            FROM estados AS e
            INNER JOIN ocorrencias AS o
                ON e.cod = o.cod_estado
            INNER JOIN acidentes AS a 
                ON a.cod = o.cod_acidente
            INNER JOIN causas AS c
                ON c.cod = o.cod_causa
            WHERE e.estado = '{estado}'
            GROUP BY e.estado, c.descricao
            ORDER BY count(*) DESC; 
        """
    df = pd.read_sql_query(query, con=conn)
    causa = df['descricao'][0]
    dict_causa[estado] = causa

dict_causa

{'Acre': 'Acessar a via sem observar a presença dos outros veículos',
 'Alagoas': 'Acessar a via sem observar a presença dos outros veículos',
 'Amapá': 'Acessar a via sem observar a presença dos outros veículos',
 'Amazonas': 'Reação tardia ou ineficiente do condutor',
 'Bahia': 'Acessar a via sem observar a presença dos outros veículos',
 'Ceará': 'Acessar a via sem observar a presença dos outros veículos',
 'Distrito Federal': 'Acessar a via sem observar a presença dos outros veículos',
 'Espírito Santo': 'Acessar a via sem observar a presença dos outros veículos',
 'Goiás': 'Reação tardia ou ineficiente do condutor',
 'Maranhão': 'Reação tardia ou ineficiente do condutor',
 'Mato Grosso': 'Reação tardia ou ineficiente do condutor',
 'Mato Grosso do Sul': 'Ausência de reação do condutor',
 'Minas Gerais': 'Velocidade Incompatível',
 'Pará': 'Reação tardia ou ineficiente do condutor',
 'Paraíba': 'Ausência de reação do condutor',
 'Paraná': 'Reação tardia ou ineficiente do condutor',

In [51]:
dados_json = []
for estado, uf in zip(lista_estados, lista_ufs):

    acidentes = dict_acidentes[estado]
    fatalidades = dict_fatalidades[estado]
    via_mais_letal = dict_via[estado]
    principal_causa = dict_causa[estado]

    dado_estado = {'estado' : estado,
                   'UF' : uf,
                   'acidentes': acidentes,
                   'fatalidades': fatalidades,
                   'via_mais_perigosa': via_mais_letal,
                   'principal_causa': principal_causa}

    dados_json.append(dado_estado)

with open("dados.json", "w") as arquivo:     
    json.dump(dados_json, arquivo, indent=4, ensure_ascii=False)