# 03 - Análise de Dados Exploratória (EDA)
Autora: Fernanda Baptista de Siqueira  
Curso: MBA em Tecnologia para Negócios – AI, Data Science e Big Data  
Tema: Análise de Acidentes de Trânsito em Porto Alegre (2020–2024)  
Origem DataFrame: Equipe Armazém de Dados de Mobilidade - EAMOB/CIET  
https://dadosabertos.poa.br/dataset/acidentes-de-transito-acidentes (11/05/2025)  

### 1. Importa bibliotecas, funções e Dataset

In [1]:
from config import (
    pd, np, plt, sns, graf_heatmap,
    graf_contagem, graf_crosstab, 
    graf_temporal, ordenar_dias_semana,
    proporcao_por_veiculo, evolucao_veiculos,
    PATH_CLEAN
)
df = pd.read_parquet(PATH_CLEAN + 'df_20_24_chuva.parquet')

### 2. Visualização do Dados
1) Temporal

In [None]:
# Sazonalidade mensal
graf_temporal(df, "data", "idacidente", freq="M", titulo="Sazonalidade mensal de acidentes (2020–2024)")

# Dias da semana
df = ordenar_dias_semana(df, "dia_sem")
graf_contagem(df, "dia_sem", "Distribuição de acidentes por dia da semana", rotacao=45, ordenar="indice")

# Horário do dia
graf_contagem(df, "hora_int", "Distribuição de acidentes por hora do dia", ordenar="indice")



2. Tipo de Acidentes

In [None]:
# Tipos de acidente mais recorrentes
graf_contagem(df, "tipo_acid", "Top 10 tipos de acidentes mais recorrentes", rotacao=90, top=10, ordenar="valor")

# Veículos mais envolvidos
cols_veic = ["auto","moto","onibus_urb","caminhao","bicicleta"]
df[cols_veic].sum().sort_values(ascending=False).plot(kind="bar", figsize=(8,5))
plt.title("Veículos mais frequentemente envolvidos")
plt.show()

# Veículos com maior número de vítimas
proporcao_por_veiculo(df, cols_veic, alvo="feridos", titulo="Proporção de acidentes com feridos por veículo")


3. Localização

In [None]:
# Acidentes por região
graf_contagem(df, "regiao", "Acidentes por região")

# Hotspots (top 10 logradouros)
graf_contagem(df, "log1", "Top 10 logradouros com mais acidentes", rotacao=90, top=10)

4. Condições Externas

In [None]:
# Acidentes em dias de chuva
graf_crosstab(df, "chovendo", "regiao", "Acidentes em dias de chuva por região")

# Turno diurno x noturno
graf_contagem(df, "noite_dia", "Comparação de acidentes entre turnos")

# Severidade por turno
graf_crosstab(df, "noite_dia", "cont_vit", "Severidade de acidentes por turno")


5. Envolvidos

In [None]:
# Proporção de feridos por veículo
proporcao_por_veiculo(df, cols_veic, alvo="feridos", titulo="Proporção de feridos por veículo")

# Tendência de crescimento ao longo do período
evolucao_veiculos(df, cols_veic, titulo="Evolução anual de acidentes por veículo")


6. Severidade

In [None]:
# Nível geral de gravidade
df[["feridos","feridos_gr","fatais"]].sum()

# Veículos mais associados a ocorrências graves
proporcao_por_veiculo(df, cols_veic, alvo="feridos_gr", titulo="Proporção de acidentes com feridos graves por veículo")

# Veículos e tipos de acidentes mais fatais
proporcao_por_veiculo(df, cols_veic, alvo="fatais", titulo="Proporção de acidentes fatais por veículo")

# Mostrar apenas os 10 tipos mais fatais, em gráfico horizontal
graf_crosstab(df, "tipo_acid", "fatais", "Top 10 tipos de acidentes mais fatais",
              empilhado=True, horizontal=True, top=10)
