# Análise de Acidentes de Trânsito no Brasil (2025)

Este projeto faz parte da disciplina **Introdução à Ciência de Dados** e tem como objetivo analisar dados de acidentes de trânsito ocorridos no Brasil [ao decorrer do tempo]. Utilizando técnicas de análise exploratória de dados, visualização e estatística, buscamos identificar padrões, causas e fatores relacionados aos acidentes, além de propor insights para prevenção e melhoria da segurança viária.

## Objetivos do Projeto

- Explorar e compreender o conjunto de dados de acidentes de trânsito.
- Identificar as principais causas e tipos de acidentes.
- Analisar a distribuição dos acidentes por estado, município, dia da semana e horário.
- Avaliar o impacto dos acidentes em termos de vítimas (mortos, feridos leves e graves).
- Visualizar o evoluçao/regreção dos acidentes no país no decorrer dos anos.
- Visualizar os dados para facilitar a interpretação e comunicação dos resultados.

## Fonte dos Dados

Os dados utilizados neste projeto foram extraídos do sistema DATATRAN, dados disponibilizados pela PRF contendo informações detalhadas sobre cada ocorrência, como local, horário, condições meteorológicas, tipo de pista, número de vítimas, entre outros.

---


# Importações:

---

In [17]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import folium
from folium.plugins import HeatMap


# Informações Pincipais da Tabela:
---

In [18]:
tabela = pd.read_csv('datatran2025.csv', sep=';')

In [19]:
tabela

Unnamed: 0,id,data_inversa,dia_semana,horario,uf,br,km,municipio,causa_acidente,tipo_acidente,...,feridos_graves,ilesos,ignorados,feridos,veiculos,latitude,longitude,regional,delegacia,uop
0,652493.0,2025-01-01,quarta-feira,06:20:00,SP,116,225,GUARULHOS,Reação tardia ou ineficiente do condutor,Tombamento,...,0,0,1,1,2,-2348586772,-4654075317,SPRF-SP,DEL01-SP,UOP01-DEL01-SP
1,652519.0,2025-01-01,quarta-feira,07:50:00,CE,116,5462,PENAFORTE,Pista esburacada,Colisão frontal,...,0,1,4,1,6,-7812288,-3908333306,SPRF-CE,DEL05-CE,UOP03-DEL05-CE
2,652522.0,2025-01-01,quarta-feira,08:45:00,PR,369,882,CORNELIO PROCOPIO,Reação tardia ou ineficiente do condutor,Colisão traseira,...,0,2,0,3,2,-23182565,-50637228,SPRF-PR,DEL07-PR,UOP05-DEL07-PR
3,652544.0,2025-01-01,quarta-feira,11:00:00,PR,116,74,CAMPINA GRANDE DO SUL,Reação tardia ou ineficiente do condutor,Saída de leito carroçável,...,0,4,0,1,2,-2536517687,-4904223028,SPRF-PR,DEL01-PR,UOP02-DEL01-PR
4,652549.0,2025-01-01,quarta-feira,09:30:00,MG,251,471,FRANCISCO SA,Velocidade Incompatível,Colisão frontal,...,1,1,2,2,4,-1646801304,-4343121303,SPRF-MG,DEL12-MG,UOP01-DEL12-MG
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
34700,705679.0,2025-05-23,sexta-feira,17:07:00,BA,324,600,SIMOES FILHO,Ausência de reação do condutor,Queda de ocupante de veículo,...,0,0,0,1,1,-1277075662,-3842161417,SPRF-BA,DEL01-BA,UOP01-DEL01-BA
34701,705735.0,2025-06-29,domingo,08:30:00,SP,381,59,MAIRIPORA,Manobra de mudança de faixa,Colisão lateral mesmo sentido,...,0,1,0,1,2,-2328048922,-4658644867,SPRF-SP,DEL03-SP,UOP01-DEL03-SP
34702,705751.0,2025-06-05,quinta-feira,18:25:00,RJ,465,10,SEROPEDICA,Demais falhas mecânicas ou elétricas,Colisão lateral mesmo sentido,...,0,1,0,1,2,-228065671,-436390686,SPRF-RJ,DEL06-RJ,UOP02-DEL06-RJ
34703,705809.0,2025-05-01,quinta-feira,19:50:00,SE,101,986,SAO CRISTOVAO,Velocidade Incompatível,Colisão traseira,...,0,0,1,0,2,-10930556,-37185833,SPRF-SE,DEL02-SE,UOP01-DEL02-SE


In [21]:
print(tabela.info())

tabela = tabela.dropna()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 34705 entries, 0 to 34704
Data columns (total 30 columns):
 #   Column                  Non-Null Count  Dtype  
---  ------                  --------------  -----  
 0   id                      34705 non-null  float64
 1   data_inversa            34705 non-null  object 
 2   dia_semana              34705 non-null  object 
 3   horario                 34705 non-null  object 
 4   uf                      34705 non-null  object 
 5   br                      34705 non-null  int64  
 6   km                      34705 non-null  object 
 7   municipio               34705 non-null  object 
 8   causa_acidente          34705 non-null  object 
 9   tipo_acidente           34705 non-null  object 
 10  classificacao_acidente  34704 non-null  object 
 11  fase_dia                34705 non-null  object 
 12  sentido_via             34705 non-null  object 
 13  condicao_metereologica  34705 non-null  object 
 14  tipo_pista              34705 non-null

In [39]:
print(tabela['causa_acidente'].value_counts())


causa_acidente
Ausência de reação do condutor                               5319
Reação tardia ou ineficiente do condutor                     5147
Acessar a via sem observar a presença dos outros veículos    3342
Condutor deixou de manter distância do veículo da frente     2111
Velocidade Incompatível                                      1997
                                                             ... 
Modificação proibida                                            4
Semáforo com defeito                                            4
Redutor de velocidade em desacordo                              4
Sistema de drenagem ineficiente                                 2
Sinalização encoberta                                           1
Name: count, Length: 69, dtype: int64


# Analise Temporal
-----

In [48]:
principais_dias = tabela['dia_semana'].value_counts()
principais_horas = tabela['horario'].value_counts()

print(principais_dias)
print(principais_horas)

dia_semana
domingo          5478
sábado           5420
sexta-feira      5308
segunda-feira    5061
quarta-feira     4660
quinta-feira     4585
terça-feira      4179
Name: count, dtype: int64
horario
19:00:00    527
18:00:00    474
18:30:00    455
17:00:00    429
08:00:00    425
           ... 
14:21:00      1
03:23:00      1
21:08:00      1
13:53:00      1
16:21:00      1
Name: count, Length: 1299, dtype: int64


In [49]:
# Agrupa por dia da semana e horário, contando o número de acidentes
dias_horas = tabela.groupby(['dia_semana', 'horario']).size().reset_index(name='total_acidentes')

# Mostra os dias e horários com mais acidentes
print(dias_horas.sort_values('total_acidentes', ascending=False).head(10))

         dia_semana   horario  total_acidentes
526         domingo  19:00:00               88
2155  segunda-feira  08:00:00               87
3156    sexta-feira  19:00:00               87
559         domingo  20:00:00               84
1190   quarta-feira  19:00:00               83
490         domingo  18:00:00               83
3114    sexta-feira  18:00:00               77
2121  segunda-feira  07:00:00               76
3821         sábado  19:00:00               75
1150   quarta-feira  18:00:00               74


## Primeira Conclusão da Análise Temporal
Apesar de percebermos que os dados estão bem destribuidos, nos finais de semana à noite são onde ocorrem a maioria dos acidentes

---

In [42]:
alcool = tabela[tabela['causa_acidente'] == 'Ingestão de álcool pelo condutor']
#display(alcool)

print(f"Totais de casos com alcool: {alcool.shape[0]} casos")

Totais de casos com alcool: 1821 casos


# Analise Geografica
---

In [50]:
# Locais de Principais Ocorrências de Acidentes
# Acidentes por UF (estado)
print(tabela['uf'].value_counts())

# Acidentes por município
print(tabela['municipio'].value_counts())

uf
MG    4447
SC    3905
PR    3631
RJ    3062
RS    2461
SP    2278
BA    2048
GO    1494
PE    1398
MT    1293
ES    1281
PB    1032
MS     795
RN     753
CE     704
RO     692
PI     673
MA     531
DF     478
PA     475
AL     325
TO     324
SE     278
AC     120
RR      74
AP      74
AM      65
Name: count, dtype: int64
municipio
BRASILIA           478
DUQUE DE CAXIAS    392
GUARULHOS          388
SAO JOSE           334
CURITIBA           321
                  ... 
CALUMBI              1
RIBEIRAO DO SUL      1
SAMBAIBA             1
VICENTINA            1
CRUZEIRO DO SUL      1
Name: count, Length: 1708, dtype: int64


# Gravidade e Vítimas 
---

In [13]:
# Classificação dos acidentes
print(tabela['classificacao_acidente'].value_counts())


# Mortos e feridos leves por tipo de acidente
resultado = tabela.groupby('tipo_acidente')[['mortos', 'feridos_leves']].sum()
print(resultado)


classificacao_acidente
Com Vítimas Feridas    26913
Sem Vítimas             5297
Com Vítimas Fatais      2494
Name: count, dtype: int64
                                mortos  feridos_leves
tipo_acidente                                        
Atropelamento de Animal             31            519
Atropelamento de Pedestre          438            743
Capotamento                         44            739
Colisão com objeto                 168           1946
Colisão frontal                    906           2150
Colisão lateral mesmo sentido      108           3372
Colisão lateral sentido oposto     128            985
Colisão transversal                205           4272
Colisão traseira                   314           6118
Derramamento de carga                1             25
Engavetamento                       15            687
Eventos atípicos                    15            105
Incêndio                             0             30
Queda de ocupante de veículo        45           1678


In [14]:
# Total de mortos e feridos em acidentes com álcool
print(tabela['mortos'].value_counts())
print(f'Total: {0}',tabela['mortos'].value_counts().sum())

mortos
0    32211
1     2223
2      200
3       46
4       12
5        9
9        2
6        1
7        1
Name: count, dtype: int64
Total: 0 34705
