No presente trabalho serão analisados os dados e respondidas questões sobre os acidentes acontecidos no Estado do Rio Grande do Sul nos anos de 2007 até 2020.
Os conjuntos de dados correspondem ao período de 2007 a 2020 e foram disponibilizados através da plataforma Kaggle. Estes foram extraídos diretamente do website da PRF.
Esses dados são divididos em arquivos .CSV anuais e o ultimo arquivo (ano atual) é atualizado mensalmente.
Os dados são disponibilizados em 3 grupos:
- Agrupados por ocorrencia - (arquivos como datatranANO.csv)
- Agrupados por pessoa - (arquivos como acidentesANO.csv)
- Agrupados por pessoa - Todas as causas e tipos de acidentes (a partir de 2017) - (arquivos como acidentesANO_todascausas_tipos)
Para o presente trabalho, utilizaremos os dois primeiros conjuntos de dados.
Os dados são provenientes dos sistemas BR-Brasil e Boletim de Acidente de Trânsito (BAT), com as seguintes considerações:
- O sistema BR-Brasil foi usado em nivel nacional entre 2007 a 2016. Os acidentes foram armazenados usando o sistema BR-Brasil. Nesse sistema o policial responsável pela ocorrencia insere os dados relacionados aos involvidos, localização, veículos e a dinâmica do acidente.
- Python3
- Você poderá instalar somente o Jupyter Notebook ou o pacote completo Anaconda
- As versões Linux mais atuais já possuem o Python3 instalado, mas você pode baixar e instalar nas versões anteriores utilizando os os seguintes comandos:
sudo apt-get install python3
e também:
sudo apt-get install python3-pip
- Pode seguir o tutorial do Jupyter Notebook ou executar:
sudo pip install notebook
- Python3
- Você poderá instalar somente o Jupyter Notebook ou o pacote completo Anaconda
- Pandas e Numpy para tratamento dos dados;
- Seaborn, Matplotlib e Folium para geração dos gráficos;
sudo pip3 install -r requirements.txt
-
Você precisa extrair o arquivo arquive zipado e colocar na mesma pasta dos arquivos .ipynb.
-
Abrir o Jupyter Notebook ou o Anaconda e acessar os arquivos .ipynb.
-
Você poderá executar somente o arquivo acidentes_br.ipynb para visualizar as análises. Os arquivos data_cleaning_ocorrencia.ipynb e data_cleaning_pessoas.ipynb são referentes à limpeza e normalização dos dados originais.