#Importando bibliotecas



In [None]:
import pandas as pd
import numpy as np

# Carregar arquivo CSV
df = pd.read_csv('/content/acidentes_2017_2023.csv')

# Caminho para o arquivo CSV no Google Colab
caminho_arquivo = '/content/acidentes_2017_2023.csv'

df.head()

# Observações:
*   Arquivo 'acidentes_2017_2023.csv' contém dados sobre acidentes de trânsito de 2017 a 2023.
*  O arquivo foi carregado diretamente para o Google Colab através do upload do usuário.

#Analisar informações gerais do dataframe

In [None]:
# (Tipos de dados, valores nulos...)
print(df.info())

# Verificando se há valores ausentes e sua quantidade
print(df.isnull().sum())

#Limpeza e tratamento dos dados

In [None]:
# Substituir valores ausentes por 0
df = df.fillna(0)

# Conhecendo as colunas
df.columns

# Verificando que a coluna 'data_inversa' esteja no formato correto
df['data_inversa'] = pd.to_datetime(df['data_inversa'], errors='coerce')
print(df.head())

In [None]:
# Remover dados duplicados
df = df.drop_duplicates()
# Verificando se ainda há duplicados
print(df.duplicated().sum())

# Transformação dos dados

*   Conversão e criação de colunas
*   Utilização de critérios para filtragem dos dados (incluindo análises cruzadas)



In [12]:
# Convertendo colunas para tipo numérico
df['mortos'] = pd.to_numeric(df['mortos'], errors='coerce')
df['veiculos'] = pd.to_numeric(df['veiculos'], errors='coerce')
#Obs o parâmetro "errors='coerce'" faz com que valores não coversíveis virem NaN

# Para análise a partir do tempo, novas colunas:
# Extraindo o ano da coluna de datas
df['ano'] = df['data_inversa'].dt.year
# Extraindo o mês da coluna de datas
df['mes'] = df['data_inversa'].dt.month

In [None]:
# Filtrando os acidentes com mais de 2 mortos
df_graves = df[df['mortos'] > 2]

# Filtrando acidentes que ocorreram na BR-101
df_br101 = df[df['br'] == 101]

# Filtrando acidentes ocorridos com chuva ou neblina
df_clima_adverso = df[df['condicao_metereologica'].isin(['Chuva', 'Nevoeiro/neblina'])]

# Análise cruzada:
# Filtrando acidentes à noite, com clima adverso e mais de 2 mortos
df_cruzado = df[
    (df['fase_dia'] == 'Noite') &
    (df['condicao_metereologica'].isin(['Chuva', 'Nevoeiro/neblina'])) &
    (df['mortos'] > 2)
]

df_cruzado.head()

# Agrupamento e estatísticas



1.   TOTAL DE ACIDENTES POR ESTADO




In [None]:
# Agrupando por estado e contando o número de acidentes
acidentes_por_uf = df['uf'].value_counts()

# Exibindo os 10 estados com mais acidentes
acidentes_por_uf.head(10)



2.   ACIDENTES POR DIA DE SEMANA



In [None]:
# Contando a quantidade de acidentes por dia da semana
acidentes_dia_semana = df['dia_semana'].value_counts()

# Exibindo os resultados
acidentes_dia_semana



3. ACIDENTES COM CHUVA POR ESTADO



In [None]:
# Filtrando apenas os acidentes com chuva
df_chuva = df[df['condicao_metereologica'] == 'Chuva']

# Contando quantos ocorreram em cada estado
chuva_por_uf = df_chuva['uf'].value_counts()

# Exibindo os 5 estados com mais acidentes com chuva
chuva_por_uf.head(5)

# Gráficos



1.  Gráfico dos acidentes por dia da semana




In [27]:
import plotly.express as px

# Criando o gráfico de barras com os dados de acidentes por dia da semana
fig1 = px.bar(
    x=acidentes_dia_semana.index,  # Definindo os dias da semana como o eixo X
    y=acidentes_dia_semana.values,  # Definindo a quantidade de acidentes como o eixo Y
    labels={'x': 'Dia da Semana', 'y': 'Quantidade de Acidentes'},  # Renomeando os eixos para melhor visualização
    title='Quantidade de Acidentes por Dia da Semana'  # Título do gráfico
)

fig1.show()





2.   Gráfico dos acidentes com chuva por estado



In [28]:
# Criando o gráfico de barras para mostrar os acidentes com chuva por estado
fig2 = px.bar(
    x=chuva_por_uf.index,  # Eixo X com os estados (UF)
    y=chuva_por_uf.values,  # Eixo Y com a quantidade de acidentes com chuva
    labels={'x': 'Estado (UF)', 'y': 'Acidentes com Chuva'},  # Renomeando os eixos
    title='Acidentes com Chuva por Estado (UF)'  # Título do gráfico
)

fig2.show()