<a href="https://colab.research.google.com/github/VictorAFBZhao/Projeto_Tecnicas_de_Programacao_I/blob/main/An%C3%A1lise_SC.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Relatório Análise Exploratória

Este relatório apresenta uma análise exploratória dos dados de acidentes ocorridos na Autopista Litoral Sul em SC entre 2010 e 2023. Foram analisados padrões temporais no número de acidentes, tipos mais comuns, severidade, veículos envolvidos e outras métricas relevantes.

Os principais insights obtidos foram:

    - Há uma tendência de queda no número total de acidentes ao longo dos anos, com uma média de decréscimo de aproximadamente 233 acidentes por ano entre 2010 e 2022, porém essa razão de decrescimo é muito baixa.
    - Os acidentes mais comuns são colisões traseiras, saídas de pista, choques e colisões laterais.
    - Atropelamentos representam a maioria dos acidentes fatais, seguidos por colisões traseiras.
    - A proporção de acidentes fatais em relação ao total tem diminuído com o passar dos anos.
    - Automóveis estão envolvidos em cerca de 59% dos acidentes, seguidos por caminhões e motocicletas.

Análise Temporal

Foi analisada a progressão temporal do número total de acidentes, número de mortes e proporção de mortes em acidentes.

    - O número total de acidentes apresentou tendência de queda ao longo dos anos, com uma média de decréscimo de aproximadamente 233 acidentes por ano entre 2010 e 2022.
    - O número de mortes também diminuiu progressivamente.
    - A proporção de mortes em relação ao total de acidentes, que chegou a 1,5% em 2010, caiu para 0,86% em 2022.

Tipos de Acidentes

    - Os acidentes mais comuns na Autopista Litoral Sul são colisões traseiras, saídas de pista, choques e colisões laterais, nessa ordem.
    - Em termos de gravidade, atropelamentos representam a maioria dos acidentes fatais, seguidos por colisões traseiras.
    - Foi feita uma análise específica para acidentes por atropelamento. A proporção desses acidentes que resultam em morte vem caindo ano a ano, saindo de 55% em 2010 para 36% em 2022.

Análise por Veículos

    - Automóveis representam 59% dos veículos envolvidos em acidentes na Autopista Litoral Sul.
    - Caminhões (29%) e motocicletas (19%) aparecem em segundo e terceiro, respectivamente.
    - Ônibus, bicicletas e outros veículos representam uma pequena proporção do total.


Embora os dados analisados sobre acidentes na Autopista Litoral Sul em SC mostrem algumas tendências positivas em longo prazo, ainda existem grandes oportunidades de melhoria em termos de segurança viária.
Problemas

    - Apesar da redução no número total, o alto volume de acidentes (mais de 7 mil em 2022) indica que a via ainda apresenta riscos significativos.
    - As colisões traseiras, que representam o tipo mais comum, demonstram problemas de imprudência e falta de atenção dos motoristas.
    - As saídas de pista, segundo tipo mais comum, podem indicar problemas na sinalização, no traçado da via ou no comportamento dos motoristas.
    - Os atropelamentos, que são a grande maioria dos acidentes fatais, precisam de atenção urgente.

Soluções Propostas

    - Aumento da fiscalização por radar e viaturas para coibir excesso de velocidade e imprudências.
    - Campanhas educativas enfocando a redução de colisões traseiras e saídas de pista.
    - Melhoria da sinalização horizontal e vertical.
    - Revisão de projeto geométrico da via para eliminar locais críticos de saída de pista.
    - Instalação de barreiras laterais para separar o fluxo principal do acostamento.
    - Redução dos limites de velocidade e instalação de lombadas/sonorizadores em áreas urbanas para coibir atropelamentos.

Conclusão

Apesar de algum progresso, os dados analisados ainda demonstram altos níveis de insegurança na Autopista Litoral Sul em SC. Com as soluções propostas de engenharia, fiscalização e educação, é possível reverter este quadro e salvar vidas. A análise regular dos dados de acidentes deve nortear as iniciativas de redução dos números alarmantes ainda observados.


# Código da análise exploratória

## Configurando ambiente e realizando imports necessários

In [None]:
from google.colab import drive
import pandas as pd
import plotly.express as px



# Definindo pasta onde está os arquivos necessários
drive.mount('/content/drive')
%cd "/content/drive/MyDrive/Colab Notebooks/projeto/SC"

# Configurando numero de colunas maximas que irão aparecer no DataFrame
pd.set_option('display.max_columns',100)

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
/content/drive/.shortcut-targets-by-id/1LSfm04Dx833jQk7l-kX1pHB_GKhUpxN2/projeto/SC


##### Como se trata da via de maior importância, será nosso foco principal do trecho supracitado neste topico.

In [None]:
# Carregando csv especifico da Autopista Litoral Sul
df_autopista_sul = pd.read_csv('dados_sc_tratados.csv', sep=',', low_memory=False, encoding='UTF-8')

#Analisando de formar superficial os dados ja tratados:
df_autopista_sul

Unnamed: 0,data,horario,n_da_ocorrencia,tipo_de_ocorrencia,km,trecho,sentido,tipo_de_acidente,automovel,bicicleta,caminhao,moto,onibus,outros,tracao_animal,transporte_de_cargas_especiais,trator_maquinas,utilitarios,ilesos,levemente_feridos,moderadamente_feridos,gravemente_feridos,mortos,ano,mes
0,2010-01-01,16:30:00,377,acidente com vitima,35,BR-101/SC,Sul,Queda de Moto,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,2.0,0.0,0.0,0.0,2010,1
1,2010-01-01,22:59:00,554,acidente sem vitima,7819999694824219,BR-116/PR,Sul,Saida de Pista,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,2010,1
2,2010-01-01,19:22:00,489,acidente sem vitima,97,BR-116/PR,Sul,Colisão Traseira,2.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,4.0,0.0,0.0,0.0,0.0,2010,1
3,2010-01-01,01:51:00,24,acidente sem vitima,129,BR-101/SC,Norte,Queda de Moto,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,2010,1
4,2010-01-01,15:52:00,354,acidente sem vitima,132,BR-101/SC,Sul,Saida de Pista,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,2010,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
123013,2023-06-22,16:41:11,269,acidente sem vitima,119835,BR-101/SC,Decrescente,Colisão Traseira,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,2023,6
123014,2023-06-22,18:14:32,295,acidente sem vitima,38488,BR-101/SC,Decrescente,Colisão Traseira,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,2023,6
123015,2023-06-22,18:24:55,299,acidente sem vitima,238413,BR-101/SC,Decrescente,Choque,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,2023,6
123016,2023-06-22,18:36:38,307,acidente com vitima,615314,BR-376/SC,Decrescente,Atropelamento,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,2023,6


In [None]:
df_autopista_sul.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 123018 entries, 0 to 123017
Data columns (total 25 columns):
 #   Column                          Non-Null Count   Dtype  
---  ------                          --------------   -----  
 0   data                            123018 non-null  object 
 1   horario                         123018 non-null  object 
 2   n_da_ocorrencia                 123018 non-null  int64  
 3   tipo_de_ocorrencia              123018 non-null  object 
 4   km                              123018 non-null  object 
 5   trecho                          123018 non-null  object 
 6   sentido                         123018 non-null  object 
 7   tipo_de_acidente                123018 non-null  object 
 8   automovel                       123018 non-null  float64
 9   bicicleta                       123018 non-null  float64
 10  caminhao                        123018 non-null  float64
 11  moto                            123018 non-null  float64
 12  onibus          

###### Análise dos acidentes mais comuns na Autopista Litoral Sul - SC

In [None]:
rank_acidentes_apls = df_autopista_sul['tipo_de_acidente'].value_counts()
rank_acidentes_apls.head(7)

Colisão Traseira    35489
Saida de Pista      22964
Choque              17143
Colisão Lateral     15940
Queda de Moto        8657
Engavetamento        8018
Capotamento          5402
Name: tipo_de_acidente, dtype: int64

##### Análise dos acidentes fatais

In [None]:
rank_acidentes_fatais_apls = df_autopista_sul['tipo_de_acidente'][df_autopista_sul['mortos'] != 0].value_counts()
rank_acidentes_fatais_apls.head(7)

Atropelamento       602
Colisão Traseira    293
Choque              108
Colisão Lateral     104
Queda de Moto        84
Capotamento          68
Colisão Frontal      60
Name: tipo_de_acidente, dtype: int64

##### Análise temporal do número de acidentes

In [None]:
#definindo lista com os anos
anos = df_autopista_sul['ano'].astype(str).unique().tolist()

In [None]:
#Transformando a data str em Obj datetime
valores_anos_acidentes = []
# Armazenando em cada ano a quantidade de acidentes
for ano in anos:
  valores_anos_acidentes.append(df_autopista_sul['tipo_de_acidente'][(df_autopista_sul['ano'].astype(str) == ano)].value_counts().sum())

#Plotagem para ver a progressão temporal
fig = px.line(x=anos[:-1], y=valores_anos_acidentes[:-1], title='Quantidade de acidentes por ano') # Excluindo 2023 por ainda estar sendo percorrido
# Definir o range dos eixos x e y
fig.update_xaxes(title_text='Ano')  # Range dos anos, excluindo o último
fig.update_yaxes(title_text='Quantidade de Acidentes', range=[0, max(valores_anos_acidentes)*1.1])  # Range dos valores


fig.show()

In [None]:
# Analisando a média de decrescimo entre 2010 e 2022
media_decrescimo = (valores_anos_acidentes[0] - valores_anos_acidentes[-2])/12
media_decrescimo

232.75

In [None]:
valores_anos_mortos = []
# Armazenando em cada ano a quantidade de acidentes
for ano in anos:
  valores_anos_mortos.append(df_autopista_sul['mortos'][(df_autopista_sul['ano'].astype(str) == ano) & (df_autopista_sul['mortos'] > 0)].value_counts().sum())

#Plotagem para ver a progressão temporal
df = px.data.stocks()
fig = px.line(x=anos[:-1], y=valores_anos_mortos[:-1], title='Quantidade de mortes por ano') # Excluindo 2023 por ainda estar sendo percorrido
# Definir o range dos eixos x e y
fig.update_xaxes(title_text='Ano')  # Range dos anos, excluindo o último
fig.update_yaxes(title_text='Quantidade de mortes', range=[0, max(valores_anos_mortos)*1.1])  # Range dos valores


fig.show()

In [None]:
valores_anos_feridos = []
# Armazenando em cada ano a quantidade de acidentes
for ano in anos:
  valores_anos_feridos.append(df_autopista_sul['gravemente_feridos'][(df_autopista_sul['ano'].astype(str) == ano) & (df_autopista_sul['gravemente_feridos'] > 0)].value_counts().sum())

#Plotagem para ver a progressão temporal
df = px.data.stocks()
fig = px.line(x=anos[:-1], y=valores_anos_feridos[:-1], title='Quantidade de gravemente feridos por ano') # Excluindo 2023 por ainda estar sendo percorrido
# Definir o range dos eixos x e y
fig.update_xaxes(title_text='Ano')  # Range dos anos, excluindo o último
fig.update_yaxes(title_text='Quantidade de gravemente feridos', range=[0, max(valores_anos_feridos)*1.1])  # Range dos valores


fig.show()

In [None]:
valores_anos_ilesos = []
# Armazenando em cada ano a quantidade de acidentes
for ano in anos:
  valores_anos_ilesos.append(df_autopista_sul['ilesos'][(df_autopista_sul['ano'].astype(str) == ano) & (df_autopista_sul['ilesos'] > 0)].value_counts().sum())

#Plotagem para ver a progressão temporal
df = px.data.stocks()
fig = px.line(x=anos[:-1], y=valores_anos_ilesos[:-1], title='Quantidade de ilesos por ano') # Excluindo 2023 por ainda estar sendo percorrido
# Definir o range dos eixos x e y
fig.update_xaxes(title_text='Ano')  # Range dos anos, excluindo o último
fig.update_yaxes(title_text='Quantidade de ilesos feridos', range=[0, max(valores_anos_ilesos)*1.1])  # Range dos valores


fig.show()

In [None]:
valores_anos_proporcao = pd.Series(valores_anos_mortos)/pd.Series(valores_anos_acidentes) * 100

#Plotagem para ver a progressão temporal
df = px.data.stocks()
fig = px.line(x=anos[:-1], y=valores_anos_proporcao[:-1], title='Porcentagem de mortos em acidentes') # Excluindo 2023 por ainda estar sendo percorrido
# Definir o range dos eixos x e y
fig.update_xaxes(title_text='Ano')  # Range dos anos, excluindo o último
fig.update_yaxes(title_text='Porcentagem de mortos em acidentes', range=[0, max(valores_anos_proporcao)*1.1])  # Range dos valores


fig.show()

### Análise temporal dos tipos de acidentes

#### Colisão traseira

In [None]:
valores_anos_colisao_traseira = []
# Armazenando em cada ano a quantidade de acidentes
for ano in anos:
  valores_anos_colisao_traseira.append(df_autopista_sul['tipo_de_acidente'][(df_autopista_sul['ano'].astype(str) == ano) & (df_autopista_sul['tipo_de_acidente'] == 'Colisão Traseira')].value_counts().sum())

#Plotagem para ver a progressão temporal
df = px.data.stocks()
fig = px.line(x=anos[:-1], y=valores_anos_colisao_traseira[:-1], title='Quantidade de Colisões traseiras por ano') # Excluindo 2023 por ainda estar sendo percorrido
# Definir o range dos eixos x e y
fig.update_xaxes(title_text='Ano')  # Range dos anos, excluindo o último
fig.update_yaxes(title_text='Quantidade de Colisões traseiras', range=[0, max(valores_anos_colisao_traseira)*1.1])  # Range dos valores


fig.show()

#### Atropelamento

In [None]:
valores_anos_atropelamento = []
# Armazenando em cada ano a quantidade de acidentes
for ano in anos:
  valores_anos_atropelamento.append(df_autopista_sul['tipo_de_acidente'][(df_autopista_sul['ano'].astype(str) == ano) & (df_autopista_sul['tipo_de_acidente'] == 'Atropelamento')].value_counts().sum())

#Plotagem para ver a progressão temporal
df = px.data.stocks()
fig = px.line(x=anos[:-1], y=valores_anos_atropelamento[:-1], title='Quantidade de atropelamento por ano') # Excluindo 2023 por ainda estar sendo percorrido
# Definir o range dos eixos x e y
fig.update_xaxes(title_text='Ano')  # Range dos anos, excluindo o último
fig.update_yaxes(title_text='Quantidade de atropelamento', range=[0, max(valores_anos_atropelamento)*1.1])  # Range dos valores


fig.show()

##### Mortes por atropelamento, porcentagem

In [None]:
valores_anos_atropelamento_mortes = pd.Series(valores_anos_mortos)/pd.Series(valores_anos_atropelamento) * 100
#Plotagem para ver a progressão temporal
df = px.data.stocks()
fig = px.line(x=anos[:-1], y=valores_anos_atropelamento_mortes[:-1], title='Atropelamento') # Excluindo 2023 por ainda estar sendo percorrido
# Definir o range dos eixos x e y
fig.update_xaxes(title_text='Ano')  # Range dos anos, excluindo o último
fig.update_yaxes(title_text='Porcentagem de morte por atropelamento', range=[0, max(valores_anos_atropelamento_mortes)*1.1])  # Range dos valores


fig.show()

#### Análise Veículos:

In [None]:
df_autopista_sul.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 123018 entries, 0 to 123017
Data columns (total 25 columns):
 #   Column                          Non-Null Count   Dtype  
---  ------                          --------------   -----  
 0   data                            123018 non-null  object 
 1   horario                         123018 non-null  object 
 2   n_da_ocorrencia                 123018 non-null  int64  
 3   tipo_de_ocorrencia              123018 non-null  object 
 4   km                              123018 non-null  object 
 5   trecho                          123018 non-null  object 
 6   sentido                         123018 non-null  object 
 7   tipo_de_acidente                123018 non-null  object 
 8   automovel                       123018 non-null  float64
 9   bicicleta                       123018 non-null  float64
 10  caminhao                        123018 non-null  float64
 11  moto                            123018 non-null  float64
 12  onibus          

In [None]:
#Definição dos veiculos
moto = int(df_autopista_sul['moto'].sum())
caminhao = int(df_autopista_sul['caminhao'].sum())
automovel = int(df_autopista_sul['automovel'].sum())
onibus = int(df_autopista_sul['onibus'].sum())
outros = int(df_autopista_sul['outros'].sum())
bicicleta = int(df_autopista_sul['bicicleta'].sum())
transporte_de_cargas_especiais = int(df_autopista_sul['transporte_de_cargas_especiais'].sum())
utilitarios = int(df_autopista_sul['utilitarios'].sum())
tracao_animal = int(df_autopista_sul['tracao_animal'].sum())
trator_maquinas = int(df_autopista_sul['trator_maquinas'].sum())

In [None]:
import plotly.express as px
import pandas as pd

data = {
    'Tipo': ['Moto', 'Caminhão', 'Automóvel', 'Ônibus', 'Outros', 'Bicicleta', 'transporte_de_cargas_especiais', 'utilitarios', 'tracao_animal', 'trator_maquinas'],
    'Quantidade': [moto, caminhao, automovel, onibus, outros, bicicleta,transporte_de_cargas_especiais, utilitarios, tracao_animal,trator_maquinas]
}

df1 = pd.DataFrame(data)

fig = px.histogram(df1, x='Tipo', y='Quantidade', title='Distribuição de Veículos')
fig.show()

In [None]:
#Porcentagem de carros envolvidos em comparação com so outros
automovel / sum(data['Quantidade']) * 100

58.50160959906351