# Relatório do tratamento

Leitura e Configuração Inicial

    Foi realizada a leitura do arquivo CSV 'AUTOPISTA LITORAL SUL.csv' em um DataFrame Pandas chamado df.
    Foi configurado o número máximo de colunas para mostrar no output do DataFrame como 100 para melhor visualização.
    Foi definida a pasta no Google Drive onde estão os arquivos necessários.

Verificação de Linhas Duplicadas

    Foi verificado se o número de ocorrência (n_da_ocorrencia) é único, o que não é verdadeiro, pois as ocorrências foram em locais diferentes podendo repetir os números.
    Foram identificadas 602 linhas duplicadas no dataset original.
    As linhas duplicadas foram removidas com o método drop_duplicates(), restando 123018 linhas únicas.

Tipos de Dados

    Foi verificado o tipo de dado de cada coluna.
    As colunas de data e horário eram do tipo string, então foram convertidas para datetime.date e datetime.time respectivamente para permitir operações de data.
    Foram criadas novas colunas ano e mês extraídas da data.

Normalização de Dados
Categorias

    Para a coluna tipo_de_ocorrência foram mapeados valores semelhantes para categorias padronizadas. Por exemplo: 'com vítima' -> 'acidente com vitima'.
    O mesmo procedimento foi feito para padronizar os tipos de acidentes, mapeando valores similares para categorias principais.

Valores Nulos

    Como os nulos parecem indicar a falta do dado e não um erro, os nulos foram preenchidos com zero para permitir operações matemáticas sem problemas.

Colunas Numéricas

    As colunas que deveriam conter somente números foram convertidas para float onde necessário, substituindo valores inválidos por zero.

Verificação Final

    Foi verificado novamente o tipo de cada coluna, agora somente valores numéricos ou strings, como desejado.
    Foi verificado visualmente o DataFrame tratado, que está adequado para próximas análises.
    O DataFrame tratado foi salvo em um novo arquivo CSV para uso futuro.


# Codigo do tratamento

## Configurando ambiente e realizando imports necessários

In [None]:
from google.colab import drive
import pandas as pd

# Definindo pasta onde está os arquivos necessários
drive.mount('/content/drive')
%cd "/content/drive/MyDrive/Colab Notebooks/projeto/SC"

# Configurando numero de colunas maximas que irão aparecer no DataFrame
pd.set_option('display.max_columns',100)

Mounted at /content/drive
/content/drive/MyDrive/Colab Notebooks/projeto/SC


## Tratamento

In [None]:
#Leitura do arquivo
df = pd.read_csv('AUTOPISTA LITORAL SUL.csv', sep=';', low_memory = False,encoding='ISO-8859-1')
df

Unnamed: 0,data,horario,n_da_ocorrencia,tipo_de_ocorrencia,km,trecho,sentido,tipo_de_acidente,automovel,bicicleta,caminhao,moto,onibus,outros,tracao_animal,transporte_de_cargas_especiais,trator_maquinas,utilitarios,ilesos,levemente_feridos,moderadamente_feridos,gravemente_feridos,mortos
0,01/01/2010,16:30:00,377,com vítima,35,BR-101/SC,Sul,Queda de Moto,,,,1.0,,,,,,,0,2.0,,,
1,01/01/2010,22:59:00,554,sem vítima,7819999694824219,BR-116/PR,Sul,Saida de Pista,1.0,,,,,,,,,,1,,,,
2,01/01/2010,19:22:00,489,sem vítima,97,BR-116/PR,Sul,Colisão Traseira,2.0,,,,,,,,,,4,,,,
3,01/01/2010,01:51:00,24,sem vítima,129,BR-101/SC,Norte,Queda de Moto,,,,1.0,,,,,,,1,,,,
4,01/01/2010,15:52:00,354,sem vítima,132,BR-101/SC,Sul,Saida de Pista,1.0,,,,,,,,,,1,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
123314,22/06/2023,16:41:11,269,Sem vítima,119835,BR-101/SC,Decrescente,Colisão traseira,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1,0.0,0.0,0.0,0.0
123315,22/06/2023,18:14:32,295,Sem vítima,38488,BR-101/SC,Decrescente,Colisão traseira,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1,0.0,0.0,0.0,0.0
123316,22/06/2023,18:24:55,299,Sem vítima,238413,BR-101/SC,Decrescente,Choque,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,1,0.0,0.0,0.0,0.0
123317,22/06/2023,18:36:38,307,Com vítima,615314,BR-376/SC,Decrescente,Atropelamento de pedestre,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0,0.0,0.0,0.0,1.0


### Verificando e eliminando linhas duplicadas

In [None]:
df.n_da_ocorrencia.is_unique # Verif›icando se o número da occorrência é unico. O fato de ser único ou não, não nos diz muita coisa, ja que as ocorrências foram feitas em locais diferentes, podendo repetir o nº.

False

In [None]:
#Verificando linhas duplicadas
duplicated_rows = df[df.duplicated(keep=False)]
duplicated_rows.count()

data                              602
horario                           602
n_da_ocorrencia                   602
tipo_de_ocorrencia                602
km                                602
trecho                            602
sentido                           602
tipo_de_acidente                  602
automovel                         484
bicicleta                           8
caminhao                          100
moto                              110
onibus                              2
outros                             66
tracao_animal                       0
transporte_de_cargas_especiais      0
trator_maquinas                     0
utilitarios                        84
ilesos                            602
levemente_feridos                 112
moderadamente_feridos              18
gravemente_feridos                  2
mortos                              4
dtype: int64

In [None]:
#Excluindo as linhas duplicadas
df = df.drop_duplicates()

#Verificando novamente se há linhas duplicadas
duplicated_rows = df[df.duplicated(keep=False)]
duplicated_rows.count()

data                              0
horario                           0
n_da_ocorrencia                   0
tipo_de_ocorrencia                0
km                                0
trecho                            0
sentido                           0
tipo_de_acidente                  0
automovel                         0
bicicleta                         0
caminhao                          0
moto                              0
onibus                            0
outros                            0
tracao_animal                     0
transporte_de_cargas_especiais    0
trator_maquinas                   0
utilitarios                       0
ilesos                            0
levemente_feridos                 0
moderadamente_feridos             0
gravemente_feridos                0
mortos                            0
dtype: int64

### Tipos de dados

In [None]:
#Verificando os tipos de cada coluna
df.dtypes

data                               object
horario                            object
n_da_ocorrencia                     int64
tipo_de_ocorrencia                 object
km                                 object
trecho                             object
sentido                            object
tipo_de_acidente                   object
automovel                         float64
bicicleta                         float64
caminhao                          float64
moto                              float64
onibus                            float64
outros                            float64
tracao_animal                     float64
transporte_de_cargas_especiais    float64
trator_maquinas                   float64
utilitarios                       float64
ilesos                              int64
levemente_feridos                 float64
moderadamente_feridos             float64
gravemente_feridos                float64
mortos                            float64
dtype: object

#### Data

In [None]:
#Verificando a integridade da data no formato DateTime
type(df['data'][1])

#Segundo o output é uma sring.


str

In [None]:
#Realizando um conversão para normalizar a coluna data
df['data'] = pd.to_datetime(df['data'], dayfirst=True).dt.date


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df['data'] = pd.to_datetime(df['data'], dayfirst=True).dt.date


In [None]:
#Verificando a integridade da data no formato DateTime
type(df['data'][1])

datetime.date

#### Horario

In [None]:
#Verificando a integridade do horario no formato DateTime
type(df['horario'][1])

#Segundo o output é uma sring.


str

In [None]:
df['horario'] = pd.to_datetime(df['horario'], format='%H:%M:%S').dt.time

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df['horario'] = pd.to_datetime(df['horario'], format='%H:%M:%S').dt.time


In [None]:
#Verificando a integridade do horario no formato DateTime
type(df['horario'][1])

datetime.time

In [None]:
# Criar uma nova coluna 'ano' com o ano da data
df['ano'] = df['data'].apply(lambda x: x.year)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df['ano'] = df['data'].apply(lambda x: x.year)


In [None]:
# Criar uma nova coluna 'mes' com o ano da data
df['mes'] = df['data'].apply(lambda x: x.month)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df['mes'] = df['data'].apply(lambda x: x.month)


In [None]:
#Olhando o DataFrame de forma Geral para conferir se as mudanças impactaram na estrutura.

df

Unnamed: 0,data,horario,n_da_ocorrencia,tipo_de_ocorrencia,km,trecho,sentido,tipo_de_acidente,automovel,bicicleta,caminhao,moto,onibus,outros,tracao_animal,transporte_de_cargas_especiais,trator_maquinas,utilitarios,ilesos,levemente_feridos,moderadamente_feridos,gravemente_feridos,mortos,ano,mes
0,2010-01-01,16:30:00,377,com vítima,35,BR-101/SC,Sul,Queda de Moto,,,,1.0,,,,,,,0,2.0,,,,2010,1
1,2010-01-01,22:59:00,554,sem vítima,7819999694824219,BR-116/PR,Sul,Saida de Pista,1.0,,,,,,,,,,1,,,,,2010,1
2,2010-01-01,19:22:00,489,sem vítima,97,BR-116/PR,Sul,Colisão Traseira,2.0,,,,,,,,,,4,,,,,2010,1
3,2010-01-01,01:51:00,24,sem vítima,129,BR-101/SC,Norte,Queda de Moto,,,,1.0,,,,,,,1,,,,,2010,1
4,2010-01-01,15:52:00,354,sem vítima,132,BR-101/SC,Sul,Saida de Pista,1.0,,,,,,,,,,1,,,,,2010,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
123314,2023-06-22,16:41:11,269,Sem vítima,119835,BR-101/SC,Decrescente,Colisão traseira,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1,0.0,0.0,0.0,0.0,2023,6
123315,2023-06-22,18:14:32,295,Sem vítima,38488,BR-101/SC,Decrescente,Colisão traseira,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1,0.0,0.0,0.0,0.0,2023,6
123316,2023-06-22,18:24:55,299,Sem vítima,238413,BR-101/SC,Decrescente,Choque,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,1,0.0,0.0,0.0,0.0,2023,6
123317,2023-06-22,18:36:38,307,Com vítima,615314,BR-376/SC,Decrescente,Atropelamento de pedestre,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0,0.0,0.0,0.0,1.0,2023,6


### Normalização de dados

Esta Seção serve para normalizar alguns dados e torná-los mais legíveis para uma eventual análise e apresentação.

#### Categorias

In [None]:
#Verificando os tipos de ocorrência
pd.unique(df['tipo_de_ocorrencia'])

array(['com vítima', 'sem vítima', '3 - Acidente com Danos Materiais',
       '2 - Acidente com VITIMA', '1 - Acidente com Vitima Fatal',
       'Sem vítima', 'Com vítima'], dtype=object)

In [None]:
#Realizando mapeamento para eventual normalização.
mapeamento = {
    'com vítima': 'acidente com vitima',
    'sem vítima': 'acidente sem vitima',
    '3 - Acidente com Danos Materiais': 'acidente com danos materiais',
    '2 - Acidente com VITIMA': 'acidente com vitima',
    '1 - Acidente com Vitima Fatal': 'acidente com vitima',
    'Sem vítima': 'acidente sem vitima',
    'Com vítima': 'acidente com vitima'
}

In [None]:
# Normalizando a coluna de ocorrencias
coluna_para_padronizar = 'tipo_de_ocorrencia'
df[coluna_para_padronizar] = df[coluna_para_padronizar].replace(mapeamento)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df[coluna_para_padronizar] = df[coluna_para_padronizar].replace(mapeamento)


In [None]:
#Verificanda a normalização
pd.unique(df['tipo_de_ocorrencia'])

array(['acidente com vitima', 'acidente sem vitima',
       'acidente com danos materiais'], dtype=object)

In [None]:
# Analizando a coluna "sentido"
pd.unique(df['sentido'])

array(['Sul', 'Norte', 'Decrescente', 'Crescente'], dtype=object)

In [None]:
#Verificando a coluna "tipos de acidente"
pd.unique(df['tipo_de_acidente'])

array(['Queda de Moto', 'Saida de Pista', 'Colisão Traseira',
       'Colisão Lateral', 'Atropelamento de Animal',
       'Choque - Defensa, barreira ou "submarino"',
       'Atropelamento - Morador', 'Choque - Objeto sobre a pista',
       'Engavetamento', 'Capotamento', 'Choque - Poste',
       'Colisão Transversal', 'Atropelamento - Ciclista', 'Tombamento',
       nan, 'Atropelamento - Ambulante', 'Choque - Talude',
       'Choque - Outros', 'Choque - Suporte de Sinalização',
       'Objeto lançado contra veículo', 'Choque - Arvore',
       'Choque - Cancela de Pedagio', 'Colisão Frontal',
       'Atropelamento - Andarilho', 'Outros',
       'Atropelamento - Funcionário', 'Choque - Elemento de Drenagem',
       'Outros - Sequência', 'Atropelamento - Usuário',
       'Atropelamento - Outros', 'Choque - Veiculo parado na pista',
       'Choque - Objeto não identificado',
       'Atropelamento - Sem Informação', 'Soterramento', 'Submersão',
       'Choque - Veiculo parado no acostament

In [None]:
import numpy as np
# Mapeamento das categorias
category_mapping = {
    'Atropelamento': ['Atropelamento de Animal', 'Atropelamento - Morador', 'Atropelamento - Ciclista', 'Atropelamento - Ambulante',
                      'Atropelamento - Andarilho', 'Atropelamento - Funcionário', 'Atropelamento - Usuário', 'Atropelamento - Outros',
                      'Atropelamento - Sem Informação', 'Atropelamento - Animal', 'Atropelamento de pedestre'],
    'Colisão Frontal': ['Colisão Frontal', 'Colisão frontal'],
    'Colisão Traseira': ['Colisão Traseira', 'Colisão traseira'],
    'Colisão Lateral': ['Colisão Lateral', 'Colisão lateral no mesmo sentido'],
    'Saida de Pista': ['Saida de Pista', 'Saída de pista'],
    'Queda de Moto': ['Queda de Moto', 'Queda de moto'],
    'Colisão Transversal': ['Colisão Transversal', 'Colisão transversal'],
    'Choque': ['Choque', 'Choque - Defensa, barreira ou "submarino"', 'Choque - Objeto sobre a pista', 'Choque - Poste', 'Choque - Talude',
               'Choque - Outros', 'Choque - Suporte de Sinalização', 'Choque - Arvore', 'Choque - Cancela de Pedagio', 'Choque - Elemento de Drenagem',
               'Choque - Veiculo parado na pista', 'Choque - Objeto não identificado', 'Choque - Veiculo parado no acostamento'],
    'Engavetamento': ['Engavetamento'],
    'Capotamento': ['Capotamento'],
    'Objeto Lançado': ['Objeto lançado contra veículo'],
    'Incidentes': ['Incêndio', 'Explosão', 'Submersão', 'Soterramento', 'Submersão', 'Incidentes de outra natureza'],
    'Outros': ['Outros', 'Outros - Sequência']
}

# Função para mapear as categorias
def map_categories(accident_type):
    for category, types in category_mapping.items():
        if accident_type in types:
            return category
    return np.nan

# Aplicar o mapeamento
df['tipo_de_acidente'] = df['tipo_de_acidente'].apply(map_categories)


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df['tipo_de_acidente'] = df['tipo_de_acidente'].apply(map_categories)


In [None]:
#Verificando normalização da coluna "tipos de acidente"
pd.unique(df['tipo_de_acidente'])

array(['Queda de Moto', 'Saida de Pista', 'Colisão Traseira',
       'Colisão Lateral', 'Atropelamento', 'Choque', 'Engavetamento',
       'Capotamento', 'Colisão Transversal', nan, 'Objeto Lançado',
       'Colisão Frontal', 'Outros', 'Incidentes'], dtype=object)

#### Nulos

Resolvi seguir a lógica de que se um valor é nulo ele não foi colocado por erro e/ou por não existir aquele dado. Sendo isso, irei transformar todos os nulos em 0 para evitar problemas em operações matemáticas futuras ou ate mesmo plotagem de gráficos.

In [None]:
#Verificando quantidade de nulos
df.isnull().sum()

data                                   0
horario                                0
n_da_ocorrencia                        0
tipo_de_ocorrencia                     0
km                                     0
trecho                                 0
sentido                                0
tipo_de_acidente                    2302
automovel                          30106
bicicleta                         111975
caminhao                           85821
moto                               92400
onibus                            112028
outros                            100925
tracao_animal                     113417
transporte_de_cargas_especiais    113445
trator_maquinas                   113416
utilitarios                       104848
ilesos                                 0
levemente_feridos                  90510
moderadamente_feridos             108153
gravemente_feridos                111746
mortos                            112018
ano                                    0
mes             

In [None]:
#Preenchendo nulos com 0 no local
df.fillna(0, inplace=True)

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df.fillna(0, inplace=True)


In [None]:
#Verificando os nulos novamente
df.isnull().sum()

data                              0
horario                           0
n_da_ocorrencia                   0
tipo_de_ocorrencia                0
km                                0
trecho                            0
sentido                           0
tipo_de_acidente                  0
automovel                         0
bicicleta                         0
caminhao                          0
moto                              0
onibus                            0
outros                            0
tracao_animal                     0
transporte_de_cargas_especiais    0
trator_maquinas                   0
utilitarios                       0
ilesos                            0
levemente_feridos                 0
moderadamente_feridos             0
gravemente_feridos                0
mortos                            0
ano                               0
mes                               0
dtype: int64

#### Verificando as colunas com tipos errados

In [None]:
df.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 123018 entries, 0 to 123318
Data columns (total 25 columns):
 #   Column                          Non-Null Count   Dtype  
---  ------                          --------------   -----  
 0   data                            123018 non-null  object 
 1   horario                         123018 non-null  object 
 2   n_da_ocorrencia                 123018 non-null  int64  
 3   tipo_de_ocorrencia              123018 non-null  object 
 4   km                              123018 non-null  object 
 5   trecho                          123018 non-null  object 
 6   sentido                         123018 non-null  object 
 7   tipo_de_acidente                123018 non-null  object 
 8   automovel                       123018 non-null  float64
 9   bicicleta                       123018 non-null  float64
 10  caminhao                        123018 non-null  float64
 11  moto                            123018 non-null  float64
 12  onibus          

In [None]:
# Analisando se todos os valores são floats para futuras operações matemáticas
colunas_float = ['automovel', 'bicicleta', 'caminhao', 'moto', 'onibus', 'outros', 'tracao_animal', 'transporte_de_cargas_especiais', 'trator_maquinas', 'utilitarios', 'ilesos']

for coluna in colunas_float:
  try:
    df[coluna].sum()

  except TypeError:
    print(f'{coluna} contem tipos não float')

In [None]:
# Normalizando colunas que precisam ser float, se a coluna não for float, o codigo tenta converter, se não conseguir, adiciona 0 no local
for coluna in colunas_float:
  lista = []

  for veiculo in df[coluna].tolist():
    try:
      lista.append(float(veiculo))
    except:
      lista.append(0)

  df[coluna] = lista

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df[coluna] = lista


In [None]:
df.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 123018 entries, 0 to 123318
Data columns (total 25 columns):
 #   Column                          Non-Null Count   Dtype  
---  ------                          --------------   -----  
 0   data                            123018 non-null  object 
 1   horario                         123018 non-null  object 
 2   n_da_ocorrencia                 123018 non-null  int64  
 3   tipo_de_ocorrencia              123018 non-null  object 
 4   km                              123018 non-null  object 
 5   trecho                          123018 non-null  object 
 6   sentido                         123018 non-null  object 
 7   tipo_de_acidente                123018 non-null  object 
 8   automovel                       123018 non-null  float64
 9   bicicleta                       123018 non-null  float64
 10  caminhao                        123018 non-null  float64
 11  moto                            123018 non-null  float64
 12  onibus          

In [None]:
#Olhando o dataframe para verificar integridade geral
display(df)

Unnamed: 0,data,horario,n_da_ocorrencia,tipo_de_ocorrencia,km,trecho,sentido,tipo_de_acidente,automovel,bicicleta,caminhao,moto,onibus,outros,tracao_animal,transporte_de_cargas_especiais,trator_maquinas,utilitarios,ilesos,levemente_feridos,moderadamente_feridos,gravemente_feridos,mortos,ano,mes
0,2010-01-01,16:30:00,377,acidente com vitima,35,BR-101/SC,Sul,Queda de Moto,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,2.0,0.0,0.0,0.0,2010,1
1,2010-01-01,22:59:00,554,acidente sem vitima,7819999694824219,BR-116/PR,Sul,Saida de Pista,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,2010,1
2,2010-01-01,19:22:00,489,acidente sem vitima,97,BR-116/PR,Sul,Colisão Traseira,2.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,4.0,0.0,0.0,0.0,0.0,2010,1
3,2010-01-01,01:51:00,24,acidente sem vitima,129,BR-101/SC,Norte,Queda de Moto,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,2010,1
4,2010-01-01,15:52:00,354,acidente sem vitima,132,BR-101/SC,Sul,Saida de Pista,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,2010,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
123314,2023-06-22,16:41:11,269,acidente sem vitima,119835,BR-101/SC,Decrescente,Colisão Traseira,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,2023,6
123315,2023-06-22,18:14:32,295,acidente sem vitima,38488,BR-101/SC,Decrescente,Colisão Traseira,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,2023,6
123316,2023-06-22,18:24:55,299,acidente sem vitima,238413,BR-101/SC,Decrescente,Choque,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,2023,6
123317,2023-06-22,18:36:38,307,acidente com vitima,615314,BR-376/SC,Decrescente,Atropelamento,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,2023,6


## Salvando arquivo tratado (Só execute depois que executar todos acima)

In [None]:
df.to_csv('dados_sc_tratados.csv', index=False)