# Causas externas de morbidade e de mortalidade: Acidentes de Transporte


A CID-10 é a Classificação Internacional de Doenças [(International Statistical Classification of Diseases and Related Health Problems – ICD](https://icd.who.int/browse10/2010/en), está em sua décima revisão, feita em 2010. 
Essa classificação também abrange as causas externas de mortalidade, como acidentes de trânsito. E visto que o CID-10 também é usado nos dados do SIM, precisamos saber a descrição de cada código a fim de termos maior entendimento sobre a mortalidade no trânsito.

A partir da página [CID-10 Capítulo XX: Causas externas de morbidade e de mortalidade](https://pt.wikipedia.org/wiki/CID-10_Cap%C3%ADtulo_XX:_Causas_externas_de_morbidade_e_de_mortalidade) disponível no Wikipédia, fizemos a extração dos códigos e descrições.

In [1]:
from bs4 import BeautifulSoup as bs
import pandas as pd
import requests
import lxml
pd.set_option('display.max_colwidth', None)

Os dados disponíveis em [A Classificação Internacional de Doenças CID-10 do Mobilidade Ativa]("http://mobilidadeativa.org.br/cid-10/") fornece a descrição das faixas de código. O ideal seria ter a informação no formato mais granular possível.

In [2]:
causes = pd.read_html("http://mobilidadeativa.org.br/cid-10/")
causes[0]

Unnamed: 0,0,1
0,Categoria CID-10,Descrição
1,V01-V09,Pedestre traumatizado em acidente de transporte
2,V10-V19,Ciclista traumatizado em acidente de transporte
3,V20-V29,Motociclista traumatizado em acidente de transporte
4,V30-V39,Ocupante de triciclo motorizado traumatizado em acidente de transporte
5,V40-V49,Ocupante de automóvel traumatizado em acidente de transporte
6,V50-V59,Ocupante de caminhonete traumatizado em acidente de transporte
7,V60-V69,Ocupante de veículo de transporte pesado traumatizado em acidente
8,V70-V79,Ocupante de ônibus traumatizado em acidente de transporte
9,V80-V89,Outros acidentes de transporte terrestre


## Extraindo códigos e descrições de forma granular

Vamos tentar a partir da página [CID-10 Capítulo XX: Causas externas de morbidade e de mortalidade do Wikipédia](https://pt.wikipedia.org/wiki/CID-10_Cap%C3%ADtulo_XX:_Causas_externas_de_morbidade_e_de_mortalidade)

In [3]:
page = requests.get("https://pt.wikipedia.org/wiki/CID-10_Cap%C3%ADtulo_XX:_Causas_externas_de_morbidade_e_de_mortalidade")
page = bs(page.text, 'html.parser')

In [4]:
causes = []

for ul in page.findAll('ul'):
    for li in ul.findAll('li'):
        if li.text[0:3] in ['(V0','(V1', '(V2', '(V3', '(V4', '(V5', '(V6', '(V7', '(V8', '(V9']:
            causes.append(li.text.split('\n')[0])

len(causes)

449

In [5]:
causes_df = pd.DataFrame({'causes': causes})
causes_df.head(15)

Unnamed: 0,causes
0,(V01) Pedestre traumatizado em colisão com um veículo a pedal
1,(V02) Pedestre traumatizado em colisão com um veículo a motor de duas ou três rodas
2,"(V03) Pedestre traumatizado em colisão com um automóvel (carro), “pick up” ou caminhonete"
3,(V04) Pedestre traumatizado em colisão com um veículo de transporte pesado ou com um ônibus
4,(V05) Pedestre traumatizado em colisão com trem (comboio) ou um veículo ferroviário
5,(V06) Pedestre traumatizado em colisão com outro veículo não-motorizado
6,(V09) Pedestre traumatizado em outros acidentes de transporte e em acidentes de transporte não especificados
7,"(V09.0) Pedestre traumatizado em um acidente não-de-trânsito, envolvendo outros veículos a motor e os não especificados"
8,(V09.1) Pedestre traumatizado em um acidente não-de-trânsito não especificado
9,"(V09.2) Pedestre traumatizado em um acidente de trânsito envolvendo outros veículos e os não especificados, a motor"


In [6]:
causes_df = causes_df.drop_duplicates()
len(causes_df)

273

In [7]:
causes_df['causes'] = causes_df['causes'].str.rstrip().str.lstrip().str.lstrip("(")
causes_df.head()

Unnamed: 0,causes
0,V01) Pedestre traumatizado em colisão com um veículo a pedal
1,V02) Pedestre traumatizado em colisão com um veículo a motor de duas ou três rodas
2,"V03) Pedestre traumatizado em colisão com um automóvel (carro), “pick up” ou caminhonete"
3,V04) Pedestre traumatizado em colisão com um veículo de transporte pesado ou com um ônibus
4,V05) Pedestre traumatizado em colisão com trem (comboio) ou um veículo ferroviário


In [8]:
causes_df['code'] = causes_df['causes'].str.split(")").str[0]
causes_df.head()

Unnamed: 0,causes,code
0,V01) Pedestre traumatizado em colisão com um veículo a pedal,V01
1,V02) Pedestre traumatizado em colisão com um veículo a motor de duas ou três rodas,V02
2,"V03) Pedestre traumatizado em colisão com um automóvel (carro), “pick up” ou caminhonete",V03
3,V04) Pedestre traumatizado em colisão com um veículo de transporte pesado ou com um ônibus,V04
4,V05) Pedestre traumatizado em colisão com trem (comboio) ou um veículo ferroviário,V05


Na descrição das causas também há a utilização de ")" como em : `V03) Pedestre traumatizado em colisão com um automóvel (carro), “pick up” ou caminhonete` por isso após o split para retirar o código `V03` juntamos as partes da descrição que foram separadas.

In [9]:
causes_df['causes'] = causes_df['causes'].str.split(")").str[1] + \
                        causes_df['causes'].str.split(")").str[2].apply(lambda x: ")" + x if pd.notna(x) else "")

causes_df.head()

Unnamed: 0,causes,code
0,Pedestre traumatizado em colisão com um veículo a pedal,V01
1,Pedestre traumatizado em colisão com um veículo a motor de duas ou três rodas,V02
2,"Pedestre traumatizado em colisão com um automóvel (carro), “pick up” ou caminhonete",V03
3,Pedestre traumatizado em colisão com um veículo de transporte pesado ou com um ônibus,V04
4,Pedestre traumatizado em colisão com trem (comboio) ou um veículo ferroviário,V05


In [10]:
causes_df['causes'] = causes_df['causes'].str.rstrip().str.lstrip()
causes_df.head(15)

Unnamed: 0,causes,code
0,Pedestre traumatizado em colisão com um veículo a pedal,V01
1,Pedestre traumatizado em colisão com um veículo a motor de duas ou três rodas,V02
2,"Pedestre traumatizado em colisão com um automóvel (carro), “pick up” ou caminhonete",V03
3,Pedestre traumatizado em colisão com um veículo de transporte pesado ou com um ônibus,V04
4,Pedestre traumatizado em colisão com trem (comboio) ou um veículo ferroviário,V05
5,Pedestre traumatizado em colisão com outro veículo não-motorizado,V06
6,Pedestre traumatizado em outros acidentes de transporte e em acidentes de transporte não especificados,V09
7,"Pedestre traumatizado em um acidente não-de-trânsito, envolvendo outros veículos a motor e os não especificados",V09.0
8,Pedestre traumatizado em um acidente não-de-trânsito não especificado,V09.1
9,"Pedestre traumatizado em um acidente de trânsito envolvendo outros veículos e os não especificados, a motor",V09.2


***

## Corrigindo os códigos V19.

Observando a subdivisão do código V19 percebemos que o código `V19.0` se repete mesmo com descrições diferentes. 

In [11]:
causes_df.loc[causes_df['code'] == 'V19.0']

Unnamed: 0,causes,code
27,"Condutor traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente não-de-trânsito",V19.0
28,"Passageiro traumatizado em colisão com outro veículos e com veículos não especificados, a motor, em um acidente não-de-trânsito",V19.0
29,"Ciclista não especificado traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente não-de-trânsito",V19.0
30,Ciclista (qualquer) traumatizado em um acidente não especificado e não-de-trânsito,V19.0
31,"Condutor traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente de trânsito",V19.0
32,"Passageiro traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente de trânsito",V19.0
33,"Ciclista não especificado traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente de trânsito",V19.0
34,Ciclista (qualquer) traumatizado em outros acidentes de transporte especificados,V19.0
35,Ciclista (qualquer) traumatizado em um acidente de trânsito não especificado,V19.0


Ao checar na [fonte indicada pela própria página](https://icd.who.int/browse10/2016/en#/V19.0) vimos que os códigos corretos vão de `V19.0` a `V19.9`. 
Fizemos a correção no dataframe e solicitaremos a edição na página do Wikipédia.

| Código | Descrição |
|------|-------------|
|V19.0|Condutor traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente não-de-trânsito|
|V19.1|Passageiro traumatizado em colisão com outro veículos e com veículos não especificados, a motor, em um acidente não-de-trânsito|
|V19.2|Ciclista não especificado traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente não-de-trânsito|
|V19.3|Ciclista (qualquer) traumatizado em um acidente não especificado e não-de-trânsito|
|V19.4|Condutor traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente de trânsito|
|V19.5|Passageiro traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente de trânsito|
|V19.6|Ciclista não especificado traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente de trânsito|
|V19.8|Ciclista (qualquer) traumatizado em outros acidentes de transporte especificados|
|V19.9|Ciclista (qualquer) traumatizado em um acidente de trânsito não especificado|

In [12]:
new_codes = [
{'code': 'V19.1', 'description': 'Passageiro traumatizado em colisão com outro veículos e com veículos não especificados, a motor, em um acidente não-de-trânsito'},
{'code': 'V19.2', 'description': 'Ciclista não especificado traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente não-de-trânsito'},
{'code': 'V19.3', 'description': 'Ciclista (qualquer) traumatizado em um acidente não especificado e não-de-trânsito'},
{'code': 'V19.4', 'description': 'Condutor traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente de trânsito'},
{'code': 'V19.5', 'description': 'Passageiro traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente de trânsito'},
{'code': 'V19.6', 'description': 'Ciclista não especificado traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente de trânsito'},
{'code': 'V19.8', 'description': 'Ciclista (qualquer) traumatizado em outros acidentes de transporte especificados'},
{'code': 'V19.9', 'description': 'Ciclista (qualquer) traumatizado em um acidente de trânsito não especificado'}]

In [13]:
for new_code in new_codes:
    causes_df.loc[(causes_df['causes'] == new_code.get('description')) &
             (causes_df['code'] == 'V19.0'), 'code'] = new_code.get('code')
    
causes_df.loc[27:35]

Unnamed: 0,causes,code
27,"Condutor traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente não-de-trânsito",V19.0
28,"Passageiro traumatizado em colisão com outro veículos e com veículos não especificados, a motor, em um acidente não-de-trânsito",V19.1
29,"Ciclista não especificado traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente não-de-trânsito",V19.2
30,Ciclista (qualquer) traumatizado em um acidente não especificado e não-de-trânsito,V19.3
31,"Condutor traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente de trânsito",V19.4
32,"Passageiro traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente de trânsito",V19.5
33,"Ciclista não especificado traumatizado em colisão com outros veículos e com veículos não especificados, a motor, em um acidente de trânsito",V19.6
34,Ciclista (qualquer) traumatizado em outros acidentes de transporte especificados,V19.8
35,Ciclista (qualquer) traumatizado em um acidente de trânsito não especificado,V19.9


In [15]:
causes_df.to_csv('data/causes_cid10.csv', index=False)