## Preprocessando SINAN raw_data

### Dependências

In [1]:
import pandas as pd
import plotly.express as px

### Carregando dados

In [2]:
SINAN_RAW_PATH = './../data/raw_data/2. SINAN (violencia sexual)/DadosViolSexualDomestica_2013-18_SINAN.csv'

In [3]:
# Apenas para testes (ler apenas as primeiras nrows linhas)
nrows = 10000

raw_dataframe = pd.read_csv(SINAN_RAW_PATH, nrows = nrows)

print('Número de colunas:', len(raw_dataframe.columns))
print('Número de linhas:', len(raw_dataframe))

Número de colunas: 158
Número de linhas: 10000


### Descrição das colunas (colunas completas)

- TP_NOT: (Categórica) Identifica o tipo da notificação

- ID_AGRAVO: (Código - Str) Nome e código do agravo notificado segundo CID-10 (Centro Colaborador da OMS para a Classificação de Doenças em Português)

- DT_NOTIFIC: (YYYY-MM-DD) Data de preenchimento da ficha de notificação

- SG_UF_NOT: (Código - Int) Sigla da Unidade Federativa onde está localizada a unidade de saúde (ou outra fonte notificadora) que realizou a notificação. A sigla é uma variável que está associada ao código na tabela.

- ID_MUNICIP: (Código - Int) Código do município onde está localizada a unidade de saúde (ou outra fonte notificadora) que realizou a notificação. O nome está associado ao código na tabela de municípios.

- ID_UNIDADE: (Código - Int) Código da unidade de saúde da área de abrangência da unidade notificadora.

- DT_OCOR: (YYYY-MM-DD) Data da ocorrência da violência.

- CS_SEXO: (Categórica) Sexo do paciente.

- CS_GESTANT: (Categórica) Idade gestacional da paciente.

- ?? SG_UF: (Código - Int) Sigla da Unidade Federativa onde está localizada a unidade de saúde (ou outra fonte notificadora) que realizou a notificação. A sigla é uma variável que está associada ao código na tabela.

- ID_MN_RESI: (Código - Int) Sistema relaciona o campo município de notificação com o campo regional da tabela de municípios

- ID_PAIS: (Código - Int) Se UF for digitada este campo é preenchido automaticamente com “Brasil”.

- ?? DEF_TRANS: (Categórica ??) 

- LES_AUTOP: (Categórica) Informar se a lesão foi autoprovocada

- VIOL_FISIC: (Categórica) Informar se ocorreu violência física

- VIOL_PSICO: (Categórica) Informar se ocorreu violência psicológica

- VIOL_TORT: (Categórica) Informar se ocorreu tortura

- VIOL_SEXU: (Categórica) Informar se ocorreu violência sexual

- VIOL_TRAF: (Categórica) Informar se ocorreu tráfico de seres humanos

- VIOL_FINAN: (Categórica) Informar se ocorreu violência financeira/econômica ??

- VIOL_NEGLI: (Categórica) Informar se ocorreu negligência/abandono

- VIOL_INFAN: (Categórica) Informar se ocorreu trabalho infantil

- VIOL_LEGAL: (Categórica) Informar se ocorreu intervenção legal

- VIOL_OUTR: (Categórica) Informar se ocorreu outro tipo de violência

- SEX_ASSEDI: (Categórica) Informar se ocorreu assedio sexual

- SEX_ESTUPR: (Categórica) Informar se ocorreu estupro

- ?? SEX_PUDOR: (Categórica) 

- SEX_PORNO: (Categórica) Informar se ocorreu pornografia infantíl

- SEX_EXPLO: (Categórica) Informar se ocorreu exploração sexual

- SEX_OUTRO: (Categórica) Informar se ocorreu outro tipo de violência sexual

- PEN_ORAL: (Categórica) 

- PEN_ANAL: (Categórica)

- PEN_VAGINA: (Categórica)

- PROC_DST: (Categórica) Informar se ocorreu profilaxia DST

- PROC_HIV: (Categórica) Informar se ocorreu profilaxia HIV

- PROC_HEPB: (Categórica) Informar se ocorreu profilaxia hepatite B

- PROC_SANG: (Categórica) Informar se ocorreu coleta de sangue

- PROC_SEMEN: (Categórica) Informar se ocorreu coleta de semen

- PROC_VAGIN: (Categórica) Informar se ocorreu coleta de secreção vaginal

- PROC_CONTR: (Categórica) Informar se ocorreu contracepção de emergencia

- PROC_ABORT: (Categórica) Informar se ocorreu aborto previsto em lei

- ?? CONS_GRAV:

- ?? CONS_DST:

- ?? CONS_SUIC:

- ?? CONS_MENT:

- ?? CONS_COMP:

- ?? CONS_ESTRE:

- ?? CONS_OUTR:

- REL_PAI: (Categórica) Agressor era o pai?

- REL_MAE: (Categórica) Agressor era a mãe?

- REL_PAD: (Categórica) Agressor era o padrasto?

- REL_CONJ: (Categórica) Agressor era o/a cônjuge?

- REL_EXCON: (Categórica) Agressor era o/a ex-cônjuge?

- REL_NAMO: (Categórica) Agressor era o/a namorado/a?

- REL_EXNAM: (Categórica) Agressor era o/a ex-namorado/a?

- REL_FILHO: (Categórica) Agressor era o/a filho/a?

- REL_DESCO: (Categórica) Agressor era desconhecido?

- REL_IRMAO: (Categórica) Agressor era o/a irmão/irmã?

- REL_CONHEC: (Categórica) Agressor era o/a amigo/a?

- REL_CUIDA: (Categórica) Agressor era o/a cuidador/a?

- REL_PATRAO: (Categórica) Agressor era o/a patrão/patroa?

- REL_INST: (Categórica) Agressor era pessoa com relação institucional?

- REL_POL: (Categórica) Agressor era policial/agente da lei?

- REL_PROPRI: (Categórica) Agressor era a própria pessoa?

- REL_OUTROS: (Categórica) Agressor tinha outro tipo de relação?

- REL_MAD: (Categórica) Agressor era a madrasta?

### Agrupamento de variáveis

#### Relação com agressor

In [4]:
def get_agressor_relationship(dataframe):

    '''
    Retorna uma lista das relações das vítimas com os agressores.

    Ex: ['Pai', 'Desconhecido', ..., 'N/A']
    '''

    relationship_dict = {
        'REL_PAI': 'Pai',
        'REL_MAE': 'Mãe',
        'REL_PAD': 'Padrasto',
        'REL_CONJ': 'Cônjugue',
        'REL_EXCON': 'Ex-cônjuge',
        'REL_NAMO': 'Namorado/a',
        'REL_EXNAM': 'Ex-namorado/a',
        'REL_FILHO': 'Filho/a',
        'REL_DESCO': 'Desconhecido',
        'REL_IRMAO': 'Irmão/ã',
        'REL_CONHEC': 'Amigo/a',
        'REL_CUIDA': 'Cuidador/a',
        'REL_PATRAO': 'Chefe',
        'REL_INST': 'Relação Institucional',
        'REL_POL': 'Policial/Agente da lei',
        'REL_PROPRI': 'Próprio/a',
        'REL_OUTROS': 'Outra pessoa',
        'REL_MAD': 'Madrasta'
    }

    agressor_relationship = []

    for index in dataframe.index:

        case = dataframe.loc[index]

        found_rel = False

        for key in relationship_dict.keys():

            relantionship = relationship_dict[key]

            if case[key] == '1':

                agressor_relationship.append(relantionship)
                found_rel = True

                break

        if not found_rel:

            agressor_relationship.append('N/A')

    return agressor_relationship

In [5]:
raw_dataframe['AGRESSOR'] = get_agressor_relationship(raw_dataframe)

In [6]:
fig = px.histogram(raw_dataframe, x="AGRESSOR", )
fig.show()

In [46]:
raw_dataframe['AGRESSOR']

0       Namorado/a
1       Namorado/a
2       Namorado/a
3         Cônjugue
4       Ex-cônjuge
           ...    
9995           N/A
9996           N/A
9997           N/A
9998           N/A
9999           N/A
Name: AGRESSOR, Length: 10000, dtype: object