# Tratamento dos dados relacionados às vacinas aplicadas pelo SUS de Hepatite A e Hepatite B 

# Importações dos pacotes

In [1]:
import pandas as pd
from funcoes import limpa_vacinas_dados

# Dados

[cobertura_vacina_hep.csv](https://github.com/Pedro-correa-almeida/projeto_um_mal_silencioso/blob/main/dados_brutos/cobertura_vacina_hep.csv) : dados relacionados à cobertura das vacinas contra Hepatite B e Hepatite A, a fórmula de cálculo da cobertura é o número de doses aplicadas da dose indicada (1ª, 2ª, 3ª dose ou dose única, conforme a vacina) dividida pela população alvo, multiplicado por 100.

[vacina_hepatite.csv](https://github.com/Pedro-correa-almeida/projeto_um_mal_silencioso/blob/main/dados_brutos/vacina_hepatite.csv) : dados relacionados aos totais de doses aplicadas das vacinas contra Hepatite B e Hepatite A

# Leitura dos dados

In [2]:
#Lendo os dados da cobertura das vacinas HB e HA
vacinas_cobertura = pd.read_csv('../dados_brutos/cobertura_vacina_hep.csv', sep=';', na_values=0, usecols=[0,1,2], decimal=',')

#Lendo os dados relacionados às doses aplicadas das vacinas HB e HA
vacinas_doses = pd.read_csv('../dados_brutos/vacinas_hepatite.csv', sep=';', usecols=[0,1,2,3,4,5], encoding= 'latin-1')

# Funções

In [3]:
help(limpa_vacinas_dados)

Help on function limpa_vacinas_dados in module funcoes:

limpa_vacinas_dados(dados: pandas.core.frame.DataFrame, nome_valores: str)
    Função que recebe o DataFrame relacionado às vacinas aplicadas de hepatite podendo ser sobre cobertura de vacinação ou doses aplicadas realiza algumas transformações:
        
        Retira as linhas que se referem aos dados totais e aos dados mais recentes de 2021 pois o ano ainda não acabou
        Retira a palavra 'Hepatite' antes do nome das colunas
        Renomeia a coluna Óbitos por virus
        Transforma as colunas relacionadas à virus em apenas uma coluna('virus') e atribui o 'nome_valores' como nome da coluna com os valores numéricos
    
    Parâmetros:
    
        dados : DataFrame onde estão os dados sobre vacinação da hepatite, tipo : pd.DataFrame
        nome_valores : o nome que a coluna com os valores numéricos vai se referir, podendo ser 'Cobertura' ou 'Doses_aplicadas' por exemplo, tipo : str
        
    Retorno :
        
     

# Tratando os dados

In [4]:
vacinas_doses.head()

Unnamed: 0,Ano,Hepatite A (HA),Hepatite B (HB),Hepatite B não soroconversão,Hexavalente (HX),Pentavalente (DTP+HB+Hib) (PENTA)
0,1994,0,2297035,0,0,0
1,1995,0,2521993,0,0,0
2,1996,0,2989325,0,0,0
3,1997,0,2002570,0,0,0
4,1998,0,8747762,0,0,0


Primeira coisa que irei fazer é somar todas as vacinas que protegem contra Hepatite B(Hepatite B (HB), Hepatite B não soroconversão, Hexavalente (HX) e Pentavalente (DTP+HB+Hib) (PENTA))

In [5]:
#Somando as vacinas
vacinas_doses['Hepatite B (HB)'] = vacinas_doses['Hepatite B (HB)'] + vacinas_doses['Hepatite B não soroconversão'] + vacinas_doses['Hexavalente (HX)'] + vacinas_doses['Pentavalente (DTP+HB+Hib) (PENTA)'] 
vacinas_doses = vacinas_doses[['Ano', 'Hepatite A (HA)', 'Hepatite B (HB)']]
vacinas_doses

Unnamed: 0,Ano,Hepatite A (HA),Hepatite B (HB)
0,1994,0,2297035
1,1995,0,2521993
2,1996,0,2989325
3,1997,0,2002570
4,1998,0,8747762
5,1999,0,23190333
6,2000,38,16638758
7,2001,41062,35206019
8,2002,58788,30906741
9,2003,68883,24268775


In [6]:
#Usando a função 'limpa_vacinas_dados' para tratar os dados dos dois DataFrames
vacinas_cobertura = limpa_vacinas_dados(vacinas_cobertura, 'Cobertura_vacina_100Hab')
vacinas_doses = limpa_vacinas_dados(vacinas_doses, 'Doses_totais')

In [7]:
#Juntando od dois DataFrames em apenas 1 com base no 'Ano' e no 'virus'
vacinas = pd.merge(vacinas_cobertura,vacinas_doses, on=['Ano', 'virus'], how='outer')
vacinas

Unnamed: 0,Ano,virus,Cobertura_vacina_100Hab,Doses_totais
0,1994,B,8.85,2297035
1,1995,B,10.5,2521993
2,1996,B,16.5,2989325
3,1997,B,5.79,2002570
4,1998,B,12.63,8747762
5,1999,B,83.5,23190333
6,2000,B,91.08,16638758
7,2001,B,91.88,35206019
8,2002,B,91.47,30906741
9,2003,B,92.0,24268775


In [8]:
#Salvando os dados na pasta dados_tratados
vacinas.set_index('Ano').to_csv('../dados_tratados/vacinas_hep')