In [167]:
""" 
Importando bibliotecas que serão utilizadas no projeto

Foi importada a classe 'notification' da biblioteca 'plyer' para criar o alerta sobre o status da requisição da API.
Foi importada a biblioteca 'requests' para requisitar o banco de dados da API. 
Foi importada a biblioteca 'pandas' sob o alias de 'pd' para manipulação e tratamento de dos dados obtidos através da API.
Foi importada a biblioteca 'json' para normalização dos dados JSON obtidos através da API.

"""
from plyer import notification
import requests
import pandas as pd
import json


In [168]:
def alerta_API(nome, response):
    """ 
    Função de alerta sobre a requisição do API. 

    A função deverá retornar se houve sucesso ou qual o tipo de alerta, segundo o valor do status do HTTP. 
    Parâmetros:
        nome (str): nome da API que será retornado no alerta.
        response(int): valor do status do HTTP que será retornado no alerta.

    Retorna:
        Alerta sobre qual API foi requisitado o acesso, se foi bem sucedida ou qual o grau do alerta, junto ao valor do status do HTTP.

    """
    
    titulo = f"Alerta sobre a requisição do API:{nome}"
    
    if response.status_code > 500:
       mensagem  = "Alerta crítico na requisição do API"
    elif 200 > response.status_code < 500:
        mensagem  = "Alerta moderado na requisição do API"
    elif response.status_code == 200:
        mensagem  = "Sucesso ao requisitar o API"
    
    status_HTTP = response.status_code
    
    notification.notify(
        title = titulo,
        message = f"{mensagem}\n o status do HTTP é {status_HTTP}" 
    )


In [169]:
def obter_dados_api(url, nome):
    """ 
    Requisitando os dados sobre a vacinação de COVID no Brasil - API OPENDATASUS.
    O objetivo da função é obter os dados da API. 
    Primeiramente, deve-se atentar para o usuário e senha fornecidos pelo governo federal para a autenticação.
    Foi utilizado o Postman durante o processo de autenticação para obtenção dos dados da API.
    
    Parâmetros:
        url (str): url do API.
        nome (str): nome do API que será exibido no alerta.

        Retorna:
        A função deve retornar um banco de dados JSON 'vacinas_brasil'.

    """
    payload = json.dumps({
        "size": 10000
    })

    headers = {
        'Content-Type': 'application/json',
        'Authorization': 'Basic aW11bml6YWNhb19wdWJsaWM6cWx0bzV0JjdyX0ArI1Rsc3RpZ2k='
    }

    response = requests.post(url, headers=headers, data=payload)
    response_brasil.json()
    vacinas_brasil = response_brasil.json()

    return nome, response, vacinas_brasil

url_api = "https://imunizacao-es.saude.gov.br/_search"
nome_api = "Vacinação Contra COVID-19"

brasil, response_brasil, vacinas_brasil = obter_dados_api(url_api, nome_api)
alerta_API(brasil,response_brasil)

In [170]:
vacinas_brasil["hits"]["hits"]

[{'_index': 'desc-imunizacao-v5',
  '_type': '_doc',
  '_id': '46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0',
  '_score': 1.0,
  '_source': {'sistema_origem': 'SIGRAH',
   'dt_deleted': None,
   'paciente_nacionalidade_enumNacionalidade': 'B',
   'paciente_idade': 26,
   'vacina_categoria_nome': 'Gestantes',
   'vacina_fabricante_nome': 'PFIZER',
   'paciente_endereco_nmMunicipio': 'BELO HORIZONTE',
   'paciente_endereco_coPais': '10',
   'estabelecimento_uf': 'MG',
   'estabelecimento_razaoSocial': 'MUNICIPIO DE BELO HORIZONTE',
   'estabelecimento_valor': '0023604',
   'vacina_lote': '2F1070A',
   'vacina_dataAplicacao': '2024-01-03T00:00:00.000Z',
   'paciente_endereco_uf': 'MG',
   'paciente_endereco_coIbgeMunicipio': '310620',
   'data_importacao_datalake': '2024-01-04T18:06:51.000Z',
   'paciente_id': 'a15e9085636a0b5c516cc694b605307fec3e7e5da03fb37caad2e9a22d192265',
   '@timestamp': '2024-01-04T21:16:14.013Z',
   'document_id': '46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0',
   'id_s

In [171]:
vacinas_brasil["hits"]["hits"]

[{'_index': 'desc-imunizacao-v5',
  '_type': '_doc',
  '_id': '46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0',
  '_score': 1.0,
  '_source': {'sistema_origem': 'SIGRAH',
   'dt_deleted': None,
   'paciente_nacionalidade_enumNacionalidade': 'B',
   'paciente_idade': 26,
   'vacina_categoria_nome': 'Gestantes',
   'vacina_fabricante_nome': 'PFIZER',
   'paciente_endereco_nmMunicipio': 'BELO HORIZONTE',
   'paciente_endereco_coPais': '10',
   'estabelecimento_uf': 'MG',
   'estabelecimento_razaoSocial': 'MUNICIPIO DE BELO HORIZONTE',
   'estabelecimento_valor': '0023604',
   'vacina_lote': '2F1070A',
   'vacina_dataAplicacao': '2024-01-03T00:00:00.000Z',
   'paciente_endereco_uf': 'MG',
   'paciente_endereco_coIbgeMunicipio': '310620',
   'data_importacao_datalake': '2024-01-04T18:06:51.000Z',
   'paciente_id': 'a15e9085636a0b5c516cc694b605307fec3e7e5da03fb37caad2e9a22d192265',
   '@timestamp': '2024-01-04T21:16:14.013Z',
   'document_id': '46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0',
   'id_s

In [172]:
def df_vacinas(vacinas_brasil):
    """
    A função abaixo possui o objetivo de transformar os dados JSON normalizando-os através do json_normalize,
    abrindo o arquivo JSON através do ["hits"]["hits"] e por fim criando um DataFrame.

    Parâmetro:
        vacinas_brasil (dict): Dados em tipo JSON fornecido pelo API. 
    
        Retorna:
        A função deve retornar o DataFrame 'df_vacinas_brasil'.
    """
    return pd.json_normalize(vacinas_brasil["hits"]["hits"])
df_vacinas_brasil = df_vacinas(vacinas_brasil)

df_vacinas_brasil.head(10)

Unnamed: 0,_index,_type,_id,_score,_source.sistema_origem,_source.dt_deleted,_source.paciente_nacionalidade_enumNacionalidade,_source.paciente_idade,_source.vacina_categoria_nome,_source.vacina_fabricante_nome,...,_source.status,_source.paciente_enumSexoBiologico,_source.paciente_endereco_nmPais,_source.estabelecimento_municipio_nome,_source.vacina_grupoAtendimento_codigo,_source.paciente_racaCor_valor,_source.paciente_endereco_cep,_source.estabelecimento_municipio_codigo,_source.vacina_fabricante_referencia,_source.vacina_grupoAtendimento_nome
0,desc-imunizacao-v5,_doc,46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0,1.0,SIGRAH,,B,26,Gestantes,PFIZER,...,final,F,BRASIL,BELO HORIZONTE,1801,PRETA,31585.0,310620,,Gestante
1,desc-imunizacao-v5,_doc,235b404f-749f-47ad-8b59-d5e557ecc7ae-i0b0,1.0,IDS Saúde,2024-01-04T00:00:00.000Z,B,44,Faixa Etária,ASTRAZENECA/FIOCRUZ,...,entered-in-error,M,BRASIL,SAO JOSE DOS PINHAIS,201,SEM INFORMACAO,83015.0,412550,,Pessoas de 18 a 64 anos
2,desc-imunizacao-v5,_doc,2ec5e664-36af-4825-a8f8-f2d2e64c265e-i0b0,1.0,VACIVIDA,2024-01-04T00:00:00.000Z,B,75,Faixa Etária,SINOVAC/BUTANTAN,...,entered-in-error,F,BRASIL,SAO PAULO,203,SEM INFORMACAO,2220.0,355030,,Pessoas de 70 a 74 anos
3,desc-imunizacao-v5,_doc,659c13bd-bb27-4200-b1cd-9d4dc4ce5d00-i0b0,1.0,Novo PNI,,B,7,Faixa Etária,PFIZER - PEDIÁTRICA,...,final,M,BRASIL,BRASILIA,210,PARDA,71695.0,530010,28290.0,Faixa Etária
4,desc-imunizacao-v5,_doc,1648caec-35e6-4047-a5f7-a7b45d583818-i0b0,1.0,Novo PNI,,B,11,Faixa Etária,PFIZER - PEDIÁTRICA,...,final,F,BRASIL,MACAE,210,BRANCA,,330240,28290.0,Faixa Etária
5,desc-imunizacao-v5,_doc,40238edc-6cf1-4af1-94da-fe4db5fd954a-i0b0,1.0,Novo PNI,,B,9,Faixa Etária,PFIZER - PEDIÁTRICA,...,final,F,BRASIL,GOIANIA,210,SEM INFORMACAO,74523.0,520870,28290.0,Faixa Etária
6,desc-imunizacao-v5,_doc,28471b5b-9794-4652-aca9-f3b3699f539a-i0b0,1.0,Novo PNI,,B,7,Faixa Etária,PFIZER - PEDIÁTRICA,...,final,F,BRASIL,PINDORETAMA,210,PARDA,60830.0,231085,28290.0,Faixa Etária
7,desc-imunizacao-v5,_doc,1e058eba-8de9-473f-a9b9-eba2a7e8312b-i0b0,1.0,Novo PNI,,B,10,Faixa Etária,PFIZER - PEDIÁTRICA,...,final,F,BRASIL,RIO VERDE,210,PARDA,75904.0,521880,28290.0,Faixa Etária
8,desc-imunizacao-v5,_doc,f5f6b560-d90a-4e24-ad12-a7d528ec1134-i0b0,1.0,Novo PNI,,B,6,Faixa Etária,PFIZER - PEDIÁTRICA,...,final,F,BRASIL,SALGUEIRO,210,BRANCA,56000.0,261220,28290.0,Faixa Etária
9,desc-imunizacao-v5,_doc,dc0e3cd5-5e1d-4048-b162-9bfd7048ab77-i0b0,1.0,Novo PNI,,B,11,Faixa Etária,PFIZER - PEDIÁTRICA,...,final,M,BRASIL,BELEM,210,SEM INFORMACAO,66085.0,150140,28290.0,Faixa Etária


In [173]:
df_vacinas_brasil.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10000 entries, 0 to 9999
Data columns (total 46 columns):
 #   Column                                            Non-Null Count  Dtype  
---  ------                                            --------------  -----  
 0   _index                                            10000 non-null  object 
 1   _type                                             10000 non-null  object 
 2   _id                                               10000 non-null  object 
 3   _score                                            10000 non-null  float64
 4   _source.sistema_origem                            10000 non-null  object 
 5   _source.dt_deleted                                216 non-null    object 
 6   _source.paciente_nacionalidade_enumNacionalidade  9998 non-null   object 
 7   _source.paciente_idade                            10000 non-null  int64  
 8   _source.vacina_categoria_nome                     9995 non-null   object 
 9   _source.vacina_fab

In [174]:
def colunas_df(df, colunas):
    """ 
    A função possui como objetivo criar um novo DataFrame à partir de uma seleção.

    Parâmetros:
        df (pandas.DataFrame): DataFrame desejado. 

        colunas (list): colunas desejadas para o novo DataFrame.
    
        Retorna:
        A função irá retornar o DataFrame com apenas as colunas selecionadas.
    """
    return df[colunas]

In [175]:
#Data Frame com as informações sobre os pacientes.

df_pacientes_selecao = ['_id','_source.paciente_dataNascimento','_source.paciente_idade',
                        '_source.paciente_racaCor_codigo', '_source.paciente_enumSexoBiologico','_source.paciente_endereco_uf','_source.paciente_endereco_coIbgeMunicipio'] 
df_pacientes = colunas_df(df_vacinas_brasil, df_pacientes_selecao)
df_pacientes.head(10)

Unnamed: 0,_id,_source.paciente_dataNascimento,_source.paciente_idade,_source.paciente_racaCor_codigo,_source.paciente_enumSexoBiologico,_source.paciente_endereco_uf,_source.paciente_endereco_coIbgeMunicipio
0,46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0,1997-08-28,26,2,F,MG,310620
1,235b404f-749f-47ad-8b59-d5e557ecc7ae-i0b0,1977-04-13,44,99,M,PR,412550
2,2ec5e664-36af-4825-a8f8-f2d2e64c265e-i0b0,1946-03-28,75,99,F,SP,355030
3,659c13bd-bb27-4200-b1cd-9d4dc4ce5d00-i0b0,2016-06-07,7,3,M,DF,530010
4,1648caec-35e6-4047-a5f7-a7b45d583818-i0b0,2012-10-07,11,1,F,RJ,330240
5,40238edc-6cf1-4af1-94da-fe4db5fd954a-i0b0,2014-10-24,9,99,F,GO,520870
6,28471b5b-9794-4652-aca9-f3b3699f539a-i0b0,2016-05-19,7,3,F,CE,230440
7,1e058eba-8de9-473f-a9b9-eba2a7e8312b-i0b0,2013-11-10,10,3,F,GO,521880
8,f5f6b560-d90a-4e24-ad12-a7d528ec1134-i0b0,2017-08-27,6,1,F,PE,261220
9,dc0e3cd5-5e1d-4048-b162-9bfd7048ab77-i0b0,2012-03-09,11,99,M,PA,150140


In [176]:
#Data Frame com as informações sobre as vacinas.

df_info_vacinas_selecao = ['_id', '_source.vacina_nome','_source.vacina_fabricante_nome', '_source.vacina_lote', '_source.vacina_codigo',
                            '_source.vacina_categoria_codigo', '_source.vacina_grupoAtendimento_nome', '_source.status' ]
df_info_vacinas = colunas_df(df_vacinas_brasil, df_info_vacinas_selecao)
df_info_vacinas.head(10)

Unnamed: 0,_id,_source.vacina_nome,_source.vacina_fabricante_nome,_source.vacina_lote,_source.vacina_codigo,_source.vacina_categoria_codigo,_source.vacina_grupoAtendimento_nome,_source.status
0,46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0,COVID-19 PFIZER - COMIRNATY,PFIZER,2F1070A,87,21,Gestante,final
1,235b404f-749f-47ad-8b59-d5e557ecc7ae-i0b0,COVID-19 ASTRAZENECA/FIOCRUZ - COVISHIELD,ASTRAZENECA/FIOCRUZ,219VCD297W,85,2,Pessoas de 18 a 64 anos,entered-in-error
2,2ec5e664-36af-4825-a8f8-f2d2e64c265e-i0b0,COVID-19 SINOVAC/BUTANTAN - CORONAVAC,SINOVAC/BUTANTAN,210121,86,2,Pessoas de 70 a 74 anos,entered-in-error
3,659c13bd-bb27-4200-b1cd-9d4dc4ce5d00-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final
4,1648caec-35e6-4047-a5f7-a7b45d583818-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final
5,40238edc-6cf1-4af1-94da-fe4db5fd954a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final
6,28471b5b-9794-4652-aca9-f3b3699f539a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GY0354,99,2,Faixa Etária,final
7,1e058eba-8de9-473f-a9b9-eba2a7e8312b-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final
8,f5f6b560-d90a-4e24-ad12-a7d528ec1134-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GY0354,99,2,Faixa Etária,final
9,dc0e3cd5-5e1d-4048-b162-9bfd7048ab77-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final


In [177]:
#Data Frame com as informações sobre as aplicações.

df_aplicacao_selecao = ['_id','_source.vacina_nome','_source.vacina_categoria_nome', '_source.estabelecimento_uf', '_source.estabelecimento_municipio_nome'
                        ,'_source.estabelecimento_razaoSocial','_source.vacina_dataAplicacao', '_source.vacina_descricao_dose','_source.vacina_numDose' ]
df_aplicacao = colunas_df(df_vacinas_brasil, df_aplicacao_selecao)
df_aplicacao.head(10)

Unnamed: 0,_id,_source.vacina_nome,_source.vacina_categoria_nome,_source.estabelecimento_uf,_source.estabelecimento_municipio_nome,_source.estabelecimento_razaoSocial,_source.vacina_dataAplicacao,_source.vacina_descricao_dose,_source.vacina_numDose
0,46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0,COVID-19 PFIZER - COMIRNATY,Gestantes,MG,BELO HORIZONTE,MUNICIPIO DE BELO HORIZONTE,2024-01-03T00:00:00.000Z,2ª Dose,2
1,235b404f-749f-47ad-8b59-d5e557ecc7ae-i0b0,COVID-19 ASTRAZENECA/FIOCRUZ - COVISHIELD,Faixa Etária,PR,SAO JOSE DOS PINHAIS,PREFEITURA MUNICIPAL DE SAO JOSE DOS PINHAIS,2022-03-02T00:00:00.000Z,Reforço,38
2,2ec5e664-36af-4825-a8f8-f2d2e64c265e-i0b0,COVID-19 SINOVAC/BUTANTAN - CORONAVAC,Faixa Etária,SP,SAO PAULO,PREFEITURA DO MUNICIPIO DE SAO PAULO,2021-04-12T00:00:00.000Z,2ª Dose,2
3,659c13bd-bb27-4200-b1cd-9d4dc4ce5d00-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,DF,BRASILIA,UNIDADE BASICA DE SAUDE N 1 SAO SEBASTIAO,2024-01-03T00:00:00.000Z,3ª Dose,3
4,1648caec-35e6-4047-a5f7-a7b45d583818-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,RJ,MACAE,MUNICIPIO DE MACAE,2023-11-14T00:00:00.000Z,3ª Dose,3
5,40238edc-6cf1-4af1-94da-fe4db5fd954a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,GO,GOIANIA,SECRETARIA MUNICIPAL DE SAUDE,2024-01-03T00:00:00.000Z,3ª Dose,3
6,28471b5b-9794-4652-aca9-f3b3699f539a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,CE,PINDORETAMA,PREF M PINDORETAMA,2023-12-28T00:00:00.000Z,3ª Dose,3
7,1e058eba-8de9-473f-a9b9-eba2a7e8312b-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,GO,RIO VERDE,MUNICIPIO DE RIO VERDE,2024-01-04T00:00:00.000Z,3ª Dose,3
8,f5f6b560-d90a-4e24-ad12-a7d528ec1134-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,PE,SALGUEIRO,PREFEITURA MUNICIPAL DE SALGUEIRO,2024-01-04T00:00:00.000Z,3ª Dose,3
9,dc0e3cd5-5e1d-4048-b162-9bfd7048ab77-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,PA,BELEM,PREFEITURA MUNICIPAL DE BELEM,2024-01-04T00:00:00.000Z,3ª Dose,3


In [178]:
def renomear_colunas(df, mapeamento):
    """ 
    Renomeando as colunas dos DataFrames através do mapeamento usando a função 'rename'.

    Parâmetros:
        df (pandas.DataFrame): DataFrame desejado. 

        mapeamento (dict): dicionário para renomear as colunas do DataFrame.
    
        Retorna:
        A função irá retornar o DataFrame com as colunas renomeadas.
    """
    return df.rename(columns=mapeamento)

In [179]:
#Renomeando as colunas do DataFrame com as informações dos pacientes.

renomeadas_pacientes = {
    '_id': 'id_paciente','_source.paciente_dataNascimento': 'data_nascimento','_source.paciente_idade': 'idade',
    '_source.paciente_racaCor_codigo': 'codigo_raca','_source.paciente_enumSexoBiologico': 'sexo','_source.paciente_endereco_uf': 'UF',
    '_source.paciente_endereco_coIbgeMunicipio': 'codigo_municipio'}

df_pacientes = renomear_colunas(df_pacientes, renomeadas_pacientes)
df_pacientes.head(10)

Unnamed: 0,id_paciente,data_nascimento,idade,codigo_raca,sexo,UF,codigo_municipio
0,46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0,1997-08-28,26,2,F,MG,310620
1,235b404f-749f-47ad-8b59-d5e557ecc7ae-i0b0,1977-04-13,44,99,M,PR,412550
2,2ec5e664-36af-4825-a8f8-f2d2e64c265e-i0b0,1946-03-28,75,99,F,SP,355030
3,659c13bd-bb27-4200-b1cd-9d4dc4ce5d00-i0b0,2016-06-07,7,3,M,DF,530010
4,1648caec-35e6-4047-a5f7-a7b45d583818-i0b0,2012-10-07,11,1,F,RJ,330240
5,40238edc-6cf1-4af1-94da-fe4db5fd954a-i0b0,2014-10-24,9,99,F,GO,520870
6,28471b5b-9794-4652-aca9-f3b3699f539a-i0b0,2016-05-19,7,3,F,CE,230440
7,1e058eba-8de9-473f-a9b9-eba2a7e8312b-i0b0,2013-11-10,10,3,F,GO,521880
8,f5f6b560-d90a-4e24-ad12-a7d528ec1134-i0b0,2017-08-27,6,1,F,PE,261220
9,dc0e3cd5-5e1d-4048-b162-9bfd7048ab77-i0b0,2012-03-09,11,99,M,PA,150140


In [180]:
#Renomeando as colunas do DataFrame com as informações das vacinas.

renomeadas_info_vacinas = {
    '_id':'id_paciente', '_source.vacina_nome':'nome_vacina','_source.vacina_fabricante_nome':'fabricante', '_source.vacina_lote':'lote',
    '_source.vacina_codigo':'lote_vacina', '_source.vacina_categoria_codigo':'codigo_categoria', '_source.vacina_grupoAtendimento_nome':'grupo_atendimento', '_source.status': 'status'}

df_info_vacinas = renomear_colunas(df_info_vacinas, renomeadas_info_vacinas)
df_info_vacinas.head(10)

Unnamed: 0,id_paciente,nome_vacina,fabricante,lote,lote_vacina,codigo_categoria,grupo_atendimento,status
0,46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0,COVID-19 PFIZER - COMIRNATY,PFIZER,2F1070A,87,21,Gestante,final
1,235b404f-749f-47ad-8b59-d5e557ecc7ae-i0b0,COVID-19 ASTRAZENECA/FIOCRUZ - COVISHIELD,ASTRAZENECA/FIOCRUZ,219VCD297W,85,2,Pessoas de 18 a 64 anos,entered-in-error
2,2ec5e664-36af-4825-a8f8-f2d2e64c265e-i0b0,COVID-19 SINOVAC/BUTANTAN - CORONAVAC,SINOVAC/BUTANTAN,210121,86,2,Pessoas de 70 a 74 anos,entered-in-error
3,659c13bd-bb27-4200-b1cd-9d4dc4ce5d00-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final
4,1648caec-35e6-4047-a5f7-a7b45d583818-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final
5,40238edc-6cf1-4af1-94da-fe4db5fd954a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final
6,28471b5b-9794-4652-aca9-f3b3699f539a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GY0354,99,2,Faixa Etária,final
7,1e058eba-8de9-473f-a9b9-eba2a7e8312b-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final
8,f5f6b560-d90a-4e24-ad12-a7d528ec1134-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GY0354,99,2,Faixa Etária,final
9,dc0e3cd5-5e1d-4048-b162-9bfd7048ab77-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final


In [181]:
#Renomeando as colunas do DataFrame com as informações das aplicações.

renomeadas_aplicacao = {
    '_id':'id_paciente','_source.vacina_nome':'nome_vacina','_source.vacina_categoria_nome':'categoria_aplicacao', '_source.estabelecimento_uf': 'UF_estabelecimento',
    '_source.estabelecimento_municipio_nome':'nome_municipio','_source.estabelecimento_razaoSocial':'razao_social','_source.vacina_dataAplicacao':'data_aplicacao', 
    '_source.vacina_descricao_dose':'descricao_dose','_source.vacina_numDose':'numero_dose'}

df_aplicacao = renomear_colunas(df_aplicacao, renomeadas_aplicacao)
df_aplicacao.head(10)

Unnamed: 0,id_paciente,nome_vacina,categoria_aplicacao,UF_estabelecimento,nome_municipio,razao_social,data_aplicacao,descricao_dose,numero_dose
0,46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0,COVID-19 PFIZER - COMIRNATY,Gestantes,MG,BELO HORIZONTE,MUNICIPIO DE BELO HORIZONTE,2024-01-03T00:00:00.000Z,2ª Dose,2
1,235b404f-749f-47ad-8b59-d5e557ecc7ae-i0b0,COVID-19 ASTRAZENECA/FIOCRUZ - COVISHIELD,Faixa Etária,PR,SAO JOSE DOS PINHAIS,PREFEITURA MUNICIPAL DE SAO JOSE DOS PINHAIS,2022-03-02T00:00:00.000Z,Reforço,38
2,2ec5e664-36af-4825-a8f8-f2d2e64c265e-i0b0,COVID-19 SINOVAC/BUTANTAN - CORONAVAC,Faixa Etária,SP,SAO PAULO,PREFEITURA DO MUNICIPIO DE SAO PAULO,2021-04-12T00:00:00.000Z,2ª Dose,2
3,659c13bd-bb27-4200-b1cd-9d4dc4ce5d00-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,DF,BRASILIA,UNIDADE BASICA DE SAUDE N 1 SAO SEBASTIAO,2024-01-03T00:00:00.000Z,3ª Dose,3
4,1648caec-35e6-4047-a5f7-a7b45d583818-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,RJ,MACAE,MUNICIPIO DE MACAE,2023-11-14T00:00:00.000Z,3ª Dose,3
5,40238edc-6cf1-4af1-94da-fe4db5fd954a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,GO,GOIANIA,SECRETARIA MUNICIPAL DE SAUDE,2024-01-03T00:00:00.000Z,3ª Dose,3
6,28471b5b-9794-4652-aca9-f3b3699f539a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,CE,PINDORETAMA,PREF M PINDORETAMA,2023-12-28T00:00:00.000Z,3ª Dose,3
7,1e058eba-8de9-473f-a9b9-eba2a7e8312b-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,GO,RIO VERDE,MUNICIPIO DE RIO VERDE,2024-01-04T00:00:00.000Z,3ª Dose,3
8,f5f6b560-d90a-4e24-ad12-a7d528ec1134-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,PE,SALGUEIRO,PREFEITURA MUNICIPAL DE SALGUEIRO,2024-01-04T00:00:00.000Z,3ª Dose,3
9,dc0e3cd5-5e1d-4048-b162-9bfd7048ab77-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,PA,BELEM,PREFEITURA MUNICIPAL DE BELEM,2024-01-04T00:00:00.000Z,3ª Dose,3


In [182]:
"""
Verificando o tipo das variáveis das colunas e ajustando o seu tipo de variável.
"""

df_pacientes.dtypes

id_paciente         object
data_nascimento     object
idade                int64
codigo_raca         object
sexo                object
UF                  object
codigo_municipio    object
dtype: object

In [183]:
df_pacientes['data_nascimento'] = pd.to_datetime(df_pacientes['data_nascimento'])
df_pacientes.dtypes

id_paciente                 object
data_nascimento     datetime64[ns]
idade                        int64
codigo_raca                 object
sexo                        object
UF                          object
codigo_municipio            object
dtype: object

In [184]:
converter_int = ['codigo_raca']

df_pacientes[converter_int] = df_pacientes[converter_int].astype(int)
df_pacientes.dtypes

id_paciente                 object
data_nascimento     datetime64[ns]
idade                        int64
codigo_raca                  int32
sexo                        object
UF                          object
codigo_municipio            object
dtype: object

In [185]:
df_info_vacinas.dtypes

id_paciente          object
nome_vacina          object
fabricante           object
lote                 object
lote_vacina          object
codigo_categoria     object
grupo_atendimento    object
status               object
dtype: object

In [186]:
df_aplicacao.dtypes
converter_int = ['numero_dose']

df_aplicacao[converter_int] = df_aplicacao[converter_int].astype(int)
df_aplicacao.dtypes

id_paciente            object
nome_vacina            object
categoria_aplicacao    object
UF_estabelecimento     object
nome_municipio         object
razao_social           object
data_aplicacao         object
descricao_dose         object
numero_dose             int32
dtype: object

In [187]:
df_aplicacao['data_aplicacao'] = pd.to_datetime(df_aplicacao['data_aplicacao'])
df_aplicacao['data_aplicacao'] = df_aplicacao['data_aplicacao'].dt.strftime('%Y-%m-%d')
df_aplicacao['data_aplicacao'] = pd.to_datetime(df_aplicacao['data_aplicacao'])

df_aplicacao.dtypes

id_paciente                    object
nome_vacina                    object
categoria_aplicacao            object
UF_estabelecimento             object
nome_municipio                 object
razao_social                   object
data_aplicacao         datetime64[ns]
descricao_dose                 object
numero_dose                     int32
dtype: object

In [188]:
""" 
Verificando a existência de nulos nos DataFrames e lidando com a ausência de dados.
"""

#Verificando dados nulos no df de pacientes
df_pacientes.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10000 entries, 0 to 9999
Data columns (total 7 columns):
 #   Column            Non-Null Count  Dtype         
---  ------            --------------  -----         
 0   id_paciente       10000 non-null  object        
 1   data_nascimento   10000 non-null  datetime64[ns]
 2   idade             10000 non-null  int64         
 3   codigo_raca       10000 non-null  int32         
 4   sexo              10000 non-null  object        
 5   UF                10000 non-null  object        
 6   codigo_municipio  10000 non-null  object        
dtypes: datetime64[ns](1), int32(1), int64(1), object(4)
memory usage: 507.9+ KB


In [189]:
#Verificando dados nulos no df de informações sobre vacinas
df_info_vacinas.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10000 entries, 0 to 9999
Data columns (total 8 columns):
 #   Column             Non-Null Count  Dtype 
---  ------             --------------  ----- 
 0   id_paciente        10000 non-null  object
 1   nome_vacina        10000 non-null  object
 2   fabricante         10000 non-null  object
 3   lote               10000 non-null  object
 4   lote_vacina        10000 non-null  object
 5   codigo_categoria   9995 non-null   object
 6   grupo_atendimento  10000 non-null  object
 7   status             10000 non-null  object
dtypes: object(8)
memory usage: 625.1+ KB


In [190]:
df_info_vacinas = df_info_vacinas.dropna(subset=['codigo_categoria'])
df_info_vacinas.info()

<class 'pandas.core.frame.DataFrame'>
Index: 9995 entries, 0 to 9999
Data columns (total 8 columns):
 #   Column             Non-Null Count  Dtype 
---  ------             --------------  ----- 
 0   id_paciente        9995 non-null   object
 1   nome_vacina        9995 non-null   object
 2   fabricante         9995 non-null   object
 3   lote               9995 non-null   object
 4   lote_vacina        9995 non-null   object
 5   codigo_categoria   9995 non-null   object
 6   grupo_atendimento  9995 non-null   object
 7   status             9995 non-null   object
dtypes: object(8)
memory usage: 702.8+ KB


In [191]:
#Verificando dados nulos no df sobre aplicações.

df_aplicacao.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10000 entries, 0 to 9999
Data columns (total 9 columns):
 #   Column               Non-Null Count  Dtype         
---  ------               --------------  -----         
 0   id_paciente          10000 non-null  object        
 1   nome_vacina          10000 non-null  object        
 2   categoria_aplicacao  9995 non-null   object        
 3   UF_estabelecimento   10000 non-null  object        
 4   nome_municipio       10000 non-null  object        
 5   razao_social         10000 non-null  object        
 6   data_aplicacao       10000 non-null  datetime64[ns]
 7   descricao_dose       10000 non-null  object        
 8   numero_dose          10000 non-null  int32         
dtypes: datetime64[ns](1), int32(1), object(7)
memory usage: 664.2+ KB


In [192]:
# Removendo as linhas em que não há registros na coluna 'codigo_categoria' do df.

df_aplicacao = df_aplicacao.dropna(subset=['categoria_aplicacao'])
df_aplicacao.info()

<class 'pandas.core.frame.DataFrame'>
Index: 9995 entries, 0 to 9999
Data columns (total 9 columns):
 #   Column               Non-Null Count  Dtype         
---  ------               --------------  -----         
 0   id_paciente          9995 non-null   object        
 1   nome_vacina          9995 non-null   object        
 2   categoria_aplicacao  9995 non-null   object        
 3   UF_estabelecimento   9995 non-null   object        
 4   nome_municipio       9995 non-null   object        
 5   razao_social         9995 non-null   object        
 6   data_aplicacao       9995 non-null   datetime64[ns]
 7   descricao_dose       9995 non-null   object        
 8   numero_dose          9995 non-null   int32         
dtypes: datetime64[ns](1), int32(1), object(7)
memory usage: 741.8+ KB


In [194]:
""" 
Realizando o relacionamento entre os DataFrames.
A coluna que fará o relacionamento será a 'id_paciente'
"""

# DataFrame de informações de vacinas por paciente.

df_pacientes_info_vacinas = pd.merge(df_info_vacinas, df_pacientes, on='id_paciente', how='left')
df_pacientes_info_vacinas.head(10)

Unnamed: 0,id_paciente,nome_vacina,fabricante,lote,lote_vacina,codigo_categoria,grupo_atendimento,status,data_nascimento,idade,codigo_raca,sexo,UF,codigo_municipio
0,46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0,COVID-19 PFIZER - COMIRNATY,PFIZER,2F1070A,87,21,Gestante,final,1997-08-28,26,2,F,MG,310620
1,235b404f-749f-47ad-8b59-d5e557ecc7ae-i0b0,COVID-19 ASTRAZENECA/FIOCRUZ - COVISHIELD,ASTRAZENECA/FIOCRUZ,219VCD297W,85,2,Pessoas de 18 a 64 anos,entered-in-error,1977-04-13,44,99,M,PR,412550
2,2ec5e664-36af-4825-a8f8-f2d2e64c265e-i0b0,COVID-19 SINOVAC/BUTANTAN - CORONAVAC,SINOVAC/BUTANTAN,210121,86,2,Pessoas de 70 a 74 anos,entered-in-error,1946-03-28,75,99,F,SP,355030
3,659c13bd-bb27-4200-b1cd-9d4dc4ce5d00-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final,2016-06-07,7,3,M,DF,530010
4,1648caec-35e6-4047-a5f7-a7b45d583818-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final,2012-10-07,11,1,F,RJ,330240
5,40238edc-6cf1-4af1-94da-fe4db5fd954a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final,2014-10-24,9,99,F,GO,520870
6,28471b5b-9794-4652-aca9-f3b3699f539a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GY0354,99,2,Faixa Etária,final,2016-05-19,7,3,F,CE,230440
7,1e058eba-8de9-473f-a9b9-eba2a7e8312b-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final,2013-11-10,10,3,F,GO,521880
8,f5f6b560-d90a-4e24-ad12-a7d528ec1134-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GY0354,99,2,Faixa Etária,final,2017-08-27,6,1,F,PE,261220
9,dc0e3cd5-5e1d-4048-b162-9bfd7048ab77-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,PFIZER - PEDIÁTRICA,GN0764,99,2,Faixa Etária,final,2012-03-09,11,99,M,PA,150140


In [195]:
# DataFrame de informações de aplicações por paciente.

df_pacientes_aplicacao = pd.merge(df_aplicacao, df_pacientes, on='id_paciente', how='left')
df_pacientes_aplicacao.head(10)

Unnamed: 0,id_paciente,nome_vacina,categoria_aplicacao,UF_estabelecimento,nome_municipio,razao_social,data_aplicacao,descricao_dose,numero_dose,data_nascimento,idade,codigo_raca,sexo,UF,codigo_municipio
0,46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0,COVID-19 PFIZER - COMIRNATY,Gestantes,MG,BELO HORIZONTE,MUNICIPIO DE BELO HORIZONTE,2024-01-03,2ª Dose,2,1997-08-28,26,2,F,MG,310620
1,235b404f-749f-47ad-8b59-d5e557ecc7ae-i0b0,COVID-19 ASTRAZENECA/FIOCRUZ - COVISHIELD,Faixa Etária,PR,SAO JOSE DOS PINHAIS,PREFEITURA MUNICIPAL DE SAO JOSE DOS PINHAIS,2022-03-02,Reforço,38,1977-04-13,44,99,M,PR,412550
2,2ec5e664-36af-4825-a8f8-f2d2e64c265e-i0b0,COVID-19 SINOVAC/BUTANTAN - CORONAVAC,Faixa Etária,SP,SAO PAULO,PREFEITURA DO MUNICIPIO DE SAO PAULO,2021-04-12,2ª Dose,2,1946-03-28,75,99,F,SP,355030
3,659c13bd-bb27-4200-b1cd-9d4dc4ce5d00-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,DF,BRASILIA,UNIDADE BASICA DE SAUDE N 1 SAO SEBASTIAO,2024-01-03,3ª Dose,3,2016-06-07,7,3,M,DF,530010
4,1648caec-35e6-4047-a5f7-a7b45d583818-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,RJ,MACAE,MUNICIPIO DE MACAE,2023-11-14,3ª Dose,3,2012-10-07,11,1,F,RJ,330240
5,40238edc-6cf1-4af1-94da-fe4db5fd954a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,GO,GOIANIA,SECRETARIA MUNICIPAL DE SAUDE,2024-01-03,3ª Dose,3,2014-10-24,9,99,F,GO,520870
6,28471b5b-9794-4652-aca9-f3b3699f539a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,CE,PINDORETAMA,PREF M PINDORETAMA,2023-12-28,3ª Dose,3,2016-05-19,7,3,F,CE,230440
7,1e058eba-8de9-473f-a9b9-eba2a7e8312b-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,GO,RIO VERDE,MUNICIPIO DE RIO VERDE,2024-01-04,3ª Dose,3,2013-11-10,10,3,F,GO,521880
8,f5f6b560-d90a-4e24-ad12-a7d528ec1134-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,PE,SALGUEIRO,PREFEITURA MUNICIPAL DE SALGUEIRO,2024-01-04,3ª Dose,3,2017-08-27,6,1,F,PE,261220
9,dc0e3cd5-5e1d-4048-b162-9bfd7048ab77-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,PA,BELEM,PREFEITURA MUNICIPAL DE BELEM,2024-01-04,3ª Dose,3,2012-03-09,11,99,M,PA,150140


In [196]:
# DataFrame de informações de vacinas por aplicação.

df_vacinas_aplicacao = pd.merge(df_info_vacinas, df_aplicacao, on='id_paciente', how='left')
df_pacientes_aplicacao.head(10)

Unnamed: 0,id_paciente,nome_vacina,categoria_aplicacao,UF_estabelecimento,nome_municipio,razao_social,data_aplicacao,descricao_dose,numero_dose,data_nascimento,idade,codigo_raca,sexo,UF,codigo_municipio
0,46f4b1a1-a9cf-43a4-9ca2-5e9f10dab1e7-i0b0,COVID-19 PFIZER - COMIRNATY,Gestantes,MG,BELO HORIZONTE,MUNICIPIO DE BELO HORIZONTE,2024-01-03,2ª Dose,2,1997-08-28,26,2,F,MG,310620
1,235b404f-749f-47ad-8b59-d5e557ecc7ae-i0b0,COVID-19 ASTRAZENECA/FIOCRUZ - COVISHIELD,Faixa Etária,PR,SAO JOSE DOS PINHAIS,PREFEITURA MUNICIPAL DE SAO JOSE DOS PINHAIS,2022-03-02,Reforço,38,1977-04-13,44,99,M,PR,412550
2,2ec5e664-36af-4825-a8f8-f2d2e64c265e-i0b0,COVID-19 SINOVAC/BUTANTAN - CORONAVAC,Faixa Etária,SP,SAO PAULO,PREFEITURA DO MUNICIPIO DE SAO PAULO,2021-04-12,2ª Dose,2,1946-03-28,75,99,F,SP,355030
3,659c13bd-bb27-4200-b1cd-9d4dc4ce5d00-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,DF,BRASILIA,UNIDADE BASICA DE SAUDE N 1 SAO SEBASTIAO,2024-01-03,3ª Dose,3,2016-06-07,7,3,M,DF,530010
4,1648caec-35e6-4047-a5f7-a7b45d583818-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,RJ,MACAE,MUNICIPIO DE MACAE,2023-11-14,3ª Dose,3,2012-10-07,11,1,F,RJ,330240
5,40238edc-6cf1-4af1-94da-fe4db5fd954a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,GO,GOIANIA,SECRETARIA MUNICIPAL DE SAUDE,2024-01-03,3ª Dose,3,2014-10-24,9,99,F,GO,520870
6,28471b5b-9794-4652-aca9-f3b3699f539a-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,CE,PINDORETAMA,PREF M PINDORETAMA,2023-12-28,3ª Dose,3,2016-05-19,7,3,F,CE,230440
7,1e058eba-8de9-473f-a9b9-eba2a7e8312b-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,GO,RIO VERDE,MUNICIPIO DE RIO VERDE,2024-01-04,3ª Dose,3,2013-11-10,10,3,F,GO,521880
8,f5f6b560-d90a-4e24-ad12-a7d528ec1134-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,PE,SALGUEIRO,PREFEITURA MUNICIPAL DE SALGUEIRO,2024-01-04,3ª Dose,3,2017-08-27,6,1,F,PE,261220
9,dc0e3cd5-5e1d-4048-b162-9bfd7048ab77-i0b0,COVID-19 PFIZER - COMIRNATY PEDIÁTRICA,Faixa Etária,PA,BELEM,PREFEITURA MUNICIPAL DE BELEM,2024-01-04,3ª Dose,3,2012-03-09,11,99,M,PA,150140
