##Introduction

---


The following notebook is part of data pipeline project using the medallion architecture. <br>
In this notebook, we have developed the ETL process for the project silver layer. So, the result will be saved in a s3 bucket and used to develop our gold layer. An important detail is that the script has been created to run in Aws Glue.


### Libraries, Environment variables and Spark config

---



In [1]:
!pip install findspark boto3 unidecode



In [2]:
from pyspark.sql import SparkSession
from pyspark.sql.functions import *
from pyspark.sql.types import *
from pyspark.sql import DataFrame
from functools import reduce
import findspark
import unidecode
import boto3
import os
findspark.init()

In [3]:
os.environ["AWS_ACCESS_KEY_ID"] = "AKIAUZNHGYOJQTT4ZXPY"
os.environ["AWS_SECRET_ACCESS_KEY"] = "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"
os.environ["AWS_DEFAULT_REGION"] = "us-east-1"

aws_access_key_id = os.environ.get("AWS_ACCESS_KEY_ID")
aws_secret_access_key = os.environ.get("AWS_SECRET_ACCESS_KEY")
region_name = os.environ.get("AWS_DEFAULT_REGION")

spark = (SparkSession.builder
        .appName("ColabS3Upload")
        .config("spark.hadoop.fs.s3a.impl", "org.apache.hadoop.fs.s3a.S3AFileSystem")
        .config("spark.hadoop.fs.s3a.access.key", aws_access_key_id)
        .config("spark.hadoop.fs.s3a.secret.key", aws_secret_access_key)
        .config("spark.hadoop.fs.s3a.endpoint", "s3.amazonaws.com")
        .config("spark.jars.packages", "org.apache.hadoop:hadoop-aws:3.3.4")
        .getOrCreate()
      )

### Functions to read, transform and upload transformed files

---



In [4]:
def read_s3_file(bucket_name:str, file_path:str)-> DataFrame:
  """
  Function used to read files from a s3 bucket
  args:
    bucket_name: Name of the s3 bucket
    file_path: Path of the file to be read
  returns:
    DataFrame with the file content
  """
  return spark.read.parquet(f"s3a://{bucket_name}/{file_path}/")

In [5]:
def unpivot_cols(df:DataFrame) -> DataFrame:
  """
  Function used to transform a wide dataframe to a long dataframe
  args:
    df: DataFrame to be unpivoted
  returns:
    DataFrame unpivoted

  """
  cols_ids = ['Ano', 'UF', 'CAPITAL', 'RM_RIDE']
  cols_to_unpivot = [col for col in df.columns if col not in cols_ids]
  return df.melt(cols_ids, cols_to_unpivot, 'category', 'category_value')

In [6]:
def pivot_df(df:DataFrame) -> DataFrame:
  """
  Function used to transform a long dataframe to a wide dataframe
  args:
    df: DataFrame to be pivoted
  returns:
    DataFrame pivoted

  """
  return (df
          .groupBy("month", "unidade_federacao", "capital_uf", "question_id")
          .pivot("question_description")
          .agg(first("question_answer"))
        )

In [7]:
def cols_ids_description(df:DataFrame, df_dict:DataFrame) -> DataFrame:
  """
  Function used to add descriptions to the columns of the dataframe from a glossary dataframe
  args:
    df: DataFrame to be enriched with descriptions
    df_dict: Glossary dataframe
  returns:
    DataFrame with descriptions added

  """

  uf_df = (df_dict.filter(col('codigo_variavel') == 'UF')
              .select('categoria_variavel', 'descricao_categoria')
          )

  capital_df = (df_dict.filter(col('codigo_variavel') == 'CAPITAL')
                .select('categoria_variavel', 'descricao_categoria')
            )

  return (df
          .join(uf_df, df.UF == uf_df.categoria_variavel, 'left')
          .withColumn('unidade_federacao', col('descricao_categoria'))
          .drop(*['descricao_categoria', 'UF', 'categoria_variavel'])
          .join(capital_df, df.CAPITAL == capital_df.categoria_variavel, 'left')
          .withColumn('capital_uf', col('descricao_categoria'))
          .drop(*['descricao_categoria', 'CAPITAL', 'categoria_variavel'])
        )

In [8]:
def split_dict (df_dict:DataFrame, special_cols:list) -> DataFrame:
  """
  Function used to split the glossary dataframe into two dataframes, one with the special columns and the other with the regular columns.
  args:
    df_dict: DataFrame to be splitted
    special_cols: List with the special columns
  returns:
    Two dataFrames with the special and regular columns respectively

  """
  df_dict_special = (df_dict
                    .filter(col('codigo_variavel').isin(*special_cols))
                    .filter(col('categoria_variavel').isNotNull())
                    .select('codigo_variavel', 'descricao_variavel')
                    .distinct()
                  )

  df_dict_regular = (df_dict
                    .filter(~col('codigo_variavel').isin(*special_cols))
                    )
  return df_dict_special, df_dict_regular

In [9]:
@udf(StringType())
def normalize_to_snake_case(text):
    if text is not None:
        normalized = unidecode.unidecode(text.strip().lower())  # Remove accents + lowercase
        normalized = normalized.replace(" ", "_")  # Replace spaces with underscores
        return normalized
    return None

In [10]:
def df_final(df:DataFrame, df_dict_regular:DataFrame, df_dict_special:DataFrame, special_cols:list, month:str) -> DataFrame:
  """
  Function used to add descriptions to the columns of the dataframe from two dataframes with the descriptions needed and add a month column
  args:
    df: DataFrame to be enriched with descriptions
    df_dict_regular: Glossary dataframe with the regular columns
    df_dict_special: Glossary dataframe with the special columns
    special_cols: List with the special columns
    month: Month of the data
  returns:
    DataFrame with descriptions added

  """

  cols_to_be_selected = ['month', 'unidade_federacao', 'capital_uf', 'question_id', 'question_description', 'question_answer']
  df_full = (df
            .join(df_dict_regular,
                  (df_dict_regular.codigo_variavel == df.category)
                  & (df_dict_regular.categoria_variavel == df.category_value),
                  'left'
                )
            .withColumnsRenamed({'descricao_variavel': 'category_description1',
                                'descricao_categoria':'value_description1'}
                                )
            .join(df_dict_special, (df_dict_special.codigo_variavel == df.category), 'left')
            .withColumn('question_answer',
                        when(col('category').isin(*special_cols), col('category_value'))
                        .otherwise(col('value_description1'))
                        )
            .withColumn('question_description', coalesce(col('category_description1'), col('descricao_variavel')))
            .withColumnRenamed('category', 'question_id')
            .withColumn('month', lit(month))
            .select(*cols_to_be_selected)
          )
  return df_full

In [11]:
def combined_dataframes(dataframes_list:list) -> DataFrame:
  """
  Function to combine the dataframes from the list provided into a single dataframe
  args:
    dataframes_list: List of dataframes to be combined
  returns:
    A dataFrame combined from the list provided
  """
  return reduce(DataFrame.unionAll, dataframes_list)

In [12]:
def create_bucket(bucket_name:str):
  """
  Function to create a bucket in s3
  args:
    bucket_name: Name of the bucket to be created
  """
  s3 = boto3.client(
      's3',
      aws_access_key_id= aws_access_key_id,
      aws_secret_access_key= aws_secret_access_key,
      region_name=region_name
  )
  s3.create_bucket(Bucket=bucket_name)

In [13]:
def load_to_s3(df:DataFrame, bucket_name:str, path:str):
  """
  Function to load a dataframe in parquet format to s3
  args:
    df: DataFrame to be loaded
    bucket_name: Name of the bucket to be loaded
    path: Path to be loaded
  """
  df.write.mode("overwrite").parquet(f"s3a://{bucket_name}/{path}/")

### Excution

---



In [14]:
#Variables
special_cols = ['UPA', 'V1008', 'V1012', 'V1013', 'V1016', 'Estrato',
                'V1030', 'V1031', 'V1032', 'posest', 'A001', 'A001B1',
                'A001B2', 'A001B3', 'A002', 'C0051', 'C0052', 'C0053',
                'C007E2', 'C008', 'C009', 'C01012', 'C01022', 'C011A12',
                'C011A22', 'D0013', 'D0023', 'D0033', 'D0043', 'D0053',
                'D0063', 'D0073', 'F0021', 'F006', 'A002'
              ]

bronze_bucket_name = 'project-pnad-covid-bronze-layer'
silver_bucket_name = 'project-pnad-covid-silver-layer'
path_sept_file = 'PNAD_COVID_092020_parquet'
path_oct_file = 'PNAD_COVID_102020_parquet'
path_nov_file = 'PNAD_COVID_112020_parquet'
path_dict_file = 'dicionario_PNAD_COVID_parquet'

sept = '2020-09-01'
oct = '2020-10-01'
nov = '2020-11-01'

path_silver_df = 'pnad_covid_datasets_cleaned_transformed_unified'

In [15]:
sept_df = read_s3_file(bronze_bucket_name, path_sept_file)
oct_df = read_s3_file(bronze_bucket_name, path_oct_file)
nov_df = read_s3_file(bronze_bucket_name, path_nov_file)
glossay_df = read_s3_file(bronze_bucket_name, path_dict_file)

In [16]:
# Unpivoting  datasets
sept_df_unpivoted = unpivot_cols(sept_df)
oct_df_unpivoted = unpivot_cols(oct_df)
nov_df_unpivoted = unpivot_cols(nov_df)

In [17]:
# Inserindo algumas descrições a partir do dicionário (capital e uf)
df_sept_enriched = cols_ids_description(sept_df_unpivoted, glossay_df)
df_oct_enriched = cols_ids_description(oct_df_unpivoted, glossay_df)
df_nov_enriched = cols_ids_description(nov_df_unpivoted, glossay_df)

In [18]:
# Here, we splitting the glossary dataframe in two dataframes.
# To add descriptions to the dataframes from the glossary dataframe, we need to join them.
# For some columns, we need two cols to join (must relate two ids) and for others only one column.
# So either we need to seperate them or we join the glossary df twice
# We have decided to split the df
df_dict_special, df_dict_regular = split_dict(glossay_df, special_cols)

In [19]:
# Dataframes fully enriched with descriptions
df_sept_final = df_final(df_sept_enriched, df_dict_regular, df_dict_special, special_cols, sept)
df_oct_final = df_final(df_oct_enriched, df_dict_regular, df_dict_special, special_cols, oct)
df_nov_final = df_final(df_nov_enriched, df_dict_regular, df_dict_special, special_cols, nov)

In [20]:
# Unifying the dataframes into a single one
df_list = [df_sept_final, df_oct_final, df_nov_final]
df_full = combined_dataframes(df_list)

In [21]:
#Removing answer with null records
df_silver = (df_full
             .filter(col('question_description').isNotNull())
             .filter(col('question_answer').isNotNull())
          )

In [22]:
# Re-describing the question from the census made during covid pandemic
df_silver_full = (df_silver
                  .withColumn('question_description',
                              when(col('question_description').like('%teve febre%'), lit('teve_febre'))
                              .when(col('question_description').like('%teve tosse%'), lit('teve_tosse'))
                              .when(col('question_description').like('%dor no peito%'), lit('teve_dor_no_peito'))
                              .when(col('question_description').like('%dor de garganta%'), lit('teve_dor_de_garganta'))
                              .when(col('question_description').like('%dor de cabeça%'), lit('teve_dor_de_cabeca'))
                              .when(col('question_description').like('%teve náusea%'), lit('teve_nausea'))
                              .when(col('question_description').like('%teve dificuldade para respirar%'), lit('teve_dificuldade_para_respirar'))
                              .when(col('question_description').like('%teve nariz entupido ou escorrendo%'), lit('teve_nariz_entupido_ou_escorrendo'))
                              .when(col('question_description').like('%teve fadiga%'), lit('teve_fadiga'))
                              .when(col('question_description').like('%teve dor nos olhos%'), lit('teve_dor_nos_olhos'))
                              .when(col('question_description').like('%teve perda de cheiro ou sabor%'), lit('teve_perda_de_cheiro_ou_sabor'))
                              .when(col('question_description').like('%teve dor muscular%'), lit('teve_dor_muscular'))
                              .when(col('question_description').like('%teve diarreia%'), lit('teve_diarreia'))

                              .when(col('question_description').like('%atividades escolares para realizar em casa%'), lit('atividades_escolares_em_casa'))
                              .when(col('question_description').like('%que frequenta é pública ou privada%'), lit('tipo_escola_faculdade'))
                              .when(col('question_description').like('%tendo aulas presenciais%'), lit('tendo_aulas_presenciais'))
                              .when(col('question_description').like('%realizou as atividades disponibilizadas na semana passada%'), lit('motivo_nao_realizacao_atividades_escolares'))
                              .when(col('question_description').like('%dedicou-se às atividades escolares%'), lit('qtd_dias_dedicacao_atividades_ecolares'))
                              .when(col('question_description').like('%para recuperar dos sintomas foi ficar em casa%'), lit('recuperacao_sintomas_em_casa'))
                              .when(col('question_description').like('%dos sintomas foi ligar para algum profissional de saúde%'), lit('providencia_recuperacao_sintomas_procurar_profissional_saude'))
                              .when(col('question_description').like('%dos sintomas foi comprar e/ou tomar  remédio por conta própria%'), lit('recuperacao_sintomas_por_remedios_auto_medicado'))
                              .when(col('question_description').like('%sintomas foi comprar e/ou tomar remédio por orientação médica%'), lit('recuperacao_sintomas_por_remedios_medicado'))
                              .when(col('question_description').like('%visita de algum profissional de saúde do SUS (equipe de saúde da família, agente comunitário, etc.)%'), lit('recuperacao_sintomas_por_sus_a_domicilio'))
                              .when(col('question_description').like('%Providência tomada para recuperar dos sintomas foi receber visita de profissional de saúde particular%'), lit('recuperacao_sintomas_por_medico_particular_a_domicilio'))
                              .when(col('question_description').like('%Providência tomada para recuperar dos sintomas foi outra%'), lit('providencia_recuperacao_sintomas_foi_outra'))
                              .when(col('question_description').like('%Local que buscou atendimento foi posto de saúde%'), lit('buscou_atendimento_ubs'))
                              .when(col('question_description').like('%Local que buscou atendimento foi pronto socorro do SUS/UPA%'), lit('buscou_atendimento_ps_sus_upa'))
                              .when(col('question_description').like('%Local que buscou atendimento foi hospital do SUS%'), lit('buscou_atendimento_hospital_sus'))

                              .when(col('question_description').like('%Local que buscou atendimento foi ambulatório ou consultório privado ou ligado às forças armadas%'), lit('buscou_atendimento_ambulantorio_forcas_armadas'))
                              .when(col('question_description').like('%Local que buscou atendimento foi pronto socorro privado ou ligado às forças armadas%'), lit('buscou_atendimento_ps_privado_forcas_armadas'))
                              .when(col('question_description').like('%Ao procurar o hospital, teve que ficar internado por um dia ou mais%'), lit('ficou_internado_por_1dia_ou_mais'))
                              .when(col('question_description').like('%Durante a internação, foi sedado, entubado e colocado em respiração artificial com ventilador%'), lit('foi_sedado_entubado_com_respiracao_artificial'))
                              .when(col('question_description').like('%Tem algum plano de saúde médico, seja particular, de empresa ou de órgão público%'), lit('tem_plano_de_saude'))
                              .when(col('question_description').like('%algum teste para saber se estava infectado(a) pelo coronavírus?%'), lit('fez_algum_test_covid'))
                              .when(col('question_description').like('%Fez o exame coletado com cotonete na boca e/ou nariz (SWAB)?%'), lit('fez_exame_cotonete_swab'))
                              .when((col('question_description').like('%Qual o resultado?%')) & (trim(col('question_id')) == 'B009B'), lit('resultado_exame_swab'))
                              .when(col('question_description').like('%Fez o exame de coleta de sangue através de furo no dedo?%'), lit('fez_exame_sangue_do_furo_no_dedo'))
                              .when((col('question_description').like('%Qual o resultado?%')) & (trim(col('question_id')) == 'B009D'), lit('resultado_exame_sangue_do_furo_no_dedo'))
                              .when(col('question_description').like('%Fez o exame de coleta de sangue através da veia da braço?%'), lit('fez_exame_sangue_veia_braco'))
                              .when((col('question_description').like('%Qual o resultado?%')) & (trim(col('question_id')) == 'B009F'), lit('resultado_exame_sangue_veia_braco'))

                              .when(col('question_description').like('%Algum médico já lhe deu o diagnóstico de diabetes?%'), lit('ja_teve_diagnostico_diabetes'))
                              .when(col('question_description').like('%Algum médico já lhe deu o diagnóstico de diabetes?%'), lit('ja_teve_diagnostico_diabetes'))
                              .when(col('question_description').like('%Algum médico já lhe deu o diagnóstico de hipertensão?%'), lit('ja_teve_diagnostico_hipertensao'))
                              .when(col('question_description').like('%diagnóstico de asma/bronquite/enfisema/doenças respiratória crônica ou doença de pulmão?%'), lit('ja_teve_doenca_respiratoria'))
                              .when(col('question_description').like('%Algum médico já lhe deu o diagnóstico de depressão?%'), lit('ja_teve_diagnostico_depressao'))
                              .when(col('question_description').like('%Algum médico já lhe deu o diagnóstico de câncer?%'), lit('ja_teve_diagnostico_cancer'))
                              .when(col('question_description').like('%Adevido à pandemia do Coronavírus, em que medida o(a) Sr(a) restringiu o contato com as pessoas?%'), lit('como_restringiu_contato_com_pessoas'))
                              .when(col('question_description').like('%Na semana passada, por pelo menos uma hora, trabalhou ou fez algum bico?%'), lit('trabalhou_fez_algum_bico_na_semana_anterior'))

                              .when(col('question_description').like('%estava temporariamente afastado de algum trabalho?%'), lit('ficou_afastado_temporiaramente_do_trabalho_na_semana_anterior'))
                              .when(col('question_description').like('%Qual o principal motivo deste afastamento temporário?%'), lit('motivo_desse_afastamento_temporario'))
                              .when(col('question_description').like('%Continuou a ser remunerado (mesmo que parcialmente) por esse trabalho%'), lit('foi_remunerado_nesse_periodo'))
                              .when(col('question_description').like('%Há quanto tempo está afastado desse trabalho??%'), lit('ha_quanto_tempo_esta_afastado'))
                              .when(col('question_description').like('%Tem mais de um trabalho?%'), lit('tem_mais_de_1_trabalho'))
                              .when(col('question_description').like('%No trabalho (único ou principal) que tinha nessa semana, era:%'), lit('principal_ocupacao'))
                              .when(col('question_description').like('%Esse trabalho era na área:%'), lit('trabalho_setor_privado_ou_publico'))
                              .when(col('question_description').like('%Tem carteira de trabalho assinada ou é funcionário público estatutário?%'), lit('carteira_assinada_ou_funcionario_estatutario'))
                              .when(col('question_description').like('%cargo ou função você realiza no seu trabalho (único ou principal)?%'), lit('tipo_trabalho_ou_cargo'))
                              .when(col('question_description').like('%Qual é a principal atividade do local ou empresa em que você trabalha?%'), lit('setor_da_empresa_do_trabalho'))
                              .when(col('question_description').like('%quantos empregados trabalhavam nesse negócio/empresa que ... tinha ?%'), lit('qtd_empregado_empresa'))
                              .when(col('question_description').like('%Quantas horas, por semana, normalmente trabalhava??%'), lit('horas_de_trabalho_por_semana'))
                              .when(col('question_description').like('%Número da faixa do rendimento/retirada em dinheiro%'), lit('faixa_de_rendimento'))
                              .when(col('question_description').like('%Sr(a) estava em trabalho remoto (home office ou teletrabalho)%'), lit('home_office_na_semana_passada'))
                              .when(col('question_description').like('%O(A) Sr(a) contribui para o INSS? %'), lit('contribuidor_inss'))
                              .when(col('question_description').like('%Durante o período da pandemia alguém deste domicílio solicitou algum empréstimo?  %'), lit('fez_emprestimo_na_pandemia'))

                              .when(col('question_description').like('%Este empréstimo foi adquirido com banco ou financeira%'), lit('emprestimo_em_banco_ou_financeira'))
                              .when(col('question_description').like('%Este domicílio é: %'), lit('domicilio_proprio_alugado'))
                              .when(col('question_description').like('%No seu domicílio há os seguintes itens básicos de limpeza e proteção: sabão ou detergente%'), lit('tem_itens_basico_de_limpeza_em_casa'))
                              .when(col('question_description').like('%Quem respondeu ao questionário?%'), lit('quem_respondeu_o_questionario'))
                              .when(col('question_description').like('%Qual é a principal atividade do local ou empresa em que você trabalha?%'), lit('setor_da_empresa_do_trabalho'))
                              .otherwise(col('question_description'))
                            )
                  .withColumn('question_description', normalize_to_snake_case(col('question_description')))
                )

In [23]:
# Re-describing the question answer from the census made during covid pandemic to be short and concise
df_silver_full = (df_silver_full
                  .withColumn('question_answer',
                              when(col('question_answer').like('%Sim%'), lit('sim'))
                              .when(col('question_answer').like('%Não%'), lit('nao'))
                              .when(col('question_answer').like('%Não aplicável%'), lit('nao_aplicavel'))
                              .when(col('question_answer').like('%Não, e meu normalmente é presencial/semipresencial%'), lit('parcialmente'))
                              .when(col('question_answer').like('%Não, e meu normalmente é presencial/semipresencial%'), lit('semipresencial/presencial'))
                              .when(col('question_answer').like('%Não, meu curso é online%'), lit('curso_online'))
                              .when(col('question_answer').like('%Não tinha computador / tablet / celular disponível%'), lit('Sem equipamento'))
                              .when(col('question_answer').like('%Tinha que cuidar dos afazeres domésticos, do(s) filhos ou de outro(s) parentes%'), lit('afazeres domesticos'))
                              .when(col('question_answer').like('%Reduziu o contato com as pessoas, mas continuou saindo de casa para trabalho ou atividades não essenciais e/ou recebendo visitas%'), lit('Reduziu, mas continuou saindo/recebendo visitas'))
                              .when(col('question_answer').like('%Estava em quarentena, isolamento, distanciamento social ou férias coletivas%'), lit('Quarenta/Isolamento social'))

                              .when(col('question_answer').like('%Afastamento do próprio negócio/empresa por motivo de gestação, saúde, acidente%'), lit('Afastamento por motivo de gestacao/saude/acidente'))
                              .when(col('question_answer').like('%Outro tipo de licença remunerada (estudo, paternidade, casamento, licença prêmio, etc.)%'), lit('Outro tipo de licença remunerada'))
                              .when(col('question_answer').like('%Fatores ocasionais (mau tempo, paralisação nos serviços de transportes, etc.)%'), lit('Fatores ocasionais'))
                              .when(col('question_answer').like('%Estava fora do mercado de trabalho (fazia apenas afazeres domésticos, cuidados de pessoas ou produção para próprio consumo)%'), lit('Estava fora do mercado de trabalho'))
                              .when(col('question_answer').like('%Trabalhador doméstico (empregado doméstico, cuidados, babá)%'), lit('Trabalhador domestico'))


                              .when(col('question_answer').like('%Faxineiro, auxiliar de limpeza etc. (em empresa pública ou privada)%'), lit('Auxiliar de limpeza'))
                              .when(col('question_answer').like('%Entregador de mercadorias (de restaurante, de farmácia, de loja, Uber Eats, IFood, Rappy etc.)%'), lit('Entregador de mercadorias'))
                              .when(col('question_answer').like('%Vendedor a domicílio, representante de vendas, vendedor de catálogo (Avon, Natura etc.)%'), lit('Vendedor a domicilio'))
                              .when(col('question_answer').like('%Vendedor ambulante (feirante, camelô, comerciante de rua, quiosque)%'), lit('Vendedor ambulante'))
                              .when(col('question_answer').like('%Trabalhador doméstico (empregado doméstico, cuidados, babá)%'), lit('Trabalhador domestico'))
                              .when(col('question_answer').like('%Trabalhador doméstico (empregado doméstico, cuidados, babá)%'), lit('Trabalhador domestico'))
                              .when(col('question_answer').like('%Trabalhador doméstico (empregado doméstico, cuidados, babá)%'), lit('Trabalhador domestico'))
                              .otherwise(col('question_answer'))
                            )

                  .withColumn('question_answer', normalize_to_snake_case(col('question_answer')))
                )

In [None]:
#Pivoting back to wide format and making an adjustement in age column
df_silver_final = (pivot_df(df_silver_full)
                    .withColumn('idade_do_morador', substring('idade_do_morador', 2, 3))
                )

### Load to silver bucket

---



In [27]:
create_bucket(silver_bucket_name)

In [None]:
load_to_s3(df_silver_final, silver_bucket_name, path_silver_df)