In [None]:
import pandas as pd

In [None]:
mapeamento_uf = {
    11: 'Rondônia', 12: 'Acre', 13: 'Amazonas', 14: 'Roraima', 15: 'Pará', 16: 'Amapá', 17: 'Tocantins',
    21: 'Maranhão', 22: 'Piauí', 23: 'Ceará', 24: 'Rio Grande do Norte', 25: 'Paraíba', 26: 'Pernambuco',
    27: 'Alagoas', 28: 'Sergipe', 29: 'Bahia', 31: 'Minas Gerais', 32: 'Espírito Santo', 33: 'Rio de Janeiro',
    35: 'São Paulo', 41: 'Paraná', 42: 'Santa Catarina', 43: 'Rio Grande do Sul', 50: 'Mato Grosso do Sul',
    51: 'Mato Grosso', 52: 'Goiás', 53: 'Distrito Federal'
}

mapeamento_sexo = {
    1: 'Homem',
    2: 'Mulher'
}

mapeamento_cor_raca = {
    1: 'Branca',
    2: 'Preta',
    3: 'Amarela',
    4: 'Parda',
    5: 'Indígena',
    9: 'Ignorado'
}

mapeamento_escolaridade = {
    1: 'Sem instrução',
    2: 'Fundamental incompleto',
    3: 'Fundamental completo',
    4: 'Médio incompleto',
    5: 'Médio completo',
    6: 'Superior incompleto',
    7: 'Superior completo',
    8: 'Pós-graduação, mestrado ou doutorado'
}

mapeamento_restricao_contato = {
    1: 'Não fez restrição, vida normal',
    2: 'Reduziu contato, continuou saindo',
    3: 'Ficou em casa, saiu só por necessidade',
    4: 'Ficou rigorosamente em casa',
    9: 'Ignorado'
}

mapeamento_faixa_rendimento = {
    0: '0 - 100',
    1: '101 - 300',
    2: '301 - 600',
    3: '601 - 800',
    4: '801 - 1.600',
    5: '1.601 - 3.000',
    6: '3.001 - 10.000',
    7: '10.001 - 50.000',
    8: '50.001 - 100.000',
    9: 'Mais de 100.000',
    None: 'Não aplicável'
}

mapeamento_resultado_teste = {
    1: 'Positivo',
    2: 'Negativo',
    3: 'Inconclusivo',
    4: 'Ainda não recebeu o resultado',
    9: 'Ignorado',
    None: 'Não aplicável'
}

def filtrar_renomear_colunas_multiplos_csv(arquivos_entrada, colunas, novos_nomes, arquivos_saida):
    for i, arquivo in enumerate(arquivos_entrada):
        try:
            # Leitura do arquivo CSV
            df = pd.read_csv(arquivo)

            # Verificar se as colunas especificadas existem no arquivo CSV
            colunas_existentes = [col for col in colunas if col in df.columns]
            if not colunas_existentes:
                print(f"Nenhuma das colunas especificadas existe no arquivo '{arquivo}'.")
                continue

            # Filtrar as colunas
            df_filtrado = df[colunas_existentes]

            # Renomear as colunas
            df_filtrado.columns = [novos_nomes[colunas.index(col)] for col in colunas_existentes]

            # Substituindo os códigos das colunas com mapeamentos
            if 'UF' in df_filtrado.columns:
                df_filtrado['UF'] = df_filtrado['UF'].map(mapeamento_uf).fillna('UF Desconhecido')
            if 'Sexo' in df_filtrado.columns:
                df_filtrado['Sexo'] = df_filtrado['Sexo'].map(mapeamento_sexo).fillna('Sexo Desconhecido')
            if 'Cor ou raça' in df_filtrado.columns:
                df_filtrado['Cor ou raça'] = df_filtrado['Cor ou raça'].map(mapeamento_cor_raca).fillna('Cor/Raça Desconhecida')
            if 'Escolaridade' in df_filtrado.columns:
                df_filtrado['Escolaridade'] = df_filtrado['Escolaridade'].map(mapeamento_escolaridade).fillna('Escolaridade Desconhecida')
            if 'Restricao_de_Contato_Semana_Passada' in df_filtrado.columns:
                df_filtrado['Restricao_de_Contato_Semana_Passada'] = df_filtrado['Restricao_de_Contato_Semana_Passada'].map(mapeamento_restricao_contato).fillna('Restrição de Contato Desconhecida')
            if 'Faixa_Rendimento_Retirada_Dinheiro' in df_filtrado.columns:
                df_filtrado['Faixa_Rendimento_Retirada_Dinheiro'] = df_filtrado['Faixa_Rendimento_Retirada_Dinheiro'].map(mapeamento_faixa_rendimento).fillna('Faixa de Rendimento Desconhecida')
            if 'Resultado' in df_filtrado.columns:
                df_filtrado['Resultado'] = df_filtrado['Resultado'].map(mapeamento_resultado_teste).fillna('Resultado Desconhecido')

            # Salvar o novo CSV
            df_filtrado.to_csv(arquivos_saida[i], index=False)
            print(f"Novo CSV '{arquivos_saida[i]}' gerado com as colunas renomeadas e valores substituídos.")

        except Exception as e:
            print(f"Ocorreu um erro ao processar o arquivo '{arquivo}': {e}")

# Exemplo de uso
arquivos_entrada = ['PNAD_COVID_092020.csv', 'PNAD_COVID_102020.csv', 'PNAD_COVID_112020.csv']
arquivos_saida = ['PNAD_COVID_092020_FILT.csv', 'PNAD_COVID_102020_FILT.csv', 'PNAD_COVID_112020_FILT.csv']

colunas = ['UF', 'A002', 'A003', 'A004', 'A005', 'B0011', 'B0013', 'B0014', 'B0015', 'B0016', 'B00111',
           'B0033', 'B0042', 'B007', 'B008', 'B009B', 'B011', 'C011A11', 'B005', 'B006']

novos_nomes = ['UF', 'Idade', 'Sexo', 'Cor ou raça', 'Escolaridade', 'Febre_Semana_Passada',
               'Dor_de_Garganta_Semana_Passada', 'Dificuldade_Respirar_Semana_Passada', 'Dor_de_Cabeca_Semana_Passada',
               'Dor_no_Peito_Semana_Passada', 'Perda_de_Cheiro_ou_Sabor_Semana_Passada', 'Compra_Toma_Remedio_Por_Conta_Propria',
               'Atendimento_Pronto_Socorro_SUS_UPA', 'Plano_de_Saude_Medico', 'Fez_Teste_Para_Coronavirus', 'Resultado',
               'Restricao_de_Contato_Semana_Passada', 'Faixa_Rendimento_Retirada_Dinheiro', 'Internado_Mais_UmDia', 'Sedado_Entubado_Ventilador']

# Chamar função
filtrar_renomear_colunas_multiplos_csv(arquivos_entrada, colunas, novos_nomes, arquivos_saida)


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_filtrado['UF'] = df_filtrado['UF'].map(mapeamento_uf).fillna('UF Desconhecido')
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_filtrado['Sexo'] = df_filtrado['Sexo'].map(mapeamento_sexo).fillna('Sexo Desconhecido')
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_filtrado['Cor ou raça'] = df

Novo CSV 'PNAD_COVID_092020_FILT.csv' gerado com as colunas renomeadas e valores substituídos.


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_filtrado['UF'] = df_filtrado['UF'].map(mapeamento_uf).fillna('UF Desconhecido')
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_filtrado['Sexo'] = df_filtrado['Sexo'].map(mapeamento_sexo).fillna('Sexo Desconhecido')
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_filtrado['Cor ou raça'] = df

Novo CSV 'PNAD_COVID_102020_FILT.csv' gerado com as colunas renomeadas e valores substituídos.


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_filtrado['UF'] = df_filtrado['UF'].map(mapeamento_uf).fillna('UF Desconhecido')
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_filtrado['Sexo'] = df_filtrado['Sexo'].map(mapeamento_sexo).fillna('Sexo Desconhecido')
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_filtrado['Cor ou raça'] = df

Novo CSV 'PNAD_COVID_112020_FILT.csv' gerado com as colunas renomeadas e valores substituídos.
