In [1]:
import os
import requests as r
import zipfile

In [2]:
# Diretório base para armazenar os dados
diretorio_base = 'data/'

# Lista de sufixos para os arquivos a serem baixados
sufixos_arquivos = [
    '052020',
    '062020',
    '072020',
    '082020',
    '092020',
    '102020',
    '112020',
]
# Prefixo para os nomes dos arquivos
prefixo_arquivo = 'PNAD_COVID_'

# URL base para baixar os arquivos
url_base = 'https://ftp.ibge.gov.br/Trabalho_e_Rendimento/Pesquisa_Nacional_por_Amostra_de_Domicilios_PNAD_COVID19/Microdados/Dados/'

In [3]:
def criar_diretorio(novo_diretorio='raw'):
    """
    Cria um diretório se ele não existir.
    
    Parâmetros:
    novo_diretorio (str): O diretório a ser criado.
    """
    if not os.path.isdir(novo_diretorio):
        print(f'-- Criando diretório {novo_diretorio}')
        os.makedirs(novo_diretorio)

In [4]:
def descompactar_arquivo(diretorio_saida, nome_arquivo, sufixo):
    """
    Descompacta o arquivo baixado e remove o arquivo zip.
    
    Parâmetros:
    diretorio_saida (str): O diretório onde o arquivo zip está localizado.
    nome_arquivo (str): O nome do arquivo zip.
    sufixo (str): O sufixo do arquivo.
    """
    nome_arquivo = f'{prefixo_arquivo}{sufixo}.zip'
    print(f'-- Descompactando {nome_arquivo} para {diretorio_saida}')
    caminho_arquivo = f'{diretorio_saida}{nome_arquivo}'
    with zipfile.ZipFile(caminho_arquivo, 'r') as zip_ref:
        zip_ref.extractall(diretorio_saida)
    os.remove(caminho_arquivo)

In [5]:
def baixar_arquivos(diretorio_saida=f'{diretorio_base}raw/'):
    """
    Baixa e descompacta arquivos da URL especificada.
    
    Parâmetros:
    diretorio_saida (str): O diretório para salvar os arquivos baixados.
    """
    criar_diretorio(diretorio_saida)
    for sufixo in sufixos_arquivos:
        nome_arquivo = f'{prefixo_arquivo}{sufixo}.zip'
        arquivo_saida = f'{diretorio_saida}{nome_arquivo}'
        print(f'-- Baixando {url_base}{nome_arquivo} para {arquivo_saida}')
        resposta = r.get(f'{url_base}{nome_arquivo}')
        with open(arquivo_saida, 'wb') as arquivo:
            arquivo.write(resposta.content)
        descompactar_arquivo(diretorio_saida, nome_arquivo, sufixo)

In [6]:
def baixar_documentacao():
    """
    Baixa arquivos de documentação.
    """
    prefixo_arquivo = 'Dicionario_PNAD_COVID_'
    sufixo_fixo_arquivo = '_20220621.xls'
    url_base = 'https://ftp.ibge.gov.br/Trabalho_e_Rendimento/Pesquisa_Nacional_por_Amostra_de_Domicilios_PNAD_COVID19/Microdados/Documentacao/'
    diretorio_saida = f'{diretorio_base}raw/dimensoes/'
    criar_diretorio(diretorio_saida)
    for sufixo in sufixos_arquivos:
        nome_arquivo = f'{prefixo_arquivo}{sufixo}{sufixo_fixo_arquivo}'
        arquivo_saida = f'{diretorio_saida}{nome_arquivo}'
        print(f'-- Baixando {url_base}{nome_arquivo} para {arquivo_saida}')
        resposta = r.get(f'{url_base}{nome_arquivo}')
        with open(arquivo_saida, 'wb') as arquivo:
            arquivo.write(resposta.content)

In [7]:
def obter_dados():
    """
    Baixa dados e arquivos de documentação.
    """
    baixar_arquivos()
    baixar_documentacao()

In [8]:
# Executa a função para baixar dados e documentação
obter_dados()

-- Baixando https://ftp.ibge.gov.br/Trabalho_e_Rendimento/Pesquisa_Nacional_por_Amostra_de_Domicilios_PNAD_COVID19/Microdados/Dados/PNAD_COVID_052020.zip para data/raw/PNAD_COVID_052020.zip


-- Descompactando PNAD_COVID_052020.zip para data/raw/
-- Baixando https://ftp.ibge.gov.br/Trabalho_e_Rendimento/Pesquisa_Nacional_por_Amostra_de_Domicilios_PNAD_COVID19/Microdados/Dados/PNAD_COVID_062020.zip para data/raw/PNAD_COVID_062020.zip
-- Descompactando PNAD_COVID_062020.zip para data/raw/
-- Baixando https://ftp.ibge.gov.br/Trabalho_e_Rendimento/Pesquisa_Nacional_por_Amostra_de_Domicilios_PNAD_COVID19/Microdados/Dados/PNAD_COVID_072020.zip para data/raw/PNAD_COVID_072020.zip
-- Descompactando PNAD_COVID_072020.zip para data/raw/
-- Baixando https://ftp.ibge.gov.br/Trabalho_e_Rendimento/Pesquisa_Nacional_por_Amostra_de_Domicilios_PNAD_COVID19/Microdados/Dados/PNAD_COVID_082020.zip para data/raw/PNAD_COVID_082020.zip
-- Descompactando PNAD_COVID_082020.zip para data/raw/
-- Baixando https://ftp.ibge.gov.br/Trabalho_e_Rendimento/Pesquisa_Nacional_por_Amostra_de_Domicilios_PNAD_COVID19/Microdados/Dados/PNAD_COVID_092020.zip para data/raw/PNAD_COVID_092020.zip
-- Descompactando PN