In [None]:
# Importa o módulo http.client para realizar solicitações HTTP e HTTPS
import http.client

# Importa o módulo json para manipular dados no formato JSON
import json

def obter_dados_empresa_por_cnpj(cnpj):
    
    """
    Esta função consulta a API do ReceitaWS para obter informações
                sobre uma empresa com base em seu CNPJ.
    
    Parâmetros:
    cnpj (str): O CNPJ para o qual as informações da empresa 
                devem ser consultadas.
    
    Retorna:
    dict ou str: Retorna um dicionário contendo as informações da 
                empresa, ou uma mensagem de erro se o CNPJ não for encontrado.
    """
    
    # Cria uma conexão HTTPS com o servidor 'www.receitaws.com.br', que hospeda a API do ReceitaWS.
    conexao = http.client.HTTPSConnection("www.receitaws.com.br")
    
    # Formata e envia uma requisição GET ao servidor ReceitaWS.
    # A requisição inclui o CNPJ fornecido na URL.
    # '/v1/cnpj/{cnpj}' especifica o formato da API que inclui o
    # CNPJ e espera a resposta em formato JSON.
    # O método 'request' realiza a solicitação ao servidor
    # com o método HTTP 'GET'.
    conexao.request("GET", f"/v1/cnpj/{cnpj}")
    
    # Aguarda a resposta do servidor à solicitação feita
    # anteriormente e armazena essa resposta no objeto 'resposta'.
    resposta = conexao.getresponse()
    
    # Lê o conteúdo completo da resposta HTTP, que é
    # enviado pelo servidor em formato de bytes.
    dados = resposta.read()
    
    # Decodifica os bytes recebidos para uma string usando UTF-8.
    # Converte a string JSON decodificada em um dicionário Python
    # usando o método 'loads' do módulo json.
    empresa = json.loads(dados.decode("utf-8"))
    
    # Encerra a conexão HTTPS com o servidor ReceitaWS.
    conexao.close()
    
    # Verifica se a chave 'status' no dicionário de empresa indica erro.
    if empresa.get('status', '') == 'ERROR':
        
        # Se houver erro, retorna uma mensagem de erro, que é
        # de CNPJ não encontrado ou serviço indisponível.
        return empresa.get('message', 'Erro desconhecido.')
        
    else:
        
        # Se não houver erro, retorna o dicionário contendo as
        # informações da empresa.
        return empresa

# Exemplo de uso da função

# Especifica um CNPJ exemplo para consulta
cnpj_exemplo = "06947283000160"

# Utiliza a função para obter as informações da empresa relacionada ao CNPJ
dados_empresa = obter_dados_empresa_por_cnpj(cnpj_exemplo)

# Exibe as informações da empresa ou a mensagem de erro resultante
print(dados_empresa)

{'abertura': '26/08/2004', 'situacao': 'ATIVA', 'tipo': 'MATRIZ', 'nome': 'GOOGLE INTERNATIONAL LLC', 'porte': 'DEMAIS', 'natureza_juridica': '221-6 - Empresa Domiciliada no Exterior', 'atividade_principal': [{'code': '64.62-0-00', 'text': 'Holdings de instituições não-financeiras'}], 'logradouro': '1600 AMPHITHEATER PARKWAY', 'numero': 'S/N', 'municipio': 'EXTERIOR', 'uf': 'EX', 'data_situacao': '26/08/2004', 'cnpj': '06.947.283/0001-60', 'ultima_atualizacao': '2024-06-08T23:59:59.000Z', 'status': 'OK', 'fantasia': '', 'complemento': '', 'cep': '', 'bairro': '', 'email': '', 'telefone': '', 'efr': '', 'motivo_situacao': '', 'situacao_especial': '', 'data_situacao_especial': '', 'atividades_secundarias': [{'code': '00.00-0-00', 'text': 'Não informada'}], 'capital_social': '0.00', 'qsa': [], 'extra': {}, 'billing': {'free': True, 'database': True}}


In [5]:
pip install pandas openpyxl

Note: you may need to restart the kernel to use updated packages.


In [9]:
# Importa o módulo http.client para realizar solicitações HTTP e HTTPS.
import http.client

# Importa o módulo json para manipulação de dados no formato JSON.
import json

# Importa o módulo pandas, um poderoso pacote de análise de
# dados, usado aqui para manipular dados e exportá-los para Excel.
import pandas as pd

def obter_dados_empresa_por_cnpj(cnpj):
    
    """
    Esta função realiza uma consulta à API ReceitaWS para obter 
            informações detalhadas sobre uma empresa dado seu CNPJ.
    
    Parâmetros:
    cnpj (str): CNPJ da empresa a ser consultada.
    
    Retorna:
    dict: Um dicionário com dados da empresa ou uma mensagem de 
            erro se algo der errado.
    """
    
    # Cria uma conexão HTTPS com o domínio da API da ReceitaWS.
    conexao = http.client.HTTPSConnection("www.receitaws.com.br")
    
    # Envia uma requisição GET para a API incluindo o CNPJ na
    # URL para buscar informações específicas.
    conexao.request("GET", f"/v1/cnpj/{cnpj}")
    
    # Obtém a resposta do servidor à requisição enviada.
    resposta = conexao.getresponse()

    # Imprime o status HTTP da resposta para fins de depuração.
    print(f"Status da Resposta HTTP: {resposta.status}")
    
    # Verifica se o status da resposta é diferente
    # de 200 (OK), indicando um erro.
    if resposta.status != 200:
        
        # Retorna um dicionário com status de erro e a mensagem correspondente.
        return {"status": "ERROR", "message": f"Resposta HTTP com status {resposta.status}"}

    # Lê o conteúdo da resposta HTTP, que está em bytes.
    dados = resposta.read()
    
    # Fecha a conexão HTTPS.
    conexao.close()

    # Tenta decodificar o JSON recebido para um dicionário Python.
    try:
        
        # Decodifica os dados recebidos do tipo bytes para string usando codificação UTF-8.
        # Esta etapa é necessária porque a resposta da API vem em bytes e precisamos convertê-la para
        # uma string antes de tentar transformá-la em um dicionário com json.loads().
        empresa = json.loads(dados.decode("utf-8"))
    
        # Imprime os dados da empresa decodificada para fins de depuração.
        # Esta impressão é útil para verificar se os dados estão sendo corretamente interpretados e
        # convertidos. Mostra o conteúdo do dicionário que representa a empresa, ajudando a identificar
        # se todos os campos necessários estão presentes e corretos.
        print(f"Empresa decodificada: {empresa}")
        
        # Retorna o dicionário contendo as informações da empresa.
        # Se a decodificação foi bem-sucedida e não entrou no bloco 'except', retorna-se o dicionário
        # que pode então ser utilizado para outras finalidades no código, como salvar em um arquivo Excel.
        return empresa
    
    # Captura erros de decodificação JSON, se houver.
    except json.JSONDecodeError as e:
        
        # Se ocorrer um erro durante a decodificação do JSON, ele será capturado aqui.
        # Este bloco 'except' é específico para erros de decodificação JSON, o que significa que se algo
        # der errado durante json.loads(), este bloco será executado.
    
        # Imprime o erro de decodificação para fins de depuração.
        # A impressão do erro ajuda a diagnosticar o problema, mostrando a mensagem de erro
        # associada à exceção. Isso pode indicar, por exemplo, que a resposta da API não estava no
        # formato JSON esperado, o que pode ser causado por um erro no servidor ou uma mudança na API.
        print(f"Erro na decodificação do JSON: {str(e)}")
    
        # Retorna um dicionário com status de erro e uma mensagem personalizada.
        # A mensagem personalizada indica que houve um erro na decodificação do JSON, o que pode
        # ajudar na resolução de problemas e no tratamento de erros no código que chama essa função.
        return {"status": "ERROR", "message": "Erro na decodificação do JSON."}


def salvar_dados_empresa_excel(dados_empresa, nome_arquivo="dados_empresa.xlsx"):
    
    """
    Esta função salva os dados de uma empresa em um arquivo Excel, após 
                verificar se não contêm erros e processar quaisquer dados 
                aninhados para simplificação.
    
    Parâmetros:
                dados_empresa (dict): Dicionário contendo as informações da empresa.
                nome_arquivo (str): Nome do arquivo onde os dados serão salvos, 
                        com valor padrão 'dados_empresa.xlsx'.
    """

    # Verifica se o dicionário de dados da empresa não está vazio e se não contém um status de erro.
    # A condição dados_empresa.get('status') != 'ERROR' assegura que somente dados válidos e sem erros
    # serão processados e salvos. Se o status for 'ERROR', os dados não
    # são salvos e uma mensagem de erro é exibida.
    if dados_empresa and dados_empresa.get('status') != 'ERROR':
        
        # Processa dados aninhados para um formato mais simples antes de salvar.
        # Muitas vezes, os dados da API podem vir em estruturas complexas como listas de dicionários.
        # A função tratar_dados_aninhados é chamada para transformar esses dados aninhados em strings
        # simplificadas ou outros formatos mais convenientes para visualização em um arquivo Excel.
        dados_empresa = tratar_dados_aninhados(dados_empresa)

        # Converte os dados processados da empresa em um DataFrame do pandas.
        # Pandas é uma biblioteca que fornece estruturas de dados poderosas e flexíveis, como o DataFrame,
        # que facilitam a manipulação de dados. Aqui, um DataFrame é criado a partir de uma lista que contém
        # o dicionário dados_empresa, transformando cada par chave-valor do
        # dicionário em colunas e valores no DataFrame.
        df = pd.DataFrame([dados_empresa])

        # Salva o DataFrame em um arquivo Excel.
        # O método to_excel do DataFrame permite a exportação direta
        # dos dados para um arquivo Excel.
        # O parâmetro index=False significa que o índice do DataFrame não será escrito no arquivo,
        # deixando o arquivo mais limpo e focado apenas nos dados.
        df.to_excel(nome_arquivo, index=False)

        # Imprime uma confirmação de que os dados foram salvos com sucesso.
        # Isso fornece um feedback visual no console sobre a conclusão
        # bem-sucedida da operação de salvamento.
        print(f"Dados da empresa salvos com sucesso no arquivo {nome_arquivo}")
        
    else:
        
        # Imprime uma mensagem de erro se não houver dados válidos para salvar.
        # Isso ocorre se o dicionário de dados da empresa for nulo ou contiver um status de 'ERROR'.
        # A mensagem de erro específica é obtida do dicionário dados_empresa e exibida.
        print(f"Não há dados válidos para salvar. Mensagem de erro: {dados_empresa.get('message')}")


def tratar_dados_aninhados(dados):
    
    """
    Esta função processa um dicionário de dados para simplificar a 
                estrutura de campos que contêm listas ou dicionários aninhados, 
                facilitando a posterior visualização e manipulação desses dados.
    
    Parâmetros:
                dados (dict): Dicionário contendo dados complexos, 
                com listas ou dicionários aninhados.
    
    Retorna:
    dict: Retorna o dicionário com os dados aninhados simplificados.
    """

    # Verifica e processa o campo 'atividade_principal', que geralmente contém uma lista de dicionários.
    # Cada dicionário representa uma atividade principal e possui um campo 'text' com a descrição da atividade.
    # O método 'join' é usado para concatenar todas as descrições com um ponto e vírgula entre elas,
    # transformando a lista de descrições em uma única string.
    if "atividade_principal" in dados:
        
        dados['atividade_principal'] = "; ".join([ativ['text'] for ativ in dados['atividade_principal']])

    # Verifica e processa o campo 'atividades_secundarias', semelhante ao campo 'atividade_principal'.
    # Concatena todas as descrições das atividades secundárias em uma única string.
    if "atividades_secundarias" in dados:
        
        dados['atividades_secundarias'] = "; ".join([ativ['text'] for ativ in dados['atividades_secundarias']])

    # Verifica e processa o campo 'qsa', que geralmente contém uma lista de dicionários representando sócios.
    # Cada dicionário tem campos como 'nome' e 'qual' (qualificação do sócio).
    # A string final para cada sócio inclui seu nome e qualificação, separados por parênteses,
    # e todos os sócios são concatenados em uma única string.
    if "qsa" in dados:
        
        dados['qsa'] = "; ".join([f"{q['nome']} ({q.get('qual', '')})" for q in dados['qsa']])

    # Verifica se existe um campo 'billing', que pode ser um dicionário ou um valor específico.
    # Converte o valor ou dicionário completo para string para uniformidade e simplicidade.
    if "billing" in dados:
        
        dados['billing'] = str(dados['billing'])

    # Verifica se existe um campo 'extra', que pode conter informações adicionais em forma de dicionário ou valor.
    # Similar ao campo 'billing', converte todo o conteúdo para string.
    if "extra" in dados:
        
        dados['extra'] = str(dados['extra'])

    # Retorna o dicionário modificado com campos simplificados, facilitando o
    # uso futuro desses dados,
    # especialmente útil para exportação para formatos como CSV ou Excel.
    return dados


# Define um CNPJ para consulta.
cnpj_exemplo = "06947283000160"

# Chama a função para obter dados da empresa usando o CNPJ exemplo.
dados_empresa = obter_dados_empresa_por_cnpj(cnpj_exemplo)

# Chama a função para salvar os dados obtidos em um arquivo Excel.
salvar_dados_empresa_excel(dados_empresa)

Status da Resposta HTTP: 200
Empresa decodificada: {'abertura': '26/08/2004', 'situacao': 'ATIVA', 'tipo': 'MATRIZ', 'nome': 'GOOGLE INTERNATIONAL LLC', 'porte': 'DEMAIS', 'natureza_juridica': '221-6 - Empresa Domiciliada no Exterior', 'atividade_principal': [{'code': '64.62-0-00', 'text': 'Holdings de instituições não-financeiras'}], 'logradouro': '1600 AMPHITHEATER PARKWAY', 'numero': 'S/N', 'municipio': 'EXTERIOR', 'uf': 'EX', 'data_situacao': '26/08/2004', 'cnpj': '06.947.283/0001-60', 'ultima_atualizacao': '2024-06-08T23:59:59.000Z', 'status': 'OK', 'fantasia': '', 'complemento': '', 'cep': '', 'bairro': '', 'email': '', 'telefone': '', 'efr': '', 'motivo_situacao': '', 'situacao_especial': '', 'data_situacao_especial': '', 'atividades_secundarias': [{'code': '00.00-0-00', 'text': 'Não informada'}], 'capital_social': '0.00', 'qsa': [], 'extra': {}, 'billing': {'free': True, 'database': True}}
Dados da empresa salvos com sucesso no arquivo dados_empresa.xlsx


In [17]:
# Importa os módulos necessários para operações HTTP, manipulação de JSON e
# processamento de dados em formato de planilha.

# Módulo para realizar solicitações HTTP e HTTPS a servidores web.
import http.client

# Módulo para codificar e decodificar dados em formato JSON, uma forma
# leve de troca de dados.
import json

# Biblioteca que oferece estruturas de dados e ferramentas de análise de
# dados, útil para manipular tabelas.
import pandas as pd

def limpar_cnpj(cnpj):
    
    """
    Esta função é responsável por limpar a string de CNPJ, removendo quaisquer
            caracteres que não sejam dígitos numéricos.
    Isso é essencial porque o CNPJ pode ser fornecido em formatos diversos, com 
            pontos, traços ou barras,
            que não são aceitos em solicitações de API que esperam apenas a sequência numérica.

    Parâmetros:
    cnpj (str): A string do CNPJ que pode conter formatos diversos, incluindo dígitos, 
            pontos, traços e barras.

    Retorna:
    str: Uma string contendo apenas os dígitos numéricos do CNPJ, adequada para 
            uso em URLs ou consultas de banco de dados.
    """
    
    # A função `filter` é utilizada aqui para iterar sobre cada caractere da string 'cnpj'.
    # A função `str.isdigit` é passada como argumento para `filter`, que aplica esta
            # função a cada caractere.
    # `str.isdigit` retorna True se o caractere for um dígito numérico, o que significa
            # que ele é retido na sequência final.
    # Caso contrário, caracteres como pontos, traços e espaços, que retornariam False,
            # são removidos da sequência final.
    # O resultado de `filter`, que é um iterador sobre os caracteres que são dígitos, é
            # convertido de volta em uma string usando `join`.
    # A função `join` é chamada em uma string vazia '', que serve como separador entre os
            # caracteres no resultado final.
    # Isso significa que todos os caracteres numéricos são concatenados sem nenhum
            # separador entre eles.
    return ''.join(filter(str.isdigit, cnpj))


def obter_dados_empresa_por_cnpj(cnpj):
    
    """
    Esta função faz uma consulta à API ReceitaWS para obter informações 
                sobre uma empresa, usando o CNPJ como chave de pesquisa.
    O processo envolve limpar o CNPJ para remover caracteres não numéricos, 
                enviar uma requisição HTTP GET e interpretar a resposta.
    
    Parâmetros:
    cnpj (str): CNPJ da empresa a ser consultada, podendo inicialmente 
                incluir caracteres como traços ou pontos.
    
    Retorna:
    dict: Um dicionário contendo as informações da empresa recuperadas 
                da API, ou None se ocorrer algum erro, como uma resposta HTTP não 
                bem-sucedida ou problemas na decodificação do JSON.
    """
    
    # Primeiro, a função 'limpar_cnpj' é chamada para remover quaisquer
                # caracteres não numéricos do CNPJ fornecido.
    # Isso é crucial porque a API espera um CNPJ apenas com dígitos numéricos.
    cnpj = limpar_cnpj(cnpj)
    
    # Cria uma conexão HTTPS com o domínio 'www.receitaws.com.br'.
    # O protocolo HTTPS é usado aqui para garantir a segurança dos dados
    # transmitidos através da Internet.
    conexao = http.client.HTTPSConnection("www.receitaws.com.br")
    
    # Envia uma requisição GET para o servidor da API, especificamente ao endpoint que
            # aceita CNPJ como parâmetro.
    # O método `GET` é utilizado para recuperar dados do servidor sem afetar o estado
            # do mesmo, o que é ideal para consultas.
    # A URL para a requisição é construída usando f-strings, que permite a inserção
            # dinâmica de variáveis dentro de strings.
    # O endpoint `/v1/cnpj/{cnpj}` é especificamente projetado para aceitar um CNPJ como parte da URL.
    # Aqui, `{cnpj}` na URL é substituído pelo valor da variável `cnpj`, que contém
            # o CNPJ da empresa a ser consultado.
    # Este CNPJ é inserido diretamente na URL, seguindo as especificações da API, garantindo
            # que o CNPJ correto seja utilizado na consulta.
    # A função `request` do objeto `conexao`, que é uma instância de `http.client.HTTPSConnection`,
            # é chamada com dois argumentos:
    # o método HTTP 'GET' e a URL formatada.
    # Esta chamada inicia o processo de envio da requisição HTTP ao servidor API, esperando por
            # uma resposta que contém os dados da empresa.
    conexao.request("GET", f"/v1/cnpj/{cnpj}")

    
    # Recebe a resposta do servidor após o envio da requisição.
    # O objeto 'resposta' contém tanto o status do HTTP quanto o corpo da resposta.
    resposta = conexao.getresponse()
    
    # Para fins de depuração e controle de fluxo, o status da resposta HTTP é impresso.
    # Isso ajuda a verificar se a requisição foi bem-sucedida.
    print(f"Processando CNPJ {cnpj}: Status {resposta.status}")
    
    # Verifica se o status HTTP da resposta não é 200 (OK).
    # Qualquer status diferente de 200 indica que algo deu errado com a
    # requisição, e a função então encerra prematuramente.
    if resposta.status != 200:

        # A conexão é fechada para liberar recursos.
        conexao.close()

        # A função retorna None para indicar que a requisição falhou.
        return None  
    
    # Se o status for 200, o conteúdo da resposta é lido.
    # O método 'read' obtém o corpo da resposta, que é um conjunto de bytes.
    dados = resposta.read()
    
    # Após a leitura dos dados, a conexão é fechada.
    conexao.close()
    
    # Tenta decodificar os bytes para uma string formatada em UTF-8 e então
            # carrega essa string como um dicionário JSON.
    # Esse passo é crucial porque transforma a string JSON em um objeto Python
            # que pode ser facilmente manipulado.
    empresa = json.loads(dados.decode("utf-8"))
    
    # Verifica se a resposta contém a chave 'status' com o valor 'ERROR', indicando um
            # erro na busca de dados.
    # Se um erro é encontrado, uma mensagem correspondente é impressa e a função retorna None.
    if "status" in empresa and empresa["status"] == "ERROR":
        print(f"Erro ao buscar dados para o CNPJ {cnpj}: {empresa.get('message', 'Sem mensagem de erro')}")
        return None
    
    # Se tudo ocorrer bem, o dicionário com as informações da empresa é retornado.
    return empresa


def formatar_dados(empresa):
    
    """
    Esta função é projetada para extrair e formatar campos específicos 
                dos dados de uma empresa obtidos via API.
    Ela simplifica o dicionário de entrada, selecionando apenas os 
                campos relevantes para uso posterior, como em 
                relatórios ou interfaces de usuário.

    Parâmetros:
    empresa (dict): Dicionário contendo todos os dados da 
                empresa como retornado pela API.

    Retorna:
    dict: Dicionário contendo apenas os campos selecionados e 
                formatados da empresa.
    """
    
    # Lista de campos específicos que são de interesse para a
                # aplicação ou o processo de negócio.
    # Esses campos foram escolhidos porque são comuns em consultas de
                # dados de empresas e úteis para análises básicas ou contato.
    campos_interesse = ['cnpj', 'nome', 'telefone', 'email', 'logradouro', 'bairro', 'municipio', 'uf', 'cep', 'atividade_principal']
    
    # Cria um novo dicionário que irá conter apenas os campos especificados.
    # Utiliza um dicionário por compreensão para iterar sobre a lista de campos de interesse.
    # Para cada campo, o método `get` é utilizado para buscar o valor correspondente no
            # dicionário original `empresa`.
    # Se o campo não estiver presente no dicionário `empresa`, o método `get` retorna
            # uma string vazia como padrão (''),
    # o que ajuda a manter a consistência do dicionário de saída e evita erros de chave não encontrada.
    dados_formatados = {campo: empresa.get(campo, '') for campo in campos_interesse}
    
    # Verifica se a chave 'atividade_principal' está presente no dicionário e
            # se ela contém algum valor.
    # A chave 'atividade_principal' geralmente contém uma lista de atividades, onde
            # cada atividade é um dicionário.
    # O interesse é extrair apenas o texto da primeira atividade principal listada, se disponível.
    # Acessa o primeiro elemento da lista (índice [0]) e busca a chave 'text' dentro deste dicionário.
    # Se a chave 'text' não estiver disponível, retorna uma string vazia como valor padrão.
    if 'atividade_principal' in empresa and empresa['atividade_principal']:
        dados_formatados['atividade_principal'] = empresa['atividade_principal'][0].get('text', '')
    
    # Retorna o dicionário formatado contendo apenas os campos de interesse com seus
            # valores extraídos ou padrões aplicados.
    return dados_formatados


def salvar_dados_empresa_excel(resultados, nome_arquivo, nome_aba="Dados"):
    
    """
    Esta função utiliza a biblioteca pandas para salvar um DataFrame de 
                dados das empresas em uma planilha Excel existente.
    Ela pode adicionar dados em uma aba existente ou criar uma 
                nova aba se necessário.

    Parâmetros:
    resultados (DataFrame): DataFrame contendo os dados das empresas a serem salvos.
                nome_arquivo (str): Caminho do arquivo Excel onde os 
                dados serão salvos.
    nome_aba (str): Nome da aba onde os dados serão adicionados ou 
                criados. O nome padrão da aba é 'Dados'.

    Retorno:
    None: A função não retorna nenhum valor, mas salva os dados 
                diretamente no arquivo Excel especificado.
    """
    
    # Utiliza o ExcelWriter para abrir o arquivo Excel especificado.
    # O ExcelWriter é uma ferramenta do pandas que facilita a escrita de
                # dados em múltiplos formatos de arquivo Excel sem
                # destruir os dados existentes.
    # Parâmetro 'engine' define que 'openpyxl' é usado como
                # mecanismo para trabalhar com arquivos xlsx.
    # Parâmetro 'mode' como 'a' permite anexar aos arquivos
                # existentes sem apagar o conteúdo anterior.
    # Parâmetro 'if_sheet_exists' como 'overlay' permite sobrepor dados na aba especificada se ela já existir.
    with pd.ExcelWriter(nome_arquivo, engine='openpyxl', mode='a', if_sheet_exists='overlay') as writer:
        
        try:
            
            # Tenta acessar a aba com o nome especificado dentro do arquivo Excel.
                        # Se a aba existir, 'worksheet' armazena essa aba.
            worksheet = writer.book[nome_aba]
            
            # Determina a última linha preenchida na aba existente para
                        # saber onde começar a adicionar novos dados.
            start_row = worksheet.max_row
            
            # Adiciona os dados do DataFrame 'resultados' na aba existente,
                        # começando após a última linha preenchida.
            # 'index=False' significa que os índices do DataFrame não
                        # serão escritos no Excel.
            # 'header=False' significa que os cabeçalhos das colunas também
                        # não serão escritos, pois se assume que a aba já possui cabeçalhos.
            resultados.to_excel(writer, sheet_name=nome_aba, index=False, header=False, startrow=start_row)
            
        except KeyError:
            
            # Se a aba especificada não existir no arquivo, um erro de chave é capturado.
            # Neste caso, cria-se uma nova aba com o nome especificado e
                        # adiciona-se os dados com cabeçalhos de coluna.
            resultados.to_excel(writer, sheet_name=nome_aba, index=False, header=True)
            
            # 'index=False' e 'header=True' significam que os dados serão
                        # escritos sem índices, mas com cabeçalhos de coluna,
                        # facilitando a identificação dos dados em uma nova aba.
            

# Define o caminho do arquivo Excel onde os dados serão salvos.
caminho_planilha = "CNPJ.xlsx"

# Carrega os dados de CNPJs da planilha, tratando a coluna CNPJ como string
        # para evitar perda de dígitos.
# A função 'read_excel' do pandas é usada para ler dados de uma planilha Excel.
# 'caminho_planilha' especifica o caminho do arquivo Excel que contém os dados.
# 'sheet_name' especifica a aba dentro do arquivo Excel de onde os dados devem ser lidos.
# 'dtype' especifica o tipo de dados de cada coluna; aqui, a coluna 'CNPJ' é tratada como string (str)
            # para preservar os zeros à esquerda e outros formatos numéricos que poderiam ser
# interpretados incorretamente como números inteiros.
planilha_cnpjs = pd.read_excel(caminho_planilha, sheet_name='CNPJ', dtype={'CNPJ': str})

# Inicializa uma lista vazia para armazenar os resultados formatados de
            # cada empresa consultada.
resultados = []

# Itera sobre os CNPJs da planilha, obtendo e formatando os dados de cada empresa.
# 'dropna()' é usado para eliminar quaisquer valores NaN que possam existir na
            # coluna 'CNPJ', garantindo que apenas CNPJs válidos sejam processados.
for cnpj in planilha_cnpjs['CNPJ'].dropna():
    
    # Imprime o CNPJ atual sendo processado para fins de depuração e
            # acompanhamento do progresso.
    print(f"Lendo CNPJ: {cnpj}")
    
    # Chama a função 'obter_dados_empresa_por_cnpj' para cada CNPJ,
            # convertendo o CNPJ para string por precaução,
            # embora já esteja definido como string pelo 'dtype' na leitura da planilha.
    dados_empresa = obter_dados_empresa_por_cnpj(str(cnpj))
    
    # Verifica se dados válidos foram retornados (i.e., 'dados_empresa' não é None).
    if dados_empresa:
        
        # Se dados válidos foram obtidos, chama a função 'formatar_dados' para
                    # estruturar os dados em um formato mais simples e uniforme.
        dados_formatados = formatar_dados(dados_empresa)
        
        # Adiciona os dados formatados à lista 'resultados'.
        resultados.append(dados_formatados)


# Verifica se a lista 'resultados' contém algum dicionário de dados formatados.
# 'resultados' é preenchida com dicionários se dados válidos foram
            # obtidos e formatados nas etapas anteriores.
if resultados:
    
    # Converte a lista de dicionários 'resultados' em um DataFrame do pandas.
    # Um DataFrame é uma estrutura de dados tabular muito usada em análise de
            # dados que facilita a manipulação, análise e visualização.
    # Cada dicionário na lista 'resultados' se torna uma linha no DataFrame, e
            # as chaves dos dicionários se tornam as colunas.
    resultados_df = pd.DataFrame(resultados)
    
    # Chama a função 'salvar_dados_empresa_excel' para gravar o
            # DataFrame 'resultados_df' no arquivo Excel especificado.
    # 'caminho_planilha' é o caminho do arquivo onde os dados serão salvos.
    # A função é responsável por adicionar os dados em uma aba específica
            # ou criar uma nova se necessário,
    # garantindo que os dados sejam persistidos de forma organizada e acessível.
    salvar_dados_empresa_excel(resultados_df, caminho_planilha)

# Após tentar salvar os dados, imprime uma mensagem indicando que os dados
            # das empresas foram salvos na planilha.
print("Dados das empresas foram salvos na planilha na aba 'Dados'.")

Lendo CNPJ: 33157312000162
Processando CNPJ 33157312000162: Status 200
Lendo CNPJ: 06947283000160
Processando CNPJ 06947283000160: Status 200
Lendo CNPJ: 10573521000191
Processando CNPJ 10573521000191: Status 200
Dados das empresas foram salvos na planilha na aba 'Dados'.
