Este script é projetado para formatar e validar números de processos a partir de um arquivo Excel, categorizar esses números em "Processos Válidos", "NUP" (Número Único de Processo) e "Processos Inválidos", e então salvar os resultados em um novo arquivo Excel.

Funções

1. formatar_numero_processo(numero)

Descrição:

Formata um número de processo removendo todos os caracteres não numéricos e ajustando o tamanho para 20 caracteres com preenchimento à esquerda com zeros, se necessário.

Parâmetros:
. numero (str): Número do processo a ser formatado.

Retorno:
.(str): Número de processo formatado ou uma string vazia se o número for inválido.

Log:
. Emite um aviso se o número tem menos de 18 caracteres.
. Emite um erro se o número tem mais de 20 caracteres.

2. verificar_vazio_ou_zeros(numero_formatado)

Descrição:
Verifica se o número formatado está vazio ou contém apenas zeros.

Parâmetros:
. numero_formatado (str): Número de processo formatado.

Retorno:
. (bool): True se o número estiver vazio ou contiver apenas zeros; False caso contrário.

3. verifica_nup_jud(numero_formatado)

Descrição:
. Verifica se o número de processo é um NUP válido, uma Correspondência válida ou um número inválido.

Parâmetros:
. numero_formatado (str): Número de processo formatado.

Retorno:
. (str): 'NUP' se for um NUP válido, 'Correspondencia' se for uma Correspondência válida, 'Invalido' caso contrário.

Regras:
. Verifica segmentos de data válidos (1950-2025).
. Usa regex para verificar padrões específicos de NUP.

4. processa_e_salva_excel(arquivo_entrada, arquivo_saida)

Descrição:
Processa um arquivo Excel contendo números de processos, formata e valida os números, categoriza-os e salva os resultados em um novo arquivo Excel.

Parâmetros:
. arquivo_entrada (str): Caminho para o arquivo Excel de entrada.
. arquivo_saida (str): Caminho para o arquivo Excel de saída.

Processo:
. Lê o arquivo Excel de entrada.
. Verifica a presença da coluna 'Numero do Processo'.
. Formata os números de processo.
. Remove números inválidos (vazios ou apenas zeros).
. Categoriza números começando com '00000' em 'NUP', 'Correspondencia' e 'Invalido'.
. Combina números válidos e correspondências em um único DataFrame.
. Salva os resultados em um novo arquivo Excel com três planilhas:
   - 'Processos Válidos'
   - 'NUP'
   - 'Processos Inválidos'
Log:
. Emite um erro se houver problemas ao ler ou salvar o arquivo Excel.

In [None]:
import pandas as pd
import re
import logging

# Configura o nível de log para INFO
logging.basicConfig(level=logging.INFO)

def formatar_numero_processo(numero):
    # Remove todos os caracteres não numéricos do número
    numero_formatado = re.sub(r'\D', '', str(numero))
    tamanho = len(numero_formatado)

    # Se o tamanho do número formatado estiver entre 18 e 20, preenche com zeros à esquerda até 20 caracteres
    if 18 <= tamanho <= 20:
        return numero_formatado.zfill(20)
    elif tamanho == 17:
        return numero_formatado
    elif tamanho > 20:
        logging.error(f"Tamanho incorreto. Maior que 20 caracteres: {numero_formatado}")
    else:
        logging.warning(f"Numero com menos de 18 caracteres: {numero_formatado}")

    # Retorna uma string vazia para números inválidos
    return ''

def verificar_vazio_ou_zeros(numero_formatado):
    # Verifica se o número formatado está vazio ou contém apenas zeros
    return not numero_formatado or numero_formatado == '0' * len(numero_formatado)

def verifica_nup_jud(numero_formatado):
    if not numero_formatado:
        return 'Invalido'

    # Padrão regex para verificar se o número começa com 4 ou 5 após os zeros
    pattern = r'^0*([45]\d*)$'
    regex = re.compile(pattern)
    numero = str(numero_formatado)

    # Função interna para verificar se o segmento de data está no intervalo válido
    def segmento_de_data_valido(segmento):
        return 1950 <= int(segmento) <= 2025

    # Verifica se o número corresponde a um NUP válido ou uma Correspondência válida
    if len(numero) > 2 and segmento_de_data_valido(numero[-6:-2]) and regex.match(numero):
        return 'NUP'
    elif len(numero) > 7 and segmento_de_data_valido(numero[-11:-7]):
        return 'Correspondencia'

    return 'Invalido'

def processa_e_salva_excel(arquivo_entrada, arquivo_saida):
    try:
        # Lê o arquivo Excel de entrada
        df = pd.read_excel(arquivo_entrada)
    except Exception as e:
        logging.error(f"Erro ao ler o arquivo Excel: {e}")
        return

    if 'Numero do Processo' not in df.columns:
        logging.error("A coluna 'Numero do Processo' não foi encontrada no arquivo Excel.")
        return

    # Formata os números de processo
    df['Numero do Processo'] = df['Numero do Processo'].apply(formatar_numero_processo)
    # Remove números de processo inválidos (vazios ou contendo apenas zeros)
    df = df[~df['Numero do Processo'].apply(verificar_vazio_ou_zeros) & (df['Numero do Processo'] != '')]

    # Separa os números de processo que começam com '00000'
    df_5_zeros = df[df['Numero do Processo'].str.startswith('00000')].copy()
    df_outros = df[~df['Numero do Processo'].str.startswith('00000')]

    # Verifica a categoria dos números de processo que começam com '00000'
    df_5_zeros['Verificacao'] = df_5_zeros['Numero do Processo'].apply(verifica_nup_jud)
    df_nup = df_5_zeros[df_5_zeros['Verificacao'] == 'NUP']
    df_correspondencia = df_5_zeros[df_5_zeros['Verificacao'] == 'Correspondencia']
    df_invalidos = df_5_zeros[df_5_zeros['Verificacao'] == 'Invalido']

    # Combina números válidos e correspondências em um único DataFrame
    df_validos = pd.concat([df_outros, df_correspondencia])

    try:
        # Salva os resultados em um novo arquivo Excel com três planilhas
        with pd.ExcelWriter(arquivo_saida) as writer:
            df_validos.drop(columns='Verificacao', errors='ignore').to_excel(writer, sheet_name='Processos Válidos', index=False)
            df_nup.drop(columns='Verificacao', errors='ignore').to_excel(writer, sheet_name='NUP', index=False)
            df_invalidos.drop(columns='Verificacao', errors='ignore').to_excel(writer, sheet_name='Processos Inválidos', index=False)
        logging.info(f'Arquivo {arquivo_saida} salvo com sucesso!')
    except Exception as e:
        logging.error(f"Erro ao salvar o arquivo Excel: {e}")

# Exemplo de uso
arquivo_entrada = 'caminho do arquivo'
arquivo_saida = 'caminho de saida do arquivo + o novo nome'
processa_e_salva_excel(arquivo_entrada, arquivo_saida)


In [None]:
Requisitos:
. Python 3.x
. Pandas
. re (Regular Expressions)
. logging