In [1]:
from tqdm import tqdm
from tkinter import Tk
from tkinter import filedialog
from pandas import DataFrame as DF
from pycpfcnpj.cpf import validate as valicpf
from ciso8601 import parse_datetime as to_datetime

In [2]:
def get_lines():
    lines = []
    root = Tk()
    root.attributes("-topmost", True)
    root.withdraw()
    for file in filedialog.askopenfilenames():
        with open(file) as txt:
            for n, line in enumerate(txt.readlines(), 1):
                yield n, line

Regra |Descrição |Impeditiva
:------|:------------|:--------------
7397.1| Verifica se não há linhas em branco |Sim
7397.2| Verifica o tamanho padrão da linha (133 caracteres) |Sim
7397.3| Verifica se o campo sequencial é numérico e válido (PBCSEQ) |Sim
7397.4| Verifica se o código da entidade é válido (ENTCODIGO) |Sim
7397.5| Verifica se o campo MRFMESANO corresponde, respectivamente, ao ano, mês e último dia do mês de referência do FIP/SUSEP |Sim
7397.6| Verifica se o campo QUAID corresponde ao quadro 381| Sim
7397.7| Verifica se o (PLNCODIGO) pertence ao Cadastro de Planos da entidade| Sim
7397.8| Verifica se CPF do Participante/Segurado/Beneficiário (PBCCPFPARTIC) é inteiro e válido, exceto para preenchimento com zeros |Sim
7397.9| Verifica se PBCIDADE é inteiro| Sim
7397.10| Verifica se o TPEVID pertence à tabela ‘TiposEventosPrev’ do FIP/Susep| Sim
7397.11| Verifica se o TPRENID pertence à tabela ‘TipoRenda’ do FIP/Susep |Sim
7397.12| Verifica se o TBOID pertence à tabela ‘TabuaBiometrica’ do FIP/SUSEP, exceto códigos 63, 64, 65 e 66. |Sim
7397.13| Verifica se o TFCID pertence à tabela ‘TiposFormaCalc’ do FIP/Susep |Sim
7397.14| Verifica se PBCNUMRECEBAN é inteiro e válido (aceita somente 12 e 13) |Sim
7397.15| Verifica se PBCMESRENDA13 é inteiro e se está entre 00 e 11 ou 99 de acordo com valor informado em PBCNUMRECEBAN. Se PBCNUMRECEBAN=13 então PBCMESRENDA13=00 à 11, se PBCNUMRECEBAN=12 então PBCMESRENDA13=99|Sim
7397.16| Verifica se o TFPID pertence à tabela ‘TiposFormaPagto’ do FIP/Susep |Sim
7397.17| Verifica se PBCTEMPORECEB, PBCTEMPORARIE e PBCIDADBENREV são inteiros |Sim
7397.18| Verifica se o TBOIDBENREV pertence à tabela ‘TabuaBiometrica’ do FIP/SUSEP, exceto códigos 63, 64, 65 e 66. |Sim
7397.19| Verifica se o PRAID pertence à tabela ‘PeriodicidadeAtu’ do FIP/Susep| Sim
7397.20| Verifica se o INDID pertence à tabela ‘Indexadores’ do FIP/Susep |Sim
7397.21| Verifica se o DFAID pertence à tabela ‘DefasIndex’ do FIP/Susep |Sim
7397.22| Verifica se PBCTAXAJUROS é percentual válido |Sim
7397.23| Verifica se PBCPERCREV é percentual válido e consta entre 0 e 100% |Sim
7397.24| Verifica se PBCDATULTATU é uma data válida |Sim
7397.25| Verifica se PBCVALORBENEF e PBCVALORRESER são validos e maiores que zero |Sim

In [3]:
ENTCODIGO_input = input("Digite o código da entidade: ")
# CMPID_valid = [str(i) for i in range(, )]
#date_i = to_datetime("")
#date_f = to_datetime("")

index = ["7397.1", "7397.2", "7397.3", "7397.4", "7397.5",
         "7397.6", "7397.7", "7397.8", "7397.9", "7397.10",
         "7397.11", "7397.12", "7397.13", "7397.14", "7397.15",
         "7397.16", "7397.17", "7397.18", "7397.19", "7397.20",
         "7397.21", "7397.22", "7397.23", "7397.24", "7397.25"]

df_criticas = DF(index=index, columns=["Linhas afetadas"])
df_criticas.fillna(0.0, inplace=True)
lines = 0

for n, line in tqdm(get_lines()):
    PBCSEQ = line[0:6]
    MRFMESANO = line[11:19]
    QUAID = line[19:22]
    PBCCPFPARTIC = line[22:33]
    PBCIDADE = line[33:37]
    PBCVALORBENEF = line[37:53]
    PBCVALORRESER = line[53:69]
    ENTCODIGO = line[6:11]
    PLNCODIGO = line[69:75]
    TPEVID = line[75:76]
    TPRENID = line[76:78]
    TBOID = line[78:80]
    PBCTAXAJUROS = line[80:85]
    TFCID = line[85:86]
    PBCNUMRECEBAN = line[86:88]
    PBCMESRENDA13 = line[88:90]
    TFPID = line[90:91]
    PBCTEMPORECEB = line[91:95]
    PBCTEMPORARIE = line[95:99]
    PBCIDADBENREV = line[99:103]
    TBOIDBENREV = line[103:105]
    PBCPERCREV = line[105:111]
    PBCDATULTATU = line[111:119]
    PRAID = line[119:121]
    INDID = line[121:122]
    DFAID = line[122:123]

    # 7397.1 -> Verifica se não há linhas em branco
    if line == "" or line == None:
        df_criticas.loc["7397.1", "Linhas afetadas"] += 1          
    # 7397.2 -> Verifica o tamanho padrão da linha (133 caracteres)
    if len(line) != 133:
        df_criticas.loc["7397.2", "Linhas afetadas"] += 1          
    # 7397.3 -> Verifica se o campo sequencial é numérico e válido (PBCSEQ)
    if n != PBCSEQ:
        df_criticas.loc["7397.3", "Linhas afetadas"] += 1          
    # 7397.4 -> Verifica se o código da entidade é válido (ENTCODIGO)
    if ENTCODIGO_input != ENTCODIGO:
        df_criticas.loc["7397.4", "Linhas afetadas"] += 1  
    # 7397.5 -> Verifica se o campo MRFMESANO corresponde, respectivamente, 
    # ao ano, mês e último dia do mês de referência do FIP/SUSEP
    try:
        if MRFMESANO[-2:].strip() not in ["28", "30", "31"]:
            df_criticas.loc["7397.5", "Linhas afetadas"] += 1                  
    except:
        df_criticas.loc["7397.5", "Linhas afetadas"] += 1        
    # 7397.6 -> Verifica se o campo QUAID corresponde ao quadro 381
    if QUAID != "381":
        df_criticas.loc["7397.6", "Linhas afetadas"] += 1 
    # 7397.7 -> Verifica se o (PLNCODIGO) pertence ao Cadastro de Planos da entidade
    pass
    # 7397.8 -> Verifica se CPF do Participante/Segurado/Beneficiário (PBCCPFPARTIC)
    # é inteiro e válido, exceto para preenchimento com zeros
    if not valicpf(PBCCPFPARTIC):
        df_criticas.loc["7397.8", "Linhas afetadas"] += 1              
    # 7397.9 -> Verifica se PBCIDADE é inteiro
    try:
        int(PBCIDADE)
    except:
        df_criticas.loc["7397.9", "Linhas afetadas"] += 1          
    # 7397.10 -> Verifica se o TPEVID pertence à tabela ‘TiposEventosPrev’ do FIP/Susep
    pass
    # 7397.11 -> Verifica se o TPRENID pertence à tabela ‘TipoRenda’ do FIP/Susep
    pass
    # 7397.12 -> Verifica se o TBOID pertence à tabela 
    # ‘TabuaBiometrica’ do FIP/SUSEP, exceto códigos 63, 64, 65 e 66.
    pass
    # 7397.13 -> Verifica se o TFCID pertence à tabela ‘TiposFormaCalc’ do FIP/Susep
    pass
    # 7397.14 -> Verifica se PBCNUMRECEBAN é inteiro e válido (aceita somente 12 e 13)
    try:
        if not 12<=int(PBCNUMRECEBAN)<=13:
            df_criticas.loc["7397.14", "Linhas afetadas"] += 1
    except:
        df_criticas.loc["7397.14", "Linhas afetadas"] += 1
    # 7397.15 -> Verifica se PBCMESRENDA13 é inteiro e se está
    # entre 00 e 11 ou 99 de acordo com valor informado em PBCNUMRECEBAN.
    # Se PBCNUMRECEBAN=13 então PBCMESRENDA13=00 à 11, se PBCNUMRECEBAN=12 então PBCMESRENDA13=99
    pass
    # 7397.16 -> Verifica se o TFPID pertence à tabela ‘TiposFormaPagto’ do FIP/Susep
    pass
    # 7397.17 -> Verifica se PBCTEMPORECEB, PBCTEMPORARIE e PBCIDADBENREV são inteiros
    try:
        int(PBCTEMPORECEB)
        int(PBCTEMPORARIE)
        int(PBCIDADBENREV)
    except:
        df_criticas.loc["7397.17", "Linhas afetadas"] += 1
    # 7397.18 -> Verifica se o TBOIDBENREV pertence à tabela ‘TabuaBiometrica’ do FIP/SUSEP,
    # exceto códigos 63, 64, 65 e 66.
    pass
    # 7397.19 -> Verifica se o PRAID pertence à tabela ‘PeriodicidadeAtu’ do FIP/Susep
    pass
    # 7397.20 -> Verifica se o INDID pertence à tabela ‘Indexadores’ do FIP/Susep
    pass
    # 7397.21 -> Verifica se o DFAID pertence à tabela ‘DefasIndex’ do FIP/Susep
    pass
    # 7397.22 -> Verifica se PBCTAXAJUROS é percentual válido
    try:
        float(PBCTAXAJUROS)
    except:
        df_criticas.loc["7397.24", "Linhas afetadas"] += 1  
    # 7397.23 -> Verifica se PBCPERCREV é percentual válido e consta entre 0 e 100%
    try:
        float(PBCTAXAJUROS)
    except:
        df_criticas.loc["7397.24", "Linhas afetadas"] += 1      
    # 7397.24 -> Verifica se PBCDATULTATU é uma data válida
    try:
        to_datetime(PBCDATULTATU)
    except:
        df_criticas.loc["7397.24", "Linhas afetadas"] += 1      
    # 7397.25 -> Verifica se PBCVALORBENEF e PBCVALORRESER são validos e maiores que zero
    try:
        if not all([float(PBCVALORBENEF)>0, float(PBCVALORRESER)>0]):
            df_criticas.loc["7397.25", "Linhas afetadas"] += 1
    except:
        df_criticas.loc["7397.25", "Linhas afetadas"] += 1
    
    lines += 1

Digite o código da entidade: 04251


13594it [00:24, 544.42it/s]


In [4]:
df_criticas["Linhas Analizadas"] = lines
df_criticas

Unnamed: 0,Linhas afetadas,Linhas Analizadas
7397.1,0.0,13594
7397.2,13594.0,13594
7397.3,13594.0,13594
7397.4,0.0,13594
7397.5,0.0,13594
7397.6,0.0,13594
7397.7,0.0,13594
7397.8,0.0,13594
7397.9,0.0,13594
7397.1,0.0,13594
