In [4]:
from tqdm.notebook import tqdm
from tkinter import Tk
from tkinter import filedialog
from pandas import DataFrame as DF
from pycpfcnpj.cpf import validate as valicpf
from ciso8601 import parse_datetime as to_datetime

In [5]:
def get_lines():
    lines = []
    root = Tk()
    root.attributes("-topmost", True)
    root.withdraw()
    for file in filedialog.askopenfilenames():
        with open(file) as txt:
            for n, line in enumerate(txt.readlines(), 1):
                yield n, line

Campo| Posição Inicial| Tamanho |Formato |Índice|Descrição
:-------|:-------|:-------|:-------|:-------|:-------
EBRSEQ |1|7|nnnnnnn|line[0:7]|Número da linha do arquivo.
ENTCODIGO |8|5|nnnnn|line[7:12]|Código da sociedade seguradora/entidade na SUSEP.
MRFMESANO |13|8|aaaammdd|line[12:20]|Ano, mês e último dia do mês de referência do FIP/SUSEP.
QUAID|21|3|nnn|line[20:23]|Código do quadro (Quaid: 380). [Tabela ‘Quadros’ do FIPSUSEP]
CMPID |24|4|nnnn|line[23:27]|Código do tipo de evento. [Tabela “Bib_DefCampos” do FIP/SUSEP]
PLNCODIGO |28|6|nnnnnn|line[27:33]|Código do plano. [Tabela Planos do FIP]
EBRNUMPROP |34|21|nnnnnnnnnnnnnnnnnnnnn|line[33:54]|Número da proposta.
EBRCPFPART|55|11|nnnnnnnnnnn|line[54:65]|CPF do participante/segurado do plano.
EBRCPFBENF |66|11|nnnnnnnnnnn|line[65:76]|CPF do beneficiário.
EBRDATAINICIO|77|8|aaaammdd|line[76:84]|Data de início de vigência do risco.
EBRDATAFIM |85|8|aaaammdd|line[84:92]|Data de fim de vigência do risco.
EBRDATAOCORR|93|8|aaaammdd |line[92:100]|Data de ocorrência do evento.
EBRDATAREG |101|8|aaaammdd |line[100:108]|Data em que a entidade/seguradora efetuou o registro do evento pendente de pagamento
EBRVALORMOV |109|13|nnnnnnnnnn,nn|line[108:121]|Valor monetário do evento conforme registro na PSL ou valor do depósito judicial usado como dedutor da necessidade de cobertura, de acordo com o campo CMPID.
EBRCODCESS |122|5|nnnnn|line[121:126]|Código SUSEP da sociedade seguradora que efetuou a cessão (cosseguro aceito), ou da seguradora ou resseguradora que aceitou o risco (cosseguro cedido ou resseguro).
EBRNUMSIN |127|20|nnnnnnnnnnnnnnnnnnnn|line[126:146]|Código do evento.


Regra |Descrição| Impeditiva
:-------|:-----------|:-----------
7396.1|Verifica se não há linhas em branco.|Sim
7396.2|Verifica o tamanho padrão da linha (146 caracteres).|Sim
7396.3|Verifica se o campo sequencial EBRSEQ é uma sequência válida, que se inicia em 0000001.|Sim
7396.4 |Verifica se o campo ENTCODIGO corresponde à sociedade que está enviando o FIP/SUSEP.|Sim
7396.5|Verifica se o campo MRFMESANO corresponde, respectivamente, ao ano, mês e último dia do mês de referência do FIP/SUSEP.|Sim
7396.6|Verifica se o campo QUAID corresponde ao quadro 380.|Sim
7396.7|Verifica se o campo CMPID corresponde a um tipo de operação válida (conforme tabela “Bib_DefCampos”).|Sim
7396.8|Verifica se o PLNCODIGO pertence ao Cadastro de Planos da entidade.|Sim
7396.9|Verifica se o CPF do participante (EBRCPFPART) e do beneficiário (EBRCPFBENF) são inteiros e válidos, exceto para preenchimento com zeros.|Sim
7396.10|Verifica se os campos EBRDATAINICIO, EBRDATAFIM, EBRDATAOCORR e EBRDATAREG correspondem a uma data válida e se estão compreendidos entre os anos de 1901 e 2099.|Sim
7396.11|Verifica se o campo EBRVALORMOV é float.|Sim

In [None]:
ENTCODIGO_input = input("Digite o código da entidade: ")
CMPID_valid = [str(i) for i in range(1053, 1064)]
date_i = to_datetime("19010101")
date_f = to_datetime("20991231")

index = ["7396.1", "7396.2", "7396.3",
         "7396.4", "7396.5", "7396.6",
         "7396.7", "7396.8", "7396.9",
         "7396.10", "7396.11"]

df_criticas = DF(index=index, columns=["Linhas afetadas"])
df_criticas.fillna(0.0, inplace=True)
lines = 0

for n, line in tqdm(get_lines()):
    line = line.strip().replace(",", ".")
    EBRSEQ = int(line[0:7])
    ENTCODIGO = line[7:12]
    MRFMESANO = line[12:20]
    QUAID = line[20:23]
    CMPID = line[23:27]
    PLNCODIGO = line[27:33]
    EBRCPFPART = line[54:65]
    EBRDATAINICIO = line[76:84]
    EBRVALORMOV = line[108:121]
    EBRCPFBENF = line[65:76]
    EBRDATAFIM = line[84:92]
    EBRDATAOCORR = line[92:100]
    EBRDATAREG = line[100:108]

    # 7396.1 -> Verifica se não há linhas em branco.
    if line == "" or line == None:
        df_criticas.loc["7396.1", "Linhas afetadas"] += 1
    # 7396.2 -> Verifica o tamanho padrão da linha (146 caracteres).
    if len(line) != 146:
        df_criticas.loc["7396.2", "Linhas afetadas"] += 1
    # 7396.3 -> Verifica se o campo sequencial EBRSEQ é uma sequência
    # válida, que se inicia em 0000001.
    if n != EBRSEQ:
        df_criticas.loc["7396.3", "Linhas afetadas"] += 1
    # 7396.4 -> Verifica se o campo ENTCODIGO corresponde à sociedade
    # que está enviando o FIP/SUSEP.
    if ENTCODIGO_input != ENTCODIGO:
        df_criticas.loc["7396.4", "Linhas afetadas"] += 1
    # 7396.5 -> Verifica se o campo MRFMESANO corresponde, respectivamente,
    # ao ano, mês e último dia do mês de referência do FIP/SUSEP.
    try:
        if MRFMESANO[-2:].strip() not in ["28", "30", "31"]:
            df_criticas.loc["7396.5", "Linhas afetadas"] += 1                  
    except:
        df_criticas.loc["7396.5", "Linhas afetadas"] += 1        
    # 7396.6 -> Verifica se o campo QUAID corresponde ao quadro 380.
    if QUAID != "380":
        df_criticas.loc["7396.6", "Linhas afetadas"] += 1
    # 7396.7 -> Verifica se o campo CMPID corresponde a um tipo de operação
    # válida (conforme tabela “Bib_DefCampos”).
    if ENTCODIGO_input != ENTCODIGO:
        df_criticas.loc["7396.7", "Linhas afetadas"] += 1
    # 7396.8 -> Verifica se o PLNCODIGO pertence
    # ao Cadastro de Planos da entidade.
    pass
    # 7396.9 -> Verifica se o CPF do participante (EBRCPFPART)
    # e do beneficiário (EBRCPFBENF) são inteiros e válidos,
    # exceto para preenchimento com zeros.
    if not (valicpf(EBRCPFPART) == valicpf(EBRCPFBENF)):
        df_criticas.loc["7396.9", "Linhas afetadas"] += 1
    """
    HÁ CPFs COM O VALOR 11111111111.
    O QUE FAZER? É VÁLIDO OU INVÁLIDO?
    """
    # 7396.10 -> Verifica se os campos EBRDATAINICIO, EBRDATAFIM,
    # EBRDATAOCORR e EBRDATAREG correspondem a uma data válida
    # e se estão compreendidos entre os anos de 1901 e 2099.
    try:
        tests = [date_i <= to_datetime(EBRDATAINICIO) <= date_f,
                 date_i <= to_datetime(EBRDATAFIM) <= date_f,
                 date_i <= to_datetime(EBRDATAOCORR) <= date_f,
                 date_i <= to_datetime(EBRDATAREG) <= date_f]
        if not all(tests):
            df_criticas.loc["7396.10", "Linhas afetadas"] += 1
    except:
        df_criticas.loc["7396.10", "Linhas afetadas"] += 1
    # 7396.11 -> Verifica se o campo EBRVALORMOV é float.
    try:
        float(EBRVALORMOV)
    except:
        df_criticas.loc["7396.11", "Linhas afetadas"] += 1

    lines += 1

In [None]:
df_criticas["Linhas Analizadas"] = lines
df_criticas

In [None]:
df_criticas.to_excel("380.xlsx", sheet_name="Críticas 390")

In [8]:
with open("380_Export.csv", "a+") as csv:
    header = [
        "EBRSEQ",
        "ENTCODIGO",
        "MRFMESANO",
        "QUAID",
        "CMPID",
        "PLNCODIGO",
        "EBRNUMPROP",
        "EBRCPFPART",
        "EBRCPFBENF",
        "EBRDATAINICIO",
        "EBRDATAFIM",
        "EBRDATAOCORR",
        "EBRDATAREG",
        "EBRVALORMOV",
        "EBRCODCESS",
        "EBRNUMSIN"]
    csv.write(";".join(header)+"\n")
    
with open("380_Export.csv", "a+") as csv:
    for n, line in tqdm(get_lines()):
        line = line.strip().replace(".", ",")
        if not (line == "" or line == None):
            data = [
                line[0:7],
                line[7:12],
                line[12:20],
                line[20:23],
                line[23:27],
                line[27:33],
                line[33:54],
                line[54:65],
                line[65:76],
                line[76:84],
                line[84:92],
                line[92:100],
                line[100:108],
                line[108:121],
                line[121:126],
                line[126:146],
            ]

            csv.write(";".join(data)+"\n")

HBox(children=(IntProgress(value=1, bar_style='info', max=1), HTML(value='')))


