# C6Bank - Case - Saul de A. Souza
    - Cenário: usando bibliotecas cientificas em Python , crie um validador de CPF, em Jupyter Notebook, valide os números de 0 a 10_000_000. Otimize seu código e mensure a diferença de velocidade. Tenha em mente o porquê das suas decisões para a entrevista.

## O que é um validador e CPF
    - Um validador de CPF é uma função ou programa que verifica se um número de CPF (Cadastro de Pessoas Físicas) fornecido é válido de acordo com as regras estabelecidas. Para um CPF ser válido não basta apenas atender à máscara "###.###.###-##" (o caractere '#' representa um número), existe uma regra matemática que também deve ser verificada para um CPF ser considerado válido.


## CPF UTILIZANDO COMO EXEMPLO: 529.982.247-25
    O cálculo para validar um CPF é especificado pelo Ministério da Fazenda. Vamos entender como funciona.

## Validação do primeiro dígito
    1. Primeiramente multiplica-se os 9 primeiros dígitos pela sequência decrescente de números de 10 à 2 e soma os resultados. Assim: 5 * 10 + 2 * 9 + 9 * 8 + 9 * 7 + 8 * 6 + 2 * 5 + 2 * 4 + 4 * 3 + 7 * 2
    2. O resultado do nosso exemplo é: 295
    3. O próximo passo da verificação também é simples, basta multiplicarmos esse resultado por 10 e dividirmos por 11: 295 * 10 / 11
    4. O resultado que nos interessa na verdade é o RESTO da divisão
    5. Se ele for igual ao primeiro dígito verificador (primeiro dígito depois do '-'), a primeira parte da validação está correta
    6. Observação Importante: Se o resto da divisão for igual a 10, nós o consideramos como 0
    7. O resultado da divisão acima é '268' e o RESTO é 2
    8. Isso significa que o nosso CPF exemplo passou na validação do primeiro dígito

## Validação do segundo dígito
    1. A validação do segundo dígito é semelhante à primeira, porém vamos considerar os 9 primeiros dígitos, mais o primeiro dígito verificador, e vamos multiplicar esses 10 números pela sequencia decrescente de 11 a 2
    2. ou seja: 5 * 11 + 2 * 10 + 9 * 9 + 9 * 8 + 8 * 7 + 2 * 6 + 2 * 5 + 4 * 4 + 7 * 3 + 2 * 2
    3. O resultado é: 347
    4. Seguindo o mesmo processo da primeira verificação, multiplicamos por 10 e dividimos por 11
    5. 347 * 10 / 11
    6. Verificando o RESTO, como fizemos anteriormente, temos: O resultado da divisão é '315' e o RESTO é 5
    7. Verificamos, se o resto corresponde ao segundo dígito verificador.
    8. Com essa verificação, constatamos que o CPF 529.982.247-25 é válido.


## CPFS INVÁLIDOS CONHECIDOS
    Existe alguns casos de CPFs que passam nessa validação que expliquei, mas que ainda são inválidos. É os caso dos CPFs com dígitos repetidos (111.111.111-11, 222.222.222-22, ...)

# Algoritmo para Validar CPF
    - Como os números de 0 a 10000000 não possuem 11 dígitos, utilizarei 0's a esquerda do número para manter a quantidade de digitos necessários na estrutura de um CPF
    - Na sequência irei trabalhar com os CPF's tranformados em String
    - Construo um algoritmo versão 1 e outro versão 2 otimizado
    - calculo a diferença no tempo de execução dos dois algoritmos
    - Os resultados serão salvos em um arquivo TXT (CPF'S válidos e inválidos), pois aplicar prints consome muita memória

In [6]:
import time

def validaCPF(cpf):
    # preenche com zeros à esquerda até 11 dígitos. Transforma CPF em String
    cpf = str(cpf).zfill(11)
    
    # Verifica se todos os dígitos são iguais, o que configura um CPF inválido
    if len(set(cpf)) == 1: #set: identifica os valores únicos. Se a quantidade de valores únicos for igual a 1 é pq todos os números são iguais
        return False # retorna FALSE, ou seja, não é valido
    
    # Calcula o primeiro dígito verificador
    soma1 = sum(int(cpf[i]) * (10 - i) for i in range(9))  # Seleciona o primeiro Digito de CPF e  multiplica por 10. Em cada iteração subtrai -1 do 10 e seleciona um outro digito. Por fim, soma todas as parcelas
    resto1 = (soma1 * 10) % 11  # multiplica a soma das parcelas por 10 e divide por 11. %: retorna o resto da divisão
    if resto1 == 10:  # Observação: se o resto é 10 então equivale a 0
        resto1 = 0
    
    # Calcula o segundo dígito verificador
    soma2 = sum(int(cpf[i]) * (11 - i) for i in range(10)) # Seleciona o primeiro Digito de CPF e  multiplica por 11. Em cada iteração subtrai -1 do 11 e seleciona um outro digito. Por fim, soma todas as parcelas
    resto2 = (soma2 * 10) % 11 # multiplica a soma das parcelas por 10 e divide por 11. %: retorna o resto da divisão
    if resto2 == 10: # Observação: se o resto é 10 então equivale a 0
        resto2 = 0
    
    # Verifica se os dígitos verificadores estão corretos
    return int(cpf[9]) == resto1 and int(cpf[10]) == resto2  # Retorna um valor lógico TRUE (se Válido) ou FALSE (se não Válido)

# Inicia a contagem de tempo
start_time = time.time()   # Marcador de tempo para executar o algoritmo

# Abre o arquivo TXT em modo de escrita
with open('cpf_resultados.txt', mode='w') as file:   # Salvar os dados no formato TXT uma vez que exige muita memória para print
    
    # Valida todos os CPFs de 0 a 10 milhões e escreve os resultados no arquivo TXT
    for cpf in range(10_000_001):
        if validaCPF(cpf):
            file.write(f"CPF {cpf:011} é válido!\n")  # CPF Válido se TRUE
        else:
            file.write(f"CPF {cpf:011} é inválido!\n") # CPF inválido se FALSE

# Calcula o tempo de execução
execution_time = time.time() - start_time  
print("Tempo de execução:", execution_time, "segundos") # Retorna o tempo de execução


Tempo de execução: 43.00762486457825 segundos


# Pedidos do CASE:
    - Otimize seu código 
    - Mensure a diferença de velocidade. 

- Então, irei criar uma versão otimizada e calcular a diferença entre os tempos de execução entre os dois algoritmos

## Código otimizado

In [7]:
import time

def validaCPF(cpf):
    # preenche com zeros à esquerda até 11 dígitos. Converte em string
    cpf = str(cpf).zfill(11)
    
    # Verifica se todos os dígitos são iguais, o que configura um CPF inválido
    if len(set(cpf)) == 1:  
        return False
    
    # Calcula o primeiro dígito verificador
    # Utilizar esse padrão de soma para as parcelas, aparentemente otimiza o código. Sum: exige a criação de listas dentro do LOOP.
    soma1 = 0 # A soma inicia em 0 e é atualizada em cada iteração
    peso = 10 # o peso inicial em 10 e é atualizado em cada iteração
    for i in range(9): 
        soma1 += int(cpf[i]) * peso  #utilizar esse tipo de soma melhora o tempo de execução 
        peso -= 1
    resto1 = (soma1 * 10) % 11
    if resto1 == 10:  # se resto é igual a zero, chame de 0
        resto1 = 0
    
    # Calcula o segundo dígito verificador
    # Evitar o uso de SUM melhora o tempo de execução do algoritmo.
    soma2 = 0 # A soma inicia em 0 e é atualizada em cada iteração
    peso = 11 # o peso inicial em 11 e é atualizado em cada iteração
    for i in range(10):
        soma2 += int(cpf[i]) * peso
        peso -= 1
    resto2 = (soma2 * 10) % 11
    if resto2 == 10: # se resto é igual a zero, chame de 0
        resto2 = 0
    
    # Verifica se os dígitos verificadores estão corretos
    return int(cpf[9]) == resto1 and int(cpf[10]) == resto2 # Retorna um valor lógico TRUE (se Válido) ou FALSE (se não Válido)

# Inicia a contagem de tempo
start_time = time.time() # Marcador de tempo para executar o algoritmo

# Abre o arquivo TXT em modo de escrita
with open('cpf_resultados.txt', mode='w') as file:
    
    # Valida todos os CPFs de 0 a 10 milhões e escreve os resultados no arquivo TXT
    for cpf in range(10_000_001):
        if validaCPF(cpf):
            file.write(f"CPF {cpf:011} é válido!\n") # CPF Válido se TRUE
        else:
            file.write(f"CPF {cpf:011} é inválido!\n") # CPF inválido se FALSE

# Calcula o tempo de execução
execution_time_otimizado = time.time() - start_time
print("Tempo de execução:", execution_time_otimizado, "segundos")


Tempo de execução: 37.495712757110596 segundos


## Calculando a diferença de tempo de execução entre os dois códigos

In [8]:
# Existe uma diferença de 6.6 segundos
execution_time-execution_time_otimizado

5.511912107467651