# Gerador e Verificador de Assinaturas Virtuais

Geradores de assinaturas digitais são ferramentas as quais garantem a autenticidade e/ou a integridade de uma dada mensagem. Para isso, utiliza-se técnicas de criptografia, normalmente criptografia assimétrica, onde uma chave privada é empregada para assinar digitalmente um dado, e o hash da mensagem é incorporado na assinatura como uma forma de validação do conteúdo.

Já verificadores de assinaturas são responsáveis por confirmar a autenticidade e/ou a integridade de uma assinatura digital. Considerando um cenário de criptografia assimétrica como o dado acima, o verificador utiliza a chave pública correspondente do emissor para decifrar a mensagem cifrada, caso a mensagem realmente seja do emissor declaro, o hash deste texto em claro deve ser correspondente ao hash enviado pelo o emissor.

Assim, neste notebook iremos implementar um gerador e verificador de assinatura digitais de documentos, utilizando técnicas avançadas em segurança da computação. Para isso, o projeto consta com três módulos principais: geração de chaves,  encriptação e decriptação, assinatura e verificação.

O primeiro módulo será responsável pela geração de chaves criptográficas com base no algoritmo RSA, onde essas chaves serão derivadas de números primos de 1024 bits. O segundo módulo dedica-se ao processo de encriptação e decriptação de mensagens utilizando o OAEP (Optimal Asymmetric Encryption Padding). O terceiro realiza o cálculo do hash da mensagem e formatação do resultado em BASE64. Por fim, o quarto módulo sumariza a verificação de assinaturas digitais com um exemplo prático.


## Geração de Chaves

Primeiramente começaremos nosso projeto com a parte mais crucial nos sistemas modernos de criptografia, a geração das chaves. As chaves são responsáveis por garantir a confidencialidade e a integridade de qualquer algoritmo de criptografia moderno, então é necessário uma alta atenção para se evitar qualquer tipo de padrão ou rastreabilidade em sua geração. Para isso, usaremos duas bibliotecas que irão nos trazer a aleatoriedade necessária para a geração das Chaves.

In [41]:
from random import getrandbits, randrange

O algoritmo que será responsável pela encriptação e decriptação do nosso projeto será o algoritmo de criptografia assimétrica RSA, amplamente reconhecido por sua segurança e aplicabilidade em sistemas modernos de criptografia assimétrica. 

Dito isso, por ser assimétrico, iremos gerar duas chaves, uma pública e uma privada. A chave pública será composta por n=p×q,  onde p e q são números primos com no mínimo 1024 bits e por "e", o qual será um número inteiro escolhido que satisfaça a propriedade 1< "e" < ϕ(n) e sendo coprimo de ϕ(n) = (p−1)×(q−1). Já a chave privada será representada por "d", calculado como "d"≡ "e"⁻¹ (mod  ϕ(n)), sendo "d" o inverso modular de "e" em relação a ϕ(n).

Com isto, o primeiro passo será gerar os primos q e p. Faremos isso usando o teste de primalidade de Miller–Rabin, o que nos retornará dois primos diferentes entre si com uma alta probabilidade.

In [42]:
def is_prime(n: int, k=128) -> bool:
    """Teste de primalidade usando o algoritmo de Miller-Rabin."""
    s = 0
    r = n - 1
    while r & 1 == 0:
        s += 1
        r //= 2

    for _ in range(k):
        a = randrange(2, n - 1)
        x = pow(a, r, n)
        if x != 1 and x != n - 1:
            j = 1
            while j < s and x != n - 1:
                x = pow(x, 2, n)
                if x == 1:
                    return False
                j += 1
            if x != n - 1:
                return False
    return True

def get_prime():
    """Gera um número primo de 1024 bits."""
    while True:
        p = getrandbits(1024)
        p |= 1  # Garante que o número é ímpar
        p |= 1 << 1023  # Garante o tamanho correto (1024 bits)
        if is_prime(p):
            return p
        
p = get_prime()
q = get_prime()

while p == q:
    q = get_prime()

Com p e q gerados, iremos definir algumas funções auxiliares para calcularmos a operação mdc e os valores de n e phi.

In [43]:
def gcd(a, b):
    """Calcula o máximo divisor comum (GCD) usando o algoritmo de Euclides."""
    while b:
        a, b = b, a % b
    return a

def get_n(p, q):
    """Calcula o valor de n = p * q."""
    return p * q

def get_phi(p, q):
    """Calcula o valor de phi = (p - 1) * (q - 1)."""
    return (p - 1) * (q - 1)

n = get_n(p, q)
phi = get_phi(p, q)

Agora, iremos definir duas função que irão encapsular as equações de geração de "e" e "d"

In [44]:
def choose_e(phi):
    """Escolhe um valor de 'e' que seja coprimo a 'phi'."""
    e = 2
    while e < phi and gcd(e, phi) != 1:
        e += 1
    return e

def get_d(e, phi):
    """Encotra o inverso modular de 'e'."""
    return pow(e, -1, phi)

e = choose_e(phi)
d = get_d(e, phi)

Pronto, com "n", "e" e "d" estamos pronto para gerarmos nossas chaves com a função generate_keys();

In [45]:
def generate_keys(n, e, d):
    """Gera as chaves pública e privada."""
    public_key = (e, n)
    private_key = (d, n)

    return public_key, private_key

pk, sk = generate_keys(n, e, d)

print(f"Chave Pública: {pk}. \n Chave privada: {sk}")

Chave Pública: (3, 22751120259698780917888422215996285425815318360335129294714747800173474348434684905013723216622000690799783714033445272684364085686774103170704222785604288767317216239499575368836783219334959660958298709605983752335726428001316471323185390383255601200069160555692526168605222778965130624254287841956444750275710815999862346897088948145403026539196695575984062208007911597654841709403816768354406265905366029655563378512194337584350387721282251753221346893650739680426464117052789094773850152335316649588796841319317039200473396378621774140695382026346092812631820696785432822295891006402974008215970086363963704671197). 
 Chave privada: (1516741350646585394525894814399752361721021224022341952980983186678231623228978993667581547774800046053318914268896351512290939045784940211380281519040285917821147749299971691255785547955663977397219913973732250155715095200087764754879026025550373413337944037046168411240348185264342041616952522797096316685027040711570934025082811454826344700

## Encriptação e Decriptação

Agora, já em porte da chave pública e a privada, podemos avançar para o processo de encriptação e decriptação do algoritmo RSA. A encriptação será realizada com a chave privada (sk), seguindo a fórmula C = M^"e" mod n, onde M é a mensagem original, d é o expoente da chave privada e n é o produto dos números primos gerados. Já para a decriptação, utilizaremos a chave pública (pk), seguindo essa fórmula: M = C^"d", onde C é o texto cifrado e “e” é o expoente da chave pública.

### RSA

Para encapsular a lógica dessas fórmulas, criaremos uma classe chamada RSA que irá gerenciar as operações de encriptação e decriptação.No método de inicialização da classe iremos passar as chaves pública e privada já definidas. 

In [46]:
class RSA:
    def __init__(self):
        self.public_key, self.private_key = pk, sk

    def encrypt(self, message: int):
        """Criptografa uma mensagem usando a chave privada."""
        d, n = self.private_key
        result = pow(message, d, n)  # (m^d) mod n
        return str(result)

    def decrypt(self, message: int):
        """Descriptografa uma mensagem usando a chave pública."""
        e, n = self.public_key
        result = pow(message, e, n)  # (c^e) mod n
        return str(result)


### OAEP

Mas, antes de aplicarmos diretamente o RSA na nossa mensagem a ser encriptada, primeiramente, iremos utilizar uma técnica de padding pseudo aleatória, OAEP (Optimal Asymmetric Encryption Padding), com o intuito de aumentar a segurança da nossa criptografia tornando mais difícil técnicas baseadas em análises matemáticas e/ou estruturais, as quais podem possuir alguma efetividade em mensagens com tamanho muito pequeno.

O algoritmo funciona mesclando a mensagem original com um valor pseudo aleatório r de tamanho de 64 bytes, esse r servirá para gerarmos x e y que serão a base da nossa nova mensagem com seu padding. Já o algoritmo de  decriptação é determinismo, o qual realiza operações reversas para obter a mensagem original. Vale ressaltar que esse algoritmo não traz segurança a mensagem, qualquer um que tenha acesso a cifra será capaz de fazer o processo reverso, ele apenas serve como técnica de preenchimento de mensagens.


In [47]:
from hashlib import sha3_512
from os import urandom

class OAEP:
    k0 = 512
    k1 = 256

    def __init__(self):
        self.x = None
        self.y = None

    def sha3_512(self, data: bytes) -> bytes:
        """Aplica SHA3-512 e retorna o hash como bytes."""
        return sha3_512(data).digest()

    def encrypt(self, message: int) -> int:
        """Encriptação do algoritmo OAEP"""
        r = urandom(64)
        
        message = message << self.k1
        
        x = message ^ int.from_bytes(self.sha3_512(r))
        
        y = int.from_bytes(r) ^ int.from_bytes(self.sha3_512(x.to_bytes(128)))
        
        return (x << self.k0) | y

    def decrypt(self, ciphertext: int) -> int:
        """Decriptação do algoritmo OAEP"""
        
        y = ciphertext & ((1 << self.k0) - 1)
        x = ciphertext >> self.k0

        r = y ^ int.from_bytes(self.sha3_512(x.to_bytes(128)))

        pm = x ^ int.from_bytes(self.sha3_512(r.to_bytes(self.k0 // 8)))

        return pm >> self.k1

## Assinatura, Transmissão e Verificação de Assinatura

Agora que já temos ferramentas o suficiente para realizarmos a geração das chaves, encriptação e decriptação, iremos nos preocupar com questionamentos fundamentais na nossa aplicação: Como podemos assinar a mensagem? Como podemos transmitir essa mensagem de uma maneira adequada? Como podemos verificar nossa assinatura?

### Assinatura

Para assinar digitalmente nossa mensagem a ser transmitida, utilizaremos uma função de compactação de dados, mais especificamente a função SHA3-512. Uma função de compactação é um algoritmo que dado uma entrada de dados de qualquer tamanho, sua saída será de tamanho fixo, a qual é chamada de hash. Utilizaremos essa função de compactação, pois ela possui a propriedade de que a computação reversa do hash para a mensagem original é extremamente custosa computacionalmente.

Assim, a nossa estratégia de assinatura será transmitir nossa mensagem e o seu hash, porém este hash estará criptografado pelo algoritmo RSA. Com isso, ao realizar a decriptação utilizando a chave pública do emissor, o receptor poderá fazer o hash da mensagem recebida e comparar com o hash  decriptado, e, caso eles sejam iguais, o emissor terá a garantia que a mensagem é realmente do seu emissor, já que apenas ele possui acesso a sua chave privada capaz de gerar a encriptação correta.

Nesta parte do nosso projeto, utilizaremos a biblioteca “hashlib” para o desenvolvimento da nossa função Hash, sendo a única parte do nosso projeto que utilizará código de terceiros.


#### Função Hash



In [48]:
from hashlib import sha3_512, sha3_256
class sha3:
  @staticmethod
  def hash_512(message):
    if type(message) == int:
      message = str(message)
    elif type(message) == str:
      message = message.encode()
    return int.from_bytes(sha3_512(message).digest())

  @staticmethod
  def hash_256(message):
    if type(message) == int:
      message = str(message)
    elif type(message) == str:
      message = message.encode()
    return int.from_bytes(sha3_256(message).digest())


### Transmissão

Para a transmissão da nossa cifra, primeiramente, iremos converter a cifra para o formato Base64. Isso será feito, a Base64 é uma forma de codificação que transforma dados binários em uma sequência de caracteres ASCII, o que normalmente é um formato mais adequado a transmissão de dados.

Nossa implementação é um modelo simplificado da Base64, mas suficientemente robusto para o escopo deste projeto.

#### BASE64

In [49]:
class base_convert:

  #converte para base 64
  @staticmethod
  def format(message: int):
    #Usa uma string de referencia
    base64_chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
    res = ""
    #Enquanto a mensagem nao se tornar 0 realiza o metodo de divisoes sucessivas
    while message > 0:
      remainder = message % 64
      res = base64_chars[remainder] + res
      message = message // 64
    return res


  @staticmethod
  def parse(base64_message: str):
    #Tambem usa uma string de referebncia
    base64_chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
    res = 0
    # procura o caracter encontrado na string e coloca e soma com o resultado multiplicado por 64
    # essa multiplicacao por 64 fara com que os termos sejam multiplicados por 64 o numero correto de vezes
    for char in base64_message:
      res = res * 64 + base64_chars.index(char)
    return res



### Verificação com Exemplo Prático


Agora, finalmente partiremos para a demonstração do nosso projeto. Nesta demonstração, geramos nosso plain text utilizando o lorem ipsum, um gerador randômico de texto.

O processo começa com a transformação do texto em números, utilizando a tabela ASCII para converter cada caractere em um valor numérico. Em seguida, calculamos o hash da mensagem para criar uma representação única e compacta do texto. Após isso, utilizamos o padding OAEP sobre o hash da mensagem para adicionar segurança à encriptação. Com o hash preparado, realizamos a sua criptografia utilizando a chave privada do algoritmo RSA. Por fim, para realizarmos a transmissão, concatenamos a mensagem ao hash criptografado e assim, colocamos o resultado da concatenação em Base64.

Já o processo de verificação é o reverso no processo de assinatura. Primeiramente, desfazemos o formato Base64, separamos a mensagem do hash criptografado e realizamos a decriptação com a chave pública do emissor e retiramos o padding resultado do OAEP. Assim, ao final dessa série de processos, temos dois dados fundamentais, a mensagem e o hash do emissor, caso o hash do emissor seja compatível com o hash da mensagem, realmente essa mensagem é do emissor declarado, garantindo assim confiabilidade a origem dessa mensagem, caso não seja, concluímos que ou o hash ou a mensagem foram interceptadas e trocadas durante a nossa transmissão, logo, ambas devem ser invalidadas e descartadas.


In [50]:
# Instanciação da classe RSA
cy = RSA()
oaep = OAEP()

plain_text = """
    Veniam sint in nulla eiusmod esse proident magna pariatur ea fugiat ipsum. Ut cupidatat aliqua amet Lorem consequat 
    amet eu anim. Id ad ut voluptate quis tempor nisi sunt esse consectetur. Ullamco cupidatat sit commodo minim amet nulla 
    sit. Tempor occaecat ad occaecat minim irure. Incididunt nostrud sunt ea culpa reprehenderit esse sunt Lorem id ea et 
    cillum tempor. Magna excepteur labore dolore Lorem esse do  adipisicing aliquip culpa pariatur laboris deserunt consequat.
"""
f = open('../resources/input.txt', 'rb')
plain_text = f.read()
f.close()

plain_text = str(int.from_bytes(plain_text))

# Calculo do hash 256 da mensagem
h = sha3.hash_256(plain_text)

# Encryptação desse hash
e = oaep.encrypt(h)
e = cy.encrypt(e)

# Concatenação entre plain_text e o hash encriptado
message_to_encode = plain_text + str(e)

# Conversão para a Base64
encoded_message = base_convert.format(int(message_to_encode))

print("Mensagem codificada em base64:", encoded_message)

# Parse da base64
decoded_message = str(base_convert.parse(encoded_message))

# Separação entre o plain_text e o hash encriptado
decoded_plain_text = decoded_message[:len(plain_text)]
decoded_plain_text_hash = sha3.hash_256(decoded_plain_text)

encrypted_hash = decoded_message[len(plain_text):]

# Decryptação do hash encriptado
decrypted_hash = cy.decrypt(int(encrypted_hash))
decrypted_hash = oaep.decrypt(int(decrypted_hash))

# Comparação entre os hashs para verificação da assinatura
print("Hash da mensagem:", decoded_plain_text_hash)
print("Hash decodificado:", decrypted_hash)
print("Verificação de assinatura:", decrypted_hash == decoded_plain_text_hash)

Mensagem codificada em base64: BC1b8cYlAabPT3htInRDRnv66QiGCK0XgVetzu3hlT9Hr4jptq20/kYNmKXpcfNWpS1+tA3LtnhyHsZVXteTXlRzbdTgSX/W4IuGi7XomV8Uq1ddW028GnEXbTMBKY7lNCcp/7fzhSiL912s616THPJh64Qg8Jv4QC53WqEc0FFg1k7xdpmMYlaaT6/r6Jiu5Hz2yFlCPkCz9ETRPDLfXUAe48YyCBoPTZcc7qeLHCHSpU6abKFKbLV2GjuigxDmFmUqQ36sigmZkAgB2H+lzxIG8nsz05zXIMHRz865goxWxcVAYjdgeHFumVTzs/anOwdE1v0fKiiIilk6PkMZyLzDjr5tmImMFTzozKpPh8EBnSJa77Ck4KEJGTz/5sQK6lXv/UxrLFhvVj3OqJbVABqyVkcjfOOkBRgP7Gwb5Q4xKpIvJaFXpnH60KOCgkLucm2kLJKvci1huUOJLikFsiRodTWVN6+oVMLma53z7+8tqlRsZijfcBtpYIcI31TP/VibNmnWhoco8bLvk1orEsW9f4IlRzZLvT1X9y2r+LCI1hxf8YUnfcQC/DML8dJQsK1eBeN8a15vfxaN8DF8g5SbIbid4p5Myw1sMNvsKHLSs4Y4fddMQGg4vo698BN7tf8TgOT7BKpHyLAbkAy/oG8Xcdh8L4/XD3MTJj9NYBg4TCagcwOhU6pWgHxpm1wBGxADwz4Ezp/pol6b3/rei6tBiApACcUma/wpp8FSPuVhfvXFg9hYGKHgvlY+qlL4E3TGVJzjKpHvLqBNzS3BDqeGduzAGxqJ7a84B1AxcfJ9v58sfjvoY4qlNCarOIbtUCtzyj6sZOQOHMqyT2hANcWJaS0kPk6o82IFbxqOa5PcSnHsbzah2GqPlCDglObuUUo0Up20AkNon3wX5owt58cnrn26MYz0liIIcDABmAyjs8hF0i3yBYN2vcqWewa6dt1ZUPrh4