# Implementação passo a passo do HASH SHA-256

# ---Primeiro passo: Operações básicas---

## - Operação SHR (Shift Right) ou Descolamento para a Direita

<img src="images/shr.gif" width="700" align="center">

In [1]:
# SHR
def SHR(palavra, deslocamento):
    if len(palavra) != 32:
        print('A palavra deve conter 32 bits no SHA-256')

    for _ in range(deslocamento):
        
        # Adiciona um '0' no começo da string que não contem o ultimo caractere
        palavra = '0' + palavra[:-1] 
    
    return palavra

## - Operação ROTR (Rotation Right) ou Rotação para a direita

<img src="images/rotr.gif" width="700" align="center">

In [2]:
# ROTR
def ROTR(palavra, deslocamento):
    if len(palavra) != 32:
        print('A palavra deve conter 32 bits no SHA-256')

    for _ in range(deslocamento):
        #Seleciona o ultimo caractere e concatena na mesma string sem o ultimo caractere
        palavra = palavra[-1] + palavra[:-1] 
    
    return palavra

## - Operação XOR (Exclusive OR) ou 'OU exclusivo'

<img src="images/xor.gif" width="700" align="center">

In [3]:
def XOR(palavra_1, palavra_2):
    if len(palavra_1) != 32 or len(palavra_2) != 32:
        print('A palavra deve conter 32 bits no SHA-256')

    palavra_resultante = ''
    
    for bit_palavra_1, bit_palavra_2 in zip(palavra_1, palavra_2):
        if(bit_palavra_1 == bit_palavra_2):
            palavra_resultante += '0'
        else:
            palavra_resultante += '1'

    
    return palavra_resultante

## - Operação ADD (Addition) ou Adição

<img src="images/add.gif" width="700" align="center">

In [4]:
def ADD(*palavras):

    resultante = 0
    for palavra in palavras:
        if len(palavra) != 32:
            print('A palavra deve conter 32 bits no SHA-256')
            return
        resultante += int(palavra, 2) # Converte do binário para Decimal

    palavra_resultante = format(resultante % (2** 32), '032b') 

    return palavra_resultante

# --- Segundo passo: Funções ---

## - Função σ0 (sigma 0 minúsculo)
 
 <img src="images/sigma0.gif" width="700" align="center">

In [5]:
def L_sigma0(palavra):
    if len(palavra) != 32:
        print('A palavra deve conter 32 bits no SHA-256')
    
    palavra_rotr_7 = ROTR(palavra, 7)
    palavra_rotr_18 = ROTR(palavra, 18)
    palavra_shr_3 = SHR(palavra, 3)

    palavra_resultante = XOR( XOR(palavra_rotr_7, palavra_rotr_18), palavra_shr_3 )

    return palavra_resultante

## - Função σ1 (sigma 1 minúsculo)

<img src="images/sigma1.gif" width="700" align="center">

In [6]:
def L_sigma1(palavra):
    if len(palavra) != 32:
        print('A palavra deve conter 32 bits no SHA-256')
    
    palavra_rotr_17 = ROTR(palavra, 17)
    palavra_rotr_19 = ROTR(palavra, 19)
    palavra_shr_10 = SHR(palavra, 10)

    palavra_resultante = XOR( XOR(palavra_rotr_17, palavra_rotr_19), palavra_shr_10 )

    return palavra_resultante

## - Função Σ0 (sigma 0 maiúsculo)

<img src="images/usigma0.gif" width="700" align="center">

In [7]:
def U_sigma0(palavra):
    if len(palavra) != 32:
        print('A palavra deve conter 32 bits no SHA-256')
    
    palavra_rotr_2 = ROTR(palavra, 2)
    palavra_rotr_13 = ROTR(palavra, 13)
    palavra_rotr_22 = ROTR(palavra, 22)

    palavra_resultante = XOR( XOR(palavra_rotr_2, palavra_rotr_13), palavra_rotr_22 )

    return palavra_resultante

## - Função Σ1 (sigma 1 maiúsculo)

<img src="images/usigma1.gif" width="700" align="center">

In [8]:
def U_sigma1(palavra):
    if len(palavra) != 32:
        print('A palavra deve conter 32 bits no SHA-256')
    
    palavra_rotr_6 = ROTR(palavra, 6)
    palavra_rotr_11 = ROTR(palavra, 11)
    palavra_rotr_25 = ROTR(palavra, 25)

    palavra_resultante = XOR( XOR(palavra_rotr_6, palavra_rotr_11), palavra_rotr_25 )

    return palavra_resultante

## - Função CH (Choice) ou 'Escolha'

<img src="images/ch.gif" width="700" align="center">

In [9]:
def CH(palavra_x, palavra_y, palavra_z):
    if len(palavra_x) != 32 or len(palavra_y) != 32 or len(palavra_z) != 32:
        print('A palavra deve conter 32 bits no SHA-256')

    palavra_resultante = ''
    
    for bit_x, bit_y, bit_z in zip(palavra_x, palavra_y, palavra_z):
        if(bit_x == '1'):
            palavra_resultante += bit_y
        else:
            palavra_resultante += bit_z
    
    return palavra_resultante

## - Função MAJ (Majority) ou 'Maioria'

<img src="images/maj.gif" width="700" align="center">

In [10]:
def MAJ(palavra_x, palavra_y, palavra_z):
    if len(palavra_x) != 32 or len(palavra_y) != 32 or len(palavra_z) != 32:
        print('A palavra deve conter 32 bits no SHA-256')

    palavra_resultante = ''
    
    for bit_x, bit_y, bit_z in zip(palavra_x, palavra_y, palavra_z):

        bit_3 = int(bit_x) + int(bit_y) + int(bit_z)
        
        if bit_3 >= 2:
            palavra_resultante += '1'
        else:
            palavra_resultante += '0'
    
    return palavra_resultante

# --- Terceiro Passo: Constantes ---

## - Descobrir os primeiros N números primos (Desconsiderando o 1)

In [27]:
def primos(n):
    primos = []
    numero = 2

    while(len(primos) < n):
        isPrimo = True
        for X in range(numero-1, 1, -1):
            if(numero % X == 0):
                isPrimo = False
        
        if(isPrimo):
            primos.append(numero)

        numero += 1
    
    return primos

## - Usar a raíz cúbica de cada primo para calcular as constantes
### - SHA-256 usa um total de 64 constantes

<img src="images/constants.gif" width="700" align="center">

In [12]:
def const(k):

    const_primos = primos(k)
    constantes = []


    for primo in const_primos:

        raiz = primo ** (1/3)
        fracao = raiz - int(raiz)
        hexa = ''

        # Equivalente a fazer: fracao * (2^32) uma única vez
        for _ in range(8):
        
            produto = fracao * 16
            inteira = int(produto)
            fracao = produto - int(produto)
            hexa += hex(inteira).replace('0x', '')
        
        constantes.append( '{0:032b}'.format( int(hexa, 16) ) )
    
    return constantes

# - Quarto Passo: Mensagem, Padding, Blocos

# -- Mensagem --
## - Converta a Mensagem de entrada da função SHA-256 para binário

<img src="images/message.gif" width="700" align="center">

In [13]:
def mensagem_bin(mensagem):

    mensagem_resultante = ''
    
    for caractere in mensagem:
        caractere_binario = '{0:08b}'.format( ord(caractere) )  

        mensagem_resultante += caractere_binario
    
    return mensagem_resultante

# -- Padding --
## - Fazer um padding até que a mensagem tenha uma tamanho de um multiplo de 512
## -- A mensagem será: mensagem + 1 + padding(até 448 bits) + tamanho(64 bits)
## -- O '1' é para dividir a mensagem do padding
## -- O padding é feito até 448 para deixar 64 bits do tamanho no final da mensagem

<img src="images/padding.gif" width="700" align="center">

### ------ mensagem ------------- padding ---------- tamanho M--
### |---------M---------|1|...00000000000000000000|...0000001100|
###  <----------------- 448 bits -----------------> <- 64 bits ->

In [14]:
def padding(mensagem):
    
    tamanho = len(mensagem)
    quant_zeros = (448 - tamanho - 1) % 512
    tamanho_bin = '{0:064b}'.format(tamanho)

    mensagem_padding = mensagem + '1' + (quant_zeros*'0') + tamanho_bin

    return mensagem_padding

# -- Blocos --

## - Quebrar a mensagem em blocos de 512 bits

<img src="images/blocks.gif" width="700" align="center">

In [15]:
def blocks(mensagem_padding):

    blocos = []
    quant_blocks = int(len(mensagem_padding)/512)

    for n in range(quant_blocks):
        inicio = (n*512)
        final = ((n+1)*512)

        bloco = mensagem_padding[inicio : final]
        blocos.append(bloco)
    
    return blocos

# - Quinto Passo: Message Schedule

## Para cada bloco:
## - O bloco é quebrado em 16 palavras de 32 bits
## - SHA-256 opera com 64 palavras, então é necessário gerar as proximas 40

<img src="images/schedule.gif" width="700" align="center">

## Cada nova palavra é gerada a partir da seguinte formula:
## σ1(t-2) + (t-7) + σ0(t-15) + (t-16) 
## Sendo t o indice da nova palavra gerada

<img src="images/expansion.gif" width="700" align="center">

In [16]:
def mensage_schedule(block):

    palavras_mensage_schedule = []

    for n in range(16):
        inicio = (n*32)
        final = ((n+1)*32)

        palavra_nova = block[inicio : final]
        palavras_mensage_schedule.append(palavra_nova)
    

    for t in range(16, 64):

        palavra_nova = ADD( L_sigma1(palavras_mensage_schedule[t-2]), 
                        palavras_mensage_schedule[t-7], 
                        L_sigma0(palavras_mensage_schedule[t - 15]), 
                        palavras_mensage_schedule[t-16])

        palavras_mensage_schedule.append(palavra_nova)
    
    return palavras_mensage_schedule

# - Sexto Passo: Compressão

## A compressão é feita para cada bloco

## São geradas os primeiros valores do Hash (H0)

<img src="images/initial.gif" width="700" align="center">

In [17]:
def hash_inicial():

    primos_iniciais = primos(8)

    state_registers = {
        'a': None,
        'b': None,
        'c': None,
        'd': None,
        'e': None,
        'f': None,
        'g': None,
        'h': None,
    }

    for registro, idx_primo in zip(state_registers, range(8)):
        raiz = primos_iniciais[idx_primo] ** (1/2)

        fracao = raiz - int(raiz)

        valor = int( fracao * (2**32) )

        valor_bin = '{0:032b}'.format(valor)

        state_registers[registro] = valor_bin

    return state_registers

## - Para cada uma das 64 palavras do 'mensage schedule'(Wn) e das constantes(Kn)
## são geradas variáveis temporárias T1 e T2 

## Formula do T1:
## T1 = Σ1(e) + CH(e, f, g) + h + Wn + Kn
<img src="images/t1.gif" width="700" align="center">


## Formula do T2:
## T2 = Σ0(a) + MAJ(a, b, c)
<img src="images/t2.gif" width="700" align="center">

## A compressão é feita a partir das variáveis temporárias T1 e T2
<img src="images/compression.gif" width="700" align="center">

In [18]:
def compressao(msg_schedule, hash_anterior):
    constantes = const(64)

    compress_hash = hash_anterior.copy()

    for Wn, Kn in zip(msg_schedule, constantes):
        

        # Σ1(e) + CH(e, f, g) + h + Wn + Kn
        T1 = ADD(U_sigma1(compress_hash['e']), 
                 CH(compress_hash['e'], compress_hash['f'], compress_hash['g']),
                 compress_hash['h'],
                 Wn,
                 Kn)

        # Σ0(a) + MAJ(a, b, c)
        T2 = ADD(U_sigma0(compress_hash['a']),
                 MAJ(compress_hash['a'], compress_hash['b'], compress_hash['c']))
    
        # Shift Down
        compress_hash['b'] = compress_hash['a']
        compress_hash['c'] = compress_hash['b']
        compress_hash['d'] = compress_hash['c']
        compress_hash['e'] = compress_hash['d']
        compress_hash['f'] = compress_hash['e']
        compress_hash['g'] = compress_hash['f']
        compress_hash['h'] = compress_hash['g']


        compress_hash['a'] = ADD(T1, T2)

        compress_hash['e'] = ADD(compress_hash['e'], T1)

    for registro in hash_anterior:

        compress_hash[registro] = ADD( compress_hash[registro], hash_anterior[registro])
    
    return compress_hash
    

## A compressão resultante é utilizada como valor inicial do proximo bloco

<img src="images/merkle-damgard-construction.png" width="700" align="center">

## - O Hash final é convertido para hexadecimal
<img src="images/final.gif" width="700" align="center">

In [19]:
def hash_hex(final_hash):

    hexa = ''
    for registro in final_hash:

        hexa += format(int(final_hash[registro], 2), '08x')
    
    return hexa

# SHA-256
<img src="images/sha256.gif" width="700" align="center">

In [21]:
def SHA_256(mensagem_entrada):

    msg_bin = mensagem_bin(mensagem_entrada)

    msg_padded = padding(msg_bin)

    list_blocos = blocks(msg_padded)

    hash_result = hash_inicial()

    for bloco in list_blocos:
        msg_schd_bloco = mensage_schedule(bloco)

        hash_result = compressao(msg_schd_bloco, hash_result)

    hexa = hash_hex(hash_result)

    return hexa

In [25]:
mensagem = 'Smdplmdpvsmpdvsvrvssdcoampcoamcpeokpeokfpoak'

print(SHA_256(mensagem))

1255ba57b90429623a0b6e4fa2ec701731abb91298a1e3691d205488597d47f6
