# Exercício 1 - Quebrando Shift Cipher

## Instruções:

- Elaborar os códigos para realizar a cifra por deslocamento e a respectiva
decifração (dica: validar para cifra de César onde k=3);
- Elaborar os códigos que quebram a cifra por deslocamento, através de duas
estratégias de ataques à cifra (CipherText-only):
    - o por ataque de força bruta;
    - o por distribuição de frequência;

Descrever a viabilidade das estratégias, comparar a complexidade dos algoritmos e
tempo de execução, onde cada técnica seria melhor aplicada etc.

Utilizar a distribuição de frequência da língua portuguesa:
https://www.dcc.fc.up.pt/~rvr/naulas/tabelasPT/

## Contextualização:

A criptografia é a prática de desenvolver e usar algoritmos para proteger e obscurer informações. Normalmente envolver transformar textos legíveis em textos cifrados, ou que estão em formato ilegível usando uma chave.

Nesse sentido, como estaremos lidando com uma "Shift Cipher" que é uma criptografia simétrica, ou seja o remetente e destinatário possuem a mesma chave para criptografar e descriptografar, devemos ter os seguintes componentes:
- Geração da chave privada - Gen -> K
- Encriptação da mensagem M - EncK(M)
- Decriptação da mensagem cifrada C - M = DecK(C)

## Implementação:

### Cifra por Deslocamento

Sabendo que as "Shift Cipher" tratam letras como inteiros, iniciaremos a implementação declarando um dicionário que mapeia o inteiro à letra correspondente no alfabeto:

In [96]:
letters = {
   0: 'a', 1: 'b', 2: 'c', 3: 'd', 4: 'e',
    5: 'f', 6: 'g', 7: 'h', 8: 'i', 9: 'j',
    10: 'k', 11: 'l', 12: 'm', 13: 'n', 14: 'o',
    15: 'p', 16: 'q', 17: 'r', 18: 's', 19: 't',
    20: 'u', 21: 'v', 22: 'w', 23: 'x', 24: 'y',
    25: 'z'
}

Em seguida, faz-se necessário realizar a função de Encriptação que deve transformar uma mensagem legível "M" em um texto cifrado "C" através de uma chave privada.

In [97]:
def enc(m, k):
 m = m.lower()
 print(f'Message being encrypted: {m}')
 c = ''
 for char in m:
  if char in letters.values():
   for num, letter in letters.items():
    if char == letter:
     c += letters[(num + k) % len(letters)]
  else:
   c += char
 print(f'Message encrypted: {c}\n')
 return c

No código acima, foi usado o resto da divisão por 26, pois ao somar o inteiro com o valor da chave privada, é possível obter um inteiro que não tenha uma letra correspondente no alfabeto, portanto devemos voltar às primeiras letras. Os prints do código servem para verificar se a função está funcionando propriamente e gerando a cifra. Para exemplicar o funcionamento, iremos validar para a cifra de César onde k=3.

In [98]:
caesar_test_one = 'abcdefghijklmnopqrstuvwxyz'
caesar_test_two = 'cifradecesar'

# First paragraph of the Harry Potter book
shift_cipher_test_one = 'O Sr. e a Sra. Dursley, da Rua dos Alfeneiros, nº. 4, se orgulhavam de dizer que eram perfeitamente normais, muito bem, obrigado. Eram as últimas pessoas no mundo que se esperaria que se metessem em alguma coisa estranha ou misteriosa, porque simplesmente não compactuavam com esse tipo debobagem.'

# Encode test for Caesar in which K = 3
caesar_test_one_enc = enc(caesar_test_one, 3)
caesar_test_two_enc = enc(caesar_test_two, 3)

# Another test with a longer text and a different K = 8 for example
shift_cipher_test_one_enc = enc(shift_cipher_test_one, 8)

Message being encrypted: abcdefghijklmnopqrstuvwxyz
Message encrypted: defghijklmnopqrstuvwxyzabc

Message being encrypted: cifradecesar
Message encrypted: fliudghfhvdu

Message being encrypted: o sr. e a sra. dursley, da rua dos alfeneiros, nº. 4, se orgulhavam de dizer que eram perfeitamente normais, muito bem, obrigado. eram as últimas pessoas no mundo que se esperaria que se metessem em alguma coisa estranha ou misteriosa, porque simplesmente não compactuavam com esse tipo debobagem.
Message encrypted: w az. m i azi. lczatmg, li zci lwa itnmvmqzwa, vº. 4, am wzoctpidiu lm lqhmz ycm mziu xmznmqbiumvbm vwzuiqa, ucqbw jmu, wjzqoilw. mziu ia útbquia xmaawia vw ucvlw ycm am maxmzizqi ycm am umbmaamu mu itocui kwqai mabzivpi wc uqabmzqwai, xwzycm aquxtmaumvbm vãw kwuxikbcidiu kwu maam bqxw lmjwjiomu.



Assim, observa-se que a função está tendo o comportamento esperado. Entretanto, problemas com caracteres não previstos no dicionário de "letters" podem acarretar em comportamentos não esperados, mas visto que na distribuição de frequência da la língua portuguesa fornecida nas instruções não inclui outras letras a implementação irá funcionar para estes casos.

Agora, faz necessário fazer o processo contrário. Ou seja, a decriptação onde a partir de uma mensagem ilegível obtemos a mensagem legível usando a chave privada.

In [99]:
def dec(c, k):
 c = c.lower()
 print(f'Cipher being decrypted: {c}')
 m = ''
 for char in c:
  if char in letters.values():
   for num, letter in letters.items():
    if char == letter:
     m += letters[(num - k) % len(letters)]
  else:
   m += char
 print(f'Cipher decrypted: {m}\n')
 return m

No código acima, foi usado a subtração pela chave para assim retornar à letra da mensagem. O uso do resto da divisão é análogo na função "enc" em função da quantidade de letras no dicionário. Para verificar o funcionamento desta função, veremos se ao usar o resultado da função de "enc" como cifra na função de "dec" se obteremos a mesma mensagem. Para ambas funções a chave deve ser a mesma e novamente usaremos a cifra de César em que k=3.

In [100]:
# Decrypt test for Caesar tests in which K = 3
dec(caesar_test_one_enc, 3)
dec(caesar_test_two_enc, 3)

# Another test with a longer text and a different K = 8 for example
dec(shift_cipher_test_one_enc, 8)

Cipher being decrypted: defghijklmnopqrstuvwxyzabc
Cipher decrypted: abcdefghijklmnopqrstuvwxyz

Cipher being decrypted: fliudghfhvdu
Cipher decrypted: cifradecesar

Cipher being decrypted: w az. m i azi. lczatmg, li zci lwa itnmvmqzwa, vº. 4, am wzoctpidiu lm lqhmz ycm mziu xmznmqbiumvbm vwzuiqa, ucqbw jmu, wjzqoilw. mziu ia útbquia xmaawia vw ucvlw ycm am maxmzizqi ycm am umbmaamu mu itocui kwqai mabzivpi wc uqabmzqwai, xwzycm aquxtmaumvbm vãw kwuxikbcidiu kwu maam bqxw lmjwjiomu.
Cipher decrypted: o sr. e a sra. dursley, da rua dos alfeneiros, nº. 4, se orgulhavam de dizer que eram perfeitamente normais, muito bem, obrigado. eram as últimas pessoas no mundo que se esperaria que se metessem em alguma coisa estranha ou misteriosa, porque simplesmente não compactuavam com esse tipo debobagem.



'o sr. e a sra. dursley, da rua dos alfeneiros, nº. 4, se orgulhavam de dizer que eram perfeitamente normais, muito bem, obrigado. eram as últimas pessoas no mundo que se esperaria que se metessem em alguma coisa estranha ou misteriosa, porque simplesmente não compactuavam com esse tipo debobagem.'

### Ataque por Força Bruta

Os ataques de segurança buscam achar informações sobre a mensagem legível e/ou a chave. Sob essa ótica, o ataque por Força Bruta consiste em testar todas chaves possíveis até obter tradução inteligível para o texto claro. Suponhamos que o "hacker" saiba que a mensagem foi originada no Brasil, portanto terá os mesmos caractéres do alfabeto da variável já definida acima.

In [101]:
def brute_force_attack(c):
 print("Testing all possible keys:")
 possible_messages = []
 for k in range(len(letters)):
  attempted_message = ""
  for char in c:
   for num, letter in letters.items():
    if char == letter:
     attempted_message += letters[(num - k) % len(letters)]
  print(f'Attempted K = {k}: {attempted_message}')
  possible_messages.append(attempted_message)
 correct_key = int(input('Type the key that has a readable message: '))
 if correct_key in range(len(letters)):
  return possible_messages[correct_key]

No código acima, é usado como parâmetro o texto cifrado que é o que vamos tentar traduzir de volta para uma mensagem legível através do teste de todas as possibilidades. Nesse sentido, as possíveis chaves são a quantidade de letras possíveis. Assim, devemos testar todas estas chaves até conseguirmos compreender o que está escrito. Quando isso ocorrer, significa que encontramos a mensagem. Vamos testar o ataque através de mensagem encriptada abaixo:

In [102]:
c = enc('cifradecesar', 6)
print(f'The cryted message is: {c}')

print(f'The message obtained by the brute force attack is: {brute_force_attack(c)}')

Message being encrypted: cifradecesar
Message encrypted: iolxgjkikygx

The cryted message is: iolxgjkikygx
Testing all possible keys:
Attempted K = 0: iolxgjkikygx
Attempted K = 1: hnkwfijhjxfw
Attempted K = 2: gmjvehigiwev
Attempted K = 3: fliudghfhvdu
Attempted K = 4: ekhtcfgeguct
Attempted K = 5: djgsbefdftbs
Attempted K = 6: cifradecesar
Attempted K = 7: bheqzcdbdrzq
Attempted K = 8: agdpybcacqyp
Attempted K = 9: zfcoxabzbpxo
Attempted K = 10: yebnwzayaown
Attempted K = 11: xdamvyzxznvm
Attempted K = 12: wczluxywymul
Attempted K = 13: vbyktwxvxltk
Attempted K = 14: uaxjsvwuwksj
Attempted K = 15: tzwiruvtvjri
Attempted K = 16: syvhqtusuiqh
Attempted K = 17: rxugpstrthpg
Attempted K = 18: qwtforsqsgof
Attempted K = 19: pvsenqrprfne
Attempted K = 20: ourdmpqoqemd
Attempted K = 21: ntqclopnpdlc
Attempted K = 22: mspbknomockb
Attempted K = 23: lroajmnlnbja
Attempted K = 24: kqnzilmkmaiz
Attempted K = 25: jpmyhkljlzhy
The message obtained by the brute force attack is: agdpybcacqyp


### Ataque por Distribuição de Frequência

Este ataque conta a frequência das letras cifradas e compara com a típica usada no português. Em seguida, usam esta frequência para ajustar o deslocamento até que a frequência do texto cifrado se alinhe com a frequência esperada. Assim, será possível descobrir a mensagem e traduzir o texto criptografado para algo legível. Para isso, iremos usar a distribuição de frequência apresentada nas intruções: https://www.dcc.fc.up.pt/~rvr/naulas/tabelasPT/

In [103]:
port_char_frequency = {
 'a': 13.9, 'b': 1, 'c': 4.4, 'd': 5.4, 'e': 12.2,
 'f': 1, 'g': 1.2, 'h': 0.8, 'i': 6.9, 'j': 0.4,
 'k': 0.1, 'l': 2.8, 'm': 4.2, 'n': 5.3, 'o': 10.8,
 'p': 2.9, 'q': 0.9, 'r': 6.9, 's': 7.9, 't': 4.9,
 'u': 4.0, 'v': 1.3, 'w': 0.0, 'x': 0.3, 'y': 0.0,
 'z': 0.4
}

Vamos iniciar fazendo uma função que realiza a distribuição de frequência para o texto cifrado

In [104]:
def cipher_distribution(c):
 cipher_char_distribution = {}
 for char in c:
  if char in cipher_char_distribution:
   cipher_char_distribution[char] += 1
  else:
   cipher_char_distribution[char] = 1

 return cipher_char_distribution

In [105]:
def distribution_frequency_attack(c):
 print