# Exercício 1 - Quebrando Shift Cipher

## Instruções:

- Elaborar os códigos para realizar a cifra por deslocamento e a respectiva
decifração (dica: validar para cifra de César onde k=3);
- Elaborar os códigos que quebram a cifra por deslocamento, através de duas
estratégias de ataques à cifra (CipherText-only):
    - o por ataque de força bruta;
    - o por distribuição de frequência;

Descrever a viabilidade das estratégias, comparar a complexidade dos algoritmos e
tempo de execução, onde cada técnica seria melhor aplicada etc.

Utilizar a distribuição de frequência da língua portuguesa:
https://www.dcc.fc.up.pt/~rvr/naulas/tabelasPT/

## Contextualização:

A criptografia é a prática de desenvolver e usar algoritmos para proteger e obscurer informações. Normalmente envolver transformar textos legíveis em textos cifrados, ou que estão em formato ilegível usando uma chave.

Nesse sentido, como estaremos lidando com uma "Shift Cipher" que é uma criptografia simétrica, ou seja o remetente e destinatário possuem a mesma chave para criptografar e descriptografar, devemos ter os seguintes componentes:
- Geração da chave privada - Gen -> K
- Encriptação da mensagem M - EncK(M)
- Decriptação da mensagem cifrada C - M = DecK(C)

## Implementação:

### Cifra por Deslocamento

Sabendo que as "Shift Cipher" tratam letras como inteiros, iniciaremos a implementação declarando um dicionário que mapeia o inteiro à letra correspondente no alfabeto:

In [41]:
letters = {
   0: 'a', 1: 'b', 2: 'c', 3: 'd', 4: 'e',
    5: 'f', 6: 'g', 7: 'h', 8: 'i', 9: 'j',
    10: 'k', 11: 'l', 12: 'm', 13: 'n', 14: 'o',
    15: 'p', 16: 'q', 17: 'r', 18: 's', 19: 't',
    20: 'u', 21: 'v', 22: 'w', 23: 'x', 24: 'y',
    25: 'z'
}

Em seguida, faz-se necessário realizar a função de Encriptação que deve transformar uma mensagem legível "M" em um texto cifrado "C" através de uma chave privada.

In [42]:
def enc(m, k):
 print(f'Message being Encrypted: {m}')
 c = ''
 for char in m:
  for num, letter in letters.items():
   if char == letter:
    print(f'The character {char} is being encrypted to {letters[(num + k) % 26]}')
    c += letters[(num + k) % 26]
 print(f'Message Encrypted: {c}')
 return c

No código acima, foi usado o resto da divisão por 26, pois ao somar o inteiro com o valor da chave privada, é possível obter um inteiro que não tenha uma letra correspondente no alfabeto, portanto devemos voltar às primeiras letras. Os prints do código servem para verificar se a função está funcionando propriamente e gerando a cifra. Para exemplicar o funcionamento, iremos validar para a cifra de César onde k=3.

In [43]:
print(enc("abcdefghijklmnopqrstuvwxyz", 3))
print(enc("cifradecesar", 3))

Message being Encrypted: abcdefghijklmnopqrstuvwxyz
The character a is being encrypted to d
The character b is being encrypted to e
The character c is being encrypted to f
The character d is being encrypted to g
The character e is being encrypted to h
The character f is being encrypted to i
The character g is being encrypted to j
The character h is being encrypted to k
The character i is being encrypted to l
The character j is being encrypted to m
The character k is being encrypted to n
The character l is being encrypted to o
The character m is being encrypted to p
The character n is being encrypted to q
The character o is being encrypted to r
The character p is being encrypted to s
The character q is being encrypted to t
The character r is being encrypted to u
The character s is being encrypted to v
The character t is being encrypted to w
The character u is being encrypted to x
The character v is being encrypted to y
The character w is being encrypted to z
The character x is being enc

Assim, observa-se que a função está tendo o comportamento esperado. Entretanto, problemas com caracteres não previstos no dicionário de "letters" podem acarretar em comportamentos não esperados, mas visto que na distribuição de frequência da la língua portuguesa fornecida nas instruções não inclui outras letras a implementação irá funcionar para estes casos.

Agora, faz necessário fazer o processo contrário. Ou seja, a decriptação onde a partir de uma mensagem ilegível obtemos a mensagem legível usando a chave privada.

In [44]:
def dec(c, k):
 print(f'Cipher being Decrypted: {c}')
 m = ''
 for char in c:
  for num, letter in letters.items():
   if char == letter:
    print(f'The character {char} is being decrypted back to {letters[(num - k) % 26]}')
    m += letters[(num - k) % 26]
 print(f'Cipher Decrypted: {m}')
 return m

No código acima, foi usado a subtração pela chave para assim retornar à letra da mensagem. O uso do resto da divisão é análogo na função "enc" em função da quantidade de letras no dicionário. Para verificar o funcionamento desta função, veremos se ao usar o resultado da função de "enc" como cifra na função de "dec" se obteremos a mesma mensagem. Para ambas funções a chave deve ser a mesma e novamente usaremos a cifra de César em que k=3.

In [45]:
print(dec(enc("abcdefghijklmnopqrstuvwxyz", 3), 3))
print(dec(enc("cifradecesar", 3), 3))

Message being Encrypted: abcdefghijklmnopqrstuvwxyz
The character a is being encrypted to d
The character b is being encrypted to e
The character c is being encrypted to f
The character d is being encrypted to g
The character e is being encrypted to h
The character f is being encrypted to i
The character g is being encrypted to j
The character h is being encrypted to k
The character i is being encrypted to l
The character j is being encrypted to m
The character k is being encrypted to n
The character l is being encrypted to o
The character m is being encrypted to p
The character n is being encrypted to q
The character o is being encrypted to r
The character p is being encrypted to s
The character q is being encrypted to t
The character r is being encrypted to u
The character s is being encrypted to v
The character t is being encrypted to w
The character u is being encrypted to x
The character v is being encrypted to y
The character w is being encrypted to z
The character x is being enc

### Ataque por Força Bruta

Os ataques de segurança buscam achar informações sobre a mensagem legível e/ou a chave. Sob essa ótica, o ataque por Força Bruta consiste em testar todas chaves possíveis até obter tradução inteligível para o texto claro. Suponhamos que o "hacker" saiba que a mensagem foi originada no Brasil, portanto terá os mesmos caractéres do alfabeto da variável já definida acima.

In [46]:
def brute_force_attack(c):
 print("Testing all possible keys:")
 possible_messages = []
 for k in range(len(letters)):
  attempted_message = ""
  for char in c:
   for num, letter in letters.items():
    if char == letter:
     attempted_message += letters[(num - k) % len(letters)]
  print(f'Attempted K = {k}: {attempted_message}')
  possible_messages.append(attempted_message)
 correct_key = int(input('Type the key that has a readable message: '))
 if correct_key in range(len(letters)):
  return possible_messages[correct_key]

No código acima, é usado como parâmetro o texto cifrado que é o que vamos tentar traduzir de volta para uma mensagem legível através do teste de todas as possibilidades. Nesse sentido, as possíveis chaves são a quantidade de letras possíveis. Assim, devemos testar todas estas chaves até conseguirmos compreender o que está escrito. Quando isso ocorrer, significa que encontramos a mensagem. Vamos testar o ataque através de mensagem encriptada abaixo:

In [47]:
c = enc('cifradecesar', 6)
print(f'The cryted message is: {c}')

print(f'The message obtained by the brute force attack is: {brute_force_attack(c)}')

Message being Encrypted: cifradecesar
The character c is being encrypted to i
The character i is being encrypted to o
The character f is being encrypted to l
The character r is being encrypted to x
The character a is being encrypted to g
The character d is being encrypted to j
The character e is being encrypted to k
The character c is being encrypted to i
The character e is being encrypted to k
The character s is being encrypted to y
The character a is being encrypted to g
The character r is being encrypted to x
Message Encrypted: iolxgjkikygx
The cryted message is: iolxgjkikygx
Testing all possible keys:
Attempted K = 0: iolxgjkikygx
Attempted K = 1: hnkwfijhjxfw
Attempted K = 2: gmjvehigiwev
Attempted K = 3: fliudghfhvdu
Attempted K = 4: ekhtcfgeguct
Attempted K = 5: djgsbefdftbs
Attempted K = 6: cifradecesar
Attempted K = 7: bheqzcdbdrzq
Attempted K = 8: agdpybcacqyp
Attempted K = 9: zfcoxabzbpxo
Attempted K = 10: yebnwzayaown
Attempted K = 11: xdamvyzxznvm
Attempted K = 12: wczluxy