# Criptografia simétrica com Python

É fundamental o uso bem aplicado de criptografia simétrica para garantir a confidencialidade em sistemas modernos. Com esse roteiro você aprenderá a fazer isso utilizando Python.
<br>
<br>
Para isso, utilizaremos a biblioteca **[cryptography](https://cryptography.io/en/latest/hazmat/primitives/symmetric-encryption/)**, que é a biblioteca mais utilizada para realizar esse tipo de operação. Também seguiremos as recomendações de algoritmos e modos de operação préviamente expostas (AES-128 e CTR).

## Conhecendo a biblioteca

A biblioteca possui várias funcionalidades como criptografia simétrica, criptografia assimétrica, hashing, HMAC, etc. No nosso caso iremos utilizar apenas a criptografia simétrica.
<br>
<br>
Para usar todo esse ferramental, precisamos instalar a biblioteca.

In [None]:
!pip install cryptography

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting cryptography
  Downloading cryptography-39.0.0-cp36-abi3-manylinux_2_28_x86_64.whl (4.2 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m4.2/4.2 MB[0m [31m27.0 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: cryptography
Successfully installed cryptography-39.0.0


## Lidando com chaves

Antes de começarmos a cifrar alguma coisa, primeiro precisamos entender como gerar chaves para utiliza-las com a biblioteca.
<br>
<br>
Se a chave gerada não for aleatória o suficiente e tiver alguma correlação com ser dependente do tempo, dependente da máquina ou uma palavra do dicionário, por exemplo, ela se torna vulnerável. Para evitar palavras conhecidas, vamos utilizar um gerador aleatório de bytes ao invés de gerá-las manualmente (o que também seria pouco escalável).
<br>
<br>
Existe algumas formas de se gerar chaves aleatórias, por exemplo usando ```random.randbytes(bytes_size: int)``` ou  ```os.urandom(bytes_size: int)```, porém elas não são seguras pois utilizam informações da máquina, como timestamp para gerar os valores.
<br>
<br>
A forma mais aconselhadas de se gerar numeros de forma segura é utilizando a função ```.token_bytes(bytes_size: int)``` da biblioteca ```secrets```. Como vamos utilizar o gerador para obter uma chave secreta para usar no AES-128 e um nonce para o modo de operação counter, precisamos de uma chave secreta de 128 bits e também de um nonce de 128 bits.

In [None]:
import secrets

# lembraando que 1 byte = 8 bits, então 16 bytes = 128 bits
key = secrets.token_bytes(16)
nonce = secrets.token_bytes(16)

## Configurando o Cipher

Bem, agora que já temos nossa chave secreta e o nosso nonce, podemos começar a cifrar dados. Para isso, instaciamos um objeto da classe `Cipher` e passamos como parâmetro o algoritmo que será utilizado (AES) e modo de operação (counter).
<br>
<br>
**obs:** A variação do algoritmo (no caso do AES) pode estar explicito ou definido pelo tamanho da chave passada. No nosso caso, definiremos pela chave de 128 bits passada no construtor.

In [None]:
from cryptography.hazmat.primitives.ciphers import Cipher, algorithms, modes

cipher = Cipher(algorithms.AES(key), modes.CTR(nonce))

A classe `Cipher` não cifra nem descifra nada, apenas armazena as informações necessárias e retorna duas interfaces, o encryptor e o decryptor. E é com elas que realizamos as operações.

## Cifrando uma mensagem

Para enfim cifrar uma mensagem, precisamos criar uma interface `encryptor` e a partir dela cifrar nossos dados utilizando o método `.update(plain_text: bytes)`, que retorna o texto cifrado. Quando terminarmos de cifrar o que desejamos, devemos chamar `.finalize()` para retornar algum dado que ainda não tenha sido retornado.

In [None]:
encryptor = cipher.encryptor()

texto_plano = "O segredo do fotografo ainda nao foi revelado."
cipher_text = encryptor.update(texto_plano.encode()) + encryptor.finalize()

print(cipher_text)

b'\xe8\x1c\x9b\x0f\xa8\x81J\x1e\x92\x01u\xa6RO\x8cq.\xf8Lu\x81\xeb\xeeZR\xf2\r\x13.\xdb\xbb"^\x98FeOg\xb5\x93\xefT\xa2#\x9bq'


Uma coisa que deve ser observada é que a API foi montada de forma que facilita o processamento de dados grandes em pedaços menores. Porém cuidado quando for fazer paralelismo aqui, pois existem modos de operação que não suportam cifrar de forma paralela.

In [None]:
encryptor = cipher.encryptor()
ct = b''

with open('file.txt', 'w') as file:
  file.write("Esse arquivo é para mostrar um exemplo na cadeira de sistemas distribuídos.")

with open('file.txt', 'rb') as file:
  chunk = file.read(5) # para ler de 5 em 5 bytes

  while chunk:
    ct += encryptor.update(chunk)
    chunk = file.read(5)

ct += encryptor.finalize()

**obs:** Padding não é adicionado automaticamente, caso você tenha problema do dado não ser ser um múltiplo do tamanho do bloco, adicione o [padding](https://cryptography.io/en/latest/hazmat/primitives/padding/#cryptography.hazmat.primitives.padding.PKCS7).

## Descifrando a mensagem

Descifrar dados usando essa biblioteca é muito semelhante, precisamos criar uma interface `decryptor` e a partir dela cifrar nossos dados utilizando o método `.update(plain_text: bytes)`, que retorna o texto plano. Quando terminarmos de descifrar o que desejamos, devemos chamar `.finalize()` para retornar algum dado que ainda não tenha sido retornado.

In [None]:
decryptor = cipher.decryptor()
texto = decryptor.update(cipher_text) + decryptor.finalize() # ainda está em bytes

print(texto.decode())

O segredo do fotografo ainda nao foi revelado.


**obs:** Da mesma forma que partimos o processo de cifrar de um dado grande, podemos fazer o de descifrar.

# Atividade

Para praticar o que foi aprendido, seu objetivo é puxar os dados de um
arquivo .csv criptografada, descriptografar, fazer a soma dos números entre colunas, cifrar o resultado e enviar de volta [nesse form](https://forms.gle/FZFaQjTmUdbWzYjY7). Você deve fazer isso usando o algoritmo, modo de operação, segredos e o arquivo especificado [aqui](https://docs.google.com/spreadsheets/d/139yB3GN1nzaftxxAmqIpUOzq9Y-Z4GptUpc0GSqEC5E/edit?usp=sharing).
<br>
<br>
Você deve retornar a base de dados e o código usado. Você pode utilizar qualquer linguagem que desejar.
<br>
<br>
Boa sorte!

In [2]:
!pip install cryptography

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting cryptography
  Downloading cryptography-39.0.0-cp36-abi3-manylinux_2_28_x86_64.whl (4.2 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m4.2/4.2 MB[0m [31m70.5 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: cryptography
Successfully installed cryptography-39.0.0


In [None]:
import pandas as pd
import secrets
import csv
from cryptography.hazmat.primitives.ciphers import Cipher, algorithms, modes

key = bytearray.fromhex("5effc934f57c6832a19fcdfe9c358cbe")
nonce = bytearray.fromhex("8245248d6750f7efdda9e5c4b5288e53")
cipher = Cipher(algorithms.AES(key), modes.CTR(nonce))

decryptor = cipher.decryptor()
encryptor = cipher.encryptor()

data = []
with open("./118210822.csv", 'r') as file:
  csvreader = csv.reader(file)
  for row in csvreader:
    n1, n2 = row
    n1 = bytearray.fromhex(n1)
    n2 = bytearray.fromhex(n2)
    n1 = int(decryptor.update(n1).decode())
    n2 = int(decryptor.update(n2).decode())
    sum = n1 + n2
    cipher_text = encryptor.update(str(sum).encode())
    data.append([n1, n2, sum, cipher_text])

df = pd.DataFrame(data, columns = ['n1', 'n2', 'sum', 'sum_cryp'])
df.to_csv("118210822_with_sum.csv")

In [4]:
import pandas as pd
import secrets
import csv
from cryptography.hazmat.primitives.ciphers import Cipher, algorithms, modes

key = bytearray.fromhex("5effc934f57c6832a19fcdfe9c358cbe")
nonce = bytearray.fromhex("8245248d6750f7efdda9e5c4b5288e53")
cipher = Cipher(algorithms.AES(key), modes.CTR(nonce))

decryptor = cipher.decryptor()
encryptor = cipher.encryptor()

data = []
with open("./118210822.csv", 'r', newline='') as file:
  csvreader = csv.reader(file, delimiter=',')
  for row in csvreader:
    # Decrypt
    n1, n2 = row
    n1 = int(decryptor.update(bytes.fromhex(n1)).decode())
    n2 = int(decryptor.update(bytes.fromhex(n2)).decode())
    # Sum
    sum = n1 + n2
    # Encrypt
    cipher_n1 = encryptor.update(str(n1).encode()).hex()
    cipher_n2 = encryptor.update(str(n2).encode()).hex()
    cipher_sum = encryptor.update(str(sum).encode()).hex()
    data.append([cipher_n1, cipher_n2, cipher_sum])

with open("./118210822_final.csv", 'w', newline='') as file:
  csvwriter = csv.writer(file, delimiter=',')
  csvwriter.writerows(data)

In [5]:
decryptor = cipher.decryptor()
with open("./118210822_final.csv", 'r', newline='') as file:
  csvreader = csv.reader(file, delimiter=',')
  for row in csvreader:
    print([decryptor.update(bytes.fromhex(data)).decode() for data in row])

['0', '1', '1']
['1', '1', '2']
['2', '8', '10']
['3', '2', '5']
['4', '1', '5']
['5', '0', '5']
['6', '8', '14']
['7', '2', '9']
['8', '2', '10']
