# Números pseudoaleatorios y cifrado de flujo

In [1]:
from IPython.display import IFrame
IFrame(src="https://drive.google.com/file/d/1edLyTBnPYB7ZkfTq3Cmvmf-ZTJwcFjqj/preview", width=640, height=360)

## RC4

El algoritmo RC4 consta de dos etapas:

1. Inicialización o Key-scheduling algorithm, donde se usa la llave o semilla para inicializar el estado;
2. Generación de bytes, donde se generan tantos bytes como se requieran.

En https://en.wikipedia.org/wiki/RC4#Description puede verse la descripción del algoritmo; también puede verse otra explicación en el video https://www.youtube.com/watch?v=G3HajuqYH2U.

El siguiente código es una implementación de RC4 como cifrador de flujo, es decir, la función recibe el mensaje claro `data` y la llave `key`, ambos del tipo `bytes`, y se devuelve el XOR de `data` y los bytes pseudoaleatorios generados por RC4 con la llave `key`.

In [2]:
# Para Python 3.x
def rc4_encrypt(key, data):
    # Inicialización
    x = 0
    box = list(range(256))
    for i in range(256):
        x = (x + box[i] + key[i % len(key)]) % 256
        box[i], box[x] = box[x], box[i]
        
    # Generación de bytes pseudoaleatorios y cifrado
    x = 0
    y = 0
    out = []
    for byte in data:
        x = (x + 1) % 256
        y = (y + box[x]) % 256
        box[x], box[y] = box[y], box[x]
        out.append(byte ^ box[(box[x] + box[y]) % 256])
    return bytes(out)

print(rc4_encrypt(b'Key', b'Plaintext').hex()) # Primer ejemplo de la página de Wikipedia

bbf316e8d940af0ad3


### Preguntas
1. Prueba los otros ejemplos que aparecen en la página de Wikipedia, verificando que coincide el texto cifrado.
2. ¿Cómo sería la función de descifrado? Prueba tu respuesta descifrando la cadena de 9 bytes `bbf316e8d940af0ad3` con la llave `Key`.
3. En los ejemplos de Wikipedia aparece la cadena de bytes pseudoaleatorios generada (keystream), ¿qué cadena `data` tendrías que pasarle a `rc4_encrypt` para que devuelva la cadena de bytes pseudoaleatorios (keystream)?

Como se puede ver en la página de Wikipedia, existen varios ataques a RC4, por lo que actualmente no se recomienda usarlo para fines criptográficos. De hecho antes se usaba RC4 como parte del generador de números aleatorios de Linux, y actualmente ha sido reemplazado por el algoritmo ChaCha.