<a href="https://colab.research.google.com/github/Carolinsrainbow/UC_Seguridad/blob/main/2_otp.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# El algoritmo de criptografía simétrica One-Time Pad (OTP)



## La definición de protocolo

En este tutorial nos vamos a restringir a un conjunto de símbolos que consiste de las 26 letras del alfabeto Inglés en mayúscula y del símbolo espacio ``' '``. Para esto consideramos el siguiente diccionario que codifica cada uno de estos 27 símbolos como un número entero.

In [None]:
alfabeto = { 'A': 0, 'B': 1, 'C': 2, 'D': 3, 'E': 4, 'F': 5, 'G': 6, 'H': 7, 'I': 8, 'J': 9,
             'K': 10, 'L': 11, 'M': 12, 'N': 13, 'O': 14, 'P': 15, 'Q': 16, 'R': 17, 'S': 18, 'T': 19,
             'U': 20, 'V': 21, 'W': 22, 'X': 23, 'Y': 24, 'Z': 25, ' ': 26}

Como una primera implementación de la criptografía simétrica, consideremos el algoritmo de criptografía simétrica One-Time Pad (OTP). En este algoritmo, cada mensaje es considerado como una lista donde cada caracter es reemplazado por un número entero entre ``0`` y ``26`` de acuerdo con el diccionario ``alfabeto``. La siguiente función permite traducir un mensaje en su representación como lista de números enteros.

In [None]:
def representar_texto_lista(m):
    lista = []
    for i in range(len(m)):
        lista.append(int(alfabeto[m[i]]))
    return lista

Por ejemplo, a continuación usamos la función ``representar_texto_lista`` para calcular la representación del mensaje ``ESTE ES UN CURSO``.

In [None]:
mensaje = "ESTE ES UN CURSO"
lista = representar_texto_lista(mensaje)
print(lista)

[4, 18, 19, 4, 26, 4, 18, 26, 20, 13, 26, 2, 20, 17, 18, 14]


Y en el siguiente ejemplo usamos la función ``representar_texto_lista`` para calcular la representación del mensaje ``ESTE ES UN CURSO DE SEGURIDAD COMPUTACIONAL Y PROTECCION DE DATOS``.

In [None]:
mensaje = "ESTE ES UN CURSO DE SEGURIDAD COMPUTACIONAL Y PROTECCION DE DATOS"
lista = representar_texto_lista(mensaje)
print(lista)

[4, 18, 19, 4, 26, 4, 18, 26, 20, 13, 26, 2, 20, 17, 18, 14, 26, 3, 4, 26, 18, 4, 6, 20, 17, 8, 3, 0, 3, 26, 2, 14, 12, 15, 20, 19, 0, 2, 8, 14, 13, 0, 11, 26, 24, 26, 15, 17, 14, 19, 4, 2, 2, 8, 14, 13, 26, 3, 4, 26, 3, 0, 19, 14, 18]


Además, debemos tener una función que nos permita traducir una lista de números enteros en un mensaje, de manera tal de poder transformar en mensajes los resultados de OTP.

In [None]:
def simbolo(v):
    for s in alfabeto:
        if alfabeto[s] == v:
            return(s)

def representar_lista_texto(lista):
    mensaje = ""
    for i in range(len(lista)):
        mensaje += simbolo(lista[i])
    return mensaje

Por ejemplo, a continuación usamos la función ``represent_lista_texto`` para representar como textos las listas de números enteros que habíamos calculado antes.

In [None]:
lista1 = [4, 18, 19, 4, 26, 4, 18, 26, 20, 13, 26, 2, 20, 17, 18, 14]
lista2 = [4, 18, 19, 4, 26, 4, 18, 26, 20, 13, 26, 2, 20, 17, 18, 14, 26, 3, 4, 26, 18, 4, 6,
         20, 17, 8, 3, 0, 3, 26, 2, 14, 12, 15, 20, 19, 0, 2, 8, 14, 13, 0, 11, 26, 24, 26,
         15, 17, 14, 19, 4, 2, 2, 8, 14, 13, 26, 3, 4, 26, 3, 0, 19, 14, 18]
mensaje1 = representar_lista_texto(lista1)
mensaje2 = representar_lista_texto(lista2)
print(mensaje1)
print(mensaje2)

ESTE ES UN CURSO
ESTE ES UN CURSO DE SEGURIDAD COMPUTACIONAL Y PROTECCION DE DATOS


El algoritmo de cifrado de OTP funciona de la siguiente forma.

Como vimos en clases, para que dos personas se puedan comunicar de manera segura con un protocolo de criptografía simétrica, primero se deben poner de acuerdo en una clave secreta ``clave``. Entonces, dado un texto plano ``mensaje`` y la clave secreta ``clave``, se utiliza una función de cifrado ``EncOTP`` para producir un texto cifrado. En el caso de OTP, ``EncOTP`` funciona bajo el supuesto de que ``clave`` y ``mensaje`` tienen el mismo largo, y es definida de la siguiente forma.

In [None]:
def EncOTP(clave, mensaje):
    clave_lista = representar_texto_lista(clave)
    mensaje_lista = representar_texto_lista(mensaje)
    cifrado_lista = []
    for i in range(len(clave_lista)):
          cifrado_lista.append((mensaje_lista[i] + clave_lista[i]) % 27)
    return representar_lista_texto(cifrado_lista)

Vale decir, el algoritmo de cifrado primero transforma ``clave`` es su representación ``[k_1, k_2, ..., k_n]`` como lista de números enteros, y transforma ``mensaje`` es su representación ``[m_1, m_2, ..., m_n]`` como lista de números enteros, de acuerdo al diccionario ``alfabeto``. Nótese que ambas listas tienen ``n`` elementos ya que suponemos que ``clave`` y ``mensaje`` tienen el mismo largo. Luego el algoritmo calcula la lista de números enteros ``[(m_1 + k_1) % 27, (m_2 + k_2) % 27, ..., (m_n + k_n) % 27]``, y retorna como mensaje cifrado la traducción de esta lista como texto, nuevamente de acuerdo al diccionario ``alfabeto``. Por ejemplo, el siguiente código muestra el cifrado del texto plano ``ESTE ES UN CURSO`` utilizando la clave ``MI CLAVE SECRETA``.

In [None]:
mensaje = "ESTE ES UN CURSO"
clave = "MI CLAVE SECRETA"
cifrado = EncOTP(clave, mensaje)
print("Mensaje original: ", mensaje)
print("Mensaje cifrado: ", cifrado)

Mensaje original:  ESTE ES UN CURSO
Mensaje cifrado:  Q SGKEMDTEDEKVKO


El algoritmo de descifrado ``DecOTP`` de OTP funciona de manera similar al de cifrado, pero debe realizar otra operación con la clave secreta. Como se muestra a continuación, la entrada de este algoritmo es la clave secreta ``clave`` y un mensaje cifrado ``cifrado``, que nuevamente deben ser del mismo largo.

In [None]:
def DecOTP(clave, cifrado):
    clave_lista = representar_texto_lista(clave)
    cifrado_lista = representar_texto_lista(cifrado)
    mensaje_lista = []
    for i in range(len(clave_lista)):
          mensaje_lista.append((cifrado_lista[i] - clave_lista[i]) % 27)
    return representar_lista_texto(mensaje_lista)

El algoritmo de descifrado primero transforma ``clave`` es su representación ``[k_1, k_2, ..., k_n]`` como lista de números enteros, y transforma ``cifrado`` es su representación ``[c_1, c_2, ..., c_n]`` como lista de números enteros, de acuerdo al diccionario ``alfabeto``. Nótese que nuevamente ambas listas tienen ``n`` elementos ya que suponemos que ``clave`` y ``cifrado`` tienen el mismo largo. Luego el algoritmo calcula la lista de números enteros ``[(c_1 - k_1) % 27, (c_2 - k_2) % 27, ..., (c_n - k_n) % 27]``, y retorna como mensaje descifrado la traducción de esta lista como texto, nuevamente de acuerdo al diccionario ``alfabeto``. Por ejemplo, el siguiente código muestra el cifrado y descifrado del texto plano ``ESTE ES UN CURSO`` utilizando la clave ``MI CLAVE SECRETA``.

In [None]:
mensaje = "ESTE ES UN CURSO"
clave = "MI CLAVE SECRETA"
cifrado = EncOTP(clave, mensaje)
descifrado = DecOTP(clave, cifrado)
print("Mensaje original: ", mensaje)
print("Mensaje cifrado: ", cifrado)
print("Mensaje descifrado: ", descifrado)

Mensaje original:  ESTE ES UN CURSO
Mensaje cifrado:  Q SGKEMDTEDEKVKO
Mensaje descifrado:  ESTE ES UN CURSO


Como esperábamos, el resultado de descifrar un mensaje con la clave correcta es el mensaje original. O en términos de la notación que usamos en clases, tenemos que:

$\textit{DecOTP}(\textit{clave}, \textit{EncOTP}(\textit{clave}, \textit{mensaje})) = \textit{mensaje}$

A continuación tenemos un segundo ejemplo del proceso de cifrado y descifrado en OTP.

In [None]:
mensaje = "ESTE ES UN CURSO DE SEGURIDAD COMPUTACIONAL Y PROTECCION DE DATOS"
clave = "MI CLAVE SECRETA EXTENDIDA CON CARACTERES ARBITRARIOS JDICNEHFGSH"
cifrado = EncOTP(clave, mensaje)
descifrado = DecOTP(clave, cifrado)
print("Mensaje original: ", mensaje)
print("Mensaje cifrado: ", cifrado)
print("Mensaje descifrado: ", descifrado)

Mensaje original:  ESTE ES UN CURSO DE SEGURIDAD COMPUTACIONAL Y PROTECCION DE DATOS
Mensaje cifrado:  Q SGKEMDTEDEKVKOZHASWRJBUICCRMBQMFUVTGZSE LQZHHHOJMQUHXQHFRDKFZFZ
Mensaje descifrado:  ESTE ES UN CURSO DE SEGURIDAD COMPUTACIONAL Y PROTECCION DE DATOS


¿Y qué sucede si utilizamos la clave secreta incorrecta? Como esperamos, el proceso de descifrado no entrega el mensaje original.

In [None]:
mensaje = "ESTE ES UN CURSO"
clave = "MI CLAVE SECRETA"
clave2 = "UNA CLAVE INCORR"
cifrado = EncOTP(clave, mensaje)
descifrado = DecOTP(clave2, cifrado)
print("Mensaje original: ", mensaje)
print("Mensaje cifrado: ", cifrado)
print("Mensaje descifrado: ", descifrado)

Mensaje original:  ESTE ES UN CURSO
Mensaje cifrado:  Q SGKEMDTEDEKVKO
Mensaje descifrado:  XNSHIUMJPFWSIHUY


¿Por qué funciona de manera correcta OTP? O según la notación que usamos en clases, ¿por qué tenemos que $\textit{DecOTP}(\textit{clave}, \textit{EncOTP}(\textit{clave}, \textit{mensaje})) = \textit{mensaje}$? Para responder a esta pregunta, tenemos que utilizar las propiedades que aprendimos en un tutorial anterior sobre aritmética modular.

Suponga que el primer símbolo de ``mensaje`` es ``m`` y que el primer símbolo de ``clave`` es ``k``, cuando hemos representado a ``mensaje`` y ``clave`` como listas de números enteros. Entonces al calcular $\textit{DecOTP}(\textit{clave}, \textit{EncOTP}(\textit{clave}, \textit{mensaje}))$ realizamos las siguientes operaciones con el símbolo ``m``:

``(((m + k) % 27) - k) % 27``

Como ``(m + k) % 27`` y ``(m + k)`` son equivalentes en resto 27, el valor anterior es igual a:

``(((m + k) - k) % 27``

Y como estamos sumando y restando ``k``, obtenemos que este valor es igual a:

``m % 27``

Finalmente obtenemos que este valor es igual a ``m``, ya que ``m`` es un número entre ``0`` y ``26``.

De la misma forma, podemos demostrar que para los otros símbolos del mensaje y la clave, al cifrarlos y descifrarlos obtenemos el símbolo original.

## OTP en la práctica

Se puede demostrar de forma matemática que OTP es un esquema criptográfico seguro. Sin embargo, OTP tienes dos deventajas si queremos utilizarlo en aplicaciones prácticas.

1. Los textos planos y las claves deben tener el mismo largo.
2. Cada clave debe ser utilizada una solo vez. Vale decir, si ya se utilizó ``clave`` para cifrar ``mensaje``, y ahora se necesita cifrar un segundo mensaje ``mensaje2``, entonces **no** se debe utilizar ``clave`` para cifrar ``mensaje2``.

En las aplicaciones prácticas se espera que las claves puedan ser mucho más pequeñas que los mensajes a cifrar. En la primera tarea del curso, veremos cómo se puede modificar OTP para lograr esta condición.