<a href="https://colab.research.google.com/github/javiersago/colab/blob/main/Criptograf%C3%ADa_Sistema_RSA_(v2).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Sistema criptográfico RSA**

#### **Javier Salido, 2022**
#### Departamento de Tecnología e Informática.<br>IES Francisco de los Cobos, Úbeda (Jaén)

Referencias:

* [1] Hernández, L. (2016) *La criptografía*. Colección: ¿Qué sabemos de? CSIC - Catarata.
* [2] Wikipedia. *RSA*. https://es.wikipedia.org/wiki/RSA


# El criptosisitema RSA

El criptosistema RSA (Rivest, Shamir y Adleman) es uno de los sistemas de **cifrado asimétrico** más utilizados en la actualidad. Se emplea principalmente para:
* Cifrar mensajes y archivos.
* Firmar digitalmente documentos.

RSA consta de tres procedimientos:
* Generación de claves.
* Cifrado.
* Descifrado.

# Generación de claves RSA

La generación de claves es un procedimiento sencillo y eficiente. Este **protocolo de generación de claves** ejecuta los siguientes pasos:

1. Buscar dos números primos, $p$ y $q$, con $p \neq q$ (en la práctica $p$ y $q$ deben ser *muy grandes*, de 1024 o 2048 bits o más para una seguridad adecuada).

2. Calcular $n = p \cdot q$ (cuyo número de bits será la suma de los de $p$ y $q$). El número $n$ se denomina **módulo RSA**.

3. Determinar el valor del indicador de Euler, $\varphi(n) = (p-1)(q-1)$, que es el número de elementos del grupo $\mathbb Z^*_n$.

4. Elegir un entero positivo, $e$, tal que $1 < e < \varphi(n)$, que sea primo relativo de $\varphi(n)$, es decir, que $\mathrm{mcd}(e, \varphi(n))=1$. El número $e$ será el **exponente de cifrado**.

5. Calcular el inverso de $e$ módulo $\varphi(n)$, es decir, el único número $d$ que cumple: $e \cdot d \equiv 1 \pmod {\varphi(n)}$. El número $d$ será el **exponente de descifrado**.

La **clave pública** es el par de números $(n,e)$ y la **clave privada** es $(n, d)$. Por cuestiones de seguridad, es decir, para proteger la clave privada, los números $p$, $q$ y $\varphi(n)$ se mantienen en secreto.

> **Nota:** $\mathbb Z^*_n$ es el subconjunto de $\mathbb Z_n$ formado por los números que tienen inverso. Cuando $n$ es primo, el número de elementos de $\mathbb Z^*_n$ es $\varphi(n) = (n-1)$, pero si $n$ no es primo, $\varphi(n)$ es más difícil de calcular, dado que hay que calcular todos los números que son primos relativos de $n$.

In [None]:
import math

# GENERACIÓN DE CLAVES RSA

# Elegimos dos números primos (pequeños para nuestro ejemplo)
p = 11
q = 23

print(f'p = {p}')
print(f'q = {q}')

# Calculamos n y el indicador de Euler
n = p*q
phi = (p - 1)*(q - 1)

print(f'n = {n}')
print(f'φ(n) = {phi}')

# Buscamos el primer valor 'e' válido (exponente de cifrado)
# (También se prodría buscar alearotiamente)
encontrado = False
e = 2
while not encontrado:
  if math.gcd(e, phi) == 1:
    encontrado = True
  else:
    e = e + 1

print(f'e = {e}')

# Calculamos el inverso de 'e', 'd'(exponente de descifrado)
# Resolvemos la congruencia para calcular el inverso de 'e' en módulo phi(n)
# e·d ≡ 1 (mod φ) --> d = (1 + φ·k) / e
# Recordar: a ≡ b (mod n) --> a = b + m·k, con k entero.
def inv(a, b):
  k = 1
  fin = False
  while not fin:
    if ((1 + b*k) % a) == 0:
      c = (1 + b*k) // a
      fin = True
    k = k + 1

  return c

d = inv(e, phi)
print(f'd = {d}')

# Mostramos las claves de cifrado
print(f'Clave pública: (n,e) = ({n},{e})')
print(f'Clave privada: (n,d) = ({n},{d})')

p = 11
q = 23
n = 253
φ(n) = 220
e = 3
d = 147
Clave pública: (n,e) = (253,3)
Clave privada: (n,d) = (253,147)


# Cifrado de un mensaje

Para cifrar un mensaje se seguirá el siguiente **protocolo de cifrado**:

1. Pedir al destinatario del mensaje su clave pública $(n,e)$.

2. Codificar adecuadamente el mensaje para transformarlo en un elemento de $\mathbb Z^*_n$. Así, el mensaje codificado, $m$, tendrá un valor comprendido entre $1$ y $n-1$.

3. Obtener el mensaje cifrado, $c$, calculando $c \equiv m^e \pmod n$.

4. Enviar el mensaje cifrado, $c$, al destinatario.

* Operación de cifrado usando la clave pública: $c = m^e \: \mathrm{mod}\: n$


> Para nuestro ejemplo y por simplicidad, emplearemos el código ASCII estándar (7 bits; 128 caracteres, del 0 al 127) para codificar los mensajes. El valor ASCII de cada caracter del mensaje será nuestro $m$. Esta elección se justifica porque $128 \leq n$. Los mensajes cifrados sí podrán tener códigos ASCII mayores que 128 (entre 0 y $n-1$), entrando ya en el código ASCII extendido (8 bits; 256 caracteres, del 0 al 255).

In [None]:
# CIFRADO DEL MENSAJE

# Texto a cifrar
texto_claro = 'Demasiados secretos'

# Convertir los caracteres del texto a sus códigos correspondientes:
codigos = []
for caracter in texto_claro:
  m = ord(caracter)
  codigos.append(m)

# Ciframos el mensaje con la clave pública:
cifrado = []
for m in codigos:
  c = (m**e) % n
  cifrado.append(c)

# Obtenemos el texto cifrado
texto_cifrado = ''
for c in cifrado:
  texto_cifrado = texto_cifrado + chr(c)

print('Mensaje original:  ', texto_claro)
print('Códigos:           ', codigos)
print('Cifrado:           ', cifrado)
print('Mensaje cifrado:   ', texto_cifrado)

Mensaje original:   Demasiados secretos
Códigos:            [68, 101, 109, 97, 115, 105, 97, 100, 111, 115, 32, 115, 101, 99, 114, 101, 116, 111, 115]
Cifrado:            [206, 85, 175, 102, 92, 150, 102, 144, 166, 92, 131, 92, 85, 44, 229, 85, 139, 166, 92]
Mensaje cifrado:    ÎU¯f\f¦\\U,åU¦\


# Descifrado de un mensaje

Cuando el destinatario recibe el nebsaje cifrado, $c$, aplicará el siguiente **protocolo de descifrado**:

1. Calcular $m$ mediante $m \leftarrow c^d \: \mathrm{mod}\: n$ (como $e$ y $d$ son inversos en módulo $\varphi(n)$, se cumple que $c^d \pmod n \equiv (m^e)^d \pmod n \equiv m^{e \cdot d} \pmod n \equiv m)$

2. Descodificar $m$ para obtener el mensaje original.

In [None]:
# DESCIFRADO DEL MENSAJE

# Desciframos el mensaje con la clave privada
descifrado = []
for c in cifrado:
  m = (c**d) % n
  descifrado.append(m)

# Recuperamos el texto
texto_claro = ''
for m in descifrado:
  texto_claro = texto_claro + chr(m)

print('Mensaje cifrado:   ', texto_cifrado)
print('Descifrado:        ', descifrado)
print('Mensaje recuperado:', texto_claro)

Mensaje cifrado:    ÎU¯f\f¦\\U,åU¦\
Descifrado:         [68, 101, 109, 97, 115, 105, 97, 100, 111, 115, 32, 115, 101, 99, 114, 101, 116, 111, 115]
Mensaje recuperado: Demasiados secretos


# Observaciones finales y conclusiones

* Se puede observar que la implementación de los protocolos de cifrado y descifrado es esencialmente la misma, dado que ambas emplean las mismas operaciones matemáticas. Lo único que cambian son los exponentes. De aquí deducimos que ambos exponentes se pueden usar indistintamente para cifrar y descifrar. De hecho, para cifrar mensajes se usan como hemos visto pero para la firma digital se cifra con la clave privada y se descifra con la pública.

* Además de la facilidad de implementación y de la seguridad que ofrece, el algoritmo de cifrado/descifrado es muy efeciente si se implementa adecuadamente.

* El criptosistema RSA presenta una dificultad, la de determinar números primos grandes, lo cual requiere bastante tiempo de computación. Esto se conoce como el *problema de la primalidad*. En la práctica se revuelve haciendo uso de Test de Miller-Rabin que garantiza de números impares generados aleatoriamente pueden ser primos con una probabilidad del orden del 99,9999%.

* El problema matemático que garantiza la seguridad del criptosistema RSA es el **problema de la factorización de números enteros**, que consiste en calcular la descomposición en factores primos de un número compuesto. Este problema se considera, hoy en día, como uno de los más difíciles de resolver si el número a factorizar se elige convenientemente. Muchos números son fáciles de factorizar, basta con que sean *pequeños* o tengan muchos factores primos. Sin embargo, si el número a factorizar es *grande* y tiene pocos factores, la complejidad computacional es muy elevada.<br>
Según lo anterior, si se pudiera descomponer fácilmente $n$ (conocido) en $p$ y $q$, como el valor $e$ es conocido y $\varphi(n)$ se podría calcular fácilmente, se podría determinar $d$ por el algoritmo de Euclides y el sistema quedaría vulnerado.

# Anexo

* Observación: al codificar sólo un caracter en vez de un bloque de ellos (como se hace en la práctica), el cifrado obtenido en ejemplo estudiado no se diferencia en nada de un cifrado César, por lo que podría romperse con las mismas técnicas de criptoanálisis.

* Las claves pública y privada en binario y hexadecimal:

In [None]:
# Clave pública
publica = n*256 +e
print('Clave pública (16 bits):', '{:016b}'.format(publica), '|', '{:04x}'.format(publica))

# Clave privada
privada = n*256 + d
print('Clave privada (16 bits):', '{:016b}'.format(privada), '|', '{:04x}'.format(privada))

Clave pública (16 bits): 1111110100000011 | fd03
Clave privada (16 bits): 1111110110010011 | fd93
