<a href="https://colab.research.google.com/github/Juosorioca420/DiscretasII/blob/main/Proyecto/RSA.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>



# **RSA: Sistema Criptográfico de clave pública**

---
Proyecto de Matematicas Discretas II

Desarrollado por:
> * Juan Carlos Garavito higuera
> * Julian David Osorio
> * Haider Andres Mayorga Vela
> * Eder José Hernandez Buelvas

---
Video explicativo que aborda el contenido del notebook: https://youtu.be/a6yysJO4hKc

## Introducción

La criptografía es una herramienta fundamental en la era digital para garantizar la privacidad, la seguridad y la integridad de la información que se transmite y almacena. En un mundo cada vez más interconectado, donde la comunicación y el intercambio de datos se realizan a través de redes públicas, es crucial proteger la confidencialidad de la información sensible, como contraseñas, datos bancarios, información personal o secretos comerciales, a continuacion uno de los pilares de los algoritmos mas importantes de la criptografia.



El algoritmo RSA,fue nombrado en honor a sus inventores, Ron Rivest, Adi Shamir y Leonard Adleman, este sistema criptográfico de clave pública altamente utilizado en la actualidad, se basa en la dificultad computacional de factorizar números enteros grandes en sus factores primos, lo que brinda una base sólida para la seguridad de la información.

La historia del algoritmo RSA se remonta a finales de la década de 1970, cuando Ron Rivest, Adi Shamir y Leonard Adleman, tres matemáticos e investigadores en criptografía, trabajaron juntos en el Laboratorio de Ciencias de la Computación del Instituto de Tecnología de Massachusetts (MIT).

En 1977, Rivest, Shamir y Adleman publicaron un artículo titulado "A Method for Obtaining Digital Signatures and Public-Key Cryptosystems" ("Un método para obtener firmas digitales y criptosistemas de clave pública"), en el cual presentaron el algoritmo RSA por primera vez. Este artículo se convirtió en un hito importante en el campo de la criptografía y sentó las bases de los sistemas criptográficos de clave pública.

El algoritmo RSA sigue siendo de gran importancia en la actualidad debido a su papel fundamental en la seguridad de la información y las comunicaciones en entornos digitales. algunas de las razones por las cuales RSA es relevante en la actualidad:
* Seguridad de la comunicación: RSA se utiliza para cifrar y descifrar datos, lo que garantiza la confidencialidad de la información transmitida a través de redes inseguras como Internet. Esencial para la privacidad de las comunicaciones y proteger los datos sensibles.
* Firma digital: RSA se utiliza para generar firmas digitales, que verifican la autenticidad e integridad de documentos electrónicos los cuales permiten la verificación de identidad y la protección contra la falsificación de documentos en entornos digitales.
* Infraestructura de clave pública (PKI): RSA es uno de los algoritmos fundamentales en las infraestructuras de clave pública, que gestionan la emisión, distribución y gestión de certificados digitales utilizados para autenticar entidades y establecer comunicaciones seguras.
* Comercio electrónico: RSA juega un papel crucial en la seguridad de las transacciones en línea, ya que se utiliza en protocolos como SSL/TLS para establecer conexiones seguras entre clientes y servidores. Esto garantiza la confidencialidad de la información financiera y protege contra el fraude en línea.

## Metodología

Los algoritmos para cifrado RSA, se valen del uso de la aritmética modular para llegar a sus resultados; a continuación explicamos los métodos empleados.

* **Identidad de Bézout**

  La identidad de Bézout o Lema de Bezout enuncia que si $a$ y $b$ son números enteros diferentes de cero con máximo común divisor $d$, entonces existen enteros $x$ e $y$ tales que:
  \begin{align*}
    & ax+by=d \:\: \text{ , ó,} \\
    & ax+by= mcd(a,b)
  \end{align*}

  Por tanto si a,b son coprimos $mcd(a,b)=1$, con ello en mente podemos ahora ver porque Coeficiente de Bezout asociado $a$ a es el inverso modular de $a$, tenemos la siguiente expresion.
  \begin{align*}
    & ax+by=1 \\
    & ax-1=-by
  \end{align*}

  Por definicion de congruencia tenemos que:
  \begin{align*}
    & ax \equiv 1 \pmod{y}
  \end{align*}

  Siendo $x$ el inverso de $a$

* **Exponenciación modular rápida**

  Para resolver problemas del tipo $A^B mod C$ podemos dividirlo en dos partes, inicialmente cuando B es potencia de dos y cuando no, para ello usaremos la siguiente propiedad.

  $ A^2  \ mod \ C \ = \ (A * A) \ mod C \  =\ ((A \  mod\ C) \ * \ (A \ mod\ C)) \ mod \ C$

  de la siguiente manera, inicialmente el caso base el cual sera
  \begin{align*}
    & U_1 = A^1 \pmod C \:\:  \text{ , y recursivamente,} \\
    & U_n=(U_{n-1})*(U_{n-1})
  \end{align*}

  Y cuando no; expandimos el $B$ en potencias de $2$ al escribirlo en binario, tal que resulte
  \begin{align*}
    A^{suma \ de \ tales \ potencias}
  \end{align*}

  Posteriormente calculamos el $\pmod C$ de las potencias de $2 ≤ B$ por separado y finalmente usamos propiedade de multiplicación modular tal que encontremos el resultado.
  como por ejemplo:

  $5^{117}mod 19$

  1. $117=1110101$ en binario

  2. $117=(2^0+2^{2}+2^{4}+2^{5}+2^{6})$

  3. $5^{117}mod 19 = 5^{1+4+16+32+64}mod 19$

  4. $5^{117}mod 19 = 5^1*5^{4}*5^{16}*5^{32}*5^{64}mod 19$

<br>

Una vez se ha planteado las propiedades básicas a utilizar, se describen ahora los algoritmos.


**Algoritmo Encriptacion RSA**

```
input = mensaje a encriptar "mensaje" en formato string
output = lista de letras en unicode formato string encriptadas de "mensaje"
Definir p,q # numero primos grandes
Definir n= p*q #entero resultante de p*q
Definir phi = (p-1)*(q-1) # funcion euler totiem de p*q
Definir a #numero tal que 1<a<phi y MCD(a,phi)=1
Definir b #numero tal que a*b=1 mod(phi) (inversa)
#llaves publicas a,n
#llave privadas p,q,b

Definir contador = 0
Definir long_cad = Longitud(mensaje)
Definir str_enc = ""
mientras contador < long_cad
	Definir letra = mensaje[contador] #letra en la posicion de "contador"
	Definir letra_ord = ord(letra) #conversion de str->unicode
	definir letra_enc = letra_ord^a mod(n) #letra encriptada que es el unicode

	str_enc = concatenar(str_enc,str(letra_enc)) # concatenar letras
	contador= contador+1

# str_enc es finalmente la cadena encriptada

```
Fin Algoritmo


**Algoritmo Desencriptacion RSA**

```
input = mensaje a desencriptar "mensaje" en formato string
output = mensaje desencriptado "str_des" en formato string
Definir b #numero tal que a*b=1 mod(phi) (inversa)
Definir contador = 0
Definir long_cad = Longitud(mensaje)
Definir str_des = ""
mientras contador < long_cad
	Definir letra = mensaje[contador] #letra en la posicion de "contador"
	Definir letra_chr = chr(letra) #letra encriptada conversion de unicode->str
	Definir letra_des = letra_ord^b mod(n) #letra desencriptada
	str_des = concatenar(str_des,str(letra_enc)) # concatenar letras
	contador=contador+1
# str_des es finalmente la cadena desencriptada
```
Fin Algoritmo


##  Desarrollo


Recordando las propiedades de la *Función Phi de Euler*.
> *   $\phi(1)$ = 1
*   $\phi(p^a)$ = $p^a - p^{a-1}$
* $mcd(m,n) = 1 \:\: ⟶$ $\:\:\phi(m\cdot n)$ = $\phi(m)$$\phi(n)$

Donde, para un número primo $p ⟶$ $φ(p) = (p^1-p^0) = (p-1)$.

<br>

Se plantea la siguiente rutina, basada en los pasos presentados en la sección anterior para la implementación de el **cifrado RSA**:

1. Seleccionar dos números primos grandes y diferentes, $p$ y $q$.
1. Calcular $n = p * q$.
1. Calcular la función totient de Euler de n: $φ(n) = (p-1) * (q-1)$.
1. Seleccionar un número entero $a$ tal que $1 < a < φ(n)$; coprimo con $φ(n)$.
1. Calcular b como el inverso multiplicativo $ a\cdot b \equiv 1 \mod{φ(n)}$.
1. Definir las llaves.
  > * $(n, a) ⟶$ llave pública.
  > * $(p, q, b) ⟶$ llave privada.


<br>

Para cifrar un mensaje, para cada caracter $x$.
\begin{align}
  e(x) = x^a \mod{n}
\end{align}

A su vez, la operación de descifrado:
\begin{align}
  d(x) = x^b \mod{n}
\end{align}

**1. Generación de Llaves**

Se inicia implementando la función para la generación de las llaves requeridas; a su vez la función auxiliar para calcular el inverso modular necesario para esta tarea.

Para el cálculo de $b = a^{-1}$, usamos el algoritmo extendido de Euclides para calcular los números de Bézout. Para los cuales:
\begin{align}
&d = av + bw  \quad \text{ donde,}\\
& a\cdot v ≡ 1 \mod(b)
\end{align}
Es decir $b = a^{-1} = v$, con $d = mcd(a,b)$.

In [None]:
from sympy import randprime # Generador de numeros primos
import time as t
import sys

In [None]:
def mcd(x, y):
  return x if y == 0 else mcd(y, (x % y))

def inverso(a, phi):
  neg = (a<0 and phi<0)

  # Inicializamos los coeficientes de Bezout para los casos base.
  v, w = 1, 0 # d = av + bw  ->   phi = 0; d = a(1) + 0
  v1, w1 = 0, 1 # Auxiliares: iniciar en caso base para proxima iteración en caso de existir.

  while phi != 0:
    q, r = a//phi, a%phi  # Cociente y resto
    v, w,   v1, w1  =  v1, w1,   v - q*v1, w - q*w1  # Actualizar los coeficientes
    a, phi = phi, r   # Actualizar a y phi

  return v if (not neg) else -v


def primos(start = 1e8, stop = 1e9):
  '''
  Para fines demostrativos definimos valores p y q de minimo 27 bits.
  Donde {10^8: 27bits }, {10^9: 30bits}

  Comercialmente se usan cifras de 1024 bits, donde la exigencia
  para los algoritmos de fuerza bruta crece abruptamente.
  '''
  p, q = ( randprime(start, stop) for i in range(2) )
  return p, q


def llaves(p, q):
  n , phi = (p*q), (p - 1)*(q - 1)

  a = 0 # Si a es primo, garantizo a, φ(n) coprimos
  for i in range(2, phi-1):
    if mcd(i, phi) == 1:
      a = i
      break

  b = inverso(a, phi)

  return n, a, b

**2. Encriptado**


La función de encriptado recibe como parámetro el mensaje per se, además de la llave pública $(n, a)$.


Donde se considera cada carácter que compone el mensaje en su forma numérica asociada a su código *Unicode*. Es decir:


\begin{align}
  &(a, b, ⋯, z) ⟶ (97, 98, ⋯, 122) \\
  &(A, B, ⋯, Z) ⟶ (65, 66, ⋯, 90)
\end{align}

In [None]:
def encriptar( mensaje, n, a ):
  # Lista de cada caracter cifrado
  e = [ str(ord(char)**a %n)  for char in mensaje ] # Ord() devuelve el Unicode

  return ' '.join(e)

**3. Desencriptado**


La función de desencriptado recibe como parámetro el mensaje numérico incrustado.


Encuentra cada número ingresado a su código original asociado y lo transforma a una cadena de caracteres legible.


Para ello nos servimos del método de exponenciación modular rápida anterior expuesto.




In [None]:
def exp_mod(base, exp, mod):
    sys.setrecursionlimit(15000) #Uso un sistema con 16 Gb de RAM

    if exp == 0: return 1
    elif exp % 2 == 0: return exp_mod(base**2 % mod, exp//2, mod)
    else: return base * exp_mod(base**2 % mod, (exp-1)//2, mod) % mod

def desencriptar(e, n, b):
    lst = e.split() # Formato lista facilita la conversion
    d = [ chr( exp_mod(int(num), b, n) ) for num in lst ] # Pasar los codigos a su caracter correspondiente.

    return ''.join(d)

Integremos lo anterior visto en una pequeña rutina principal.


In [None]:
def main_rsa(mensaje, b):
  global n,a # n,a - Llave publica.
  # b - Llave privada como parametro que solo nosotros conocemos.

  t1 = t.time()
  e = encriptar( mensaje, n, a)
  d = desencriptar(e, n, b)
  t2 = t.time() - t1

  print( f'Mensaje original: {mensaje}\n\nEncriptado: {e}\nDesencriptado: {d}\n\nTiempo RSA: {round(t2,3)}s\n' )

  return t2

## Resultados

Una vez implementadas las funciones pertinentes, podemos apreciar el funcionamiento del sistema de cifrado.

Definamos una *llave* de prueba.

In [None]:
p, q = primos()
n, a, b = llaves(p, q)

print( f'Publica = [ n: {n}, a: {a} ]\nPrivada = [ p: {p}, q: {q}, b: {b} ]' )

Publica = [ n: 197892093196268131, a: 5 ]
Privada = [ p: 229642663, q: 861739237, b: 79156836841954493 ]


Ahora, encriptemos un pequeño mensaje como:
> Hola Mundo!



In [None]:
e = encriptar('Hola Mundo!', n, a)
print( f'Encriptado: {e}' )

Encriptado: 1934917632 16850581551 14693280768 8587340257 33554432 2706784157 21924480357 16105100000 10000000000 16850581551 39135393


A su vez, podemos desencriptar el mensaje cifrado resultante.

In [None]:
d = desencriptar(e, n, b)
print( f'Desencriptado: {d}' )

Desencriptado: Hola Mundo!


Veamos el rendimiento general del algoritmo.

In [None]:
rsa = main_rsa('Hola Mundo!', b)

Mensaje original: Hola Mundo!

Encriptado: 1934917632 16850581551 14693280768 8587340257 33554432 2706784157 21924480357 16105100000 10000000000 16850581551 39135393
Desencriptado: Hola Mundo!

Tiempo RSA: 0.001s



Para determinar la seguridad del algoritmo anterior visto; desarrollemos ahora una rutina a *fuerza bruta* para desencriptar un mensaje cifrado y comparemos el tiempo empleado en dicha tarea.


Para ello necesitamos tomar $n$ de la llave pública y descomponerlo en sus factores primos $p$ y $q$ para hallar posteriormente el valor de $b$.




In [None]:
def factorizar(n, a):
  for i in range(2, int( n**0.5 ) + 1 ):
    if n % i == 0:
      p, q = i, n//i
      break

  phi = (p - 1)*(q - 1)
  b = inverso(a, phi)
  print( f'[ p: {p}, q: {q}, b: {b} ]' )

  return p, q, b

def main_f(mensaje):
  global n, a # n,a - Llave publica.
  # b - llave a descubrir

  t1 = t.time()
  e = encriptar( mensaje, n, a)

  p, q, b = factorizar(n,a)
  d = desencriptar(e, n, b)
  t2 = t.time() - t1

  print( f'Mensaje original: {mensaje}\n\nEncriptado: {e}\nDesencriptado: {d}\n\nTiempo Fuerza bruta: {round(t2,3)}s\n' )

  return t2

Comparemos $\verb|main_rsa()|$ y $\verb|main_f()|$.

In [None]:
fuerza = main_f('Hola Mundo!')

[ p: 229642663, q: 861739237, b: 79156836841954493 ]
Mensaje original: Hola Mundo!

Encriptado: 1934917632 16850581551 14693280768 8587340257 33554432 2706784157 21924480357 16105100000 10000000000 16850581551 39135393
Desencriptado: Hola Mundo!

Tiempo Fuerza bruta: 39.903s



In [None]:
def ganancia(fuerza, rsa):
  G = round( ( fuerza/rsa * 100 ) - 100, 3 )
  return G

G = ganancia(fuerza, rsa)
print( f'RSA ha sido un {G}% mas rapido.' )

RSA ha sido un 4265112.029% mas rapido.


Veamos la progresión del tiempo consumido por el algoritmo de fuerza bruta.




Es posible determinar la función de complejidad para las rutinas implementadas y luego contrastar su evolución conforme aumenta el tamaño de un $n$.


1. $\verb|main_rsa()|$

  Debido a que la mayor parte del trabajo de esta función está en el desencriptado y éste depende fuertemente de exp_mod() nos vamos a centrar en analizar esta función.
  Como es un función recursiva esta se puede ver por medio de un árbol de recurrencias, en el cual en cada paso (o cambio de nodo) se divide entre 2 el exp, haciendo que a lo sumo como cota superior se tenga $O(Log_2(exp))$




```
                       exp_mod(base, exp, mod)
                                 |
                --------------------------------------
                |                                     |
exp_mod(base^2 % mod, exp//2, mod)    base * exp_mod(base^2 % mod, (exp-1)//2, mod) % mod
                |                                     |
    -------------------                     -----------------------
    |                 |                     |                     |
exp_mod(...)    exp_mod(...)             exp_mod(...)        exp_mod(...)

 ```





2. $\verb|main_f()|$

  Para el caso de la función que rompe el algoritmo a fuerza, esta depende de la función factorizar() que se encarga de encontrar las llaves privadas que encajen para una desencriptación exitosa, la función se basa en un ciclo for el cual itera como máximo hasta raíz de un parámetro ingresado, por ende como cota superior $O(Sqrt(n))$

Finalmente podemos ver una demostración grafica del crecimiento de las complejidades de ambos algoritmos con el siguiente código:

In [None]:
import plotly.express as px
import numpy as np
import pandas as pd

In [None]:
x = np.arange(1, 1e4 + 1)  # Valores de n
y_log = np.log2(x)  # Complejidad O(log(n)) - RSA
y_sqrt = np.sqrt(x)  # Complejidad O(sqrt(n)) - Fuerza bruta

data = {'n': x, 'log2': y_log, 'sqrt': y_sqrt}
df = pd.DataFrame(data)

fig = px.line( template= 'plotly' ) # Layouts para personalizar los labels
fig.add_scatter(x=df['n'], y=df['sqrt'], name= '√n')
fig.add_scatter(x=df['n'], y=df['log2'], name= 'log2(n)')

fig.update_layout(xaxis_title='n', yaxis_title='Tiempo',
                  title = 'Evolución de complejidad para RSA y Fuerza bruta')

fig.show()

Nótese como, para fines demostrativos, definimos valores $p$ y $q$ de mínimo 27 bits.
Donde $\{10^8: 27\:\: bits,\: 10^9: 30\:\: bits \}$

Comercialmente se usan cifras de $1024$ bits, donde la exigencia
para los algoritmos de fuerza bruta crece abruptamente, como se aprecia en la anterior gráfica.

Descrito lo anterior, observemos cómo evoluciona el tiempo requerido para romper el cifrado en función de los bits usados para definir $p$ y $q$. Usamos hasta máximo $30$ bits ($1e^9$), pues a partir de este punto usando llaves de magnitud $1e^{10}$, el algoritmo de fuerza bruta se vuelve inviable en sistemas convencionales, superando la marca de los $60 \: min$ en compilación sin producir resultados.

| Bits | RSA [s]   | Fuerza [s]    | Ganancia   [%]    |
|------|-----------|------------|----------------|
| 7    | 0.00015   | 0.00029    | 99.35          |
| 10   | 0.00027   | 0.00102    | 280.70         |
| 14   | 0.00027   | 0.00180    | 563.04         |
| 17   | 0.00047   | 0.00952    | 1,916.61       |
| 20   | 0.00064   | 0.05759    | 8,952.89       |
| 24   | 0.00044   | 0.52682    | 120,646.39     |
| 27   | 0.00092   | 15.34951   | 1,664,339.43   |
| 30   | 0.00099   | 85.76919   | 8,685,125.64   |


In [None]:
tabla = { # No uso un .csv pues se necesitaria una copia local para correr.
    'Bits': [7, 10, 14, 17, 20, 24, 27, 30],
    'RSA': [0.00015, 0.00027, 0.00027, 0.00047, 0.00064, 0.00044, 0.00092, 0.00099],
    'Fuerza': [0.00029, 0.00102, 0.00180, 0.00952, 0.05759, 0.52682, 15.34951, 85.76919],
    'Ganancia': [99.35, 280.70, 563.04, 1916.61, 8952.89, 120646.39, 1664339.43, 8685125.64]
}
df = pd.DataFrame(tabla)

fig = px.line( template= 'plotly' ) # Layouts para personalizar los labels
fig.add_scatter(x=df['Bits'], y=df['RSA'], name= 'RSA')
fig.add_scatter(x=df['Bits'], y=df['Fuerza'], name= 'Fuerza',
                fill = 'tonexty', mode = 'lines', line_color='indigo',
                line_shape= 'spline')

fig.update_layout(xaxis_title='Bits', yaxis_title='Tiempo [s]',
                  title = 'Tiempo empleado para romper el cifrado con Fuerza bruta')

fig.show()


In [None]:
fig = px.bar( y=df['Bits'], x=df['Ganancia'] ,title = 'Ganancia de tiempo RSA contra Fuerza', orientation = 'h',text_auto=True )
fig.update_layout(xaxis_title='Ganancia [%]', yaxis_title='Bits')

fig.show()

##  Conclusiones

Para finalizar, el algoritmo RSA es una prueba indudable del potencial de las matematicas en el terreno computacional, al elevar los estandarés en terminos de eficiencia y uso de recursos computacionales. Nutriendo así el área de la algoritmia en la era de la digitalización de la información, con el objetivo de garantizar la seguridad e integridad de miles de millones de datos en una red global que crece día a día. Debido a esto, el desarrollo investigativo en este campo se convierte en una necesiadad para mejorar continuamente el potencial tecnologico, procesos de automatización, protocolos de comunicación, manipulación de grandes volumenes de datos y la optimización de todos los procesos utilizados en la encriptación de información.


## Bibliografia

* Wikipedia contributors. (2023). RSA (cryptosystem). Wikipedia. https://en.wikipedia.org/wiki/RSA_(cryptosystem)

* Rivest, R. L., Shamir, A., & Adleman, L. (1978). A method for obtaining digital signatures and public-key cryptosystems. Communications of the ACM, 21(2), 120–126. https://doi.org/10.1145/359340.359342

* Exponenciación modular rápida. (s/f). Khan Academy. Recuperado el 12 de junio de 2023, de https://es.khanacademy.org/computing/computer-science/cryptography/modarithmetic/a/fast-modular-exponentiation

* `Wikipedia contributors. (s/f). Identidad de Bézout. Wikipedia, The Free Encyclopedia. https://es.wikipedia.org/w/index.php?title=Identidad_de_B%C3%A9zout&oldid=151585578


