# El algoritmo RSA

## Presentado por: Juan Andrés Gonzalez Arias



### Sobre el algoritmo...
Desarrollado en 1979 por Ron Rivest, Adi Shamir y Leonard Adleman, del Instituto Tecnológico de Massachusetts (MIT), el algoritmo RSA (nombrado así por las iniciales de los apellidos de sus creadores) es un sistema criptográfico de clave publica en el que cada usuario posee dos claves de cifrado: una pública y otra privada. Al usuario que envía el mensaje lo llamarémos emisor, y a quien lo recibe lo llamaremos receptor. 
Cuando se quiere enviar un mensaje, el emisor lo cifra con la llave pública del receptor y cuando el mensaje llega, el receptor usa su clave privada para descifrarlo.

En teoría de números, la factorización en primos consiste en la descomposición de un numero compuesto (es decir que no es primo) en divisores no triviales, que cuando se multiplican dan el número original.
Cuando el número es suficientemente grande (+200 dígitos) la factorización en primos del número excede la capacidad de la computación clasica, es decir que efectuarla se hace prácticamente imposible computacionalmente hablando. A lo anterior se le conoce como el problema de la factorización. 

La seguridad del algoritmo RSA radica en el problema de la factorización y en la dificultad computacional que este supone.

### ¿En qué consiste?

Los mensajes enviados se representan mediante números y el funcionamiento se basa en el producto de dos números primos grandes elegidos al azar (actualmente se usan primos del orden de $10^{300}$). Estos números deben permanecer en secreto ya que de conocerse publicamente su valor, el algoritmo no tendría sentido.

Inicialmente, se desea enviar un mensaje <i><b>M</b></i> en forma de un numero <i><b>m</b></i>, mediante un protocolo reversible conocido como <i><b>padding scheme</b></i>. A continuación genera el mensaje cifrado <i><b>c</b></i> mediante la siguiente operación: 

$$
    c = m^e (mod \ n)
$$
<br>
Donde <i><b>e</b></i> es el exponente de la llave pública del receptor.

Al recibir el mensaje <i><b>c</b></i>, el receptor lo descifra mediante la operación:

$$
    m = c^d (mod \ n)
$$
<br>
Donde <i><b>d</b></i> es el exponente de la clave privada del receptor.
### ¿Cómo se generan las claves?

<ol>
<li>Se eligen aleatoriamente dos números primos <i><b>p</b></i> y <i><b>q</b></i>. Estos numeors deben tener una longitud en bits parecida.</li>
<li>Se calcula $n = pq$. Este será el módulo para ambas claves.</li>
<li>Se define la función $\phi$ de Euler como $\phi(n) = (p-1)(q-1).$</li>
<li>Se escoge un entero positivo $e$ coprimo con $\phi(n)$ tal que $e<\phi(n)$. Este número será el exponente de la llave pública.</li>
<li>Usando aritmética modular, se determina $d$ como el inverso multiplicativo tal que $e \cdot d \equiv 1 \ (mod \ \phi(n))$. Este número será el exponente de la llave privada</li>
</ol>
Finalmente, se determinan las claves como la dupla $(n, \ exp)$. Donde $exp$ representa el exponente para cada una de las claves. Luego, la clave pública será $(n,e)$ y la clave privada será $(n,d)$.

### ¿Matemáticamente cómo funciona el algoritmo?

Como se expuso anteriormente, se envia un mensaje <i><b>M</b></i> en forma de un numero $m$ tal que $m<n$, mediante un protocolo reversible conocido como <i>padding scheme</i>, previamente acordado. Es necesario que $m$ y $n$ sean coprimos para que se pueda aplicar el <b>Teorema de Euler</b>.

<b>El teorema de Euler encuncia lo siguiente:</b>    
Si $a$ y $n$ son enteros primos relativos, entonces $a^{\phi(n)} \equiv 1 \ (mod\  n)$.
Donde $\phi(n)$ es la función $\phi$ de Euler.
    
<b>La Función $\phi$ de Euler:</b>
Es una función importante en teoría de números. Si $n$ es un número entero positivo, entonces $\phi(n)$ se define como el número de enteros positivos menores o iguales a $n$ y coprimos con $n$. Formalmente, se define como:

$$
    \phi(n) = |\{m \in \mathbb N| m \leq n \ \wedge mcd(m,n) = 1\}|
$$

Cuado ya temenos el mensaje $m$ como un número, obtenemos el mensaje cifrado $c$ mediante la operación:

$$
    c\equiv m^e\ (mod\ n)
$$

Se envía $c$ al receptor, quien a partir de este puede recuperar $m$ usando el exponente $d$ de su clave privada mediante la operación:

$$
    m\equiv c^d\ (mod\ n)
$$

Este procedimiento funciona debido a que

$$
    c^d = (m^e)^d\equiv m^{ed}\ (mod\ n)
$$

Esto es así porque como hemos elegido $d$ y $e$ de tal forma que $ed=1\ +\ k\phi(n)$ ($d$,$e$ son divisibles por $\phi (n)$), luego, se cumple que

$$
    m^{ed} = m^{1+k\phi(n)}\equiv m(m^{\phi(n)})^k\ \equiv m \ (mod\ n)
$$

Usando congruencias y el teorema del resto chino se puede demostrar que la ecuaciones se cumplen para todo $m$, de tal manera que se muestra que obtenemos el mensaje original:

$$
    m = c^d \ (mod\ n)
$$

### Veamos un ejemplo.

Primero generamos las claves, para esto escogemos dos números primos $p$ y $q$. En la aplicación real del algoritmo, se usan números muy grandes, pero para este ejemplo tomaremos $p = 11$ y $q = 23$.

Ahora obtenemos $n = p\cdot q = 11\cdot 23 = 253$.

Y $\phi(n) = (p-1)(q-1) = (11 - 1)\cdot(23 - 1) = 10 \cdot 22 =220$.

Para encontrar el exponente público, buscamos un numero $e$ tal que $1<e<\phi(n)$ y $MCD(\phi(n),e)=1$.
Si escogieramos aleatoriamente a e, podriamos tomar por ejemplo $e = 3$. Es trivial ver que $e$ y $\phi(n)$ son coprimos pero en la realidad, el algoritmo escoge números más grandes, por lo que para verificar que son coprimos se aplica el algoritmo de euclides. 

<ul>
<li><b>Algoritmo de euclides:</b>
    Dados  dos número enteros positivos $a$ y $b$, tales que $ a > b\geq 0$, tenemos que
   $$
    a=b\cdot q +r
    $$ Entonces   
    $$
    MCD \ (a,b)=MCD\ (b,r)
    $$
    </li>
</ul>

Hallamos MCD(3,220)
$$
    \begin{align}
    220 & = 73 \cdot 3 + 1 \\
    3 & = 3 \cdot 1 +0\\
    \end{align}
$$
Y de acuerdo al algoritmo, tomando la segunda ecuación de abajo hacia arriba, vemos que el residuo es 1, es decir que MCD ($e$ y $\phi(n)$)$=1$ por lo que concluimos que son coprimos.

Para buscar el exponente privado, debemos encontrar $d$ tal que es el inverso multiplicativo modular de $e$ modulo $\phi (n)$. Para esto, usamos el algoritmo de Euclides extendido:

Tomamos las mismas ecuaciones del algoritmo de euclides normal pero despejamos el <i>resto</i> menos la última, veamos

\begin{align}
1 &= 220 -73 \cdot 3 \\
\end{align}

Escribimos la ecuación $(1) \cdot 220 -73 \cdot 3 = 1$ (por la identidad de Benzout) como una congruencia modulo 220 para dar el inverso multiplicativo como:

$$
-73 \cdot 3 = 1 - (1) \cdot 220 
$$

Obtenemos

$$
3 \cdot (-73) \equiv 1\ (mod \ 220)
$$

Entonces vemos que $-73 + 220 = 147$ es un inverso multiplicativo de 3 modulo 220.

Luego $d = 147$.

Ya que hemos encontrado los dos exponentes para las claves, podemos enunciarlas:

<ul>
<li>La clave pública es $(e,n) = (3,253)$.</li>
<li>La clave privada es $(d,n) = (147,253)$.</li>
</ul>

Usaremos el siguiente protocolo reversible para convertir el mensaje $M$ a números:
<table style="width:30%">
<tr>
<th>A</th>
<th>B</th>
<th>C</th>
<th>D</th>
<th>E</th>
<th>F</th>
<th>G</th>
<th>H</th>
<th>I</th>
<th>J</th>
<th>K</th>
<th>L</th>
<th>M</th>
</tr> 
<tr>
<th>0</th>
<th>1</th>
<th>2</th>
<th>3</th>
<th>4</th>
<th>5</th>
<th>6</th>
<th>7</th>
<th>8</th>
<th>9</th>
<th>10</th>
<th>11</th>
<th>12</th>
</tr> 
</table>

<table style="width:30%">
<tr>
<th>N</th>
<th>O</th>
<th>P</th>
<th>Q</th>
<th>R</th>
<th>S</th>
<th>T</th>
<th>U</th>
<th>V</th>
<th>W</th>
<th>X</th>
<th>Y</th>
<th>Z</th>
</tr> 
<tr>
<th>13</th>
<th>14</th>
<th>15</th>
<th>16</th>
<th>17</th>
<th>18</th>
<th>19</th>
<th>20</th>
<th>21</th>
<th>22</th>
<th>23</th>
<th>24</th>
<th>25</th>
</tr> 
</table>
        
Vamos a cifrar el siguiente mensaje $M = $ "SEGURIDAD":
<table style="width:30%">
<tr>
<th>S</th>
<th>E</th>
<th>G</th>
<th>U</th>
<th>R</th>
<th>I</th>
<th>D</th>
<th>A</th>
<th>D</th>

</tr> 
<tr>
<th>18</th>
<th>4</th>
<th>6</th>
<th>20</th>
<th>17</th>
<th>8</th>
<th>3</th>
<th>0</th>
<th>3</th>
</tr>
</table>

Por lo que obtenemos que $m$ será el número correspondiente a cada letra que queremos enviar.

Vamos a cifrar el mensaje con la llave pública $(e,n) = (3,253)$, usando $c\equiv m^e\ (mod\ n)$:

<ul>
<li>Para "S", $m=18$:
$18^{3} = 5832 \ mod \ 253 = 13$</li>
<li>Para "E", $m=4$:
$4^{3} = 64 \ mod \ 253 = 64$</li>
<li>Para "G", $m=6$:
$6^{3} = 216 \ mod \ 253 = 216$</li>
<li>Para "U", $m=20$:
$20^{3} = 8000 \ mod \ 253 = 157$</li>
<li>Para "R", $m=17$:
$17^{3} = 4913 \ mod \ 253 = 106$</li>
<li>Para "I", $m=8$:
$8^{3} = 512 \ mod \ 253 = 6$</li>
<li>Para "D", $m=3$:
$3^{3} = 27 \ mod \ 253 = 27$</li>
<li>Para "A", $m=0$:
$0^{3} = 0 \ mod \ 253 = 0$</li>
<li>Para "D", $m=3$:
$3^{3} = 27 \ mod \ 253 = 27$</li>
</ul>
Luego $c = 13\ 64\ 216\ 157\ 106\ 6\ 27\ 0\ 27$ se envía al receptor.

Cuando el mensaje cifrado $c$ llega, se procede a descifrar usando la clave priivada $(d,n) = (147,253)$ y la operación $m = c^d (mod \ n)$.

<ul>
<li>Para, $c=13$:
$m = 13^{147} \ mod \ 253 = 18</li>
<li>Para, $c=64$:
$m = 64^{147} \ mod \ 253 = 4</li>
<li>Para, $c=216$:
$m = 216^{147} \ mod \ 253 = 6</li>
<li>Para, $c=157$:
$m = 157^{147} \ mod \ 253 = 20</li>
<li>Para, $c=106$:
$m = 106^{147} \ mod \ 253 = 17</li>
<li>Para, $c=6$:
$m = 6^{147} \ mod \ 253 = 8</li>
<li>Para, $c=27$:
$m = 27^{147} \ mod \ 253 = 3</li>
<li>Para, $c=0$:
$m = 0^{147} \ mod \ 253 = 0</li>
<li>Para, $c=27$:
$m = 27^{147} \ mod \ 253 = 3</li>
</ul>

De esta manera el receptor ha obtenido  $m = 18\ 4\ 6\ 20\ 17\ 8\ 3\ 0\ 3$. Finalmente, Aplica el protocolo reversible anteriormente explicaco y obtiene que:

$M = $ "SEGURIDAD".

De esta manera, hemos concluido este ejemplo ilustrativo.

### Implementación del algoritmo en Python.

Lo primero que tenemos que hacer es crear los dos objetos correspondientes a las claves privada y pública. Es decir, debemos crear dos clases; <i><b>clavePublica</b></i> y <i><b>clavePrivada</b></i>.

In [1]:
class clavePublica:

    def __init__(self,  modulo, exponente):
        self.modulo = modulo
        self.exponente = exponente

In [2]:
class clavePrivada:

    def __init__(self, modulo, exponente):
        self.modulo = modulo
        self.exponente = exponente

El siguiente paso, es escoger dos números primos <i><b>p</b></i> y <i><b>q</b></i> de manera aleatoria y hallar su producto <i><b>n</b></i>.

Para escoger los dos primos que necesitamos, definimos la función <i><b>fermatEsPrimo</b></i>, la cual es una implementación del test de primalidad de Fermat para verificar si un número dado es primo.

El test de primalidad de Fermat utiliza el <i><b>Pequeño teorema de Fermat</b></i>, el cual enuncia que:

"Si $p$ es un número primo, entonces, para cada número natural $a$, con $a>0$ , coprimo con $p$ , $ap-1 \equiv 1 (mod p)$ "

In [3]:
from random import randint
k = 20
def fermatEsPrimo(n, k):
    if n == 2:
        return True
    if n % 2 == 0:
        return False
    for i in range(1, k):
        a = randint(2, n-1)
        if pow(a, n-1) % n != 1:
            return False
    return True

Los parámetros para la función son <i><b>n</b></i> que representa el número al que se le quiere comprobar su primalidad, y <i><b>k</b></i> el número de veces que se desea hacer la iteración. Esto Último debido a que es probable que algún número compuesto cumpla también con el Pequeño teorema de Fermat, por lo que cuanto más veces se efectúe el test de primalidad, más probable es que se descarten dichos números compuestos.

Ahora, procedemos a definir la función <i><b>generarPrimo</b></i>, la cual recibe como parámetro la cantidad de cifras que queremos que el número generado tenga.
Esta función genera un número aleatorio y posteriormente comprueba su primalidad, si el número generado no pasa el test de Fermat (llamando a la función anterior), la iteración se repite hasta que otro número generado aleatoriamente lo pase.

In [4]:
cifras = 4

In [5]:
def generarPrimo(cifras):
    flag = False
    while not flag:
        n = randint(pow(10, cifras - 1), pow(10, cifras))
        flag = fermatEsPrimo(n,k)
    return n

Generamos entonces el primer número primo <i><b>p</b></i>:

In [6]:
p = generarPrimo(cifras)
print("p =", p)

p = 8839


Ahora generamos el segundo número primo <i><b>q</b></i>:

In [7]:
while True:
    q = generarPrimo(cifras)
    if p != q:
        break
print("q =", q)

q = 2719


Ahora hallamos <i><b>n</b></i>, que será el módulo de las claves:

In [8]:
n = p*q
print("n = ",n)

n =  24033241


Lo siguiente que tenemos que hacer es hallar $\phi(n)$:

In [9]:
phi_n = (p-1)*(q-1)
print("φ(n) = ",phi_n)

φ(n) =  24021684


Usando esta última, procedemos a calcular los exponentes de las claves.

Para hallar el exponente de la clave pública <i><b>e</b></i>, debemos generar un número que sea menor a $\phi(n)$ coprimo con este. 
Para verificar que dos números son coprimos, debemos asegurar que su $MCD = 1$, para esto, utilizaremos el algoritmo de euclides, que definiremos así:

In [10]:
def algoritmoEuclides(n1,n2):
    while n1%n2 != 0:
        n1,n2=n2,n1%n2
    return n2

Procedemos entonces a definir la función que generará a <i><b>e</b></i>:

In [11]:
def generar_e(phi_n):
    while True:
        e = randint(2, phi_n - 1)
        if algoritmoEuclides(e, phi_n) == 1:
            return e

Esta función recibe como parámetro a $\phi(n)$ ya que es con quien queremos comparar. Genera un número aleatorio entre $2$ y $\phi(n)-1$ y luego, si $MCD(e,\phi(n))=1$ retorna $e$.

Tenemos que <i><b>e</b></i> será:

In [12]:
e = generar_e(phi_n)
print("e = ",e)

e =  5454851


Ahora, vamos a generar el exponente de la clave privada <i><b>d</b></i>. Para esto, usaremos la aritmética modular para encontrar el inverso multiplicativo modular de <i><b>e</b></i>.

Esto lo harémos usando el algoritmo de euclides extendido implementado en la función <i><b>generar_d</b></i> que se define a continuación:

In [13]:
def generar_d(a,b):
 r = [a,b]
 s = [1,0] 
 t = [0,1]
 i = 1 
 q = [[]]
 while (r[i] != 0): 
  q = q + [r[i-1] // r[i]]
  r = r + [r[i-1] % r[i]]
  s = s + [s[i-1] - q[i]*s[i]]
  t = t + [t[i-1] - q[i]*t[i]]
  i = i+1
 return (s[i-1]+b)

Esta función recibe como parametros dos números $a$ y $b$ a los que les aplicará el algoritmo de euclides extendido, y retorna un inverso multiplicativo de $a$ modulo $b$. Si este es negativo, se le suma b.
En nuestro caso, $a \rightarrow e$ y $b \rightarrow \phi(n)$. Luego la función retornará el inverso multiplicativo $d$, de $e$ modulo $\phi(n)$.
Esto es:
$$
    e \cdot (d) \equiv 1\ (mod \ \phi(n))
$$
Esto es válido debido a que ya probamos que $e$ y $\phi(n)$ son coprimos.

Luego tenemos que <i><b>d</b></i> será:

In [14]:
d = generar_d(e,phi_n)
print("d = ", d)

d =  15120731


Ahora, ya que hemos encontrado los exponentes de las claves, podemos enunciarlas. Recordemos que las claves se definen por la dupla $(n, \ exp)$. Donde $exp$ representa el exponente para cada una de las claves.

La clave pública será:

In [15]:
clave_publica = clavePublica(n,e)
print("La clave pública es: (n,e) → (" + str(clave_publica.modulo) + "," + str(clave_publica.exponente) + ").")

La clave pública es: (n,e) → (24033241,5454851).


La clave privada será:

In [16]:
clave_privada = clavePrivada(n,d)
print("La clave privada es: (n,d) → (" + str(clave_privada.modulo) + "," + str(clave_privada.exponente) + ").")

La clave privada es: (n,d) → (24033241,15120731).



Ya tenemos casi todo listo para aplicar el algoritmo RSA, lo que sigue es definir el mensaje que vamos a enviar:
Sea $M = $"CRIPTOGRAFIA PARA TODES".

Definimos también el siguiente protocolo reversible para convertir el mensaje $M$ a números:
<table style="width:30%">
<tr>
<th>A</th>
<th>B</th>
<th>C</th>
<th>D</th>
<th>E</th>
<th>F</th>
<th>G</th>
<th>H</th>
<th>I</th>
<th>J</th>
<th>K</th>
<th>L</th>
<th>M</th>
</tr> 
<tr>
<th>0</th>
<th>1</th>
<th>2</th>
<th>3</th>
<th>4</th>
<th>5</th>
<th>6</th>
<th>7</th>
<th>8</th>
<th>9</th>
<th>10</th>
<th>11</th>
<th>12</th>
</tr> 
</table>

<table style="width:30%">
<tr>
<th>N</th>
<th>O</th>
<th>P</th>
<th>Q</th>
<th>R</th>
<th>S</th>
<th>T</th>
<th>U</th>
<th>V</th>
<th>W</th>
<th>X</th>
<th>Y</th>
<th>Z</th>
</tr> 
<tr>
<th>13</th>
<th>14</th>
<th>15</th>
<th>16</th>
<th>17</th>
<th>18</th>
<th>19</th>
<th>20</th>
<th>21</th>
<th>22</th>
<th>23</th>
<th>24</th>
<th>25</th>
</tr> 
</table>

El protocolo reversible anterior lo representaremos simplemente por un arreglo en que contenga cada letra (primera fila de cada tabla), y el valor (segunda fila de cada tabla) está dado por el índice que le corresponde a cada letra en el arreglo.
A continuación definimos ese arreglo y lo nombramos <i><b>tabla</b></i>:

In [17]:
tabla = ["A","B","C","D","E","F","G","H","I","J","K","L","M","N","O","P","Q","R","S","T","U","V","W","X","Y","Z",
         " ","a","b","c","d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u","v","w","x","y","z"]

Ahora instanciamos el mensaje que queremos enviar. Lo llamamos <i><b>Mensaje</b></i>:

In [18]:
Mensaje = list("CRItograAFIA PAra TOdEs")

Para aplicar el protocolo reversible establecido, definimos la función <i><b>protocoloReversible</b></i>:

In [19]:
def protocoloReversible (tabla, mensaje):
    i = 0
    encriptado = []
    for ina in mensaje:
        for ino in tabla:
            if ino == ina:
                a = tabla.index(ina)
                encriptado.append(a)
                i = i+1
    return encriptado

Esta función recibe como parametros el arreglo que llamamos <i><b>tabla</b></i>, y el arreglo que contiene el mensaje letra por letra que llamamos <i><b>Mensaje</b></i>. La función retorna <i><b>m</b></i>, que es el mensaje pero en su equivalente numérico. 

Luego, tenemos que $m$ sería:

In [20]:
m = protocoloReversible(tabla, Mensaje)   
print ("m = ", m)

m =  [2, 17, 8, 46, 41, 33, 44, 27, 0, 5, 8, 0, 26, 15, 0, 44, 27, 26, 19, 14, 30, 4, 45]


Es momento de encriptar el mensaje, para esto, vamos a usar $c\equiv m^e\ (mod\ n)$, la operación de encriptación definida para el algoritmo RSA que explicamos más arriba en este documento.

Para esto es necesaria nuestra clave pública ya definida $(n,e)$.

Definimos la función <i><b>encriptarMensaje</b></i> que hace uso del objeto creado clave pública, para efectuar la operación y obtener $c$.

In [21]:
def encriptarMensaje ():
    c = []
    for i in m:
        a = pow(i,clave_publica.exponente,clave_publica.modulo)
        c.append(a)
    return c

Luego, tenemos que $c$ sería:

In [22]:
c = encriptarMensaje ()
print ("c = ",c)

c =  [1098407, 20502119, 17880634, 14835982, 17562453, 21792763, 2196341, 21840894, 0, 4264201, 17880634, 0, 4895865, 18019950, 0, 2196341, 21840894, 4895865, 19294533, 11124768, 14696593, 5206208, 12017632]


Luego de que el emisor obtiene y envia $c$ al receptor, este último deberá aplicar $m = c^d (mod \ n)$, que es la operación de descifrado explicada más arriba en este documento.

Para esto es necesario utilizar la clave privada ya definida $(d,n)$.

Definimos la función <i><b>descencriptarMensaje</b></i> que hace uso del objeto creado clave privada, para efectuar la operación y obtener devuelta a $m$.

In [23]:
def descifrarMensaje ():
    m = []
    mensaje = ""
    for i in c:
        a = pow(i,clave_privada.exponente,clave_privada.modulo)
        m.append(a)
        
    for j in m:
        a = tabla[j]
        mensaje += a
    return mensaje

Esta función realiza la operación de descifrado antes mencionada. El resultado de esta, como ya vimos es el inverso de la operación de encriptación, por lo que devuelve y guarda dentro de un arreglo los valores numéricos $m$ del mensaje $M$. Finalmente, utiliza esos valores para revertir el <i>Protocolo Reversible</i> y retorna el mensaje original.

Por tanto, luego de aplicar la operación de descifrado y revertir el <i>Protocolo Reversible</i>, tenemos que el mensaje $M'$ obtenido es:

In [24]:
M_descifrado = descifrarMensaje()
print("El mensaje descifrado es M' = ", M_descifrado)

El mensaje descifrado es M' =  CRItograAFIA PAra TOdEs


De esta manera, hemos finalizado la implementación del Algoritmo RSA en Python y también concluimos con este trabajo ilustrativo sobre dicho algoritmo.