# Práctica 1: Criptografía clásica

## Fundamentos de Criptografía y Seguridad Informática
## UAM, 2022/2023

### Maitane Gómez González
### Ana Martínez Sabiote

El lenguaje elegido para la implementación de esta práctica ha sido Python. La memoria de la práctica y el código en Python desarrollado están contenidos en este notebook. Se entrega tanto en formato .pdf para su lectura, como el fichero .ipynb, que permite la ejecución del código en Jupyter Notebook.

## 1. Sustitución monoalfabeto

## 1.a Método afín

Para implementar el método afín, al igual que para la mayoría de los demás cifrados de la práctica, utilizamos un alfabeto formato por todos los caracteres en minúsculas y todos los caracteres en mayúsculas. Por tanto, un alfabeto de 52 elementos. Si una cadena contiene además símbolos que no están contemplados en nuestro alfabeto, éstos no se tienen en cuenta. 

Para el desarrollo de este apartado hemos implementado las siguientes funciones
- La función *algoritmo_euclides(a,b)* que calcula el máximo común divisor de los dos números pasados como parámetros de manera recursiva.
- La función *algoritmo_euclides_extendido(a,b)* que aplica el algoritmo de extendido de Euclides que hemos estudiado. Esta función recibe dos números *a* y *b* como parámetros y devuelve el máximo común divisor de ellos, *u* y *v*, los coeficientes de la Identidad de Bézout: **1=a\*u + b\*v**. Por tanto con esta función obtenemos el inverso de *a* módulo *b*, que es *u* y recíprocamente, el inverso de *b* mod *a*, que es *v*.
- La función *inverso(a,m)*, que calcula el inverso multiplicativo de *a* módulo *m* si *a* y *m* son primos relativos.


In [3]:
import gmpy2
from gmpy2 import mpz
import sympy
import numpy as np

In [4]:
def algoritmo_euclides(a,b):
    if gmpy2.t_mod(a,b) == 0:
        return b
    else:
        return algoritmo_euclides(b, gmpy2.t_mod(a,b))

In [5]:
mcd=algoritmo_euclides(39,150)
print(mcd)

3


In [6]:
algoritmo_euclides(7,15)

mpz(1)

In [7]:
def algoritmo_euclides_extendido(a,b):
    """
    # Condición a>b, sino las cambiamos
    if b>a:
        aux=a
        a=b
        b=aux
    """
    # Identidad de Bézout 1=u*a + v*b
    # El inverso de a módulo b es u. Recíprocamente, el inverso de b mod a es v
    if a==0:
        mcd=b
        u=0
        v=1
    else:
        mcd, x, y = algoritmo_euclides_extendido(gmpy2.c_mod(b,a), a)
        u=gmpy2.sub(y,(gmpy2.mul(gmpy2.c_div(b,a),x)))
        v=x
        
    return mcd, u, v

In [8]:
def inverso(a,m):
    result = algoritmo_euclides_extendido(a,m)
    # Comprobamos que el mcd es 1 para que exista inverso multiplicativo
    # En consecuencia, a y m determinan una función afín inyectiva
    if result[0] == 1:
        # Entonces devolvemos el coeficiente u (que acompaña a) de la Id. de Bézout
        inv=result[1]
        return inv
    else:
        print("Error")

In [9]:
inverso(51,23)

mpz(-9)

Las siguientes dos funciones: *read_input* y *read_output* se utilizarán a lo largo de todos los ejercicios de esta práctica para gestionar el comportamiento de entrada y salida requerido. 

- *read_input(i)* lee por la entrada estándar si el parámetro *i* es nulo. De lo contrario, abre el fichero pasado como parámetro.
- *read_output(o, cadena)* imprime el parámetro *cadena* por la entrada estándar si el parámetro *o* es nulo. De lo contrario, escribe  *cadena* en el fichero *o*, y si no existe, lo crea.

In [10]:
def read_input(i):
    # Primero tomamos el input de i o de la entrada estándar
    if i==0:
        cadena=input()
    else:
        file=open(i, "r")
        cadena=file.read()
        file.close()
    
    if len(cadena)<50:
        print("Cadena: {}".format(cadena))
    return cadena

In [11]:
def print_output(o,cadena):
    if o==0:
        print("Cadena: {}".format(cadena))
    else:
        file=open(o, "w")
        cadenaToStr = ' '.join([str(elem) for elem in cadena])
        file.write(cadenaToStr)
        file.close()

La siguiente función implementa el método afín.

La llamada a la función:

**afin {-C|-D} {-m |Zm|} {-a N×} {-b N+} [-i filein] [-o fileout]**

- -C el programa cifra
- -D el programa descifra
- -m tamaño del espacio de texto cifrado
- -a coeficiente multiplicativo de la función afín
- -b término constante de la función afín
- -i fichero de entrada
- -o fichero de salida

Como estamos trabajando con funciones de Python en celdas de Jupyter notebook, no con scripts, la llamada de la función se realiza en una celda así: afin(modo,m,a,b,i,o), indicando como modo *-C* o *-D*, *m*, *a*, *b* como enteros y *i*, *o* se introducen opcionalmente: si no se especifican, por defecto realiza la operación (entrada o salida) con la estándar y si se especifican, se trabaja con los ficheros proporcionados. 

Los parámetros *a* y *m* deben ser primos relativos, es la primera condición que verifica nuestra función. Si lo son, continúa con el algoritmo de cifrado o descifrado, según se haya especificado en la llamada. Además, *m* debe se la longitud de nuestro alfabeto.

El esquema de funcionamiento que sigue este método y los demás métodos de la práctica es:

1. Traducimos el input de caracteres a números enteros utilizando nuestro alfabeto de 52 elementos.
2. Aplicamos el mecanismo de cifrado o descifrado sobre la cadena numérica. En este caso el del cifrado afín.
3. Obtenemos una cadena cifrada numérica, que pasamos de números a caracteres usando nuestro alfabeto.


In [12]:
def afin(modo,m,a,b,i=0,o=0):
    alfabeto='abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
    if algoritmo_euclides(a,m) == 1:
        if modo=="-C":
            cadena=read_input(i)
            #Traducimos los caracteres a números
            cadena_numerica=[]
            for k in cadena:
                if k in alfabeto: 
                    cadena_numerica.append(alfabeto.index(k))
            cadena_cifrada=[]
            for k in cadena_numerica:
                cadena_cifrada.append(((a*k)+b)%m)
            
            #Traducimos la cadena_cifrada numérica a caracteres
            resul=""
            for i in range(len(cadena_cifrada)):
                   resul=resul+alfabeto[cadena_cifrada[i]]
                    
            print_output(o,resul)
            
        elif modo=="-D":
            
            cadena_cifrada=read_input(i)
            
            #Traducimos los caracteres a números
            cadena_numerica=[]
            for k in cadena_cifrada:
                if k in alfabeto: 
                    cadena_numerica.append(alfabeto.index(k))
                    
            cadena_descifrada=[]
            cadena_texto=""
            #inv=inverso(m,a)
            inv=pow(a, -1, m)
            print(inv)
            for i in range(len(cadena_numerica)):
                cadena_numerica[i]=int(cadena_numerica[i])
                
            for k in cadena_numerica:
                k_descifrado=gmpy2.c_mod(gmpy2.mul((k-b),inv),m)
                if k_descifrado<0:
                    k_descifrado=m+k_descifrado
                cadena_descifrada.append(k_descifrado)
                cadena_texto=cadena_texto+alfabeto[k_descifrado]
            
            print_output(o, cadena_texto)
    else:
        print("{} y {} no son primos relativos. Error".format(a,m))

In [13]:
afin("-C",51,23,3,"cadena.txt","cadena_cifrada.txt")

Cadena: Hola Nueva York!


In [14]:
afin("-D",51,23,3, "cadena_cifrada.txt")

Cadena: W t b d H e S B d F t L D
20
Cadena: HolaNuevaYork


In [15]:
afin("-C",130,16,27)

16 y 130 no son primos relativos. Error


In [16]:
afin("-C",51,13,0)

KeyboardInterrupt: Interrupted by user

In [33]:
afin("-D",51,13,0)

LqcsbrEcNaNGfRDqDdaNbJaNrcN
Cadena: LqcsbrEcNaNGfRDqDdaNbJaNrcN
4
Cadena: UniversidadAutonomadeMadrid


## 1.b Criptoanálisis del cifrado afín

Nuestro afin no trivial se basa en aumentar el tamaño de la clave. Hemos decidido cambiar el tamaño de la base y cifrarlo en bigramas. Lo que nos daría un espacio de 676.Con el afín normal, en nuestro caso, obteniamos uno de 52. 

Como se puede observar en la función fortaleza y en su ejecución el normal nos daría 128 claves y el no trivial 11545444563871328761349212098135488565445348609393477048015277366400000000. 



In [None]:
def fortaleza(m):
    z_m_inv=sympy.totient(m) #calculamos la funcion phi
    return gmpy2.mul((m),z_m_inv) #calculamos la fortaleza multiplicando Zm y Zm*


In [None]:
print(fortaleza(26**26+26))
#fortaleza(26) este seria el resultado si no aceptaramos mayúsculas
print(fortaleza(52))


El siguiente programa implementa el método afín no trivial.

Llamada a la función:

**afin_no_trivial {-C|-D} {-m |Zm|} {-a N×} {-b N+} [-i filein] [-o fileout]**

- -C el programa cifra
- -D el programa descifra
- -m tamaño del espacio de texto cifrado
- -a coeficiente multiplicativo de la función afín
- -b término constante de la función afín
- -i fichero de entrada
- -o fichero de salida

En este programa utilizamos un alfabeto de 26 elementos, las letras del abecedario en minúsculas


In [30]:
def afin_no_trivial(modo,m,a,b,i=0,o=0):
    alfabeto='abcdefghijklmnopqrstuvwxyz'
    digrama=([]) #generamos un vetor de di-gramas del alfabeto que hemos declarado arriba
    for k in alfabeto:
        for j in alfabeto:
            digrama.append(k+j)
    
    if algoritmo_euclides(a,m) == 1:
        if modo=="-C":
            #obtenemos el texto claro, si no se ha pasado por parámetro, se obtine de teclado
            cadena=read_input(i)

            
            #ponemos la cadena de entrada solo en caracteres de nuestro alfabeto
            cadena_formateada=""
            for k in range(len(cadena)):
                if cadena[k] in alfabeto:
                    cadena_formateada=cadena_formateada+cadena[k]
                
            #Traducimos los caracteres a números para poder operar
            cadena_numerica=[]
            j=0
            if len(cadena_formateada)%2==0:
                    while j <(len(cadena_formateada)-1):
                        cadena_numerica.append(digrama.index(cadena_formateada[j]+cadena_formateada[j+1]))
                        j=j+2
            else:
                    while j <(len(cadena_formateada)-2):
                        cadena_numerica.append(digrama.index(cadena_formateada[j]+cadena_formateada[j+1]))
                        j=j+2
                    cadena_numerica.append(alfabeto.index(cadena_formateada[len(cadena_formateada)-1])) #como es impar, la última letra la ciframos aparte
            
            #utilizamos la función de cifrado
            cadena_cifrada=[]
            for k in cadena_numerica:
                cadena_cifrada.append(((a*k)+b)%m)
            
            #pasamos el resultado a caracteres y lo guardamos como string
            resul=""
            for k in cadena_cifrada:
                resul=resul+digrama[k]
          
            #si no se ha pasado un fichero de salida por parámetro, imprimimos el resultado
            print_output(o,resul)
            
        elif modo=="-D":
            
            cadena_cifrada=read_input(i)
            #cadena_cifrada=input()
    
            cadena_descifrada=[]
            cadena_texto=""
            
             #obtenemos el texto claro, si no se ha pasado por parámetro, se obtine de teclado
            #if i==0:
             #    cadena_cifrada=input()
            #cadena=read_input(i)
            #else:
             #   file=open(i, "r")
             #   cadena_cifrada=file.read()
              #  file.close()
                
            #obtenemos el inverso en el modulo para poder utilizar la función de descifrado
            #ya hemos comprobado al principio que el inverso existe.
           
            #inv=inverso(a,m)
            inv=pow(a, -1, m)
            
            #pasamos el texto a un formato numérico para poder operar
            cadena_numerica=[]
            j=0
            if len(cadena_cifrada)%2==0:
                while j <(len(cadena_cifrada)-1):
                    cadena_numerica.append(digrama.index(cadena_cifrada[j]+cadena_cifrada[j+1]))
                    j=j+2
            else:
                while j <(len(cadena_cifrada)-2):
                    cadena_numerica.append(digrama.index(cadena_cifrada[j]+cadena_cifrada[j+1]))
                    j=j+2
                cadena_numerica.append(alfabeto.index(cadena_cifrada[len(cadena_cifrada)-1])) #como es impar, la última letra la ciframos aparte
            
            #desciframos el texto con la función de descifrado: 
            for k in cadena_numerica:
                k_descifrado=gmpy2.c_mod(gmpy2.mul((k-b),inv),m)
                if k_descifrado<0: #ajustamos el modulo
                    k_descifrado=m+k_descifrado
                cadena_descifrada.append(k_descifrado)
            
            #pasamos el texto a caracteres
            if len(cadena_cifrada)%2==0:
                for k in cadena_descifrada:
                    cadena_texto=cadena_texto+digrama[k]
            else:       
                for k in range(len(cadena_descifrada)-1):
                    cadena_texto=cadena_texto+digrama[cadena_descifrada[k]]
                    
                cadena_texto=cadena_texto+alfabeto[cadena_descifrada[(len(cadena_descifrada)-1)]]
            
            #si no se ha pasado un archivo para guardar el resultado, se imprime por pantalla
            print_output(o, cadena_texto)
    else:
        print("{} y {} no son primos relativos. Error".format(a,m))
  

In [35]:
afin_no_trivial("-C",701,23,3)

hola super nueva york
Cadena: hola super nueva york
Cadena: ltkmalzdzefiyuzhwn


In [36]:
afin_no_trivial("-D",701,23,3, "cadena_trivial.txt")

Cadena: ltkmalzdzefiyuzhwn
Cadena: holasupernuevayork


In [24]:
afin_no_trivial("-D",701,23,3, 0, "resultado_trivial.txt")

vpkmlfad
Cadena: vpkmlfad


In [37]:
afin_no_trivial("-D",701,23,3)

vpkmlfad
Cadena: vpkmlfad
Cadena: palabraa


El cifrado afin muy vulnerable a los ataques. Se rompe imediatamente con B,C,D y E. Con A hace falta un analisis de frecuencias (El análisis de frecuencia es el estudio de la frecuencia de letras o grupos
de letras en un texto cifrado).

#### Ejemplo de criptoánalisis afín

Hemos cifrado "antiaereo" con afin (modulo 51, a=13 y b=0), lo que nos ha dado la cadena "aqRcabrbD". 

En el ejemplo de abajo hemos guardado las tablas de frecuencia del castellano y el ingles y luego las hemos ordenado por mayor a menor. En este caso solo hemos utilizado la del castellano.

Hemos conseguido descifrarlo con la segunda hipotesís:
c1: la posición del elemento más utilizado de la cadena en el alfabeto.
c2: la posición del segundo elemento más utilizado de la cadena en el alfabeto.
t1: la posición del elemento más utilizado en el alfabeto.
t2: la posición del segundo elemento más utilizado en el alfabeto.

pos(c1)=pos(t1)* a+b 
pos(c2)=pos(t1)* a+b

Se puede resolver de dos formas:
1- restando las ecuaciones, lo que nos daría el resultado de: 
      pos(c1)-pos(c2)=(pos(t1)-pos(t2))* a -> 
      a=pos(c1)-pos(c2) inv((pos(t1)-pos(t2))
      b=pos(c1)-pos(t1)* a

2- Al introducir los datos conocidos, nos damos cuenta de que se puede simplificar y resolver casi directamente:
      pos(c1)=pos(t1)* a+b -> 1=4* a+b->a=1* inv(4)=13
      pos(c2)=pos(t1)* a+b -> 0=0* a+b ->b=0

En ambos casos el resultado da a=13, b=0. El cifrado esta roto.

In [40]:

alfabeto='abcdefghijklmnopqrstuvwxyz'
cadena = "aqRcabrbD"

castellano=(['a', 11.96],['b', 0.92],['c', 2.92],['d', 6.87],['e', 16.78],['f', 0.52],['g', 0.73],
           ['h', 0.89],['i', 4.15],['j', 0.3],['k', 0.0],['l', 8.37],['m', 2.12],['n', 7.01],
           ['o', 8.69],['p', 2.77],['q', 1.53],['r', 4.94],['s', 7.88],['t', 3.31],['u', 4.80],
           ['v', 0.39],['w', 0.0],['x', 0.06],['y', 1.54],['z', 0.15])

ingles=(['a', 11.96],['b', 1.54],['c', 3.06],['d', 3.99],['e', 12.51],['f', 2.30],['g', 1.96],
        ['h', 0.89],['i', 7.26],['j', 0.16],['k', 0.67],['l', 4.14],['m', 2.53],['n', 7.09],
       ['o', 7.60],['p', 2.0],['q', 0.11],['r', 6.12],['s', 6,54],['t', 9.25],['u', 2.71],
       ['v', 0.99],['w', 1.92],['x', 1.92],['y', 1.73],['z', 0.19])


castellano_ord=sorted(castellano, key=lambda letra: letra[1], reverse=True)
ingles_ord=sorted(ingles, key=lambda letra: letra[1], reverse=True)

print("Primera hipotesis:")
c1=alfabeto.index("a")
c2=alfabeto.index("b")
t1=alfabeto.index(castellano_ord[0][0])
t2=alfabeto.index(castellano_ord[1][0])

#pos(c1)=pos(t1)*a+b -> 0=4*a+b->a=-1*inv(4)
#-
#pos(c2)=pos(t1)*a+b -> 1=0*a+b ->b=1
a=1*pow(-1,-1,51)

#comprobamos que hemos resuelto bien la ecuación
#comprobamos que sean co-primos
if algoritmo_euclides(a,51)==1:
        b=c1-int(a)*t1
        if a==13 and b%51==0:
            print("es correcto, antiaereo se cifro con 13 y 0")
        else:
            print("No es correcto")
else:
    print("no son coprimos")


print("Segunda hipotesis:")
c1=alfabeto.index("b")
c2=alfabeto.index("a")
t1=alfabeto.index(castellano_ord[0][0])
t2=alfabeto.index(castellano_ord[1][0])

#pos(c1)=pos(t1)*a+b -> 1=4*a+b->a=1*inv(4)
#-
#pos(c2)=pos(t1)*a+b -> 0=0*a+b ->b=0

#pos(c1)-pos(c2)=(pos(t1)-pos(t2))*a
#0-1=(4-0)*a
#a=1*inv(4)

a=1*pow(4,-1,51)

#comprobamos que hemos resuelto bien la ecuación
#comprobamos que sean co-primos
if algoritmo_euclides(a,51)==1:
        b=c1-int(a)*t1
        if a==13 and b%51==0:
            print("Es correcto, antiaereo se cifro con 13 y 0")
        else:
            print("No es correcto")
        
else:
    print("no son coprimos")
              
    


Primera hipotesis:
No es correcto
Segunda hipotesis:
Es correcto, antiaereo se cifro con 13 y 0


## 2. Sustitución polialfabeto

## 2.a Método de Hill

El siguiente programa implementa el método hill. El cifrado Hill es de
sustitución poligráfica basado en álgebra lineal.

En este cifrado se utiliza una matriz cuadrada como clave de dimesiones n*n, tenemos que divir el texto claro (ahora numerico) en bloques de n elementos. Si la división no es exacta, se hace padding.

El requisito principal para poder cifrar y descifrar, es que la matriz tenga una función biyectiva. Si no fuera así habría que cambiar los datos ya que si lo cifráramos no podríamos descifrarlo.

Primero se asocia cada letra del alfabeto con un número. La forma más sencilla es hacerlo con la asociación natural ordenada pero se podría hacer mediante otras asociaciones.

Después, aplicamos la función de cifrado y volvemos a pasar el resultado a letras. Para descifrar el proceso es muy parecido, simplemente hay que cambiar la función de cifrado por la de descifrado. Y para ello tenemos que tener la inversa de la matriz calculada.

In [53]:
import numpy as np
import os
import math
import copy

Funcion que cálcula el determinante de una matriz.

determinante{matriz}

In [42]:
def determinante(matriz):
   
    if len(matriz)==2 and len(matriz[0])==2:
        #calculamos el determinante
        det=matriz[0][0]*matriz[1][1]-(matriz[1][0]*matriz[0][1])
       
        return det
    else:
        suma=0
        for i in range(len(matriz)): #calculamos el determinante por cofactores
            maux=copy.deepcopy(matriz)
            maux.remove(matriz[0]) #eliminamos la primera fila
            for j in range(len(maux)):
                maux[j]=maux[j][0:i]+maux[j][i+1:]
                
         
            suma= suma+ (-1)**((i+j)%2)*matriz[0][i]*determinante(maux)
            
        return suma
        

In [43]:
#comprobación de la función
matriz = [[11,8], [3,7]]
print(determinante(matriz))

53


Función que cálcula el adjunto de una matriz.

adjunto{matriz}

In [44]:
def adjunto(matriz):
    adjunto=np.zeros(np.shape(matriz))
    if len(matriz)==2 and len(matriz[0])==2:
         #calculamos el adjunto
        adjunto[0][0]=matriz[1][1]
        adjunto[0][1]=-matriz[0][1]
        adjunto[1][0]=-matriz[1][0]
        adjunto[1][1]=matriz[0][0]
        
        return adjunto
    else:
        
        for i in range(len(matriz)):
            maux=copy.deepcopy(matriz)
            for j in range(len(matriz)):
             
                maux=np.delete(matriz,i,0)
                aux=np.delete(maux,j,1)
                auxi=aux.tolist()
                #la matriz de cofactores transpuesta es el djunto
                adjunto[j][i]=(-1)**((i+j)%2)*determinante(auxi)
            
                
        return adjunto

In [45]:
#comprobación de la función
matriz = [[11,8], [3,7]]
print(adjunto(matriz))

[[ 7. -8.]
 [-3. 11.]]


Función que cálcula la inversa de una matriz.

inversa{matriz}{modulo}

In [46]:
def inversa(matriz,modulo):
    inversa=np.zeros(np.shape(matriz))
    det=determinante(matriz)%modulo
    if det !=0:
        adj=adjunto(matriz)%modulo
        for i in range(len(matriz)):
            for j in range(len(matriz[i])):
                inversa[i][j]=(adj[i][j]/det)#%modulo
                
    return inversa%modulo #esto puede que no sea necesario porque ya estamos en matemática modular

In [47]:
#comprobación de la función
matriz = [[11,8], [3,7]]
print(inversa(matriz,26))

[[ 7. 18.]
 [23. 11.]]


Función de cifrado del algoritmo.

cifrar{matriz_numerica}{matriz}{mod}{n}

Parámetros:
- matriz_numerica: el texto a cifrar en formato matriz de numeros
- matriz: matriz de transformación
- mod: modulo en el que trabajamos
- n: dimensión  

In [48]:
def cifrar(matriz_numerica, matriz,mod,n):
  
    matriz_cifrada=[]
    for i in range(len(matriz_numerica)):
        cadena_cifrada= (np.dot(matriz_numerica[i],matriz))%mod #utilizamos la función de cifrado
        matriz_cifrada.append(cadena_cifrada)

    return matriz_cifrada   

Función de descifrado del algoritmo.

descifrar{matriz_cifrada}{matriz}{mod}{n}

Parámetros:

- matriz_cifrada: el cifrado a descifrar en formato matriz de numeros
- matriz: matriz de transformación
- mod: modulo en el que trabajamos
- n: dimensión

In [49]:
def descifrar(matriz_cifrada, matriz,mod,n):
    
    inv=inversa(matriz,mod)
    matriz_descifrada=[]
    for i in range(len(matriz_cifrada)):
        cadena_descifrada= (np.dot(matriz_cifrada[i],inv))%mod #utilizamos la funcion de descifrado
        matriz_descifrada.append(cadena_descifrada)

    return matriz_descifrada 

El siguiente programa implementa el método hill.

Llamada a la función:

**hill {-C|-D} {-m |Zm|} {-n NK} {-k f ileK} [-i f ilein] [-o f ileout]**

Los parámetros introducidos en este caso son:
- m cardinalidad de Zm
- n dimensión de la matriz de transformación
- k fichero que contiene la matriz de transformación

In [52]:
def hill(modo,mod,n,k,i=0,o=0):
    alfabeto='abcdefghijklmnopqrstuvwxyz'
  
    #leemos la matriz de transformación del archivo y la guardamos
    with open(k,'r') as f:
        datos = ''.join(f.readlines()).replace('\n',';')
    matriz = np.matrix(datos).tolist()
    f.close()
    
    #cálculamos el determinante de la matriz
    det=np.linalg.det(matriz)
    #comprobamos que la matriz K tiene una función biyectiva
    if algoritmo_euclides(int(det),mod)==1:
       
        if modo=="-C":
            
            cadena=read_input(i)
            #Traducimos los caracteres a números
            cadena_numerica=[]
            for k in cadena:
                if k in alfabeto: 
                    cadena_numerica.append(alfabeto.index(k))
                    
            # Dividimos en bloques de n elementos el texto
            # Si m no es múltiplo de n se añade padding
            m=len(cadena_numerica)/n
            maxi=len(cadena_numerica)
            
            matriz_numerica=np.zeros((math.ceil(m),n))
         
            pos=0
            for i in range(math.ceil(m)):
                for j in range(n):
                    if pos<maxi:
                        matriz_numerica[i][j]=cadena_numerica[pos]
                        pos=pos+1
        
            #ciframos cadena a cadena y lo guardamos en un matriz           
            matriz_cifrada=cifrar(matriz_numerica,matriz,mod,n)
            
            #lo volvemos a pasar a caracteres
            resul=""
            for i in range(len(matriz_cifrada)):
                for j in range(len(matriz_cifrada[i])):
                    resul=resul+alfabeto[int(matriz_cifrada[i][j])]
          
            print_output(o,resul)
           
            
        elif modo=="-D":
            if i==0:
                cadena_cifrada=input()
                datos=[]
                for i in range(len(cadena_cifrada)):
                    if cadena_cifrada[i] in alfabeto:
                        datos.append(alfabeto.index(cadena_cifrada[i]))
                
                        
            else:
                file=open(i, "r")
                cadena_cifrada=file.read()
                file.close()
               
                
                datos=[]
                for i in range(len(cadena_cifrada)):
                    if cadena_cifrada[i] in alfabeto:
                        datos.append(alfabeto.index(cadena_cifrada[i]))

             
                
            # Dividimos en bloques de n elementos el texto
            # Si m no es múltiplo de n se añade padding
            m=len(datos)/n
            maxi=len(datos)
            
            matriz_cifrada=np.zeros((math.ceil(m),n))
         
            pos=0
            for i in range(math.ceil(m)):
                for j in range(n):
                    if pos<maxi:
                        matriz_cifrada[i][j]=datos[pos]
                        pos=pos+1
        
            #ciframos cadena a cadena y lo guardamos en un matriz  
            matriz_descifrada=descifrar(matriz_cifrada, matriz,mod,n)
            
            resul=""
            for i in range(len(matriz_descifrada)):
                for j in range(len(matriz_descifrada[i])):
                    
                    if matriz_descifrada[i][j]<0:
                        matriz_descifrada[i][j]=mod+matriz_descifrada[i][j]
        
                    resul=resul+alfabeto[int(matriz_descifrada[i][j])]
            
             
            print_output(o,resul)
            
    else:
        print("{} y {} no son primos relativos. Error".format(det,mod))

In [54]:
k = [[11,8], [3,7]]
hill("-D",26, 2,"matriz_k.txt","matriz_cifrada.txt" ,0)

Cadena: holaquetal


In [55]:
hill("-C",26,2, "matriz_k.txt", 0,"resulta_hill.txt" )

esta es una frase
Cadena: esta es una frase


In [56]:
hill("-D",26, 2,"matriz_k.txt","resulta_hill.txt",0)

Cadena: estaesunafrase


In [59]:
hill("-D",26,2, "matriz_k.txt" )

pyrkvkdxumxxgc
Cadena: holanuevayorka


## 2.b Método de Vigenere

El siguiente programa implementa el método de Vigenere.

Llamada a la función: 

**vigenere {-C|-D} {-k clave} [-i filein] [-o fileout]**

El parámetro *k* es cadena de caracteres usada como clave. Consideramos que la clave está formada por caracteres de nuestro alfabeto. Puede ser una frase, ya que se eliminarán los espacios. Al igual que hacemos con el input, la clave se traducirá de caracteres a números. 

Como el cifrado de Vigenere es un cifrado de bloques, entonces dividimos el input en bloques de n (longitud de la clave) elementos. Si la longitud del input no es múltiplo de la longitud de la clave, añadimos padding de ceros al final del último bloque para que todos los bloques tengan n elementos. Tras este proceso hemos obtenido una matriz de n columnas, en la que cada fila es un bloque.

Realizamos el cifrado de Vigenere a la matriz. Ciframos bloque a bloque recorriendo las filas de la matriz: al elemento i-ésimo del bloque se le suma el elemento i-ésimo de la clave y al resultado se le aplica el módulo de la longitud del alfabeto. Esta operación se realiza para cada elemento del bloque ( i de 1 a n).  Como resultado, obtenemos una matriz de bloques cifrados. A continuación concatenamos esta matriz para obtener la cadena cifrada resultante.

A la hora de descifrar, el procesamiento es el mismo pero la operación que se realiza a la hora de descifrar bloque a bloque es diferente, naturalmente. Para cada elemento i-ésimo del bloque, se resta el elemento i-ésimo de la clave y al resultado se le aplica el módulo de la longitud del alfabeto.


In [61]:
def vigenere(modo,k,i=0,o=0):
    alfabeto='abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
    base=len(alfabeto)
    
    #Traducimos la clave de caracteres a números
    k_numerica=[]
    for j in k:
        if j in alfabeto: 
            k_numerica.append(alfabeto.index(j))
    n=len(k_numerica)
    if modo=="-C":
        cadena=read_input(i)
        # Traducimos los caracteres a números
        cadena_numerica=[]
        for k in cadena:
            if k in alfabeto: 
                cadena_numerica.append(alfabeto.index(k))
        # Dividimos en bloques de n elementos el input
        # Si m no es múltiplo de n se añade padding
        m=len(cadena_numerica)/n
        maxi=len(cadena_numerica)
        matriz_numerica=np.zeros((math.ceil(m),n))
        pos=0
        for i in range(math.ceil(m)):
            for j in range(n):
                if pos<maxi:
                    matriz_numerica[i][j]=cadena_numerica[pos]
                    pos=pos+1
        # Tenemos una matriz que tenemos que cifrar. 
        # Cada bloque es una fila de la matriz
        filas=matriz_numerica.shape[0]
        elementos=matriz_numerica.shape[1]
        matriz_cifrada=np.zeros((filas,elementos))
        for i in range(filas):
            for j in range(elementos):
                matriz_cifrada[i][j]=(matriz_numerica[i][j]+k_numerica[j])%base
        
        cadena_cifrada=np.concatenate(matriz_cifrada)
        resul=""
        for i in cadena_cifrada:
            resul=resul+alfabeto[int(i)]
        print_output(o,resul)
    elif modo=="-D":
        cadena_cifrada_texto=read_input(i)
        cadena_cifrada=[]
        for k in cadena_cifrada_texto:
            if k in alfabeto: 
                cadena_cifrada.append(alfabeto.index(k))
        # Dividimos en bloques de n elementos el texto cifrado
        # Si m no es múltiplo de n se añade padding
        m=len(cadena_cifrada)/n
        maxi=len(cadena_cifrada)
        matriz_cifrada=np.zeros((math.ceil(m),n))
        pos=0
        for i in range(math.ceil(m)):
            for j in range(n):
                if pos<maxi:
                    matriz_cifrada[i][j]=cadena_cifrada[pos]
                    pos=pos+1
        # Tenemos una matriz que tenemos que descifrar. 
        # Cada bloque es una fila de la matriz
        filas=matriz_cifrada.shape[0]
        elementos=matriz_cifrada.shape[1]
        matriz_descifrada=np.zeros((filas,elementos))
        for i in range(filas):
            for j in range(elementos):
                matriz_descifrada[i][j]=(matriz_cifrada[i][j]-k_numerica[j])%base
        cadena_descifrada=np.concatenate(matriz_descifrada)
        cadena_texto=[]
        for i in range(len(cadena_descifrada)):
            cadena_texto.append(alfabeto[int(cadena_descifrada[i])])
        print_output(o,cadena_texto)

In [62]:
vigenere("-C", "clave")

Universidad Autonoma de Madrid
Cadena: Universidad Autonoma de Madrid
Cadena: WyiQitDiyefLuOspzmvhgXayvkoave


In [63]:
vigenere("-D", "clave")

WyiQitDiyefLuOspzmvhgXayvkoave
Cadena: WyiQitDiyefLuOspzmvhgXayvkoave
Cadena: ['U', 'n', 'i', 'v', 'e', 'r', 's', 'i', 'd', 'a', 'd', 'A', 'u', 't', 'o', 'n', 'o', 'm', 'a', 'd', 'e', 'M', 'a', 'd', 'r', 'i', 'd', 'a', 'a', 'a']


In [98]:
vigenere("-C", "probamos con otra clave mas larga")

Universidad Autonoma de Madrid
Cadena: Universidad Autonoma de Madrid
Cadena: jEwweDGAfoqONKopzmvhqMsorzja


In [99]:
vigenere("-D", "probamos con otra clave mas larga")

jEwweDGAfoqONKopzmvhqMsorzja
Cadena: jEwweDGAfoqONKopzmvhqMsorzja
Cadena: ['U', 'n', 'i', 'v', 'e', 'r', 's', 'i', 'd', 'a', 'd', 'A', 'u', 't', 'o', 'n', 'o', 'm', 'a', 'd', 'e', 'M', 'a', 'd', 'r', 'i', 'd', 'a']


In [None]:
vigenere("-C", "clave", "texto_vigenere.txt", "resultado_vigenere.txt")

In [None]:
vigenere("-D", "clave", "resultado_vigenere.txt", "descifrado_vigenere.txt")

También probamos el cifrado de Vigenere para cifrar el Quijote con la clave "En un lugar de la Mancha, de cuyo nombre no quiero acordarme".

In [None]:
vigenere("-C","En un lugar de la Mancha, de cuyo nombre no quiero acordarme", "quijote.txt", "quijote_cifradoVigenere.txt")

In [None]:
vigenere("-D", "En un lugar de la Mancha, de cuyo nombre no quiero acordarme", "quijote_cifradoVigenere.txt", "quijote_descifradoVigenere.txt")

## 2.c Criptoanálisis del cifrado de Vigenere

El primer paso para criptoanalizar el cifrado de vigneres es calcular el tamaño de la clave. Para ello hay dos opciones:

1-test de Kasiski: se trata de buscar repeticiones de conjuntos de caracteres en el texto y despues medir la distancia entre ellas.

2-indice de coincidencia: este índice determina la probabilidad de que dos caracteres en una cadena o en un texto sean el mismo. 

Lo más interesante a destacar del uso de este índice es que si una cadena o texto descifrado posee un IC parecido al de su idioma, significa que la clave propuesta es la original del cifrado.


El siguiente programa implementa el indice de coincidencia.

Llamada a la función: 
**IC {-l Ngrama} [-i filein] [-o fileout]**

- l longitud de n-grama buscado


El siguiente programa implementa el test de kasiski.

Llamada a la función: 
kasiski {lista}{-tam conjunto_caracteres} [-i f ilein] [-o f ileout]

-tam longitud del conjunto.

In [62]:
def test_kasiski(lista, tam, i=0, o=0):
    from collections import Counter
    
    conj_dist=[]
    conjuntos=[]
    #buscamos conjuntos que se repitan en el texto y la distancia entre ellos
    i = 0
    while i < len(lista): 
        conj= lista[i:i+3] # Cogemos al menos 3 caracteres como tamaño de la tupla
        t = len(conj)
        if t == tam: #tiene que ser t, si no estamos al final de la lista
            for j in range(i+1,len(lista)): 
                if lista[i:i+t] == lista[j:j+t]: #Si coinciden, seguimos comprobando
                    while lista[i:i+t] == lista[j:j+t]:
                        t = t + 1
                    t = t -1
                    conj = lista[i:i+t] #Ahora tenemos un conjunto que sabemos que se repite
                    conjuntos.append(conj)
                    dist = j - i #calculamos la distancia
                    conj_dist.append([conj,dist])
                    
                    j = j + t + 1
            i = i + t -3 +1
        else:
            i = i + 1
            
    #escogemos el conjunto que más se repite y buscamos el mcd de sus distancias
    #
    res=0
    cont_conj=Counter(conjuntos) #contamos las repeticiones de los conjuntos
    mas_repetido=cont_conj.most_common(1) #nos quedamos con el que más se repite
    distancias=[]
    #elejimos los 5 más repetidos
    for i in range(len(conj_dist)):
        
        if conj_dist[i][0]==mas_repetido[0][0]:
                distancias.append(conj_dist[i][1])
        
    res=mcd_lista(distancias)
                
                
    return res
    

In [64]:
#comprobación de Kasiski
lista="kceizwpsovcdmzvepdzwvlmwmpnmjinpmkitldjvxfegzgwaniuaaghcdyyilldzwrpccefzayspliaitzszpefagccgeigozamvquadqrlcdipeeyinlcgitllznqddzwgwtvfnprjcnlsoedwancrtdzercizwcwanetxanccooisnonnyrcihsrtdzttpsoeflspiuaayewciihcyatgozdjrqwdirqdegesfizvgarzwvlrjjtpcdrfzlzwwnohtcleipcoiagkwehttpsvipbuzwgaoiirprjingagitzsjipzjvhqyogssfizvglcztvlrvrvpsymepqpindogsgdbvwvlnoirlrvwcnameufentqdanmdteiiueuqmgdehivtdvipplhwjznysepnovqoegevtemvcjcjrgdtjwgpnovclamqccpvvcaoiitdegygrozrelmdrqfegzcyvpiuervwoprxifpsgsuzjjwclqpinwaostcelygllgtccexisfenircenyrznzuwpenypldzpcdtjvtpsyinllxdccdzetlgjdcbuzejzrvpnlmvrnlleehprvccbuzpnldvqcbuziplqpinmaggpaamiepvzwvtdvenzmjvqpsgeutnketpldwgydmesfeyiuoevpnxuxlcdvzggdsztqyavqkcaminnahmpzdzvcycdeaauzwvllvmolgdrcniiiplrncgyspiuaonsupcjruzlvfcpnnyeluomxprdskceixcxbdrwynpixzcvwqbuzejzrvwwneyisfiurqginxquahw"
print(test_kasiski(lista,3))

5


Función que cálcula el mcd de todos los elementos de una lista.

mcd_lista {lista}

In [61]:
def mcd_lista(lista):
    mcd=lista[0]
    for i in range(1,len(lista)):
        mcd=math.gcd(mcd,lista[i])
    return mcd

In [65]:
def calcular_divisores(n):
    lista = []
    for i in range(2,n):
        if n % i == 0:
            lista.append(i)
    return lista


INDICE DE COINCIDENCIA

En general, el algoritmo consiste en iterar varias veces en busca de un tamaño n de clave correcto para un texto que nos dan cifrado. 

Este texto se va a dividir en bloques iguales al de clave propuesta, en este caso (n). En cada iteración, y luego, se van a
coger de cada bloque los caracteres cuyas posiciones puedan coincidir con la
subclave i de esta clave de tamaño n (como se ha visto en teoría). 

Cuabdo tenemos los n vectores, cálculamos sus IC. Si utilizando el conteo de frecuencias de sus caracteres, se aproximan al IC
del idioma utilizado, esto implica que el tamaño de clave n propuesto es el correcto para la
clave original del cifrado.

Esto ocurre porque se trata de un cifrado por
desplazamiento, por lo que las frecuencias de los caracteres permanece igual en el
estado de cifrado y de descifrado. 

El siguiente programa implementa el indice de coincidencia.

Llamada a la función: 
IC {lista}{-maxi maximo de iteraciones} [-i filein] [-o fileout]


In [65]:
def IC(cadena,maxi, i=0, o=0):
    from collections import Counter
    #INFORMACIÓN SOBRE EL IC DEL CASTELLANO Y EL ÍNGLES
    castellano=(['a', 11.96],['b', 0.92],['c', 2.92],['d', 6.87],['e', 16.78],['f', 0.52],['g', 0.73],
           ['h', 0.89],['i', 4.15],['j', 0.3],['k', 0.0],['l', 8.37],['m', 2.12],['n', 7.01],
           ['o', 8.69],['p', 2.77],['q', 1.53],['r', 4.94],['s', 7.88],['t', 3.31],['u', 4.80],
           ['v', 0.39],['w', 0.0],['x', 0.06],['y', 1.54],['z', 0.15])
    
    castellano_ord=sorted(castellano, key=lambda letra: letra[1], reverse=True)
    IC_castellano=0
    for i in range(len(castellano_ord)):
        IC_castellano= IC_castellano+castellano_ord[i][1]*castellano_ord[i][1]
    print(IC_castellano)
    IC_castellano=0.083
    
    ingles=(['a', 8.04],['b', 1.54],['c', 3.06],['d', 3.99],['e', 12.51],['f', 2.30],['g', 1.96],
        ['h', 5.49],['i', 7.26],['j', 0.16],['k', 0.67],['l', 4.14],['m', 2.53],['n', 7.09],
       ['o', 7.60],['p', 2.0],['q', 0.11],['r', 6.12],['s', 6,54],['t', 9.25],['u', 2.71],
       ['v', 0.99],['w', 1.92],['x', 0.19],['y', 1.73],['z', 0.19])

    ingles_ord=sorted(ingles, key=lambda letra: letra[1], reverse=True)
    IC_ingles=0
    for i in range(len(ingles)):
        IC_ingles= IC_ingles+(ingles[i][1]*ingles[i][1])
    
    IC_aleatorio=0.038
    #probamos con 18 tamaños diferentes (ponemos un máximo para que sea mas eficiente/posible)
    sublista=[]
    tamaño_clave=0
    #n es el tamaño de la clave propuesta
    for n in range(1,maxi):
        dic=dividir_lista(n,cadena) #dividimos el texto en sublistas del tamaño de la clave propuesta
        media=0
        for j in range(len(dic)): 
            media=media+calcular_IC(dic[j])
        print(media)
        #Si n es el tamaño de bloque con el que se ha cifrado, todos estos vectores tienen estructura de lenguaje 
        #y por tanto su coincidencia es diferente al de un lenguaje aleatorio y casi la misma que la del castellano
        #en este caso
        if media>=IC_castellano-0.005:
            if media<=IC_castellano+0.005: #buscamos un resultado aproximado
                    print("coincide, el tamaño de la clave es:")
                    print(media)
                    print(n)
                    sublista=dic
                    tamaño_clave=n
                    #break
                    #break
    return sublista, tamaño_clave
    

In [74]:
lista="jkceizwpsovcdmzvepdzwvlmwmpnmjinpmkitldjvxfegzgwaniuaaghcdyyilldzwrpccefzayspliaitzszpefagccgeigozamvquadqrlcdipeeyinlcgitllznqddzwgwtvfnprjcnlsoedwancrtdzercizwcwanetxanccooisnonnyrcihsrtdzttpsoeflspiuaayewciihcyatgozdjrqwdirqdegesfizvgarzwvlrjjtpcdrfzlzwwnohtcleipcoiagkwehttpsvipbuzwgaoiirprjingagitzsjipzjvhqyogssfizvglcztvlrvrvpsymepqpindogsgdbvwvlnoirlrvwcnameufentqdanmdteiiueuqmgdehivtdvipplhwjznysepnovqoegevtemvcjcjrgdtjwgpnovclamqccpvvcaoiitdegygrozrelmdrqfegzcyvpiuervwoprxifpsgsuzjjwclqpinwaostcelygllgtccexisfenircenyrznzuwpenypldzpcdtjvtpsyinllxdccdzetlgjdcbuzejzrvpnlmvrnlleehprvccbuzpnldvqcbuziplqpinmaggpaamiepvzwvtdvenzmjvqpsgeutnketpldwgydmesfeyiuoevpnxuxlcdvzggdsztqyavqkcaminnahmpzdzvcycdeaauzwvllvmolgdrcniiiplrncgyspiuaonsupcjruzlvfcpnnyeluomxprdskceixcxbdrwynpixzcvwqbuzejzrvwwneyisfiurqginxquahwqgezrcbuzpozrjuwpcvpnlnymezykeuttjerlsjtwpsosgwdzhqpngedzcvwgwlzkcaompcdentcwdvwfpegmupnyvcfenqkceigozlvhcfnwiuzeiqkeayhgwonpcmijwawakvkpsvuwpegpcdeyecpsxyrtrtentmkmtdegsunoipcmlvrelmvrildzwwnahmulyxqqdegeopnoeadevvtlnxefppzwccspwjprhsuzsxedplgsunohsutegpqdtpzkprvrnlcpprldzpollzjknijmtpnoeomiigozalygwgmexpmjvqbuziueeiesfegpqdcjvtpdjvgdenincetetdigmqoevrufevinnuvprzrcedprqmueogekysjpgycdefplhstzppiueolygprvypaammgytzcicaitttvvhqdutsnpmvrfwuzkqarzrfprtuwplzhgydjgkpnosulzjxgdlgixydjpgaompcdcvpnpsvgqdtpqdcayeuoegeetuyeflave"
IC(lista,18)

832.3528
0.04602705524285091
0.09453937592867756
0.14165229308267158
0.19540644593902043
0.4126098133865986
0.29782867107979216
0.34319360424635365
0.4048369870571621
0.4615539028961848
0.851535970938956
0.5796271023271132
0.630081092470473
0.6535203327036564
0.7488017724724181
1.2926852797639314
0.8735378488744897
0.9185491723466407


([], 0)

Función que calcula la probabilidad de que dos caracteres de una cadena sean el mismo.

calcular_IC {lista}

In [69]:
def calcular_IC(lista):
    #print(lista)
    alfabeto='abcdefghijklmnopqrstuvwxyz'
     #esta funcion esta mal
    castellano=(['a', 11.96],['b', 0.92],['c', 2.92],['d', 6.87],['e', 16.78],['f', 0.52],['g', 0.73],
           ['h', 0.89],['i', 4.15],['j', 0.3],['k', 0.0],['l', 8.37],['m', 2.12],['n', 7.01],
           ['o', 8.69],['p', 2.77],['q', 1.53],['r', 4.94],['s', 7.88],['t', 3.31],['u', 4.80],
           ['v', 0.39],['w', 0.0],['x', 0.06],['y', 1.54],['z', 0.15])
    
    from collections import Counter
    resul_contador = Counter(lista)
    
    frecuencias=[]
    for i in range(len(alfabeto)):
        frecuencias.append(resul_contador[alfabeto[i]])
   
    n_pares_iguales=0
    for i in range(len(frecuencias)):
        n_pares_iguales=n_pares_iguales+(frecuencias[i]*frecuencias[i]-1)
         #n_pares_iguales=castellano[i][1]*castellano[i][1]
    #n_pares_letras=(len(lista)*len(lista)-1)/2
    n_pares_letras=len(lista)*(len(lista)-1)
    #frecuencias=[]
    #el número de casos posibles en los que podemos elegir dos caracteres 
    #iguales entre un total de m caracteres del alfabeto
    #for j in range(len(resul_contador)): #vamos a calcular la frecuencia de cada caracter
            #frecuencias.append(resul_contador[j])
    
    #print(resul_contador)
    #print(frecuencias)
    #castellano_ord=sorted(castellano, key=lambda letra: letra[1], reverse=True)
    IC=n_pares_iguales/n_pares_letras
    #for i in range(len(lista)):
       # for j in range(len(castellano)):
           # if lista[i]==resul_contador[j][0]:
           #     IC= IC+(resul_contador[j][1]*resul_contador[j][1])
    return IC

In [71]:
lista="kceizwpsovcdmzvepdzwvlmwmpnmjinpmkitldjvxfegzgwaniuaaghcdyyilldzwrpccefzayspliaitzszpefagccgeigozamvquadqrlcdipeeyinlcgitllznqddzwgwtvfnprjcnlsoedwancrtdzercizwcwanetxanccooisnonnyrcihsrtdzttpsoeflspiuaayewciihcyatgozdjrqwdirqdegesfizvgarzwvlrjjtpcdrfzlzwwnohtcleipcoiagkwehttpsvipbuzwgaoiirprjingagitzsjipzjvhqyogssfizvglcztvlrvrvpsymepqpindogsgdbvwvlnoirlrvwcnameufentqdanmdteiiueuqmgdehivtdvipplhwjznysepnovqoegevtemvcjcjrgdtjwgpnovclamqccpvvcaoiitdegygrozrelmdrqfegzcyvpiuervwoprxifpsgsuzjjwclqpinwaostcelygllgtccexisfenircenyrznzuwpenypldzpcdtjvtpsyinllxdccdzetlgjdcbuzejzrvpnlmvrnlleehprvccbuzpnldvqcbuziplqpinmaggpaamiepvzwvtdvenzmjvqpsgeutnketpldwgydmesfeyiuoevpnxuxlcdvzggdsztqyavqkcaminnahmpzdzvcycdeaauzwvllvmolgdrcniiiplrncgyspiuaonsupcjruzlvfcpnnyeluomxprdskceixcxbdrwynpixzcvwqbuzejzrvwwneyisfiurqginxquahwqgezrcbuzpozrjuwpcvpnlnymezykeuttjerlsjtwpsosgwdzhqpngedzcvwgwlzkcaompcdentcwdvwfpegmupnyvcfenqkceigozlvhcfnwiuzeiqkeayhgwonpcmijwawakvkpsvuwpegpcdeyecpsxyrtrtentmkmtdegsunoipcmlvrelmvrildzwwnahmulyxqqdegeopnoeadevvtlnxefppzwccspwjprhsuzsxedplgsunohsutegpqdtpzkprvrnlcpprldzpollzjknijmtpnoeomiigozalygwgmexpmjvqbuziueeiesfegpqdcjvtpdjvgdenincetetdigmqoevrufevinnuvprzrcedprqmueogekysjpgycdefplhstzppiueolygprvypaammgytzcicaitttvvhqdutsnpmvrfwuzkqarzrfprtuwplzhgydjgkpnosulzjxgdlgixydjpgaompcdcvpnpsvgqdtpqdcayeuoegeetuyeflave"
criptoanalisis_vigenere(lista, 0)

832.3528
0.04605627102141972
0.09459986749785912
0.14174499180025069
0.1955051206451844
0.4131526382955113
0.298030375827461
0.34336272707954685
0.40505358682466003
0.46195235503960336
0.8528032352855606
0.5800131737938432
0.63045338321887
0.6536155164082063
0.7489656809549646
1.2942600158892295
0.8738061489656105
0.919482310938007
puede que el tamaño escogido sea incorrecto
0
[]


Función que divide una lista siguiendo el esquema dado en clase 
para poder criptoanalizar vigenere.

dividir_lista {n}{lista}

In [67]:
def dividir_lista(n,lista): #ahora que sabemos la cardinalidad de la llave, dividimos la lista en ese modulo
    dic = {}
    for elem in range(n): #hacemos sublistas de n elementos
        dic[elem] = []
        
    i = 0
    for j in range (len(lista)):
        if i == n: #si el inidice es igual a n hemos llegado al final de la sublista
            i = 0 
        dic[i].append(lista[j])
        i = i + 1
    return dic

Esta función cálcula la clave de vigenere. Habiendo cálculado antes
el tamaño de la clave con el test de kasiski o e IC (ambas funciones
programadas al principio de este apartado).

criptoanalisis_vigenere {lista}

In [73]:
def criptoanalisis_vigenere(lista):
    maxi=18 #la cantidad de intentos que queramos que haga como maximo
    conj=3 #la longitud de los conjuntos que queremos que compruebe
    sublista,n_ic= IC(lista,maxi)
    n_kasiski=test_kasiski(lista,conj)
    if n_ic==n_kasiski:
        print("el tamaño esta comprobado")
    else:
        print("puede que el tamaño escogido sea incorrecto")
        
        
    #ya sabemos la longitud de la clave, para que sea mas exacto, puesto que dependiendo
    #de la longitud del texto el IC calculado varia bastante, podemos calcular el tamaño
    #con el test de kasiski y comprobar si son el mismo resultado
    
    #ahora que ya tenemos el tamaño de la clave, vamos a esimar la clave 
    #de cifrado
    IC_castellano=0.078
    
    clave=[]
    print(len(clave))
    for i in range(len(sublista)):
        resul_contador = Counter(cadena)
        frecuencias=[]
        for s in range(len(alfabeto)):
            frecuencias.append(resul_contador[alfabeto[s]])
        
        for j in range(len(sublista[i])):
            for k in range(len(castellano)):
                
                if sublista[i][j]==castellano[k][0]:
                    m=castellano[k][1]*((frecuencias[k]-i)/len(sublista[i]))
                    print(m/10)
                    
                    if m/10>=IC_castellano-0.005:
                        if m/10<=IC_castellano+0.005:
                            print(sublista[i])
                            print(clave)
                            clave.append(sublista[i][j])
                            break
                            break
       # print(m)           
    print(clave)
        

## 3. Cifrado de flujo

El siguiente programa implementa el cifrado de flujo.

Llamada a la función: 

**flujo {-C|-D} {-m clave} {-n tamaño de la secuencia de claves} [-i filein] [-o fileout]**

Este cifrado es parecido al cifrado de Vigenere, de hecho, hemos visto que el cifrado de Vigenere se puede entender como un caso particular del cifrado de flujo. Su parecido reside en que el cifrado se realiza elemento a elemento operando con el elemento de la clave correspondiente. La diferencia es que las claves del cifrado de flujo pertenecen a una secuencia cifrante generada de manera aleatoria. Por lo tanto, para la implementación del cifrado de flujo es necesario programar un generador de una secuencia de números aleatorios, es decir, la secuencia cifrante. Hemos realizado un cifrado síncrono de flujo ya que el flujo de claves se codifica a partir de una clave que es independiente del texto original.
Nuestro funcion *generador_aleatorio* genera la secuencia cifrante.

Para cifrar, este método toma para cada elemento, un número aleatorio de la secuencia y los opera con la aplicación XOR lógica. Obtenemos una la cadena cifrada y expresada en binario, ya que actualmente los cifrados de flujo normalmente se expresan en alfabeto binario.


La fortaleza de este cifrado depende directamente del generador de la secuencia aleatoria. En nuestro caso **FALTA**

In [None]:
import random

In [77]:
def rec_fib(n):
    if n > 1:
        return rec_fib(n-1) + rec_fib(n-2)
    return n

In [110]:
# Generador de secuencia aleatoria
def generador_aleatorio(m,cont):
    if cont==0:
        k=(rec_fib(m)%m)*m
    else:
        k=(rec_fib(m)%m)*m*cont
    return k

In [112]:
def secuencia_LFSR(m):
    random.seed(m)
    LFSR=[]
    for i in range(m):
        LFSR[i]=random.randint(0,1)
    return LFSR

In [None]:
def generador_aleatorio(LFSR,):
    new=LFSR[m]^LFSR[m-1]
    LFSR=[new,LFSR]

In [None]:
 def crearLlave(self):
        random.seed(self.semilla)

        # Caso de logitud de secuencia cifrante mayor a longitud de texto a cifrar
        llave = [int(i) for i in str(self.semilla)]
        self.lenSemilla = len(llave)

        # Generacion de valores random para secuencia cifrante
        funcionLFSR = [random.randint(0,1) for _ in range(self.lenSemilla)]

        num = len(funcionLFSR)
        start = 0

        # Calculo de cada valor restante de la llave
        while (len(llave) < self.n + self.lenSemilla):
            # Calcular suma con modulo m
            value = 0

            for i in range(num):
                value += funcionLFSR[i] * llave[i + start]

            llave.append(value % self.m)
            start += 1

        self.llave = llave[:len(llave) - self.lenSemilla]



In [111]:
# Ejemplo de secuencia cifrante de 5 elementos para clave 14
m=14
for i in range(5):
    k=generador_aleatorio(m,i)
    print(k)

182
182
364
546
728


In [80]:
# m es la clave
def flujo(modo,m,i=0,o=0):
    alfabeto='abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
    if modo=="-C":
        cadena=read_input(i)
        # Traducimos los caracteres a números
        cadena_numerica=[]
        for k in cadena:
            if k in alfabeto: 
                cadena_numerica.append(alfabeto.index(k))
        # Ciframos carácter a carácter
        cadena_cifrada=[]
        count=0
        for i in cadena_numerica:
            k=generador_aleatorio(m,count)
            cadena_cifrada.append(int(bin(i^k)[2:]))
            count=count+1
        print_output(o,cadena_cifrada)
    elif modo=="-D":
        cadena_cifrada=read_input(i)
        cadena_cifrada=cadena_cifrada.split(" ")
        cadena_descifrada=[]
        cadena_texto=[]
        for i in range(len(cadena_cifrada)):
            cadena_cifrada[i]=int(cadena_cifrada[i],2)
        count=0
        for i in cadena_cifrada:
            if count<n:
                k=generador_aleatorio(m,count)
            else:
                k=generador_aleatorio(m,count-n)
            cadena_descifrada.append((i^k))
            count=count+1
        for i in range(len(cadena_descifrada)):
            cadena_texto.append(alfabeto[int(cadena_descifrada[i])])
        print_output(o,cadena_texto)

In [81]:
flujo("-C", 4,2)

Hola
Cadena: Hola
Cadena: [100001, 10, 1011, 1100]


In [82]:
flujo("-D", 4,2)

100001 10 1011 1100
Cadena: 100001 10 1011 1100
Cadena: ['H', 'o', 'l', 'a']


In [None]:
flujo("-C", 10,20, "cadena.txt", "cadena_cifradaFlujo.txt")

In [None]:
flujo("-D", 10, 20, "cadena_cifradaFlujo.txt", "cadena_descifradaFlujo.txt")

A continuación, aplicamos el cifrado de flujo al libro del Quijote.

In [None]:
flujo("-C", 8, 500, "quijote.txt", "quijote_cifradoFlujo.txt")

In [None]:
flujo("-D", 8, 500, "quijote_cifradoFlujo.txt", "quijote_descifradoFlujo.txt")

## 4. Producto de criptosistemas de permutación

El siguiente programa implementa el cifrado producto de criptosistemas de permutación.

Llamada a la función: 

**permutacion {-C|-D} {-k1} {-k2} [-i filein] [-o fileout]**

- k1 es el vector de m elementos que constitiye la clave para el cifrado de permutación por filas.
- k2: vector de n elementos que constituye la clave para el cifrado de permutación por columnas.

Primero hacemos un procesamiento del input: formamos una matriz de dimensiones m x n, y la rellenamos fila a fila con el input. A esta matriz resultante la hemos denominado *matriz_numerica*.

A continuación realizamos el producto de criptosistemas de permutación:
1. Realizamos la permutación de filas con k1 y obtenemos *matriz_cifrada1* resultado de esta operación. Para ello, hemos ido recorriendo *matriz_cifrada1* (matriz m x n inicializada a 0) y en el elemento i,j hemos introducido el elemento de *matriz_numerica* k1[i],j (i de 1 a m, j de 1 a n) De esta manera se consigue permutar las filas según la clave k1.
2. Realizamos la permutación de columnas sobre la matriz que hemos obtenido en el paso anterior, ahora con k2 como clave. Para este paso, recorremos *matriz_cifrada2* (matriz m x n inicializada a 0) y en el elemento i,j  introducimos el elemento de *matriz_cifrada1* i,k2[j] (i de 1 a m, j de 1 a n).


Por último, concatenamos la matriz *matriz_cifrada2*, resultante de aplicar ambas permutaciones. 

Para facilitar el seguimiento del algoritmo, se han dejado habilitados los prints de la matriz obtenida tras cada paso.

In [100]:
# k1: vector de m elementos que constituye la clave para el cifrado de permutación por filas
# k2: vector de n elementos que constituye la clave para el cifrado de permutación por columnas
def permutacion(modo,k1,k2,i=0,o=0):
    alfabeto='abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
    if modo=="-C":
        cadena=read_input(i)
        # Traducimos los caracteres a números
        cadena_numerica=[]
        for k in cadena:
            if k in alfabeto: 
                cadena_numerica.append(alfabeto.index(k))

        # Matriz numerica es la matriz m x n 
        m=len(k1)
        n=len(k2)
        maxi=len(cadena_numerica)
        matriz_numerica=np.zeros((m,n))
         
        pos=0
        for i in range(m):
            for j in range(n):
                if pos<maxi:
                    matriz_numerica[i][j]=cadena_numerica[pos]
                    pos=pos+1
        print(matriz_numerica)
        
        # Cifrado de permutación por filas
        matriz_cifrada1=np.zeros((m,n))
        for i in range(m):
            for j in range(n):
                matriz_cifrada1[i][j]=matriz_numerica[k1[i]][j]
        print(matriz_cifrada1)
                
        # Cifrado de permutación por columnas
        matriz_cifrada2=np.zeros((m,n))
        for i in range(m):
            for j in range(n):
                matriz_cifrada2[i][j]=matriz_cifrada1[i][k2[j]]
                
        print(matriz_cifrada2)
        cadena_cifrada=np.concatenate(matriz_cifrada2)
        resul=""
        for i in cadena_cifrada:
            resul=resul+alfabeto[int(i)]
      
        print_output(o, resul)
    elif modo=="-D":
        cadena_cifrada_texto=read_input(i)
        cadena_cifrada=[]
        for k in cadena_cifrada_texto:
            if k in alfabeto: 
                cadena_cifrada.append(alfabeto.index(k))
        
        
         # Matriz numerica es la matriz m x n 
        m=len(k1)
        n=len(k2)
        maxi=len(cadena_cifrada)
        matriz_cifrada=np.zeros((m,n))
         
        pos=0
        for i in range(m):
            for j in range(n):
                if pos<maxi:
                    matriz_cifrada[i][j]=cadena_cifrada[pos]
                    pos=pos+1
        print(matriz_cifrada)
        
        # Desciframos cifrado de permutación por columnas
        matriz_descifrada2=np.zeros((m,n))
        for i in range(m):
            for j in range(n):
                matriz_descifrada2[i][k2[j]]=matriz_cifrada[i][j]
        
        print(matriz_descifrada2)
        
        # Desciframos cifrado de permutación por filas
        matriz_descifrada1=np.zeros((m,n))
        for i in range(m):
            for j in range(n):
                matriz_descifrada1[k1[i]][j]=matriz_descifrada2[i][j]
        print(matriz_descifrada1)
        
        cadena_descifrada=np.concatenate(matriz_descifrada1)
        cadena_texto=[]
        for i in range(len(cadena_descifrada)):
            cadena_texto.append(alfabeto[int(cadena_descifrada[i])])

        print_output(o, cadena_texto)

In [101]:
k1=[3,2,4,1,0]
k2=[1,3,2,0]
permutacion("-C", k1, k2, "cadena.txt", "cadena_cifradaPermutacion.txt")

Cadena: Hola Nueva York!
[[33. 14. 11.  0.]
 [39. 20.  4. 21.]
 [ 0. 50. 14. 17.]
 [10.  0.  0.  0.]
 [ 0.  0.  0.  0.]]
[[10.  0.  0.  0.]
 [ 0. 50. 14. 17.]
 [ 0.  0.  0.  0.]
 [39. 20.  4. 21.]
 [33. 14. 11.  0.]]
[[ 0.  0.  0. 10.]
 [50. 17. 14.  0.]
 [ 0.  0.  0.  0.]
 [20. 21.  4. 39.]
 [14.  0. 11. 33.]]


In [102]:
permutacion("-D", k1, k2, "cadena_cifradaPermutacion.txt", "cadena_descifradaPermutacion.txt")

Cadena: a a a k Y r o a a a a a u v e N o a l H
[[ 0.  0.  0. 10.]
 [50. 17. 14.  0.]
 [ 0.  0.  0.  0.]
 [20. 21.  4. 39.]
 [14.  0. 11. 33.]]
[[10.  0.  0.  0.]
 [ 0. 50. 14. 17.]
 [ 0.  0.  0.  0.]
 [39. 20.  4. 21.]
 [33. 14. 11.  0.]]
[[33. 14. 11.  0.]
 [39. 20.  4. 21.]
 [ 0. 50. 14. 17.]
 [10.  0.  0.  0.]
 [ 0.  0.  0.  0.]]


### Posible criptoanálisis del doble cifrado de permutación implementado

Bajo el modelo de seguridad que nos permita utilizar la máquina de cifrado infinitas veces para cifrar los textos que queramos, podemos romper el criptosistema mediante el ataque tipo E. con texto claro elegido. 

Primero es necesario hallar el tamaño de las claves k1 y k2. Para ello, pensamos que con una cadena de texto plano formada por bloques e ir cambiando el número de elementos del bloque
- K=1    ABCDABCDABCD
- K=2    AABBCCDD
- K=3    AAABBBCCCDDD



Ésto nos puede ayudar a entender el comportamiento del criptosistema y deducir el tamaño de las claves, ya que obtendremos una cadena cifrada con secuencias que se repiten según las claves desconocida. Una vez deducida la longitud de las claves, deberíamos interpretar el texto cifrado y deducir la permutación por columnas y despues la permutación por filas, que nos da la cadena original.  