# Laboratorio 2022-2023

##  Sesi√≥n 20: Criptograf√≠a
El objeto de la criptograf√≠a es el de transmitir un mensaje de tal modo que si este es interceptado no se pueda leer, pero que si llega a su destino, el mensaje original se pueda recuperar. Las biyecciones, a la hora de encriptar, constituyen una buena herramienta. Si se pretende que la descodificaci√≥n (la biyecci√≥n inversa) no sea sencilla de averiguar, s√≥lo tendremos que elegir bien la biyecci√≥n directa.

**Cifrados por sustituci√≥n**

Un **cifrado por sustituci√≥n** es un m√©todo de cifrado por el que unidades del texto original son sustituidas con texto cifrado siguiendo un sistema regular; las "unidades" pueden ser una sola letra (el caso m√°s com√∫n), pares de letras, tr√≠os de letras, mezclas de lo anterior, entre otros. El receptor descifra el texto realizando la sustituci√≥n inversa.

Comp√°rese con los **cifrados por transposici√≥n**, en los que las unidades del texto original son cambiadas usando una ordenaci√≥n diferente y normalmente bastante compleja, pero las unidades en s√≠ mismas no son modificadas. Por el contrario, en un cifrado por sustituci√≥n, las unidades del texto plano mantienen el mismo orden, lo que se hace es sustituir las propias unidades del texto original.

**Sustituci√≥n simple**

En los cifrados de **sustituci√≥n simple** un car√°cter en el texto original es reemplazado por un car√°cter determinado del alfabeto de sustituci√≥n. Es decir, se establecen parejas de caracteres donde el segundo elemento de la pareja es el car√°cter que sustituye al primer elemento de la pareja.

A veces el sistema usa el mismo alfabeto para el texto en claro y para el texto cifrado. Esto permite aprovechar el orden definido por los alfabetos para as√≠ facilitar la descripci√≥n de los algoritmos.

## Cifrado de C√©sar

El ejemplo m√°s sencillo de cifrado de sustituci√≥n simple es el cifrado de C√©sar. El **cifrado C√©sar con clave $k$** utiliza $T_k(j)=(j+k)\,\mathrm{mod}\,L$, como biyecci√≥n en el conjunto de caracteres del alfabeto (estrictamente, en el conjunto de √≠ndices), siendo $L$ la longitud del alfabeto. En t√©rminos de √≠ndices, se usa la permutaci√≥n:
$$
(0,1,2,\dots,L-1)\mapsto
(k,k+1,\dots,L-1,0,1,2,\dots,k-1)
$$
As√≠, el _alfabeto de sustituci√≥n_ es simplemente una _traslaci√≥n_ (m√≥dulo la longitud del alfabeto) del _alfabeto original_.

**Ejemplo 1.** Consideremos, por defecto, la siguiente cadena
$$\verb|
alfabeto=' ABCDEFGHIJKLMN√ëOPQRSTUVWXYZabcdefghijklmn√±opqrstuvwxyz'|$$
que tiene un espacio en blanco como primer caracter. Para este primer ejemplo, tomaremos textos que contengan solo este juego de caracteres. En la siguiente celda mostramos una manera de generar el alfabeto completo, y aprovechamos para presentar algunos m√©todos aplicados a cadenas.


In [1]:
## Tratamiento de cadenas
## Ejecuta y observa

alfabeto='ABCEDFGHIJKLMN√ëOPQRSTUVWXYZ'
print(len(alfabeto))
alfabeto=' '+alfabeto+alfabeto.lower()
print(len(alfabeto))
print(alfabeto) 

27
55
 ABCEDFGHIJKLMN√ëOPQRSTUVWXYZabcedfghijklmn√±opqrstuvwxyz


La funci√≥n de Sage, $\verb|cifradoCesar|()$,  que se define en la siguiente celda, espera un $\verb|texto|$ y una $\verb|clave|$ (un entero $k$) y un $\verb|alfabeto|$, toma uno por defecto pero se puede tomar otro al usarla. La funci√≥n devuelve una cadena resultado de cambiar cada caracter en $\verb|texto|$ por el que en el $\verb|alfabeto|$ ocupa $k$ posiciones a su derecha (si el alfabeto se queda corto, se vuelve a empezar). As√≠ $\verb|cifradoCesar|(\verb|'Calzado',5|)$ devuelve $\verb|'HfpDfit'|$.

In [2]:
## Definici√≥n de la funci√≥n cifradoCesar()

def cifradoCesar(texto, clave, alfabeto=' ABCDEFGHIJKLMN√ëOPQRSTUVWXYZabcdefghijklmn√±opqrstuvwxyz'):
    textocifrado=str() # Cadena vac√≠a (tambi√©n '')
    for letra in texto:
        if letra in alfabeto: # Si el caracter est√° en alfabeto, se cambia
            letra=alfabeto[(alfabeto.index(letra)+clave)%len(alfabeto)]
        textocifrado+=letra # Se almacena en el cifrado (cambiada o tal cual)
    return textocifrado

In [3]:
# Comprobaci√≥n:

print(cifradoCesar('Calzado', 5))

HfpDfit


¬øQu√© devolver√≠a cifradoCesar('Calzado',5,'ABC')?

In [4]:
cifradoCesar('Calzado',5,'ABC')

'Balzado'

In [5]:
print(cifradoCesar('¬°Tengo sue√±o, as√≠ que me voy a echar una siesta de las grandes!',12))

¬°fpyr LDFpz ,LmD√≠LBFpLxpLG JLmLp√±smCLFymLDtpDEmLopLwmDLrCmyopD!


## Descifrar el cifrado C√©sar
Para **descifrar** un texto cifrado a la C√©sar basta conocer el n√∫mero de lugares elegidos para desplazar cada letra (la clave) y el alfabeto utilizado. As√≠ cifradoCesar('HfpDfit',-5) devolver√° 'Calzado'.

Si conocemos el alfabeto, es f√°cil averiguar la clave: _basta utilizar cifradoCesar() con el texto cifrado, el alfabeto y probar distintas claves (no m√°s de la longitud del alfabeto de ellas)'._ Este m√©todo de descifrado es lo que llamaremos **por fuerza bruta**.

**Ejemplo 2.** Vamos a averiguar por fuerza bruta el texto original que produce el guardado en la cadena $\tt texto1$ del siguiente cuadro, cifrado a la C√©sar con el juego de caracteres 'abcdefghijklmnopqrstuvwxyz' y respetando (esto es, no encriptando) espacios en blanco y signos de puntuaci√≥n.

In [10]:
##Descomenta y ejecuta
load('Cesar.py')
show(texto1)

Aplicamos nuestra funci√≥n ${\tt cifradoCesar}()$

In [11]:
abc='abcdefghijklmnopqrstuvwxyz'#alfabeto a utilizar
for k in [1..len(abc)-1]:#Posibles claves
    print(k, cifradoCesar(texto1[:25], k,abc))

1 va gnorean dhnaqb fhzhf,

2 wb hopsfbo eiobrc giaig,

3 xc ipqtgcp fjpcsd hjbjh,

4 yd jqruhdq gkqdte ikcki,

5 ze krsvier hlreuf jldlj,

6 af lstwjfs imsfvg kmemk,

7 bg mtuxkgt jntgwh lnfnl,

8 ch nuvylhu kouhxi mogom,

9 di ovwzmiv lpviyj nphpn,

10 ej pwxanjw mqwjzk oqiqo,

11 fk qxybokx nrxkal prjrp,

12 gl ryzcply osylbm qsksq,

13 hm szadqmz ptzmcn rtltr,

14 in taberna quando sumus,

15 jo ubcfsob rvboep tvnvt,

16 kp vcdgtpc swcpfq uwowu,

17 lq wdehuqd txdqgr vxpxv,

18 mr xefivre uyerhs wyqyw,

19 ns yfgjwsf vzfsit xzrzx,

20 ot zghkxtg wagtju yasay,

21 pu ahilyuh xbhukv zbtbz,

22 qv bijmzvi ycivlw acuca,

23 rw cjknawj zdjwmx bdvdb,

24 sx dklobxk aekxny cewec,

25 ty elmpcyl bflyoz dfxfd,



In [14]:
original=cifradoCesar(texto1,14,abc)
print(original)
len(alfabeto)

in taberna quando sumus,
 non curamus quid sit humus,
 sed ad ludum properamus,
 cui semper insudamus.
 quid agatur in taberna
 ubi nummus est pincerna,
 hoc est opus ut quaeratur;
 si quid loquar, audiatur.


55

In [17]:
# Comprobamos
# Si la contraclave es 14, la clave es -14, que es lo mismo que 12 en  ‚Ñ§26 (26 es la longitud del alfabeto utilizado).
cifradoCesar(original,12,abc)==texto1

True

## Otros cifrados de sustituci√≥n simple
Veamos otro ejemplo de cifrado de sustituci√≥n simple que usa el orden definido por el alfabeto para describir el algoritmo.

**Ejercicio 1. (Cifrado af√≠n)** Implementa una funci√≥n para cifrar y descifrar textos usando como clave una pareja $(a,b)$ de enteros $0\le a,b\le L$ seg√∫n la regla:
"Cambia el car√°cter de √≠ndice $j$ por el car√°cter de √≠ndice $(a*j+b)\pmod{L}$, con $L={{\tt len}}$(alfabeto).

_Nota_: Puesto que se quiere que el encriptado se pueda deshacer, ¬øqu√© parejas $(a,b)$ son aceptables como claves del cifrado?

In [18]:
def cifrado_afin(texto, a, b, alfabeto=' ABCDEFGHIJKLMN√ëOPQRSTUVWXYZabcdefghijklmn√±opqrstuvwxyz'):
    if gcd(a, len(alfabeto))!=1:        # En este caso, salimos del programa...
        print('La clave no es v√°lida')  # ...con este mensaje explicativo...
        return None                     # ... y con ning√∫n resultado.
    textocifrado=str()
    for letra in texto:
        if letra in alfabeto:           # Solo cambia si est√° en alfabeto
            letra=alfabeto[(alfabeto.index(letra)*a+b)%len(alfabeto)]  # El cambio
        textocifrado+=letra
    return textocifrado

In [19]:
a,b=17,7
original='Cifrando voy, cifrando vengo'
texto_cifrado=cifrado_afin(original,a,b)
print(texto_cifrado)
texto_descifrado=cifrado_afin(texto_cifrado, (a^(-1))%55, (-b*a^(-1))%55)
print(texto_descifrado)
original==texto_descifrado

CNQRoplVGeVa,GUNQRoplVGeAphV
Cifrando voy, cifrando vengo


True

## Cifrado de permutaci√≥n

En el cifrado de permutaci√≥n, se usa una biyecci√≥n arbitraria del conjunto de letras del alfabeto elegido.

**Ejercicio 2.-** Fijado un alfabeto, se pide crear una funci√≥n ${\tt cifradoPermutacion}()$ con dos argumentos, 
un ${\tt texto}$ y una ${\tt clave}$. Esta √∫ltima ser√° una permutaci√≥n, dada como diccionario, del conjunto de caracteres de un ${\tt alfabeto}$ previamente fijado. La funci√≥n devolver√° el texto resultado de cambiar, en ${\tt texto}$, cada letra por su imagen por la permutaci√≥n  (la ${\tt clave}$) dada. 

Recursos de ayuda: ${\tt Permutations}()$, $.{\tt random}\_{\tt element}()$ y ${\tt join}()$.

In [30]:
## Ejecuta y observa

alfabeto=' ABCDEFGHIJKLMN√ëOPQRSTUVWXYZabcdefghijklmn√±opqrstuvwxyz'
permus=Permutations(alfabeto)
perm=permus.random_element()
print(perm)
print(''.join(perm))

['Z', 'M', 'h', 'Y', 's', 'P', 'K', 'N', 'q', 'w', 'p', 'E', 'J', 'c', 'r', 'U', 'G', 'k', 'V', 'y', 'X', 't', 'I', 'O', 'R', 'a', 'u', 'd', '√±', 'l', 'A', 'z', 'm', 'v', 'B', 'f', 'e', ' ', 'C', 'L', 'x', 'W', 'Q', 'o', 'F', 'g', 'S', 'H', 'j', 'D', 'i', 'n', '√ë', 'T', 'b']
ZMhYsPKNqwpEJcrUGkVyXtIORaud√±lAzmvBfe CLxWQoFgSHjDin√ëTb


In [36]:
def cifradoPermutacion(texto, clave):
    texto_cifrado = ''
    for letra in texto:
        if letra in clave:
            letra = clave[letra]
        texto_cifrado += letra
    return texto_cifrado

Prueba tu funci√≥n ${\tt cifradoPermutacion}()$ con la cadena ${\tt ejemplar}$, que se genera al ejecutar la siguiente celda, con una permutacion, un diccionario ${\tt F}$, tomada al azar de entre las permutaciones del diccionario del alfabeto
> ' ABCDEFGHIJKLMN√ëOPQRSTUVWXYZabcdefghijklmn√±opqrstuvwxyz'

In [37]:
# Ejecuta para cargar el texto

load('novela.py')
print(len(ejemplar))
print(ejemplar[:150])

111924
LA ILUSTRE FREGONA
 
 En B√∫rgos, ciudad ilustre y famosa, no ha muchos a√±os que en ella
 vivian dos caballeros principales y ricos: el uno se llamaba 


In [43]:
def permutacion_aleatoria(A):
    # De todas las permutaciones del conjunto nos quedamos con una.
    L = Permutations(A)
    permutacion = L.random_element()
   
    # Creamos el diccionario de A en si mismo con esa permutaci√≥n.
    diccionario = dict(zip(A, permutacion))
    return diccionario

In [48]:
alfabeto = ' ABCDEFGHIJKLMN√ëOPQRSTUVWXYZabcdefghijklmn√±opqrstuvwxyz'
clave = permutacion_aleatoria(alfabeto)

texto_cifrado = cifradoPermutacion(ejemplar, clave)
print(texto_cifrado[:150])

dFbldkShoKbQoKHYcF
b
bKUba√∫n xE,bP√ëRMjMb√ë√±REGnfbwbJjpxEj,bUxbrjbpRPrxEbjuxEbzRfbfUbf√±√±j
be√ëe√ëjUbMxEbPjgj√±√±fnxEbTn√ëUP√ëTj√±fEbwbn√ëPxE:bf√±bRUxbEfb√±√±jpjgjb


Conocida la permutaci√≥n usada para encriptar (o, lo que es lo mismo, el diccionario asociado), desencriptar es tanto como construir el diccionario inverso (la *contraclave*), y aplicar de nuevo el proceso de cifrado usando esta *contraclave* como clave.

Intenta recuperar la cadena *ejemplar* original por este m√©todo.

In [50]:
contraclave=dict(zip(clave.values(),clave.keys()))
textodescifrado=cifradoPermutacion(texto_cifrado, contraclave)
print(textodescifrado[:150])

LA ILUSTRE FREGONA
 
 En B√∫rgos, ciudad ilustre y famosa, no ha muchos a√±os que en ella
 vivian dos caballeros principales y ricos: el uno se llamaba 


## Descifrado del cifrado de permutaci√≥n. An√°lisis de frecuencias

Intentar descifrar por fuerza bruta un texto cifrado por un cifrado de permutaci√≥n no parece una opci√≥n muy sensata: ¬øcu√°ntas claves posibles hay cuando se usa el alfabeto que has usado en el ejercicio anterior?



In [51]:
# Ejecuta

alfabeto=' ABCDEFGHIJKLMN√ëOPQRSTUVWXYZabcdefghijklmn√±opqrstuvwxyz'
print(len(alfabeto))
print(factorial(len(alfabeto)))

55
12696403353658275925965100847566516959580321051449436762275840000000000000


Sin embargo, una idea ingeniosa empieza por hacer un _an√°lisis de frecuencias_, especialmente √∫til si el texto codificado es suficientemente largo (o si tenemos varios textos que sabemos que han sido codificados por el mismo m√©todo). 

La idea es comparar las frecuencias de aparici√≥n de los caracteres del texto codificado (frecuencia=n√∫mero de repeticiones de dicho car√°cter) con un modelo de las frecuencias que los caracteres suelen presentar en los textos del idioma en el que se sospecha est√° escrito el mensaje original. Se apuesta a que el car√°cter m√°s frecuente del texto encriptado
est√° sustituyendo al car√°cter que es habitualmente el m√°s frecuente en ese idioma, que el segundo car√°cter m√°s frecuente del texto encriptado est√© sustituyendo al que es habitualmente el segundo car√°cter m√°s frecuente, etc√©tera. Obviamente, para que esto est√© cerca de ser verdad se necesita que el texto sea muy largo, para que haya esperanza de que las frecuencias del texto sean un reflejo de las frecuencias protot√≠picas.

Antes de realizar esta tarea, entrenemos las herramientas necesarias para el an√°lisis de frecuencias para cadenas de caracteres.

**Ejercicio 3.**
a) Escribe una funci√≥n ${\tt Frecuencias}\_{\tt texto}()$, que a partir de un ${\tt texto}$  y un ${\tt alfabeto}$ nos devuelva una lista (o un diccionario) de pares $({\tt caracter, frecuencia})$ para cada ${\tt caracter}$ del ${\tt alfabeto}$ (poner uno por defecto en la definici√≥n). La funci√≥n no debe tomar como distintos el mismo car√°cter en may√∫sculas o en min√∫sculas ($.{\tt upper}()$ o $.{\tt lower}()$ pueden ser √∫tiles).


In [52]:
##funci√≥n Frecuencias_texto (utilizando el m√©todo .count())
def Frecuencias_texto(texto, alfabeto='ABCDEFGHIJKLMN√ëOPQRSTUVWXYZ'):
    diccio=dict()
    textomay=texto.upper()
    for letra in alfabeto:
        diccio[letra]=textomay.count(letra)
    return diccio

In [53]:
print(Frecuencias_texto('kwjherrrrJAa'))

{'A': 2, 'B': 0, 'C': 0, 'D': 0, 'E': 1, 'F': 0, 'G': 0, 'H': 1, 'I': 0, 'J': 2, 'K': 1, 'L': 0, 'M': 0, 'N': 0, '√ë': 0, 'O': 0, 'P': 0, 'Q': 0, 'R': 4, 'S': 0, 'T': 0, 'U': 0, 'V': 0, 'W': 1, 'X': 0, 'Y': 0, 'Z': 0}


In [54]:
## funci√≥n Frecuencias_texto (sin utilizar el m√©todo .count(), no se necesita un alfabeto)

def Frecuencias_texto(texto):
    diccio=dict()
    textomay=texto.upper()
    for letra in textomay:
        if letra not in diccio:
            diccio[letra]=0
        diccio[letra]+=1
    return diccio

In [55]:
print(Frecuencias_texto('kwjherrrrJAa'))

{'K': 1, 'W': 1, 'J': 2, 'H': 1, 'E': 1, 'R': 4, 'A': 2}


b) Utiliza la funci√≥n del apartado anterior con alg√∫n texto suficientemente largo (por ejemplo, el del ejercicio anterior), y ordena las parejas $({\tt caracter, frecuencia})$ de mayor a menor por las frecuencias. 


In [56]:
print(Frecuencias_texto(ejemplar))

{'L': 4928, 'A': 10337, ' ': 21335, 'I': 4204, 'U': 4098, 'S': 6543, 'T': 2982, 'R': 5228, 'E': 11215, 'F': 378, 'G': 994, 'O': 7777, 'N': 5351, '\n': 2145, 'B': 1219, '√ö': 54, ',': 1951, 'C': 3070, 'D': 4569, 'Y': 1167, 'M': 2273, 'H': 1081, '√ë': 265, 'Q': 1549, 'V': 920, 'P': 1941, ':': 231, '.': 480, 'Z': 431, 'J': 496, '√Å': 837, '√ì': 544, '√â': 454, '√ç': 238, ';': 162, '¬°': 17, '!': 17, '√ú': 28, '_': 18, '√Ü': 1, '¬´': 2, '-': 292, '¬ª': 2, '¬ø': 44, '?': 44, '(': 6, ')': 6}


In [57]:
frecs=Frecuencias_texto(ejemplar)
listafrec=[(frecs[k], k) for k in frecs.keys()]
listafrec.sort(reverse=true)
print(listafrec)

[(21335, ' '), (11215, 'E'), (10337, 'A'), (7777, 'O'), (6543, 'S'), (5351, 'N'), (5228, 'R'), (4928, 'L'), (4569, 'D'), (4204, 'I'), (4098, 'U'), (3070, 'C'), (2982, 'T'), (2273, 'M'), (2145, '\n'), (1951, ','), (1941, 'P'), (1549, 'Q'), (1219, 'B'), (1167, 'Y'), (1081, 'H'), (994, 'G'), (920, 'V'), (837, '√Å'), (544, '√ì'), (496, 'J'), (480, '.'), (454, '√â'), (431, 'Z'), (378, 'F'), (292, '-'), (265, '√ë'), (238, '√ç'), (231, ':'), (162, ';'), (54, '√ö'), (44, '¬ø'), (44, '?'), (28, '√ú'), (18, '_'), (17, '¬°'), (17, '!'), (6, ')'), (6, '('), (2, '¬ª'), (2, '¬´'), (1, '√Ü')]


In [58]:
''.join([letra for frec,letra in listafrec])

' EAOSNRLDIUCTM\n,PQBYHGV√Å√ìJ.√âZF-√ë√ç:;√ö¬ø?√ú_¬°!)(¬ª¬´√Ü'

c) Compara si los $6$ caracteres m√°s frecuentes del texto coinciden con el modelo de frecuencias de un texto t√≠pico en espa√±ol (para saber cu√°les son, puedes consultar la entrada sobre [Frecuencia de aparici√≥n de letras](https://es.wikipedia.org/wiki/Frecuencia_de_aparici%C3%B3n_de_letras) de la Wikipedia). 


In [59]:
sumatotal=sum([listafrec[k][0] for k in xsrange(len(listafrec))])
sumatotal

111924

In [60]:
for k in xsrange(1,7):
    #print listafrec[k][0]
    print(listafrec[k][1],  (listafrec[k][0]*100/sumatotal).n(digits=3))

E 10.0
A 9.24
O 6.95
S 5.85
N 4.78
R 4.67


**Observaci√≥n importante** 

El objetivo del an√°lisis de frecuencias que acabamos de hacer era estudiar qu√© letras se usan m√°s en castellano. Por esa raz√≥n no hemos distinguido entre may√∫sculas y min√∫sculas. Pero al hacer un an√°lisis de frecuencias en un texto encriptado, *s√≠* que hay que hacer la distinci√≥n, porque en general las versiones may√∫scula y min√∫scula de una letra no se van a codificar con la misma letra. Para textos largos la proporci√≥n de may√∫sculas no es relevante, con lo que el _ranking_ de frecuencias no variar√° significativamente. Implementa $\texttt{Frecuencias$\_$texto}()$ para que s√≠ distinga entre may√∫sculas y min√∫sculas.

In [61]:
def Frecuencias_texto(texto):
    diccio=dict()
    for letra in texto:
        if letra not in diccio:
            diccio[letra]=0
        diccio[letra]+=1
    return diccio

print(Frecuencias_texto('kwjherrrrJAa'))

{'k': 1, 'w': 1, 'j': 1, 'h': 1, 'e': 1, 'r': 4, 'J': 1, 'A': 1, 'a': 1}


**Ejercicio 4.** Hemos interceptado cierto texto, cifrado mediante un m√©todo de sustituci√≥n simple (aparece en la siguiente celda de c√≥digo). Sabemos que el texto original estaba escrito en espa√±ol, todo en letras may√∫sculas y solo se han sustituido las letras. Intentar averiguar el texto original usando un an√°lisis de frecuencias. Las frecuencias con las que suelen aparecer las distintas letras del alfabeto en textos escritos en espa√±ol se puede consultar por ejemplo en: 

[Frecuencia de aparici√≥n de letras](https://es.wikipedia.org/wiki/Frecuencia_de_aparici√≥n_de_letras)

_Nota_: al evaluar la siguiente casilla quedar√° guardado el texto interceptado en la variable encriptado (una cadena larga de caracteres).

In [84]:
## Ejecuta para cargar el texto cifrado

load('Secreto.py')
print(len(encriptado))
print(encriptado[:200])

24065
EQLMXL LJ OK JILSOK  LJ OK ZVYQMIAKA VZJZ LO XIESML AL QJ XLOLHZJZ. ALVGQLV AL FQL TQSZ VZJKAZ XMLV ULYLV, VL ZRZ LO YTIMMIAZ AL OZV EQLOOLV AL QJK YKEK; QJZV ALAZV GKOGKMZJ VZSML OK EKALMK, KOPZ GLFQ


In [85]:
modelo=', E, A, O, S, R, N, I, D, L, C, T, U, M, P, B, G, V, Y, Q, H, F, Z, J, √ë, X, K, W'
Lmodelo=modelo.split(', ')
print(Lmodelo)
modelo=''.join(Lmodelo)
modelo

['', 'E', 'A', 'O', 'S', 'R', 'N', 'I', 'D', 'L', 'C', 'T', 'U', 'M', 'P', 'B', 'G', 'V', 'Y', 'Q', 'H', 'F', 'Z', 'J', '√ë', 'X', 'K', 'W']


'EAOSRNIDLCTUMPBGVYQHFZJ√ëXKW'

### **Propuesta de estrategia para descifrar**

La idea es seguir los pasos siguientes:

- Queremos descifrar el texto, hallando la contraclave, que es la biyecci√≥n inversa a la que est√° dada por la permutaci√≥n que se us√≥ para cifrar (que es desconocida para nosotros).

*Paso 1*.- Crea una biyecci√≥n que asocie a la lista de caracteres que aparecen en el texto cifrado, ordenados de mayor a menor frecuencia, la lista de caracteres ordenada seg√∫n son las frecuencias t√≠picas de los textos en castellano (aqu√≠ te ser√° √∫til el apartado anterior para ordenar los caracteres seg√∫n  su frecuencia en tu texto, y tendr√°s que consultar de nuevo la referencia sobre [Frecuencia de letras](https://es.wikipedia.org/wiki/Frecuencia_de_aparici√≥n_de_letras)). Llama a esta biyecci√≥n (es decir, al correspondiente diccionario) *contraclave*.

Si diera la inmensa casualidad de que el texto que estamos descifrando reflejase exactamente las frecuencias de la Wikipedia, aplicando un cifrado de permutaci√≥n a *encriptado* usando *contraclave* como clave tendr√≠amos un *textomejor* totalmente legible, que ser√≠a ya el texto descifrado. 

*Paso 2*.- En la pr√°ctica es casi imposible haber tenido tanta suerte, pero el *textomejor* obtenido ya empezar√° a ser un poco legible (te aconsejo que, como el texto es muy largo, inspecciones siempre solamente un trozo de √©l). De aqu√≠ en adelante lo que vamos a hacer es inspeccionar *textomejor* (que est√° "a medio descifrar") para intentar adivinar una sustituci√≥n concreta de una letra por otra que nos parezca que vaya desencriptando a√∫n m√°s el texto.

Conviene escribir una funci√≥n cambio(letra1, letra2, alfabeto), que produzca un diccionario que intercambia letra1 y letra2 pero deja el resto de letras del alfabeto sin cambiar.

*Paso 3*.- Mira el fragmento inicial de *textomejor* para decidir qu√© letra1 y letra2 vas a intercambiar (las palabras peque√±as suelen dar buenas pistas). Puedes aplicar el cifrado de permutaci√≥n con clave cambio a *textomejor* o, mejor a√∫n, aplicar la composici√≥n de contraclave con cambio a *encriptado* (puedes llamar a esa composici√≥n de nuevo contraclave, pues es tu segunda apuesta sobre cu√°l es la contraclave real). Puedes llamar al texto resultante de nuevo textomejor.

*Paso 4*.- Itera el proceso hasta que llegue un momento en que textomejor sea el texto real, totalmente legible, que hab√≠a sido codificado. En ese instante, si has ido modificando el diccionario contraclave componiendo con los sucesivos "cambios" de pares de letras, contraclave tendr√° ciertamente el diccionario inverso a la clave que se emple√≥ para cifrar. Habr√°s terminado el hackeo.

Idea: para asegurarnos de que todas las letras han vuelto a su estado original (contraclave est√° completa), podemos mirar sobre la primera parte del texto que contenga, al menos una vez, todos y cada uno de los caracteres que aparecen.


In [86]:
#Paso 1
frecs=Frecuencias_texto(encriptado)
listafrec=[(frecs[k], k) for k in frecs.keys()]
listafrec.sort(reverse=true)
print(listafrec)

[(4485, ' '), (2419, 'L'), (2312, 'K'), (1895, 'Z'), (1327, 'V'), (1169, 'O'), (1167, 'J'), (1098, 'M'), (1038, 'I'), (1000, 'A'), (850, 'X'), (819, 'Q'), (671, 'Y'), (506, 'E'), (457, 'G'), (388, 'S'), (343, '.'), (268, ','), (257, 'R'), (234, 'T'), (219, 'U'), (213, 'P'), (199, '‚Äî'), (186, 'F'), (152, 'D'), (87, 'N'), (75, 'H'), (49, '¬ø'), (49, '?'), (31, '√ë'), (29, ':'), (20, 'W'), (10, '¬°'), (10, '!'), (6, 'B'), (5, 'C'), (4, '¬ª'), (4, '¬´'), (4, ';'), (3, '-'), (2, '0'), (1, '√ö'), (1, '8'), (1, '5'), (1, '4'), (1, '3')]


In [87]:
#Solo interesan los caracteres que se encriptaron
listafrec=[(frec,car) for frec,car in listafrec if car in 'ABCDEFGHIJKLMN√ëOPQRSTUVWXYZ']
print(listafrec)

[(2419, 'L'), (2312, 'K'), (1895, 'Z'), (1327, 'V'), (1169, 'O'), (1167, 'J'), (1098, 'M'), (1038, 'I'), (1000, 'A'), (850, 'X'), (819, 'Q'), (671, 'Y'), (506, 'E'), (457, 'G'), (388, 'S'), (257, 'R'), (234, 'T'), (219, 'U'), (213, 'P'), (186, 'F'), (152, 'D'), (87, 'N'), (75, 'H'), (31, '√ë'), (20, 'W'), (6, 'B'), (5, 'C')]


In [67]:
# Del r√°nking de frecuencias que aparece en el texto encriptado, si el texto original se ajustase a un texto prototipo, 
# la permutaci√≥n utilizada habr√≠a convertido el modelo:
# ùô¥ùô∞ùôæùöÇùöÅùôΩùô∏ùô≥ùôªùô≤ùöÉùöÑùôºùôøùô±ùô∂ùöÖùöàùöÄùô∑ùôµùöâùôπ√ëùöáùô∫ùöÜ
# en la cadena  ùöíùöñùöäùöêùöéùöó que otenemos en la siguiente celda:

In [88]:
imagen=''
for k in xsrange(len(listafrec)):
    imagen+=listafrec[k][1]
print(imagen)

LKZVOJMIAXQYEGSRTUPFDNH√ëWBC


In [89]:
# Empezamos as√≠ nuestro descifrado utilizando el siguiente diccionario  ùöåùöòùöóùöùùöõùöäùöåùöïùöäùöüùöé, que revierte la permutaci√≥n  ùöåùöïùöäùöüùöé
# suponiendo que el texto original se ajustaba al modelo de frecuencias.

contraclave=dict(zip(imagen,'EAOSRNIDLCTUMPBGVYQHFZJ√ëXKW'))
print(contraclave)
original='EAOSRNIDLCTUMPBGVYQHFZJ√ëXKW'
print(len(original)==len(contraclave))
print(len(original)==len(imagen))

{'L': 'E', 'K': 'A', 'Z': 'O', 'V': 'S', 'O': 'R', 'J': 'N', 'M': 'I', 'I': 'D', 'A': 'L', 'X': 'C', 'Q': 'T', 'Y': 'U', 'E': 'M', 'G': 'P', 'S': 'B', 'R': 'G', 'T': 'V', 'U': 'Y', 'P': 'Q', 'F': 'H', 'D': 'F', 'N': 'Z', 'H': 'J', '√ë': '√ë', 'W': 'X', 'B': 'K', 'C': 'W'}
True
True


In [90]:
#Recuperamos aqu√≠ el c√≥digo para cifrar con una permutaci√≥n
def cifradoPermutacion(texto, clave):
    textocifrado=''
    for letra in texto:
        if letra in clave:
            letra=clave[letra]
        textocifrado+=letra
    return textocifrado

In [91]:
#El espacio en blanco no se ha cifrado: alfabeto de letras may√∫sculas
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:200]

'MTEICE EN RA NDEBRA  EN RA OSUTIDLAL SONO ER CDMBIE LE TN CEREJONO. LESPTES LE HTE VTBO SONALO CIES YEUES, SE OGO ER UVDIIDLO LE ROS MTERRES LE TNA UAMA; TNOS LELOS PARPAION SOBIE RA MALEIA, ARQO PEHT'

In [75]:
# En el primer intento vemos que algunas de las frecuencias de las letras en el original no siguieron el modelo. Por ejemplo, la s√≠laba 'RA' 
# parece m√°s razonable pensar que fuese 'LA', con lo que podemos pensar que 'R' y 'L' cambiaron su posici√≥n respecto al modelo. 
# En lo que sigue vamos a ir intercambiando, seg√∫n veamos viendo el resultado, dos caracteres en la cadena  ùöòùöõùöíùöêùöíùöóùöäùöï,
# hasta que averig√ºemos el r√°nking real del texto original. Como el prop√≥sito final es el de descrifrar el texto encriptado, nuestro c√≥digo 
# fabrica una nueva  ùöåùöòùöóùöùùöõùöäùöåùöïùöäùöüùöé a partir de la anterior y las letras que hemos visto est√°n intercambiadas. As√≠ su uso ser√°:
# ùöåùöòùöóùöùùöõùöäùöåùöïùöäùöüùöé=ùöåùöäùöñùöãùöíùöò(ùöïùöéùöùùöõùöäùü∑,ùöïùöéùöùùöõùöäùü∏,ùöåùöòùöóùöùùöõùöäùöåùöïùöäùöüùöé)

In [92]:
contraclave.keys()

dict_keys(['L', 'K', 'Z', 'V', 'O', 'J', 'M', 'I', 'A', 'X', 'Q', 'Y', 'E', 'G', 'S', 'R', 'T', 'U', 'P', 'F', 'D', 'N', 'H', '√ë', 'W', 'B', 'C'])

In [93]:
def cambio(letra1,letra2,contraclave):
    clave=dict([(v,k) for k,v in contraclave.items()])
    contraclave[clave[letra1]]=letra2
    contraclave[clave[letra2]]=letra1
    return contraclave

In [94]:
#paso 3
contraclave=cambio('R','L',contraclave)
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:200]

'MTEICE EN LA NDEBLA  EN LA OSUTIDRAR SONO EL CDMBIE RE TN CELEJONO. RESPTES RE HTE VTBO SONARO CIES YEUES, SE OGO EL UVDIIDRO RE LOS MTELLES RE TNA UAMA; TNOS REROS PALPAION SOBIE LA MAREIA, ALQO PEHT'

In [95]:
#paso 4: voy haciendo cambios
contraclave=cambio('D','I',contraclave)
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:200]


'MTEDCE EN LA NIEBLA  EN LA OSUTDIRAR SONO EL CIMBDE RE TN CELEJONO. RESPTES RE HTE VTBO SONARO CDES YEUES, SE OGO EL UVIDDIRO RE LOS MTELLES RE TNA UAMA; TNOS REROS PALPADON SOBDE LA MAREDA, ALQO PEHT'

In [96]:
contraclave=cambio('R','D',contraclave)
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:200]

'MTERCE EN LA NIEBLA  EN LA OSUTRIDAD SONO EL CIMBRE DE TN CELEJONO. DESPTES DE HTE VTBO SONADO CRES YEUES, SE OGO EL UVIRRIDO DE LOS MTELLES DE TNA UAMA; TNOS DEDOS PALPARON SOBRE LA MADERA, ALQO PEHT'

In [97]:
contraclave=cambio('C','T',contraclave)
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:200]

'MCERTE EN LA NIEBLA  EN LA OSUCRIDAD SONO EL TIMBRE DE CN TELEJONO. DESPCES DE HCE VCBO SONADO TRES YEUES, SE OGO EL UVIRRIDO DE LOS MCELLES DE CNA UAMA; CNOS DEDOS PALPARON SOBRE LA MADERA, ALQO PEHC'

In [98]:
contraclave=cambio('C','U',contraclave)
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:200]

'MUERTE EN LA NIEBLA  EN LA OSCURIDAD SONO EL TIMBRE DE UN TELEJONO. DESPUES DE HUE VUBO SONADO TRES YECES, SE OGO EL CVIRRIDO DE LOS MUELLES DE UNA CAMA; UNOS DEDOS PALPARON SOBRE LA MADERA, ALQO PEHU'

In [99]:
contraclave=cambio('J','F',contraclave)
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:200]

'MUERTE EN LA NIEBLA  EN LA OSCURIDAD SONO EL TIMBRE DE UN TELEFONO. DESPUES DE HUE VUBO SONADO TRES YECES, SE OGO EL CVIRRIDO DE LOS MUELLES DE UNA CAMA; UNOS DEDOS PALPARON SOBRE LA MADERA, ALQO PEHU'

In [100]:
contraclave=cambio('H','Q',contraclave)
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:200]

'MUERTE EN LA NIEBLA  EN LA OSCURIDAD SONO EL TIMBRE DE UN TELEFONO. DESPUES DE QUE VUBO SONADO TRES YECES, SE OGO EL CVIRRIDO DE LOS MUELLES DE UNA CAMA; UNOS DEDOS PALPARON SOBRE LA MADERA, ALHO PEQU'

In [101]:
contraclave=cambio('Y','V',contraclave)
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:200]

'MUERTE EN LA NIEBLA  EN LA OSCURIDAD SONO EL TIMBRE DE UN TELEFONO. DESPUES DE QUE YUBO SONADO TRES VECES, SE OGO EL CYIRRIDO DE LOS MUELLES DE UNA CAMA; UNOS DEDOS PALPARON SOBRE LA MADERA, ALHO PEQU'

In [102]:
textomejor[:300]

'MUERTE EN LA NIEBLA  EN LA OSCURIDAD SONO EL TIMBRE DE UN TELEFONO. DESPUES DE QUE YUBO SONADO TRES VECES, SE OGO EL CYIRRIDO DE LOS MUELLES DE UNA CAMA; UNOS DEDOS PALPARON SOBRE LA MADERA, ALHO PEQUEXO G DURO CAGO CON RUIDO SORDO SOBRE LA ALFOMBRA, LOS MUELLES CYIRRIARON NUEVAMENTE, G UNA VOZ DE Y'

In [103]:
contraclave=cambio('Y','G',contraclave)
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:300]

'MUERTE EN LA NIEBLA  EN LA OSCURIDAD SONO EL TIMBRE DE UN TELEFONO. DESPUES DE QUE GUBO SONADO TRES VECES, SE OYO EL CGIRRIDO DE LOS MUELLES DE UNA CAMA; UNOS DEDOS PALPARON SOBRE LA MADERA, ALHO PEQUEXO Y DURO CAYO CON RUIDO SORDO SOBRE LA ALFOMBRA, LOS MUELLES CGIRRIARON NUEVAMENTE, Y UNA VOZ DE G'

In [108]:
contraclave=cambio('X',u'√ë',contraclave)
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:300]

'MUERTE EN LA NIEBLA  EN LA OSCURIDAD SONO EL TIMBRE DE UN TELEFONO. DESPUES DE QUE GUBO SONADO TRES VECES, SE OYO EL CGIRRIDO DE LOS MUELLES DE UNA CAMA; UNOS DEDOS PALPARON SOBRE LA MADERA, ALHO PEQUE√ëO Y DURO CAYO CON RUIDO SORDO SOBRE LA ALFOMBRA, LOS MUELLES CGIRRIARON NUEVAMENTE, Y UNA VOZ DE G'

In [110]:
tope=max([textomejor.index(letra) for letra in u'ABCDEFGHIJKLMN√ëOPQRSTUVWXYZ'])
print(tope)

6982


In [111]:
contraclave=cambio('K','W',contraclave)
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:tope+10]

'MUERTE EN LA NIEBLA  EN LA OSCURIDAD SONO EL TIMBRE DE UN TELEFONO. DESPUES DE QUE GUBO SONADO TRES VECES, SE OYO EL CGIRRIDO DE LOS MUELLES DE UNA CAMA; UNOS DEDOS PALPARON SOBRE LA MADERA, ALHO PEQUE√ëO Y DURO CAYO CON RUIDO SORDO SOBRE LA ALFOMBRA, LOS MUELLES CGIRRIARON NUEVAMENTE, Y UNA VOZ DE GOMBRE EXCLAMO:  ‚Äî¬øDIHA?... SI, SOY YO... ¬øMUERTO?... SI... EN QUINCE MINUTOS. HRACIAS.  SONO EL RUIDILLO DE UN INTERRUPTOR, Y LA LUZ DE UN HLOBO QUE COLHABA DEL TECGO, SOSTENIDO POR TRES CADENAS DORADAS, INUNDO EL CUARTO. SPADE, DESCALZO Y CON UN PIJAMA A CUADROS VERDES Y BLANCOS, SE SENTO SOBRE EL BORDE DE LA CAMA. MIRO MALGUMORADAMENTE AL TELEFONO QUE GABIA EN LA MESILLA MIENTRAS SUS MANOS COHIAN UN ESTUCGE DE PAPEL DE FUMAR COLOR CGOCOLATE Y UNA BOLSA DE TABACO BULL DURGAM.  UN AIRE FRIO Y MOJADO ENTRABA POR DOS VENTANAS ABIERTAS, TRAYENDO CONSIHO EL BRAMIDO DE LA SIRENA CONTRA LA NIEBLA DE ALCATRAZ, MEDIA DOCENA DE VECES POR MINUTO. UN DESPERTADOR DE RUIN METAL, CON INSEHURO ACOMOD

In [112]:
#miro el final del texto
print(textomejor[-500:])

TA Y TE DARE CASI TODA CLASE DE FACILIDADES. NO TE CULPO EXCESIVAMENTE POR LO QUE..., PERO ESO NO ME IMPEDIRIA DETENERTE IHUAL.  ‚ÄîBUENO, ES UNA ACTITUD JUSTA ‚ÄîREPLICO SPADE, CON VOZ SERENA‚Äî, PERO ME SENTIRIA MEJOR SI ACABARAS LA COPA.  DUNDY SE VOLVIO GACIA LA MESA, TOMO EL VASO Y LO VACIO LENTAMENTE. LUEHO ALARHO LA MANO Y DIJO:  ‚ÄîBUENAS NOCGES.  SE ESTRECGARON LOS DOS LA MANO CEREMONIOSAMENTE. TOM Y SPADE GICIERON LO MISMO. SPADE LES ABRIO LA PUERTA. LUEHO SE DESNUDO, APAHO LA LUZ Y SE ACOSTO.


In [115]:
contraclave=cambio('G','H',contraclave)
textomejor=cifradoPermutacion(encriptado, contraclave)
textomejor[:300]

'MUERTE EN LA NIEBLA  EN LA OSCURIDAD SONO EL TIMBRE DE UN TELEFONO. DESPUES DE QUE HUBO SONADO TRES VECES, SE OYO EL CHIRRIDO DE LOS MUELLES DE UNA CAMA; UNOS DEDOS PALPARON SOBRE LA MADERA, ALGO PEQUE√ëO Y DURO CAYO CON RUIDO SORDO SOBRE LA ALFOMBRA, LOS MUELLES CHIRRIARON NUEVAMENTE, Y UNA VOZ DE H'

In [116]:
clave=dict([(x,y)  for y,x in contraclave.items()])
Permutacion=list(clave.items())
Permutacion.sort()
show(Permutacion)

In [117]:
original_real=''.join([contraclave[j] for j in imagen])
show(original_real)
show(original)