## Criptografía
El objeto de la criptografía es el de transmitir un mensaje de tal modo que si este es interceptado no se pueda leer, pero que si llega a su destino, el mensaje original se pueda recuperar. Las biyecciones a la hora de encriptar constituyen una buena herramienta. Si se pretende que la descodificación (la biyección inversa) no sea sencilla de averiguar, sólo tendremos que elegir bien la biyección directa.

**Cifrados por sustitución**

Un **cifrado por sustitución** es un método de cifrado por el que unidades del texto original son sustituidas con texto cifrado siguiendo un sistema regular; las "unidades" pueden ser una sola letra (el caso más común), pares de letras, tríos de letras, mezclas de lo anterior, entre otros. El receptor descifra el texto realizando la sustitución inversa.

Compárese con los **cifrados por transposición**, en los que las unidades del texto original son cambiadas usando una ordenación diferente y normalmente bastante compleja, pero las unidades en sí mismas no son modificadas. Por el contrario, en un cifrado por sustitución, las unidades del texto plano mantienen el mismo orden, lo que se hace es sustituir las propias unidades del texto original.

**Sustitución simple**

En los cifrados de **sustitución simple** un carácter en el texto original es reemplazado por un carácter determinado del alfabeto de sustitución. Es decir, se establecen parejas de caracteres donde el segundo elemento de la pareja establece el carácter que sustituye al primer elemento de la pareja.

A veces el sistema usa el mismo alfabeto para el texto en claro y para el texto cifrado. Esto permite aprovechar el orden definido por los alfabetos para así facilitar la descripción de los algoritmos.

## Cifrado de César

El ejemplo más sencillo de cifrado de sustitución simple es el cifrado de César. El **cifrado César con clave $k$** utiliza $T_k(j)=(j+k)\,\mathrm{mod}\,L$, como biyección en el conjunto de caracteres del alfabeto (estrictamente, en el conjunto de índices), siendo $L$ la longitud del alfabeto. En términos de índices, se usa la permutación:
$$
(0,1,2,\dots,L-1)\mapsto
(k,k+1,\dots,L-1,0,1,2,\dots,k-1)
$$
Así, el _alfabeto de sustitución_ es simplemente una _traslación_ (módulo la longitud del alfabeto) del _alfabeto original_.

**Ejercicio 1.** Consideremos, por defecto, la siguiente cadena

alfabeto=u' ABCDEFGHIJKLMNÑOPQRSTUVWXYZabcdefghijklmnñopqrstuvwxyz'

que tiene un espacio en blanco como primer caracter. Para este primer ejercicio, tomaremos textos que contengan solo este juego de caracteres.

Definir una función Sage, cifradoCesar(texto,clave,alfabeto),  que espere un texto y una clave, y considere el anterior como alfabeto por defecto. La función devolverá el texto cambiando cada caracter por el que en el alfabeto ocupa k posiciones a su derecha (si el alfabeto se queda corto, se vuelve a empezar). Así cifradoCesar('Calzado',5) devolverá 'HfpDfit'.

In [15]:
### Tratamiento de cadenas
##Descomenta y ejecuta
alfabeto=u'ABCEDFGHIJKLMNÑOPQRSTUVWXYZ'
print len(alfabeto)
alfabeto=alfabeto+alfabeto.lower()
print len(alfabeto)
print alfabeto.index(u'ñ')
print(alfabeto)
alfabeto #no muestra las ñÑ (porque son unicode)

27
54
41
ABCEDFGHIJKLMNÑOPQRSTUVWXYZabcedfghijklmnñopqrstuvwxyz


u'ABCEDFGHIJKLMN\xd1OPQRSTUVWXYZabcedfghijklmn\xf1opqrstuvwxyz'

In [16]:
##Definición de la función cifradoCesar()
def cifradoCesar(texto, k, alfabeto):
    longalf=len(alfabeto)
    textocif=u''
    for letra in texto:
        if letra in alfabeto:
            j=alfabeto.index(letra)
            letra=alfabeto[(j+k)%longalf]
        textocif+=letra
    return textocif
print cifradoCesar('Calzado', 5, alfabeto)

HfpDfjt


## Descifrar el cifrado César
Para **descifrar** un texto cifrado a la César basta conocer, el número de lugares elegidos para desplazar cada letra (la clave) y el alfabeto utilizado. Así cifradoCesar('HfpDfit',-5) devolverá 'Calzado'.

Si conocemos el alfabeto, es fácil averiguar la clave: _basta utilizar cifradoCesar() con el texto cifrado, el alfabeto y probar distintas claves (no más de la longitud del alfabeto de ellas)'._ Este método de descifrado es lo que llamaremos **por fuerza bruta**.

**Ejercicio 2.** Averiguar por fuerza bruta el texto original que produce el guardado en la cadena ${\tt texto1}$ del siguiente cuadro, cifrado a la César con el juego de caracteres 'abcdefghijklmnopqrstuvwxyz' y respetando (esto es, no encriptando) espacios en blanco y signos de puntuación.

In [11]:
##Descomenta y ejecuta
load('Cesar.py')
show(texto1)

In [36]:
alfabeto_corto=u'abcdefghijklmnopqrstuvwxyz'
LL=len(alfabeto_corto)
for contraclave in [1..LL]:
    print (contraclave,(str((cifradoCesar(texto1, contraclave, alfabeto_corto))[0:15])))
print (cifradoCesar(texto1, 14, alfabeto_corto))

(1, 'va gnorean dhna')
(2, 'wb hopsfbo eiob')
(3, 'xc ipqtgcp fjpc')
(4, 'yd jqruhdq gkqd')
(5, 'ze krsvier hlre')
(6, 'af lstwjfs imsf')
(7, 'bg mtuxkgt jntg')
(8, 'ch nuvylhu kouh')
(9, 'di ovwzmiv lpvi')
(10, 'ej pwxanjw mqwj')
(11, 'fk qxybokx nrxk')
(12, 'gl ryzcply osyl')
(13, 'hm szadqmz ptzm')
(14, 'in taberna quan')
(15, 'jo ubcfsob rvbo')
(16, 'kp vcdgtpc swcp')
(17, 'lq wdehuqd txdq')
(18, 'mr xefivre uyer')
(19, 'ns yfgjwsf vzfs')
(20, 'ot zghkxtg wagt')
(21, 'pu ahilyuh xbhu')
(22, 'qv bijmzvi yciv')
(23, 'rw cjknawj zdjw')
(24, 'sx dklobxk aekx')
(25, 'ty elmpcyl bfly')
(26, 'uz fmnqdzm cgmz')
in taberna quando sumus,
 non curamus quid sit humus,
 sed ad ludum properamus,
 cui semper insudamus.
 quid agatur in taberna
 ubi nummus est pincerna,
 hoc est opus ut quaeratur;
 si quid loquar, audiatur.


## Otros cifrados de sustitución simple
Veamos otro ejemplo de cifrado de sustitución simple que usa el orden definido por el alfabeto para describir el algoritmo.

**Ejercicio 3. (Cifrado afín)** Implementa una función para cifrar y descifrar textos usando como clave una pareja $(a,b)$ de enteros $0\le a,b\le L$ según la regla:
"Cambia el carácter de índice $j$ por el carácter de índice $a*j+b\pmod{L}$, con $L={{\tt len}}$(alfabeto).

_Nota_: Puesto que se quiere que el encriptado se pueda deshacer, ¿qué parejas $(a,b)$ son aceptables como claves del cifrado?

## Cifrado de permutación

En el cifrado de permutación, se usa una biyección arbitraria del conjunto de letras del alfabeto elegido.

**Ejercicio 4.-** Fijado un alfabeto, se pide crear una función ${\tt cifradoPermutacion}()$ con dos argumentos obligatorios
un ${\tt texto}$ y una ${\tt clave}$ que será una permutación del conjunto de caracteres de un ${\tt alfabeto}$ previamente fijado (indicar uno por defecto en la definición de la función). La función devolverá el texto resultado de cambiar, en ${\tt texto}$, cada letra por su imagen por la permutación  (la ${\tt clave}$) dada. 

Recursos de ayuda: ${\tt Permutations}()$ y $.{\tt random}\_{\tt element}()$.

In [37]:
##Descomenta y ejecuta
abc_corto=u' ABCDEFGHIJKLMNÑOPQRSTUVWXYZabcdefghijklmnñopqrstuvwxyz'
G0=Permutations(abc_corto)
b1=G0.random_element()
cadenaPermutacion=''.join(b1)
print cadenaPermutacion

JDgcATUItQbompYWyqanGESfdZlH ñMjÑkCVwKxRrizvhXusLeFOPBN


In [185]:
##Definición de cifradoPermutacion(texto,clave,alfabeto=' ABC...')
def cifradoPermutacion(texto, clave, alfabeto):
    u'''
    clave es un diccionario
    '''
    encriptado=u''
    for letra in texto:
        if letra.upper() in alfabeto:
            letra=clave[letra.upper()]
        encriptado+=letra
    return encriptado

Prueba tu función ${\tt cifradoPermutacion}()$ con la cadena ${\tt ejemplar}$, que se genera al ejecutar la siguiente celda, con una permutacion, un diccionario ${\tt F}$, tomada al azar de entre las permutaciones del diccionario del alfabeto
> u' ABCDEFGHIJKLMNÑOPQRSTUVWXYZabcdefghijklmnñopqrstuvwxyz'

In [57]:
##Descomenta y ejecuta
load('novela.py')
print len(ejemplar)
print ejemplar[0:80]

111924
LA ILUSTRE FREGONA
 
 En Búrgos, ciudad ilustre y famosa, no ha muchos años que 


In [83]:
alfabeto=u'ABCDEFGHIJKLMNÑOPQRSTUVWXYZabcdefghijklmnñopqrstuvwxyz'
G1=Permutations(alfabeto)
f1=G1.random_element()
F=dict(zip(alfabeto,f1))

ENC=cifradoPermutacion(ejemplar, F, alfabeto)
print ENC[0:100]

cU vcgÑMYj rYjIbñU
 
 jB DúiTJq, WzwKsK zZwqEiX u fspJqs, BJ ds pwWdJq sCJq owX XB XZZs
 OzOzsB KJq 


Conocida la permutación para encriptar, el diccionario ${\tt F}$, sabemos desencriptar, basta construir el diccionario inverso, ${\tt G}$ tal que ${\tt G}[{\tt F}[{\tt letra}]]=={\tt letra}$ para cualquier ${\tt letra}$ en el ${\tt alfabeto}$. Recupera la cadena original.

In [84]:
##inverso de F:
G=dict(zip(F.values(), F.keys()))

print all([G[F[x]]==x for x in alfabeto])

print cifradoPermutacion(ENC, G, alfabeto)==ejemplar

True
True


## Descifrado del cifrado de permutación. Análisis de frecuencias
En este caso no es recomendable usar el método de fuerza bruta (intentar descodificar con todas las posibles permutaciones del alfabeto) para intentar averiguar el texto original. Pero podemos hacer un _análisis de frecuencias_, si el texto codificado es suficientemente largo (o tenemos varios textos codificados por el mismo método). Se comparan entonces las frecuencias de los caracteres del alfabeto de sustitución con un modelo de las frecuencias que los caracteres suelen presentar en los textos del idioma en el que se sospecha está escrito el mensaje original. Se apuesta a que la más frecuente en el encriptado vino de la más frecuente en el modelo, la segunda, de la segunda, ... Antes de realizar esta tarea, entrenemos las herramientas necesarias para el análisis de frecuencias para cadenas de caracteres.

**Ejercicio 5.**
1. Escribe una función ${\tt Frecuencias}\_{\tt texto}()$, que a partir de un ${\tt texto}$  y un ${\tt alfabeto}$ nos devuelva una lista (o un diccionario) de pares $({\tt caracter, frecuencia})$ para cada ${\tt caracter}$ del ${\tt alfabeto}$ (poner uno por defecto en la definición). La función no debe tomar como distintos el mismo carácter en mayúsculas o en minúsculas (utilizar el método ${\tt .lower}()$).
2. Utilízalo con algún texto suficientemente largo, y ordena las parejas $({\tt caracter, frecuencia})$ de mayor a menor por las frecuencias. 
3. Compara los $6$ caracteres más frecuentes con los del modelo de frecuencias de un texto típico en español (ver [Frecuencia de aparición de letras](https://es.wikipedia.org/wiki/Frecuencia_de_aparici%C3%B3n_de_letras)). 


In [165]:
def Frecuencias_texto(texto, alfabeto):
    frecuencias=dict(zip(alfabeto,[0]*len(alfabeto)))
    for letra in texto:
        if letra.upper() in alfabeto:
            frecuencias[letra.upper()]+=1
    return frecuencias

In [167]:
ALFA=u'ABCDEFGHIJKLMNÑOPQRSTUVWXYZ'
frec=Frecuencias_texto(ejemplar, ALFA)
total=sum(frec.values())
lista=[(frec[a]/total*100.) for a in ALFA]
dicc=dict(zip(ALFA,lista))
LL=list([(f,l) for (l,f) in dicc.items()])
print LL
LL.sort(reverse=True)
print LL

[(12.4518165172979, u'A'), (3.69808229738846, u'C'), (1.46839163534740, u'B'), (13.5094439626096, u'E'), (5.50375831165077, u'D'), (1.19735954514792, u'G'), (0.455333911535126, u'F'), (5.06408403199383, u'I'), (1.30215862002506, u'H'), (0.000000000000000, u'K'), (0.597475185506408, u'J'), (2.73802640454852, u'M'), (5.93620506890238, u'L'), (9.36807362436157, u'O'), (6.44574539847740, u'N'), (1.86590536763997, u'Q'), (2.33810349812084, u'P'), (7.88161318300087, u'S'), (6.29758118916835, u'R'), (4.93639780283319, u'U'), (3.59207863544377, u'T'), (0.000000000000000, u'W'), (1.10822010214898, u'V'), (1.40575310783463, u'Y'), (0.000000000000000, u'X'), (0.519177026115448, u'Z'), (0.319215572901609, u'\xd1')]
[(13.5094439626096, u'E'), (12.4518165172979, u'A'), (9.36807362436157, u'O'), (7.88161318300087, u'S'), (6.44574539847740, u'N'), (6.29758118916835, u'R'), (5.93620506890238, u'L'), (5.50375831165077, u'D'), (5.06408403199383, u'I'), (4.93639780283319, u'U'), (3.69808229738846, u'C'), 

**Ejercicio 6.** Hemos interceptado cierto texto, cifrado mediante un método de sustitución simple (aparece en la siguiente celda de código). Sabemos que el texto original estaba escrito en español, todo en letras mayúsculas y solo se han sustituido las letras. Intentar averiguar el texto original usando un análisis de frecuencias. Las frecuencias con las que suelen aparecer las distintas letras del alfabeto en textos escritos en español se puede consultar por ejemplo en: 

[Frecuencia de aparición de letras](https://es.wikipedia.org/wiki/Frecuencia_de_aparición_de_letras)

_Nota_: al evaluar la siguiente casilla quedará guardado el texto interceptado en la variable encriptado (una cadena larga de caracteres).

In [168]:
##Descomenta y ejecuta
load('Secreto.py')
len(encriptado)

24065

### **Propuesta de estrategia para descifrar**
Seguir los siguientes pasos:
- Sea ${\tt original}$ la cadena de letras del ${\tt alfabeto}$ que se encripta, ordenadas de mayor a menor aparición en el texto original. Como no la conocemos en su orden real cogemos la de un texto típico en español (ver la referencia sobre [Frecuencia de letras](https://es.wikipedia.org/wiki/Frecuencia_de_aparición_de_letras)).
- Llamemos $F$ al diccionario (la permutación o biyección) del encriptado, y $G$ a su inverso. Obsérvese que conocido uno se conoce el otro.
- Llamemos ${\tt cifrado}$ a la cadena que hubiera resultado de aplicar $F$ a ${\tt original}$. Obsérvese que ${\tt cifrado}$ se averigua del texto ${\tt encriptado}$, mirando los caracteres encriptados y sus frecuencias, sin más que ordenarlos de mayor a menor número de apariciones.
- Con ${\tt original}$ y ${\tt cifrado}$, construir $G$.
    - Desencriptar ${\tt encriptado}$ utilizando $G$, digamos que ${\tt texto}$ es el resultado. 
    - A la vista de ${\tt texto}$, o de una parte manejable del mismo (por ejemplo los primeros 200 caracteres, ${\tt texto}[:200]$), si vemos alguna letra que no es correcta, cambiamos $G$  por la composición $\tau\circ G$ con $\tau$ la _trasposición_ entre la letra incorrecta localizada y la que debería aparecer. 
    - Repetir estos dos últimos pasos hasta que no aparezcan letras incorrectas. (Sugerencia: para acciones que vayas a repetir varias veces, quizás sea conveniente definir funciones auxiliares que te faciliten la tarea).
- Para asegurarnos de que todas las letras han vuelto a su estado original ($G$ está completa), podemos mirar sobre la primera parte del texto que contenga, al menos una vez, todos y cada uno de los caracteres que aparecen.


In [279]:
alfabeto=u'ABCDEFGHIJKLMNÑOPQRSTUVWXYZ'
T=u'E A O S R N I D L C T U M P B G V Y Q H F Z J Ñ X K W'
original=''.join(T.split(' '))
frec=Frecuencias_texto(encriptado, alfabeto)
L=[(f,l) for (l,f) in frec.items()]
L.sort(reverse=True)
cifrado=[L[j][1] for j in range(len(L))]
cifrado=''.join(cifrado)
F=dict(zip(original, cifrado))
G=dict(zip(cifrado, original))
nuevo=cifradoPermutacion(encriptado, G, alfabeto)
print nuevo[:200]

MTEICE EN RA NDEBRA  EN RA OSUTIDLAL SONO ER CDMBIE LE TN CEREJONO. LESPTES LE HTE VTBO SONALO CIES YEUES, SE OGO ER UVDIIDLO LE ROS MTERRES LE TNA UAMA; TNOS LELOS PARPAION SOBIE RA MALEIA, ARQO PEHT


In [280]:
def cambiar_(original, a, b):
    new=u''
    for letra in original:
        if letra==a:
            letra=b
        elif letra==b:
            letra=a
        new+=letra
    return new

In [281]:
ORI_inicial=u''
for l in original:
    ORI_inicial+=l
print ORI_inicial
print original

EAOSRNIDLCTUMPBGVYQHFZJÑXKW
EAOSRNIDLCTUMPBGVYQHFZJÑXKW


In [298]:
original=cambiar_(ORI_inicial, 'L', 'R')
original=cambiar_(original, 'I', 'D')
original=cambiar_(original, 'T', 'C')
original=cambiar_(original, 'R', 'D')
original=cambiar_(original, 'U', 'C')
original=cambiar_(original, 'Q', 'H')
original=cambiar_(original, 'H', 'V')
original=cambiar_(original, 'Y', 'G')
original=cambiar_(original, u'Ñ', 'X')
original=cambiar_(original, 'G', 'V')
original=cambiar_(original, 'F', 'J')

F,G=dict(zip(original, cifrado)),dict(zip(cifrado, original))
nuevo=cifradoPermutacion(encriptado, G, alfabeto)
print nuevo

MUERTE EN LA NIEBLA  EN LA OSCURIDAD SONO EL TIMBRE DE UN TELEFONO. DESPUES DE QUE HUBO SONADO TRES VECES, SE OYO EL CHIRRIDO DE LOS MUELLES DE UNA CAMA; UNOS DEDOS PALPARON SOBRE LA MADERA, ALGO PEQUEÑO Y DURO CAYO CON RUIDO SORDO SOBRE LA ALFOMBRA, LOS MUELLES CHIRRIARON NUEVAMENTE, Y UNA VOZ DE HOMBRE EXCLAMO:  —¿DIGA?... SI, SOY YO... ¿MUERTO?... SI... EN QUINCE MINUTOS. GRACIAS.  SONO EL RUIDILLO DE UN INTERRUPTOR, Y LA LUZ DE UN GLOBO QUE COLGABA DEL TECHO, SOSTENIDO POR TRES CADENAS DORADAS, INUNDO EL CUARTO. SPADE, DESCALZO Y CON UN PIJAMA A CUADROS VERDES Y BLANCOS, SE SENTO SOBRE EL BORDE DE LA CAMA. MIRO MALHUMORADAMENTE AL TELEFONO QUE HABIA EN LA MESILLA MIENTRAS SUS MANOS COGIAN UN ESTUCHE DE PAPEL DE FUMAR COLOR CHOCOLATE Y UNA BOLSA DE TABACO BULL DURHAM.  UN AIRE FRIO Y MOJADO ENTRABA POR DOS VENTANAS ABIERTAS, TRAYENDO CONSIGO EL BRAMIDO DE LA SIRENA CONTRA LA NIEBLA DE ALCATRAZ, MEDIA DOCENA DE VECES POR MINUTO. UN DESPERTADOR DE RUIN METAL, CON INSEGURO ACOMODO SOBR