# Cuaderno Jupyter

<p style="color:blue;text-align:justify;">Jupyter es una aplicación web de código abierto que ha sido desarrollada utilizando lenguaje HTML. Con esto se ha conseguido que los usuarios podamos crear, compartir y editar documentos en los que se puede ejecutar código Python en nuestro navegador. También podremos hacer anotaciones, insertar ecuaciones, visualizar resultados y documentar funcionalidades.</p>
<p style="color:blue;text-align:justify;">Si con anterioridad hemos instalado Anaconda Distribution ya tendremos instalado Jupyter Notebook. Por lo que podremos ejecutarlo desde la terminal (Ctrl+Alt+T) escribiendo:</p>
<br>
<code style="margin-left:23px">jupyter-notebook</code>
<p style="color:blue;text-align:justify;">En caso de que no querer instalar Anaconda Distribution tendremos la opción de poder instalar Jupyter Notebook utilizando pip de Python. Para ello, solo tendremos que abrir una terminal (Ctrl+Alt+T) y ejecutar el siguiente comando:</p>
<br>
<code style="margin-left:23px">pip install notebook</code>
<p style="color:blue;text-align:justify;">Una vez terminada la instalación, ya podremos lanzar el programa utilizando el siguiente comando en la misma terminal:</p>
<br>
<code style="margin-left:23px">jupyter-notebook</code>
<p style="color:blue;text-align:justify;">Sólo queda importar el archivo con extensión ".ipynb" y podra ser modificado y ejecutado el código que contiene. La forma más rápida y cómoda, y que evita errores, es seleccionar en el menú superior "Kernel" la opción "Restart & Run All"</p>

# Practica 02 - Cifrado

<p style="color:blue;text-align:justify;">Las siguientes funciones son las proporcionadas. El "import" es necesario para la lectura de los archivos. La variable "dataPath" contiene la dirección de donde estan los archivos para mayor comodidad.</p>

In [1]:
import io

dataPath = "dataFiles/"

def cadenatolista(cadena):
    l = []
    for s in cadena:
        x = ord(s)
        if x == 32:
            l.append(-1)
        elif x < 79:
            l.append(x-65)
        elif x == 209:
            l.append(14)
        else:
            l.append(x-64)
    return l

def frecuencias(texto):
    tabla = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
             0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
    lista = cadenatolista(texto)
    for x in lista:
        tabla[x] = tabla[x] + 1
    return tabla

def indice_coincidencia(texto):
    tabla = frecuencias(texto)
    num_caracteres = 0
    aux = 0
    for x in tabla:
        num_caracteres += x
        aux = aux + x * (x-1)
    ic = aux/(num_caracteres * (num_caracteres-1))
    return ic

def listatocadena(l):
    s = ''
    for x in l:
        if x == -1:
            s = s + ' '
        elif x <= 13:
            s = s + chr(x+65)
        elif x == 14:
            s = s + 'Ñ'
        else:
            s = s + chr(x+64)
    return s

<p style="color:blue;text-align:justify;">Las siguientes funciones se han implementado para ayudar a descifrar los archivos y realizar los análisis necesarios.</p>

In [2]:
def apariciones(cadena, texto):
    m = len(cadena)
    n = len(texto)
    posicion = []
    for i in range(n-m):
        if cadena == texto[i:i+m]:
            posicion.append(i)
    return (posicion, len(posicion))

def cifra_sustitucion(texto, permutacion):
    texto_cifrado = ''
    for x in texto:
        y = permutacion.get(x)
        texto_cifrado = texto_cifrado + y
    return texto_cifrado

def cifra_transposicion(texto, n):
    m = len(texto)
    k = m%n
    texto_cif = ''
    for i in range(n):
        if i < k:
            aux = m//n+1
        else: 
            aux = m//n
        for j in range(aux):
            texto_cif = texto_cif + texto[i+n*j]
    return texto_cif

def cifra_vigenere(texto, clave):
    lista_texto = cadenatolista(texto)
    lista_clave = cadenatolista(clave)
    (n, m) = (len(lista_texto), len(lista_clave))
    for i in range(n):
        lista_texto[i] = (lista_texto[i] + lista_clave[i%m])%27
    texto_cifrado = listatocadena(lista_texto)
    return texto_cifrado

def descifra_sustitucion(texto, permutacion):
    texto_des = ''
    p0 = permutacion[0]
    p1 = permutacion[1]
    for x in texto:
        if x in p0:
            pos = p0.index(x)
            texto_des = texto_des + p1[pos]
        else:
            texto_des = texto_des + x
    return texto_des

def divide_cadena(cadena, n):
    subcadenas = []
    for i in range(n):
        subcadenas.append('')
    j = 0
    for x in cadena:
        subcadenas[j] = subcadenas[j] + x
        j = (j+1)%n
    return subcadenas

def ngramas_repetidos(texto, n, m = 5):
    ngramas = []
    ngramasrep = []
    frecuencias = []
    for i in range(m):
        frecuencias.append(0)
        ngramasrep.append(texto[i:i+n])
    minimo = 0
    for i in range(len(texto)-n):
        aux = texto[i:i+n]
        if aux not in ngramas:
            f = 1
            ngramas.append(aux)
            for j in range(i+1, len(texto)-n):
                if aux == texto[j:j+n]:
                    f += 1
            if f > minimo:
                k = frecuencias.index(minimo)
                ngramasrep[k] = aux
                frecuencias[k] = f
                minimo = min(frecuencias)
    return (ngramasrep, frecuencias)

def ocurrencias(cadena, texto, n):
    l = len(texto)
    k = len(cadena)
    ocur = 0
    for i in range(l):
        contador = i
        cadenab = ''
        for j in range(k):
            if contador == -1:
                cadenab = cadenab + ' '
                contador = 0
            else:
                cadenab = cadenab + texto[contador]
                contador = siguiente(l, n, contador)
        if cadena == cadenab:
            ocur +=1
    return ocur

def siguiente(m, n, x):
    aux = m%n
    aux2 = m//n
    if aux == 0:
        ultimo = -1
    else: 
        ultimo = aux * (aux2 + 1) - 1
    if ultimo == -1 and x == m-1:
        return -1
    elif x < ultimo:
        return x + 1 + aux2
    elif x >= m - aux2:
        return x + aux2 + 1 - m
    elif x > ultimo:
        return x + aux2
    else:
        return -1

In [3]:
def analisis_vigenere(text, n):
    partition = cifra_transposicion(text, n)
    start = 0
    for i in range(0, n-1):
        end = siguiente(len(partition), n, start)
        freq = frecuencias(partition[start:end-1])
        print('\nFrecuencias (Digito {}): {}'.format(i+1, freq))
        maxim = max(partition[start:end-1])
        print('La posible A se encuentra desplazada {} ó {}'.format(freq.index(max(freq))-4, freq.index(max(freq))))
        start = end
    freq = frecuencias(partition[start:len(partition)])
    print('\nFrecuencias (Digito {}): {}'.format(n, freq))
    maxim = max(partition[start:len(partition)])
    print('La posible A se encuentra desplazada {} ó {}'.format(freq.index(max(freq))-4, freq.index(max(freq))))
    
def descifra_escitalo(text, rango = 100):
    position = 0
    value = 0
    for i in range(1, rango):
        aux = ocurrencias('QUE', text, i)
        if(aux > value):
            value = aux
            position = i
    index = 0
    textResult = text[0]
    for i in range(0, len(text)):
        index = siguiente(len(text), position, index)
        textResult += text[index]
    return textResult
    
def descifra_vigenere(text, password):
    clave = ''
    diccionario = ["A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K",
                   "L", "M", "N", "Ñ", "O", "P", "Q", "R", "S", "T", "U",
                   "V", "W", "X", "Y", "Z"]
    for i in range(0, len(password)):
        position = ord(password[i])-65
        if position > 13:
            position += 1
        position = 27 - position
        if position == 27:
            position = 0
        clave += diccionario[position]
    return cifra_vigenere(text, clave)

def get_analisis(text):
    print('\nFrecuencias: {}'.format(frecuencias(text)))
    print('\nIndice de Coincidencia: {}'.format(indice_coincidencia(text)))

def get_clave(text, n = 2):
    while True:
        cadenas = divide_cadena(text, n)
        for i in range(0, n):
            flag = True
            ic = indice_coincidencia(cadenas[i])
            if(ic > 0.08 or ic < 0.06):
                flag = False
                break
        if flag == True:
            break
        n += 1
    return n

def read_text(uri):
    with io.open(uri, 'r', encoding='utf8') as file:
        text = file.read()
        file.close()
    return text 

## Primer Texto Encriptado

<p style="color:blue;text-align:justify;"> Todos los textos a analizar se comienzan de la misma forma. Lo primero es utilizar la función "indice_coincidencias()" que devuelve el índice de coincidencia para descubrir si la distribución de las letras corresponde al idioma español o para averiguar si las frecuencias han sido atenuadas. El índice en español es más o menos de 0,07.</p>
<p style="color:blue;text-align:justify;">Con la función "frecuencias()" obtenemos el número de apariciones de cada letra en el texto. En el idioma español, unas letras aparecen más que otras. Con las frecuencias podemos intentar ver el cambio utilizado localizando la posible posición de las dos letras más frecuentes, "A" y "E".</p>

In [4]:
text1 = read_text(dataPath + "Texto1.txt")
get_analisis(text1)


Frecuencias: [49, 0, 7, 45, 23, 598, 59, 178, 237, 576, 28, 55, 37, 271, 13, 1, 256, 146, 328, 31, 431, 105, 25, 327, 421, 189, 176]

Indice de Coincidencia: 0.07540558297656552


<p style="color:blue;text-align:justify;">Podemos ver, por el índice de coincidencia, que se trata de un texto en español sin atenuación de frecuencias. Además, vemos que la F y la J son las que más veces aparecen. Si nos fijamos, la distancia entre ambas es la misma que la distancia entre A y E, las dos letras más frecuentes en español.</p>
<p style="color:blue;text-align:justify;">Podemos deducir que se ha utiliza una sustitución simple basada en el cifrado César. Si tenemos en cuenta la sutitución anterior, podemos decir la correspondencia del resto de letras y comprobar si el texto, tras la sustitución, es legible. En caso de ser así, la calve usada sería k = 5.</p>

In [5]:
text1_decrypt = descifra_sustitucion(text1, ['FGHIJKLMNÑOPQRSTUVWXYZABCDE', 'abcdefghijklmnñopqrstuvwxyz'])
print(text1_decrypt)

enelmundoesilegalreclutaryusaramenoresdequinceañoscomocombatientesmensajerosesposasdemilitaresocomococinerosenlosejercitossinembargovemoscomoconfrecuencialosadultosutilizanalosniñosyniñasparalucharsusguerrassehanutilizadoamenoresenlasguerrasrecientesdeangolaafganistansierraleonaysrilankahoydiatrescientosmilniñosyniñasmenoresdequinceañosestanrelacionadosdealgunmodoconlasfuerzasarmadasalgunosdeellostienentansolosieteañoslosadultosprefierenreclutaramenoresporquesonfacilesdecontrolarydemanipularademasdequeaprendenrapidosonusadosparamatarparacolocarlastemiblesminasparalaboresdeespionajeocomomerosporteadoreslasniñassoldadosufrenabusossexualesporpartedesuscompañerosparaaumentarlamoraldelatropasonconcedidascomoesposasalossoldadosadultossoportandounaviolenciahorribleamanosdeunoshombresqueestanespecialmenteembrutecidosporlaguerraelembarazoprematuroesunconstanteriesgodesaludparaellasyaseamedianteelreclutamientoforzosoopersuadiendolesparapresentarsecomovoluntarioslosderechosaavidaaldesarrolloyalas

## Segundo Texto Encriptado

<p style="color:blue;text-align:justify;">Comenzamos realizando los dos análisis antes mencionados: frecuencia de aparición de las letras e índice de coincidencias.</p>

In [6]:
text2 = read_text(dataPath + "Texto2.txt")
get_analisis(text2)


Frecuencias: [326, 38, 94, 133, 313, 17, 33, 18, 160, 15, 0, 130, 84, 174, 7, 261, 61, 32, 166, 223, 115, 117, 42, 0, 2, 35, 8]

Indice de Coincidencia: 0.07251764919716291


<p style="color:blue;text-align:justify;">Por los datos obtenidos sabemos que es un texto en español y que las frecuencias no han sido atenuadas. Al examinar el texto se puede ver como comienza con "EEEENNLOHNCNSZASSEE". La sucesión de letras "E" hace pensar que se ha encriptado usando un escítalo, ya que si, simplemente, se hubieran cambiado de posición las letras, esas 4 "E" seguidas representarían a la misma letra, cosa que en español no corresponde.</p>
<p style="color:blue;text-align:justify;">Lo que hacemos para resolverlo es buscar las ocurrencias de una palabra común en español recorriendo el texto de n en n (el valor de n se va variando). La palabra elegida es "QUE". Lo que hacemos es quedarnos con el n con el que se obtenga un mayor número de ocurrencias de "QUE". Una vez hecho esto, se reconstruye el texto recorriéndolo con el n obtenido.</p>

In [7]:
text2_decrypt = descifra_escitalo(text2)
print(text2_decrypt)

ELSILENCIOESCUDAYSUELEENCUBRIRLAFALTADEINGENIOYTORPEZADELENGUASBLASONQUEESCONTRARIOPUBLICASUSMENGUASAQUIENMUCHOHABLASINMUCHOSENTIRCOMOHORMIGAQUEDEJADEIRHOLGANDOPORTIERRACONLAPROVISIONJACTOSECONALASDESUPERDICIONLLEVARONLAENALTONOSABEDONDEIRELAIREGOZANDOAJENOYEXTRAÑORAPIÑAESYAHECHADEAVESQUEVUELANFUERTESMASQUEELLAPORCEBOLALLEVANENLASNUEVASALASESTABASUDAÑORAZONESQUEAPLIQUEAMIPLUMAESTEENGAÑONODESPRECIANDOALOSQUEMEARGUYENASIQUEAMIMISMOMISALASDESTRUYENNUBLOSASYFLACASNACIDASDEHOGAÑODONDEESTAGOZARPENSABAVOLANDOOYODEESCRIBIRCOBRARMASHONORDELUNOYDELOTRONACIODISFAVORELLAESCOMIDAYAMIESTANCORTANDOREPROCHESREVISTASYTACHASCALLANDOOBSTARAYLOSDAÑOSDEENVIDIAYMURMUROSINSISTOREMANDOYLOSPUERTOSSEGUROSATRASQUEDANTODOSYACUANTOMASANDOSIBIENQUEREISVERMILIMPIOMOTIVOACUALSEENDEREZADEAQUESTOSEXTREMOSCONCUALPARTICIPAQUIENRIGESUSREMOSAPOLODIANAOCUPIDOALTIVOBUSCADBIENELFINDEAQUESTOQUEESCRIBOODELPRINCIPIOLEEDSUARGUMENTOLEEDLOVEREISQUEAUNQUEDULCECUENTOAMANTESQUEOSMUESTRASALIRDECATIVOCOMOELDOLIENTEQUEPILDORAAMARGAOLAREC

<p style="color:blue;text-align:justify;">El texto corresponde a "La Celestina" de Fernando de Rojas. Concretamente a la "Tragicomedia de Calisto y Melibea".</p>

## Tercer Texto Encriptado

<p style="color:blue;text-align:justify;">Comenzamos realizando los dos análisis antes mencionados: frecuencia de aparición de las letras e índice de coincidencias.</p>

In [8]:
text3 = read_text(dataPath + "Texto3.txt")
get_analisis(text3)


Frecuencias: [892, 840, 616, 513, 1393, 741, 642, 625, 1279, 451, 313, 1004, 1133, 819, 562, 1082, 788, 618, 421, 991, 1025, 753, 721, 874, 961, 770, 600]

Indice de Coincidencia: 0.0408215990165798


<p style="color:blue;text-align:justify;">Este texto ha sido, probablemente, cifrado mediante un cifrado polialfabético dado que la distribución de las letras no se corresponde con la distribución estándar del español. Las frecuencias han sido uniformadas, por ello el índice de coincidencia se encuentra mas próximo a 0,037. Esto significa que las letras estan distribuidas con una frecuencia similar.</p>
<p style="color:blue;text-align:justify;">Esto coincide con el cifrado de Vigenère en el que tenemos una clave para encriptar usando el cifrado César, aprovechando la posición de las letras. Para averiguar el tamaño de la clave particionamos el texto hasta que cada una de las partes devuelva una frecuencia de unos 0,07. En ese momento, el número de particiones nos dirá el tamaño de la clave.</p>

In [9]:
print('La Clave es de {} Digitos'.format(get_clave(text3)))

La Clave es de 13 Digitos


<p style="color:blue;text-align:justify;">El siguiente paso es coger las letras usando como saltos el tamaño de la clave. De esta forma elegimos todas las letras que estan cifradas con la misma letra de la clave y podemos descifrar usando el mismo método que en el cifrado César (vulnerable al análisis de frecuencias).</p>

In [10]:
analisis_vigenere(text3, 13)


Frecuencias (Digito 1): [65, 79, 18, 0, 1, 24, 13, 184, 38, 51, 83, 230, 8, 7, 21, 71, 9, 0, 88, 45, 121, 8, 181, 41, 39, 103, 120]
La posible A se encuentra desplazada 7 ó 11

Frecuencias (Digito 2): [219, 27, 50, 81, 235, 5, 16, 23, 90, 10, 0, 87, 44, 109, 2, 177, 31, 33, 92, 127, 59, 78, 14, 0, 0, 31, 8]
La posible A se encuentra desplazada 0 ó 4

Frecuencias (Digito 3): [9, 210, 22, 57, 92, 238, 8, 20, 25, 76, 9, 0, 88, 37, 103, 2, 171, 44, 41, 97, 125, 50, 70, 32, 0, 0, 22]
La posible A se encuentra desplazada 1 ó 5

Frecuencias (Digito 4): [118, 76, 102, 26, 0, 1, 29, 8, 202, 22, 57, 72, 200, 3, 20, 21, 78, 9, 0, 82, 37, 117, 4, 186, 36, 37, 104]
La posible A se encuentra desplazada 4 ó 8

Frecuencias (Digito 5): [23, 89, 11, 0, 81, 39, 99, 7, 182, 33, 39, 114, 124, 64, 83, 17, 0, 0, 33, 7, 197, 21, 63, 88, 209, 8, 16]
La posible A se encuentra desplazada 20 ó 24

Frecuencias (Digito 6): [11, 26, 100, 10, 0, 77, 42, 92, 2, 161, 33, 34, 101, 128, 66, 92, 18, 0, 1, 27, 2, 224, 22,

<p style="color:blue;text-align:justify;">Al comprobar manualmente si, desde las posibles posiciones encontradas de la A, se puede situar la E, obtenemos que la clave debería ser "HABITUALMENTE". Sólo queda implementar una función que descifre el texto usando esta clave.</p>
<p style="color:blue;text-align:justify;">Para reutilizar la función de cifrado de Vigenère, se ha realizado el inverso de todas las cifras de la clave. De esta forma, al encriptar con Vigenère, en realidad, lo que estamos haciendo es descifrar el texto. Sólo hay que tener en cuenta la "Ñ" que tiene un código ASCII diferente al del resto de letras por ser un carácter especial.</p>

In [11]:
print(descifra_vigenere(text3, "HABITUALMENTE"))

NOESPOSIBLESEÑORMIOSINOQUEESTASYERBASDANTESTIMONIODEQUEPORAQUICERCADEBEDEESTARALGUNAFUENTEOARROYOQUEHUMEDECEYASISERABIENQUEVAYAMOSUNPOCOMASADELANTEQUEYATOPAREMOSDONDEPODAMOSMITIGARESTATERRIBLESEDQUENOSFATIGAQUESINDUDACAUSAMAYORPENAQUELAHAMBREPARECIOLEBIENELCONSEJOADONQUIJOTEYTOMANDODELARIENDAAROCINANTEYSANCHODELCABESTROASUASNODESPUESDEHABERPUESTOSOBREELLOSRELIEVESQUEDELACENAQUEDARONCOMENZARONACAMINARSOBREELPRADOARRIBAATIENTOPORQUELAOSCURIDADDELANOCHENOLESDEJABAVERCOSAALGUNAMASNOHUBIERONANDADODOSCIENTOSPASOSCUANDOLLEGOASUSOIDOSUNGRANRUIDODEAGUACOMOQUEDEALGUNOSGRANDESYLEVANTADOSRISCOSSEDESPEÑABAALEGROLESELRUIDOENGRANMANERAYPARANDOSEAESCUCHARHACIAQUEPARTESONABAOYERONADESHORAOTROESTRUENDOQUELESAGUOELCONTENTODELAGUAESPECIALMENTEASANCHOQUENATURALMENTEERAMEDROSOYDEPOCOANIMODIGOQUEOYERONQUEDABANUNOSGOLPESACOMPASCONUNCIERTOCRUJIRDEHIERROSYCADENASQUEACOMPAÑADOSDELFURIOSOESTRUENDODELAGUAPUSIERONPAVORACUALQUIEROTROCORAZONQUENOFUERAELDEDONQUIJOTEERALANOCHECOMOSEHADICHOOSCURAYELLOSACERTARONAESTARENT

<p style="color:blue;text-align:justify;">El texto corresponde a "Don Quijote de la Mancha" de Miguel de Cervantes. Concretamente al capítulo XX.</p>

## Cuarto Texto Encriptado

<p style="color:blue;text-align:justify;">Comenzamos realizando los dos análisis antes mencionados: frecuencia de aparición de las letras e índice de coincidencias.</p>

In [12]:
text4 = read_text(dataPath + "Texto4.txt")
get_analisis(text4)


Frecuencias: [2308, 259, 1550, 288, 1733, 2040, 326, 2, 152, 1385, 4454, 2087, 542, 2440, 1240, 0, 2273, 123, 346, 874, 863, 59, 25, 226, 3240, 4207, 348]

Indice de Coincidencia: 0.07554311523475472


<p style="color:blue;text-align:justify;">El análisis arroja los resultados esperados para un texto en idioma español sin atenuación de frencuencias. Al revisar el texto encontramos conque las letras siguen una secuencia sin muchas repeticiones lo que nos hace suponer que han sido desordenadas. También podemos apoyar esta teoría gracias a que las frecuencias obtenidas no muestran una separación viable para situar las letras "A" y "E" ya que las letras como mayor número de ocurrencias estan muy separadas entre sí.</p>

<p style="color:blue;text-align:justify;">El primer paso será situar las letras más frecuencias para ir desvelando palabras del texto. Para empezar que trío de letras aparece más veces en el texto. Este trío podría ser la palabra "QUE". De ser así podríamos situar 3 letras en el texto, y añadir la "A" intercambiándola por la letra con mas ocurrencias que reste.</p>

In [13]:
triagramas = ngramas_repetidos(text4, 3)
print(triagramas)

(['XNY', 'AEX', 'JXA', 'YAÑ', 'GCY'], [177, 166, 209, 183, 282])


<p style="color:blue;text-align:justify;">Los triagramas más repetidos son: "JXA" y "GCY". En las frecuencias podemos ver que la "Y" es la segunda letra que más se repite así que podría encajar con la "E". Por lo cual, podría cambiar "GCY" por "QUE". La "K" quedaría como la letra con más apariciones así que, ya situada la "E", podría intercambiarse con la "A".</p>

In [14]:
dic_permuta = {'A':'A', 'B':'B', 'C':'C', 'D':'D', 'E':'E', 'F':'F', 'G':'G', 'H':'H', 'I':'I', 'J':'J', 
               'K':'K', 'L':'L', 'M':'M', 'N':'N', 'Ñ':'Ñ', 'O':'O', 'P':'P', 'Q':'Q', 'R':'R', 'S':'S', 
               'T':'T', 'U':'U', 'V':'V', 'W':'W', 'X':'X', 'Y':'Y', 'Z':'Z'}

dic_permuta['G'] = 'q'
dic_permuta['C'] = 'u'
dic_permuta['Y'] = 'e'

dic_permuta['K'] = 'a'

dic_permuta['A'] = 'n'
dic_permuta['L'] = 'i'

dic_permuta['P'] = 'r'
dic_permuta['F'] = 'l'
dic_permuta['X'] = 'o'

text4_decrypt = cifra_sustitucion(text4, dic_permuta)
print(text4_decrypt)

aUoNEeNTueNenNuleJDoEeaRoniaaurelianoNeRunEoDaMiaEereJorEarlalluZioNaÑarEeEeIunioenqueenÑroenelEorSiÑorioaJonoJeraNuTriSerDiIoaunqueeralanRuiEoBlloronNinninRunraNRoEeunMuenEianoÑuZoqueTenNarEoNZeJeNTaraTonerlenoSMreNellaSaraIoNearJaEioEiIoWernanEaEelJarTiolaDerSoNaSuIerJonquienNeDaMiaJaNaEoelaUoanÑerioreNÑuZoEeaJuerEoenJaSMiourNulanoTuEooJulÑarunZaRoNenÑiSienÑoEeQoQoMraenlalarRaDiNÑoriaEelaWaSilialaÑenaQreTeÑiJionEeloNnoSMreNleDaMiaTerSiÑiEoNaJarJonJluNioneNqueleTareJianÑerSinanÑeNSienÑraNloNaurelianoNeranreÑraiEoNTeroEeSenÑaliEaEluJiEaloNIoNearJaEioeraniSTulNiZoNBeSTrenEeEoreNTeroeNÑaManSarJaEoNTorunNiRnoÑraRiJoloNuniJoNJaNoNEeJlaNiWiJaJioniSToNiMleeranloNEeIoNearJaEioNeRunEoBaurelianoNeRunEoWueronÑanTareJiEoNBÑraZieNoNEuranÑelainWanJiaquenilaTroTiaNanÑaNoWiaEelaTieEaEToEiaEiNÑinRuirloNelEiaEelMauÑiNSoaSaranÑaleNTuNoeNJlaZaNJonNuNreNTeJÑiZoNnoSMreNBloNZiNÑioJonroTaNEeJoloreNEiNÑinÑoNSarJaEaNJonlaNiniJialeNEeJaEaunoTeroJuanEoeSTeQaronaaNiNÑiralaeNJuelaoTÑaronTorJaSMiarNelaroTaBlaNeNJla

<p style="color:blue;text-align:justify;">Una vez situada la palabra "QUE", se buscan las ocurrencias de "QU_E_". Si encontramos una estructura de esta forma, suponemos que la palabra es "QUIEN" y realizamos la sustitución. Al principio del texto vemos la siguiente estructura "auPeFianX". Como la "X" encaja con la frecuencia que podría tener la "O" la palabra parece ser "aureliano", ya que tanto la "P" como la "F" tienen frecuencias que también encajan con la sustitución.</p>
<p style="color:blue;text-align:justify;">El texto, a partir de aquí, empieza a ser legible y se pueden detectar palabras para ir haciendo la sustitución y descifrar el texto.</p>

In [15]:
dic_permuta = {'A':'n', 'B':'y', 'C':'u', 'D':'h', 'E':'d', 'F':'l', 'G':'q', 'H':'k', 'I':'j', 'J':'c', 
               'K':'a', 'L':'i', 'M':'b', 'N':'s', 'Ñ':'t', 'O':'w', 'P':'r', 'Q':'z', 'R':'g', 'S':'m', 
               'T':'p', 'U':'ñ', 'V':'x', 'W':'f', 'X':'o', 'Y':'e', 'Z':'v'}

text4_decrypt = cifra_sustitucion(text4, dic_permuta)
print(text4_decrypt)

añosdespuesensulechodeagoniaaurelianosegundohabiaderecordarlalluviosatardedejunioenqueentroeneldormitorioaconocerasuprimerhijoaunqueeralanguidoylloronsinningunrasgodeunbuendianotuvoquepensardosvecesparaponerlenombresellamarajosearcadiodijofernandadelcarpiolahermosamujerconquiensehabiacasadoelañoanteriorestuvodeacuerdoencambioursulanopudoocultarunvagosentimientodezozobraenlalargahistoriadelafamilialatenazrepeticiondelosnombreslehabiapermitidosacarconclusionesqueleparecianterminantesmientraslosaurelianoseranretraidosperodementalidadlucidalosjosearcadioeranimpulsivosyemprendedoresperoestabanmarcadosporunsignotragicolosunicoscasosdeclasificacionimposibleeranlosdejosearcadiosegundoyaurelianosegundofuerontanparecidosytraviesosdurantelainfanciaquenilapropiasantasofiadelapiedadpodiadistinguirloseldiadelbautismoamarantalespusoesclavasconsusrespectivosnombresylosvistioconropasdecoloresdistintosmarcadasconlasinicialesdecadaunoperocuandoempezaronaasistiralaescuelaoptaronporcambiarselaropaylasescla

<p style="color:blue;text-align:justify;">El texto pertenece a "Cien Años de Soledad", libro de Gabriel García Márquez.</p>