# Ataques estadisticos: Analisis de frecuencias

## Funciones auxiliares

In [None]:
def ngramas(texto, n):
    """Divide el texto en ngramas"""
    texto = texto.replace(" ", "")
    return [texto[i:i+n] for i in range(len(texto)-n+1)]

In [None]:
from collections import Counter
import pandas as pd

def frec_ngramas(texto, n):
    """Calcula las frecuencias de los ngramas de un texto."""
    ng = ngramas(texto, n)
    frecuencias = Counter(ng)
    return pd.DataFrame(frecuencias.most_common(), columns=['letra','frecuencia'])

In [None]:
def leer_frecuencias(archivo):
    """Lee un fichero con las frecuencias de los ngramas en espanol."""
    return pd.read_csv(archivo, sep=" ", names=["letra", "frecuencia"])

In [None]:
def leer_texto_cifrado(texto_cifrado, n):
    """Lee el texto cifrado y calcula las frecuencias de los ngramas."""
    with open(texto_cifrado) as f:
        texto_cifrado = f.readlines()[0]
    return frec_ngramas(texto_cifrado, n)

## Analisis de Monogramas (letras)

In [None]:
monogramas_es = leer_frecuencias("spanish_monograms.txt")

In [None]:
monogramas_es.head(10)

In [None]:
monogramas_es.plot('letra', 'frecuencia', kind='bar')

In [None]:
monogramas_cifrado = leer_texto_cifrado('texto_cifrado.txt', 1)

In [None]:
monogramas_cifrado.head(10)

In [None]:
monogramas_cifrado.plot('letra', 'frecuencia', kind='bar')

## Analisis de Bigramas

In [None]:
bigramas_es = leer_frecuencias("spanish_bigrams.txt")
bigramas_es.head(10)

In [None]:
bigramas_cifrado = leer_texto_cifrado('texto_cifrado.txt', 2)
bigramas_cifrado.head(10)

## Analisis de Trigramas

In [None]:
trigramas_es = leer_frecuencias("spanish_trigrams.txt")
trigramas_es.head(40)

In [None]:
trigramas_cifrado = leer_texto_cifrado('texto_cifrado.txt', 3)
trigramas_cifrado.head(10)

## Analisis Cuatrigramas

In [None]:
cuatrigramas_es = leer_frecuencias("spanish_quadgrams.txt")
cuatrigramas_es.head(30)

In [None]:
cuatrigramas_cifrado = leer_texto_cifrado('texto_cifrado.txt', 4)
cuatrigramas_cifrado.head(20)

## Alfabeto permutado (clave)

In [None]:
alfabeto_permutado = {
     'a': 'u',
     'b': 'q',
     'c': 't',
     'd': 'f',
     'e': 'v',
     'f': 'n',
     'g': 'r',
     'h': 'a',
     'i': 'x',
     'j': 'b',
     'k': 'd',
     'l': 'e',
     'm': 'y',
     'n': 'j',
     'o': 'p',
     'p': 'c',
     'q': 'h',
     'r': 'z',
     's': 'k',
     't': 'i',
     'u': 'l',
     'v': 's',
     'w': 'g',
     'x': 'o',
     'y': 'w',
     'z': 'm'
}

In [None]:
import string

{letra:None for letra in string.ascii_lowercase}

## Algoritmo de descifrado

In [None]:
def algoritmo_descifrado(texto_cifrado, alfabeto_permutado):
    """Descifra el texto cifrado a partir de la clave de descifrado."""
    texto_plano = ""
    with open(texto_cifrado) as f:
        texto_cifrado = f.readlines()[0]
        
    for letra in texto_cifrado:
        if not alfabeto_permutado[letra.lower()]:
            texto_plano += letra
        else:
            texto_plano += alfabeto_permutado[letra.lower()]
    return texto_plano

In [None]:
algoritmo_descifrado('texto_cifrado.txt', alfabeto_permutado)