# Notebook con algoritmos utilizados en el taller

---
## Punto 1


### Solución Cifrado Afín

La función de cifrado afín está definida por:
$$
E_{a,b}(x) = (a x + b) \bmod 26
$$

#### a) Valores posibles de $a$ y $b$ para poder descifrar
Para que la función de cifrado sea invertible (y por lo tanto se pueda descifrar), el multiplicador $a$ debe tener un inverso multiplicativo módulo 26. Esto significa que **el máximo común divisor entre $a$ y 26 debe ser 1** (es decir, $a$ debe ser coprimo con 26).

El desplazamiento $b$ puede ser cualquier número entre 0 y 25.

Los valores posibles para $a$ en $\mathbb{Z}_{26}$ son: $1, 3, 5, 7, 9, 11, 15, 17, 19, 21, 23, 25$.

#### b) Total de claves válidas $k = (a, b)$
Sabiendo que existen 12 valores posibles para $a$ y 26 valores posibles para el desplazamiento $b$, el total de combinaciones de claves válidas es la multiplicación de ambos:
$$
12 \times 26 = 312 \text{ claves válidas}
$$

#### c) Descifrar el mensaje interceptado
Sabiendo que $b = 20$, iteremos sobre las 12 claves válidas para $a$ mediante un ataque de fuerza bruta intentando encontrar lenguaje natural en español.

In [16]:
def mod_inverse(a, m):
    """Encuentra el inverso multiplicativo de 'a' modulo 'm'."""
    for x in range(1, m):
        if (a * x) % m == 1:
            return x
    return None

In [17]:
ciphertext = "OAZUSKHFKHYCXKKGWKZUOQUFKQUFACUOOYHOAQPZKOKOOYZYPYXGWKHYOKTUHCWKHFUTKZYCYQPZACUTUGWKKOZUNATURYJHNYHHKWQUHH"
b = 20
m = 26
print("Texto a descifrar: \n"+ciphertext)

Texto a descifrar: 
OAZUSKHFKHYCXKKGWKZUOQUFKQUFACUOOYHOAQPZKOKOOYZYPYXGWKHYOKTUHCWKHFUTKZYCYQPZACUTUGWKKOZUNATURYJHNYHHKWQUHH


In [None]:
# Los 12 valores coprimos con 26
valores_a = [1, 3, 5, 7, 9, 11, 15, 17, 19, 21, 23, 25]

print("Probando las 12 claves posibles para 'a':\n")
for a in valores_a:
    a_inv = mod_inverse(a, m)
    plaintext = ""
    for char in ciphertext:
        y = ord(char) - ord('A')
        x = (a_inv * (y - b)) % m
        plaintext += chr(x + ord('A'))
    
    print(f"-> Probando a={a}, Inverso a^(-1)={a_inv}:")
    print(f"{plaintext[:200]}...\n")

Probando las 12 claves posibles para 'a':

-> Probando a=1, Inverso a^(-1)=1:
UGFAYQNLQNEIDQQMCQFAUWALQWALGIAUUENUGWVFQUQUUEFEVEDMCQNEUQZANICQNLAZQFEIEWVFGIAZAMCQQUFATGZAXEPNTENNQCWANN...

-> Probando a=3, Inverso a^(-1)=9:
YCTAIONVONKUBOOESOTAYQAVOQAVCUAYYKNYCQHTOYOYYKTKHKBESONKYORANUSONVAROTKUKQHTCUARAESOOYTAPCRAZKFNPKNNOSQANN...

-> Probando a=5, Inverso a^(-1)=21:
EWBAKYNXYNGMLYYSQYBAEUAXYUAXWMAEEGNEWUZBYEYEEGBGZGLSQYNGEYFANMQYNXAFYBGMGUZBWMAFASQYYEBAJWFAPGDNJGNNYQUANN...

-> Probando a=7, Inverso a^(-1)=15:
OMXAWGNJGNIQTGGYEGXAOSAJGSAJMQAOOINOMSDXGOGOOIXIDITYEGNIOGLANQEGNJALGXIQISDXMQALAYEGGOXAZMLAHIRNZINNGESANN...

-> Probando a=9, Inverso a^(-1)=3:
ISPAUWNHWNMYJWWKGWPAIOAHWOAHSYAIIMNISOLPWIWIIMPMLMJKGWNMIWXANYGWNHAXWPMYMOLPSYAXAKGWWIPAFSXARMTNFMNNWGOANN...

-> Probando a=11, Inverso a^(-1)=19:
QKRAOSNBSNYWFSSUMSRAQCABSCABKWAQQYNQKCJRSQSQQYRYJYFUMSNYQSHANWMSNBAHSRYWYCJRKWAHAUMSSQRAXKHAVYZNXYNNSMCANN...

-> Probando a=15, Inverso a^(-1)=7:
KQJAMINZINCEVIIGOIJAKYAZIYAZQEAKKCNKQYRJI

Al observar las impresiones por pantalla es claro que cuando **$a = 17$** el texto cobra sentido en espanol.

#### Mensaje original recuperado y espaciado:

> "SI LA GENTE NO CREE QUE LAS MATEMATICAS SON SIMPLES ES SOLO PORQUE NO SE DAN CUENTA DE LO COMPLICADA QUE ES LA VIDA JOHN VON NEUMANN"

*(Se asume la falta de la 'A' en matematicas en el criptograma original debido a un error de tipeo en el origen).*

---
## Punto 2

---
## Punto 3

Hay un mensaje cifrado con el criptosistema de Vigenere:

In [19]:
message = """
IAKEHSSFUGQMRWLWLREAFDWOYRBLVWXDYTQRYOSNYQJYRYIJSBVEJKSEYGPEEEYLGBATBIEDFOGHRUKJ
UALMBWLWLGPEBOHOIZINNGSJYQPEEVSEOPPTUDXKBRUAQHLWLNAMNOPJYQDEYYILBBWDVWWMCGMDUHVH
YENEPWPQUALFERQLBNBDNBSFYIMRLRRWWNTLRGLWLYQTGOIJYQZIQLRYBBWDBQIEIEVIAJLWLZWTUHVK
UVLCBPIDCGBLRUIVLVLIAJLGIQPEEHWSJVMCRRJUUXMAAGETIGBLRRJOCAMTNNILBRUTBBSMLTZAAGQG
NUMRFKIKMVKKNQHOYNSAAGXZCFEIYOHGBRZGBRHYIOMFBUIANTMTFWSGBBBAAGVWGRUBRUXGQNTKPDVW
ZHTLLGSFNFBRNBJJIZBHRSELBBZYBXQAAUBFNOPSHQJRRDOLBRJOGWPWUALWUHRQIHIRELZWXBVTSRVY
YGBOFDCYIBLMBURAHTJESRVWSBCPRHOSLBCNQKIJLBWMVOPTYPIRRIYDGBBHRUWSCQTIGWPWLRLRVGMF
AUWOQDRVMUMPERQAMRLWVWLSMZQLRWLWAEINQPSLBRZLVYIVXRMPVQXZYSWRRVXSVBCTUDPXUYMATXIX
LBUTUHZAFYIGRMYKNNALVWXDYEMDELHAHTPOBGIFNRZEQWLWQBWDFDAGFSIPCHEJYQWNGKIHUGPSUHHA
XABKARAOBNBAJLGCYQKRRDXMLRPEJDWSHQNEYWRGZRIRNWEDF
"""

In [20]:
message = message.replace("\n", "")
print(message)

IAKEHSSFUGQMRWLWLREAFDWOYRBLVWXDYTQRYOSNYQJYRYIJSBVEJKSEYGPEEEYLGBATBIEDFOGHRUKJUALMBWLWLGPEBOHOIZINNGSJYQPEEVSEOPPTUDXKBRUAQHLWLNAMNOPJYQDEYYILBBWDVWWMCGMDUHVHYENEPWPQUALFERQLBNBDNBSFYIMRLRRWWNTLRGLWLYQTGOIJYQZIQLRYBBWDBQIEIEVIAJLWLZWTUHVKUVLCBPIDCGBLRUIVLVLIAJLGIQPEEHWSJVMCRRJUUXMAAGETIGBLRRJOCAMTNNILBRUTBBSMLTZAAGQGNUMRFKIKMVKKNQHOYNSAAGXZCFEIYOHGBRZGBRHYIOMFBUIANTMTFWSGBBBAAGVWGRUBRUXGQNTKPDVWZHTLLGSFNFBRNBJJIZBHRSELBBZYBXQAAUBFNOPSHQJRRDOLBRJOGWPWUALWUHRQIHIRELZWXBVTSRVYYGBOFDCYIBLMBURAHTJESRVWSBCPRHOSLBCNQKIJLBWMVOPTYPIRRIYDGBBHRUWSCQTIGWPWLRLRVGMFAUWOQDRVMUMPERQAMRLWVWLSMZQLRWLWAEINQPSLBRZLVYIVXRMPVQXZYSWRRVXSVBCTUDPXUYMATXIXLBUTUHZAFYIGRMYKNNALVWXDYEMDELHAHTPOBGIFNRZEQWLWQBWDFDAGFSIPCHEJYQWNGKIHUGPSUHHAXABKARAOBNBAJLGCYQKRRDXMLRPEJDWSHQNEYWRGZRIRNWEDF


### Explicación del criptosistema de Vigenere

$$
C(X_i) = (X_i + K_i) \bmod 26
$$
Donde $X$ es el mensaje, $i$ es la posición y $K$ la clave

#### Ejemplo de cifrado:

$X$ = HOLA

$K$ = CLAVE

- Ambos debes quedar del mismo tamaño

$X$ = HOLA

$K$ = CLAV

- Pasamos la letra a su valor en numero

|Letra|Valor|
|---|---|
|H|7|
|O|14|
|L|11|
|A|0|
|C|2|
|L|11|
|A|0|
|V|21|

- Sumamos en módulo 26 y pasamos a letra

|Suma|Letra|
|---|---|
|9|J|
|25|Z|
|11|L|
|21|V|

Texto cifrado: JZLV



#### Funciones útiles

In [21]:
def letra_a_numero(letra):
    return ord(letra.upper()) - ord('A')

def numero_a_letra(numero):
    return chr(numero % 26 + ord('A'))

def cifrar_por_vigenere(mensaje:str, clave:str) -> str:
    # Tamaño de mensaje vs clave
    while len(mensaje) > len(clave):
        clave += clave
    
    while len(mensaje) != len(clave):
        clave = clave[:-1]
    
    # Pasar a letras
    mensaje_list = []
    for a in mensaje:
        mensaje_list.append(letra_a_numero(a))
        
    clave_list = []
    for a in clave:
        clave_list.append(letra_a_numero(a))
        
    # print(mensaje_list)
    # print(clave_list)
    
    #Sumar módulo 26
    cifrado_list = []
    for a in range(len(mensaje_list)):
        cifrado_list.append(
            mensaje_list[a] + clave_list[a]
        )
    
    for a in range(len(cifrado_list)):
        while not cifrado_list[a] < 26:
            cifrado_list[a]-=26
    
    # print(cifrado_list)
    
    # Pasar a texto
    out = ""
    for a in cifrado_list:
        out+=numero_a_letra(a)
        
    return out
    pass


### Ataque visto en clase
Intuición: La clave se repite todo el tiempo, entonces habrá un patrón cada cierto numero de letras si el mensaje tiene pedazos iguales

Se utiliza en indice de coincidencia (probabilidad de que 2 letras elejidas al azar sean iguales)
$$
IC = \frac{\sum_{i=0}^{25} f_i(f_i-1)}{N(N-1)}
$$
Donde $f_i$ es la frecuencia de la letra $i$ y $N$ es el total de letras del texto

- Las posiciones $0, k, 2k, 3k, \dots$ fueron cifradas con la misma letra de la clave.
- Las posiciones $1, k+1, 2k+1, \dots$ también.

Entonces el texto cifrado puede separarse en **$k$ columnas**, donde cada columna fue cifrada con un único desplazamiento (un César).

Se prueba con $k=1,2,3, \dots$ y se calcula el IC de cada columna

- Texto en lenguaje natural (español/inglés): $
  IC \approx 0.065
  $

- Texto completamente aleatorio:
  $
  IC \approx \frac{1}{26} \approx 0.038
  $

#### Como descifrar?
Entonces hacemos esto:

- Por cada columna:
  - Probar los 26 desplazamientos y ver cuál produce texto que parece inglés
  - usar la formula de chi cuadrado para evaluar si la distribución del decifrado se parece al inglés
  - un chi cuadrado pequeño dice que si se parece al inglés
  - un chi cuadrado grande dice que no se parece

$$
X^2= \sum^{25}_{i=0} \frac{(O_i-E_i)^2}{E_i}
$$

Donde $O_i$ es la frecuencia observada de la letra $i$ en el texto y E_i es la frecuencia esperada de la letra $i$ en en ingles

In [22]:
def ic(lista):
    
    N = len(lista)
    if N <= 1:
        return 0
    
    sumatoria = 0
    for i in range(26):
        f = lista.count(i)
        sumatoria += f*(f-1)
    
    return sumatoria / (N*(N-1))

def columnas(lista: list, j:int):
    # Separa una lista en j columnas
    out = [[] for _ in range(j)]
    # print(out)
    j_ = 0
    for a in lista:
        # print(out)
        out[j_].append(a)
        j_= j_+1 if j_<j-1 else 0
    return out

def chi2(lista, frecuencias_ingles):
    N = len(lista)
    chi = 0
    for i in range(26):
        O_i = lista.count(i)
        E_i = frecuencias_ingles[i] * N
        if E_i > 0:
            chi += ((O_i - E_i) ** 2) / E_i
    return chi

def descifrar_con_cesar(lista, desplazamiento):
    out = ["" for _ in lista]
    for a in range(len(lista)):
        decifrado = (lista[a]-desplazamiento) %26
        out[a] = decifrado
    return out

def descifrar_vigenere(texto, clave):
    texto_lista = [letra_a_numero(a) for a in texto]
    clave_lista = [letra_a_numero(a) for a in clave]
    while len(texto_lista) > len(clave_lista):
        clave_lista += clave_lista
    while len(texto_lista) != len(clave_lista):
        clave_lista.pop()
    
    decifrado = [(texto_lista[i] - clave_lista[i]) %26 for i in range(len(texto_lista))]
    out = ""
    for a in decifrado:
        out += numero_a_letra(a)
    return out


### 1. Encontrar el periodo j de la clave k
Utilizando el ataque visto en clase, utilizando el indice de coincidencia, encuentre el periodo j de la clave secreta k (busque entre 1 y 10).

In [23]:
message
msg_list = [letra_a_numero(a) for a in message]

In [24]:
ics = [0]
for a in range(1, 10):
    cols = columnas(msg_list, a)
    
    # Lista con los ic de las columnas
    ic_s=[ic(b) for b in cols]
    
    #promedio de ic asumiendo un tamaño a
    sum = 0
    for c in ic_s:
        sum+=c
    ics.append(sum/len(ic_s))
    

In [25]:
display(ics)
j = ics.index(max(ics))
print(f"Tamaño clave: {j}")

[0,
 0.04295012462071955,
 0.04679125269856341,
 0.04288484524808626,
 0.05400005877618931,
 0.04140967391741386,
 0.04756502548373314,
 0.041258809148717414,
 0.06846711656719118,
 0.04274350567100225]

Tamaño clave: 8


La posición 8 es la más cercana a 0.065, por lo que lo mas posible es que $j=len(K) = 8$

### 2. Encontrar clave secreta y texto original
Utilizando el ataque visto en clase, encuentre la clave secreta k y el texto orignal (que esta en ingles).

In [26]:
english_freq = {
    'a': 0.08167, 'b': 0.01492, 'c': 0.02782, 'd': 0.04253,
    'e': 0.12702, 'f': 0.02228, 'g': 0.02015, 'h': 0.06094,
    'i': 0.06966, 'j': 0.00153, 'k': 0.00772, 'l': 0.04025,
    'm': 0.02406, 'n': 0.06749, 'o': 0.07507, 'p': 0.01929,
    'q': 0.00095, 'r': 0.05987, 's': 0.06327, 't': 0.09056,
    'u': 0.02758, 'v': 0.00978, 'w': 0.02360, 'x': 0.00150,
    'y': 0.01974, 'z': 0.00074
}
en_list = [a for a in english_freq.values()]

In [27]:
cols = columnas(msg_list, j)

In [28]:
chis2 = []
ks=[]
for a in cols:
    mejor_k = None
    mejor_chi = float("inf")

    for k in range(26):
        lista_descifrada = descifrar_con_cesar(a, k)
        chi = chi2(lista_descifrada, en_list)
        
        if chi < mejor_chi:
            mejor_chi = chi
            mejor_k = k
    chis2.append(mejor_chi)
    ks.append(mejor_k)
print(f"Desplazamientos por columna: {ks}")

Desplazamientos por columna: [20, 13, 8, 0, 13, 3, 4, 18]


In [29]:
k = ""
for a in ks:
    k+=numero_a_letra(a)
k

'UNIANDES'

In [30]:
descifrar_vigenere(message, k)

'ONCEUPONATIMETHEREWASASWEETLITTLEGIRLLOVEDBYEVERYONEWHOMETHERBUTMOSTOFALLBYHERGRANDMOTHERTHEOLDWOMANADOREDHERSOMUCHTHATSHEMADEHERASMALLREDVELVETHOODITSUITEDHERPERFECTLYANDFROMTHATDAYONEVERYONECALLEDHERLITTLEREDRIDINGHOODONEMORNINGHERMOTHERSAIDCOMELITTLEREDRIDINGHOODHERESAPIECEOFCAKEANDABOTTLEOFWINETAKETHEMTOYOURGRANDMOTHERSHESSICKANDWEAKANDTHISWILLDOHERGOODGOBEFOREITGETSTOOHOTANDREMEMBERTOWALKCAREFULLYDONTSTRAYFROMTHEPATHORYOUMIGHTFALLANDBREAKTHEBOTTLEANDWHENYOUARRIVEDONTFORGETTOSAYGOODMORNINGBEFOREYOUPEEKAROUNDHERROOMILLBECAREFULMOTHERSAIDLITTLEREDRIDINGHOODANDSHEPROMISEDWITHASMILETHEGRANDMOTHERLIVEDDEEPINTHEFORESTABOUTHALFALEAGUEFROMTHEVILLAGEJUSTASLITTLEREDRIDINGHOODENTEREDTHEWOODSAWOLFAPPEAREDONTHEPATHSHEDIDNTKNOWWHATAWICKEDCREATUREHEWASANDFELTNOFEARATALL'