# Tarea 20% de SPSI 2025/2026

**Asignatura:**         Seguridad y Protecci√≥n de Sistemas Inform√°ticos (SPSI)  
**Grupo de trabajo:**   9  
**Curso:**              2025/2026  
**Alumnos:**             Mart√≠n Hern√°ndez Ruiz,
                         Mar√≠a Meg√≠as Moyano,
                         Patricia Cobos Rueda

---

## √çndice

1. [Introducci√≥n te√≥rica al cifrado de Vigen√®re](#intro-vigenere)  
2. [Implementaci√≥n en Python del criptosistema de Vigen√®re](#implementacion)  
   2.1. [Normalizaci√≥n del texto y representaci√≥n interna](#normalizacion)  
   2.2. [Funciones de cifrado y descifrado](#funciones-vigenere)  
   2.3. [Pruebas b√°sicas](#pruebas-basicas)  
3. [Laboratorio de criptoan√°lisis del Vigen√®re](#laboratorio)  
   3.1. [√çndice de coincidencia e √≠ndice de Friedman](#ic-friedman)  
   3.2. [An√°lisis de Kasiski](#kasiski)  
   3.3. [Ruptura de las columnas como cifrados de C√©sar](#ruptura-cesar)  
4. [Aplicaci√≥n al criptograma propuesto en las tareas de SPSI](#aplicacion-criptograma)  
5. [Conclusiones](#conclusiones)  

---


## 1. Introducci√≥n te√≥rica al cifrado de Vigen√®re <a id="intro-vigenere"></a>

El **cifrado de Vigen√®re** es un ejemplo cl√°sico de **cifrado por sustituci√≥n polialfab√©tica**.  
En lugar de usar un √∫nico alfabeto de sustituci√≥n (como en el cifrado de C√©sar), utiliza varios alfabetos distintos, controlados por una **clave** repetida peri√≥dicamente. Esto tiene como objetivo principal **disfrazar las frecuencias de las letras del texto llano** y dificultar el an√°lisis de frecuencia directo.   

Hist√≥ricamente, el cifrado fue atribuido a Blaise de Vigen√®re, aunque la idea aparece ya en trabajos anteriores de Belasso y Trithemius. 

Durante siglos se consider√≥ pr√°cticamente irrompible; lleg√≥ a ser conocido como **le chiffre ind√©chiffrable** y a principios del siglo XX a√∫n se afirmaba que era ‚Äúimposible de romper‚Äù. Sin embargo, su reputaci√≥n era inmerecida: el examen de Kasiski y, m√°s tarde, la prueba de Friedman mostraron que es vulnerable si se analiza con las herramientas adecuadas.   

### 1.1. Definici√≥n formal b√°sica

Sea n ‚àà w* A un alfabeto de n s√≠mbolos. Una clave de Vigen√®re es cualquier elemento K de ex p(A)*. La funci√≥n de cifrado sobre el alfabeto A de n s√≠mbolos seg√∫n la clave K es E<sub>k</sub> : exp(A)* ‚Üí exp(A)* definida como sigue:

  E<sub>k</sub>(s)= {(f<sup>-1</sup>)((f(s<sub>j</sub>) + f (K<sub>j</sub><sup>len(s)</sup> )) mod n)}<sub>j</sub>

donde s = ‚ü®s<sub>j</sub> ‚ü©<sub>j</sub>, K<sup>len(s)</sup> es la yuxtaposici√≥n de la expresi√≥n K consigo misma y eventual truncamiento final hasta conseguir as√≠ una expresi√≥n con la misma longitud que s. La funci√≥n de descifrado sobre ese alfabeto y clave es D<sub>K</sub> : exp(A)‚àó ‚Üí exp(A)‚àó definida por:  

  D<sub>k</sub>(s)= {(f<sup>-1</sup>)((f(s<sub>j</sub>) - f (K<sub>j</sub><sup>len(s)</sup> )) mod n)}<sub>j</sub>

En notaci√≥n compacta (como en las transparencias), la funci√≥n de cifrado \(E_K\) toma una palabra \(s\) y devuelve otra palabra de la misma longitud, sumando ‚Äútexto + clave‚Äù m√≥dulo \(n\), mientras que la funci√≥n de descifrado \(D_K\) resta la clave. Se cumple que \(D_K \circ E_K = \mathrm{id}\), es decir, descifrar lo cifrado recupera exactamente el texto original.   

### 1.2. Idea de seguridad y debilidad principal

La idea intuitiva es que **una misma letra de texto llano no siempre se cifra como la misma letra de texto cifrado**. Por ejemplo, la letra m√°s frecuente del ingl√©s, `E`, puede transformarse en muchas letras distintas en posiciones diferentes del mensaje, dependiendo de la letra de la clave que se est√© usando en cada caso. Esto rompe el patr√≥n tan evidente de un cifrado monoalfab√©tico y hace que el an√°lisis de frecuencias simple deje de funcionar. 

Sin embargo, la gran **debilidad** del cifrado de Vigen√®re est√° precisamente en la **estructura peri√≥dica de la clave**. Si un criptoanalista consigue averiguar la **longitud de la clave** \(m\), el texto cifrado puede reorganizarse en \(m\) columnas, cada una de las cuales se comporta como un **cifrado de C√©sar independiente**. Entonces es posible aplicar t√©cnicas de an√°lisis de frecuencias (œá¬≤, √≠ndice de coincidencia, etc.) columna a columna y recuperar la clave completa.   

Los dos m√©todos cl√°sicos que explotan esta debilidad son:

- El **examen de Kasiski**, que busca repeticiones de bloques en el criptograma y utiliza las distancias entre ellas para proponer candidatos a longitud de clave.   
- La **prueba de Friedman** (o prueba kappa), que se basa en el **√≠ndice de coincidencia** y permite estimar la longitud de la clave a partir de las frecuencias globales (o por columnas) del texto cifrado.   

En el resto del cuaderno implementaremos tanto el cifrado y descifrado de Vigen√®re como estas t√©cnicas de criptoan√°lisis, siguiendo el enfoque desarrollado en las transparencias de teor√≠a y los textos de Hoffstein‚ÄìPipher‚ÄìSilverman y Dalkilic‚ÄìG√ºng√∂r.

---


## 2. Implementaci√≥n en Python del criptosistema de Vigen√®re <a id="implementacion"></a>

### 2.1. Normalizaci√≥n del texto y representaci√≥n interna <a id="normalizacion"></a>

Para cumplir el modelo matem√°tico visto en las transparencias de SPSI , debemos garantizar que el texto llano
y la clave contienen **solo caracteres del alfabeto**. Por eso aplicamos:

- conversi√≥n a **may√∫sculas**,  
- eliminaci√≥n de caracteres no alfab√©ticos,  
- mapeo letra ‚Üî n√∫mero.

Esto coincide con las pr√°cticas habituales de los cifrados cl√°sicos y con la forma en que se
presenta el algoritmo en el material de teor√≠a.


In [15]:
import string

# Alfabeto que usaremos: letras may√∫sculas A-Z
ALPHABET = string.ascii_uppercase               # LLamamos a la funci√≥n de string de python que contiene todas las letras del abecedario
ALPHABET_SIZE = len(ALPHABET)


def normalize_text(text: str) -> str:           # Normaliza texto: convierte a may√∫sculas y elimina caracteres que no sean A-Z
    text = text.upper()                         # Convierte todo el texto a may√∫sculas
    normalized = []                             # Lista donde acumularemos solo los caracteres A-Z
    for ch in text:                             # Recorre cada car√°cter del texto en may√∫sculas
        if ch in ALPHABET:                      # Comprueba si el car√°cter pertenece al alfabeto A-Z
            normalized.append(ch)               # A√±ade la letra v√°lida a la lista de normalizados
    return "".join(normalized)                  # Devuelve la cadena resultante formada solo por letras A-Z


def char_to_int(ch: str) -> int:                # Convierte un car√°cter 'A'-'Z' a entero 0-25
    return ord(ch) - ord('A')                   # Resta el c√≥digo Unicode de 'A' para mapear 'A'->0, 'B'->1, ... 'Z'->25


def int_to_char(n: int) -> str:                 # Convierte un entero 0-25 a car√°cter 'A'-'Z' (con m√≥dulo 26)
    n = n % ALPHABET_SIZE                       # Normaliza el entero aplicando m√≥dulo ALPHABET_SIZE para asegurar 0-25
    return chr(n + ord('A'))                    # Suma el c√≥digo de 'A' y convierte el entero a car√°cter correspondiente


def normalize_key(key: str) -> str:             # Normaliza la clave (solo letras A-Z, may√∫scula) y valida no vac√≠a
    k = normalize_text(key)                     # Llama a normalize_text para obtener la clave en A-Z sin caracteres no permitidos
    if not k:                                    # Comprueba si la clave normalizada est√° vac√≠a
        raise ValueError("La clave debe " \
        "contener " \
        "al menos una letra A-Z.")               # Lanza excepci√≥n si no hay letras v√°lidas
    return k                                     # Devuelve la clave normalizada y validada

### 2.2. Funciones de cifrado y descifrado <a id="funciones-vigenere"></a>

Implementamos ahora las funciones principales del criptosistema de Vigen√®re:
- `vigenere_encrypt(plaintext, key)`
- `vigenere_decrypt(ciphertext, key)`


In [16]:
def vigenere_encrypt(text: str, key: str) -> str:       # Define la funci√≥n de cifrado Vigen√®re
    P = normalize_text(text)                            # Normaliza el texto de entrada (solo A-Z, may√∫sculas)
    K = normalize_key(key)                              # Normaliza y valida la clave (no vac√≠a, A-Z)
    cadena_cifrar = []                                  # Lista donde acumularemos los caracteres cifrados
    key_len = len(K)                                    # Longitud de la clave normalizada

    for i, ch in enumerate(P):                          # Recorre cada car√°cter del texto normalizado con su √≠ndice
        letra_val = char_to_int(ch)                     # Convierte la letra del texto a su valor num√©rico 0-25
        key_val = char_to_int(K[i % key_len])           # Toma la letra de la clave correspondiente (repetida) y la convierte a n√∫mero
        cif_val = (letra_val + key_val) % ALPHABET_SIZE # Suma texto+clave m√≥dulo tama√±o del alfabeto para cifrar
        cif_char = int_to_char(cif_val)                 # Convierte el valor num√©rico cifrado de vuelta a letra
        cadena_cifrar.append(cif_char)                  # A√±ade la letra cifrada a la lista de salida

    texto_cifrado = "texto_cifrado.txt"                 # Nombre del archivo donde se guardar√° el texto cifrado    
    with open(texto_cifrado, 'w+') as archivo:          # Abre (o crea) el archivo de texto cifrado en modo escritura
        archivo.write("".join(cadena_cifrar))           # Escribe la cadena cifrada en el archivo

    return "".join(cadena_cifrar)                       # Une y devuelve la cadena cifrada final


def vigenere_decrypt(cadena_cif: str, key: str) -> str: # Define la funci√≥n de descifrado Vigen√®re
    C = normalize_text(cadena_cif)                      # Normaliza el texto cifrado (solo A-Z, may√∫sculas)
    K = normalize_key(key)                              # Normaliza y valida la clave usada para descifrar
    descif_chars = []                                   # Lista donde acumularemos los caracteres descifrados
    key_len = len(K)                                    # Longitud de la clave normalizada

    for i, ch in enumerate(C):                          # Recorre cada car√°cter del texto cifrado con su √≠ndice
        char_val = char_to_int(ch)                      # Convierte la letra cifrada a su valor num√©rico 0-25
        key_val = char_to_int(K[i % key_len])           # Toma la letra de la clave correspondiente y la convierte a n√∫mero
        descif_val = (char_val-key_val) % ALPHABET_SIZE # Resta clave al cifrado m√≥dulo alfabeto para obtener el valor del texto llano
        descif_char = int_to_char(descif_val)           # Convierte el valor num√©rico descifrado de vuelta a letra
        descif_chars.append(descif_char)                # A√±ade la letra descifrada a la lista de salida
    return "".join(descif_chars)                        # Une y devuelve la cadena del texto llano resultante

### 2.3. Pruebas b√°sicas <a id="pruebas-basicas"></a>

Comprobamos ahora que cifrar y luego descifrar un mensaje devuelve el texto original (normalizado).


In [17]:
from collections import Counter

while True:
	print("|--------------|")
	print("|  1 Cifrar    |")
	print("|  2 Descifrar |")
	print("|  3 Salir     |")
	print("|--------------|")
	try:
		opt = int(input("Ingrese opcion: "))
	except ValueError:
		print("Opci√≥n inv√°lida, introduzca un n√∫mero (1-3).")
		continue

	# -----------------------------------------------------------
	# 1) CIFRAR Y GUARDAR EN ARCHIVO
	# -----------------------------------------------------------
	if opt == 1:
		ruta_entrada = "texto.txt"
		ruta_clave = "clave.txt"
		ruta_salida = "texto_cifrado.txt"

		# Leer texto plano
		try:
			with open(ruta_entrada, "r", encoding="utf-8") as f:
				texto_plano = f.read()
		except FileNotFoundError:
			print(f"No se encontr√≥ el archivo {ruta_entrada}")
			continue


		try:
			with open(ruta_clave, "r", encoding="utf-8") as f:
				clave = f.read().strip()								#Leemos la clave y la guardamos
		except FileNotFoundError:
			print(f"No se encontr√≥ el archivo {ruta_clave}")
			continue

		# Cifrar
		texto_cifrado = vigenere_encrypt(texto_plano, clave)

		# Guardar salida
		with open(ruta_salida, "w", encoding="utf-8") as f:
			f.write(texto_cifrado)

		print(f"\nTexto cifrado guardado en '{ruta_salida}'\n")

	# -----------------------------------------------------------
	# 2) DESCIFRAR DESDE ARCHIVO Y GUARDAR SALIDA
	# -----------------------------------------------------------
	elif opt == 2:
		ruta_cifrado = "texto_cifrado.txt"
		ruta_clave = "clave.txt"
		ruta_salida = "texto_descifrado.txt"

		# Leer texto cifrado
		try:
			with open(ruta_cifrado, "r", encoding="utf-8") as f:
				texto_cifrado = f.read()
		except FileNotFoundError:
			print(f"No se encontr√≥ el archivo {ruta_cifrado}")
			continue

		# Leer clave
		try:
			with open(ruta_clave, "r", encoding="utf-8") as f:
				clave = f.read().strip()
				
		except FileNotFoundError:
			print(f"No se encontr√≥ el archivo {ruta_clave}")
			continue

		# Descifrar
		texto_descifrado = vigenere_decrypt(texto_cifrado, clave)

		# Guardar salida
		with open(ruta_salida, "w", encoding="utf-8") as f:
			f.write(texto_descifrado)

		print(f"\nTexto descifrado guardado en '{ruta_salida}'\n")

	# -----------------------------------------------------------
	# 3) SALIR
	# -----------------------------------------------------------
	elif opt == 3:
		print("Saliendo...")
		break

	else:
		print("Opci√≥n no v√°lida.\n")


|--------------|
|  1 Cifrar    |
|  2 Descifrar |
|  3 Salir     |
|--------------|

Texto cifrado guardado en 'texto_cifrado.txt'

|--------------|
|  1 Cifrar    |
|  2 Descifrar |
|  3 Salir     |
|--------------|

Texto descifrado guardado en 'texto_descifrado.txt'

|--------------|
|  1 Cifrar    |
|  2 Descifrar |
|  3 Salir     |
|--------------|
Saliendo...


Vemos como se ha cifrado y descifrado el texto deseado correctamente, <b> CONOCIENDO </b> la clave de cifrado.

¬øPero qu√© pasar√≠a si <b> NO CONOCEMOS </b> la clave de cifrado?

¬øSeriamos capaces de descifrar el texto cifrado por el algor√≠tmo de Vigen√®re?.

Eso ser√° lo que estudiaremos en los siguienets apartados del cuaderno.

---

## 3. Laboratorio de criptoan√°lisis del Vigen√®re <a id="laboratorio"></a>




### 3.1. √çndice de coincidencia e √≠ndice de Friedman <a id="ic-friedman"></a>

El **√≠ndice de coincidencia (IC)** de un texto se define como:

  IC=   ‚àë<sub>i</sub> f<sub>i</sub> (f<sub>i</sub> ‚àí 1 ) / N ( N ‚àí 1 )
	‚Äã


donde:
- f<sub>i</sub> es la frecuencia absoluta de la i-√©sima letra,
- N es el n√∫mero total de letras.

El IC lo que mide con la f√≥rmula indicada arriba c√≥mo de parecida es la distribuci√≥n de las frecuencias de un texto a la del idioma natural.
Si analizamos los valores tipicos del IC observamos que:

  | Tipo de texto                    | IC aproximado                    |
  | -------------------------------- | -------------------------------- |
  | **Ingl√©s natural**               | ~0.066                           |
  | **Espa√±ol**                      | ~0.07                            |
  | **Texto aleatorio**              | ~0.038                           |
  | **Vigen√®re con clave muy larga** | cercano a 0.038                  |
  | **Vigen√®re con clave corta**     | entre 0.04 y 0.06 seg√∫n longitud |

Cuanto m√°s bajo son los valores del IC, m√°s aleatorio parece el texto.
El espa√±ol tiene un mayor IC puesto que la concentraci√≥n de letras que se repiten es mayor, es decir la distribuci√≥n de frecuencias es m√°s desigual.
  - Alta frecuencia de: E, A, O, S, N, R, L
  - Menor diversidad en las consonantes menos comunes.

El cifrado Vigen√®re mezcla varios alfabetos seg√∫n la longitud de clave m.
Friedman lo que propon es:

  - Si la clave es corta ‚Üí IC sube
  - Si la clave es larga ‚Üí IC baja

Por eso, IC te permite estimar la longitud de la clave.
La f√≥rmula de Friedman para estimar 'm' es:

  m ‚âà ( K<sub>0</sub> - K<sub>r</sub> ) N / ( N - 1 ) IC - K<sub>0</sub> + K<sub>r</sub>


Para texto en **ingl√©s** no cifrado, el IC t√≠pico es aproximadamente 0.066,
mientras que para texto completamente aleatorio es de alrededor de 0.038.

En un Vigen√®re con clave de longitud "m", cada columna se comporta como un cifrado
de C√©sar sobre texto en claro, por lo que su IC se aproxima al de un idioma natural.

El **m√©todo de Friedman** usa el IC global del criptograma para estimar la longitud
de la clave.


In [18]:

# √çndices de coincidencia t√≠picos por idioma
IC_IDIOMA = {
    "en": 0.066,   # Ingl√©s natural
    "es": 0.077    # Espa√±ol natural
}

# √çndice de coincidencia (IC)
# F√≥rmula: IC = sum( f_i * (f_i - 1) ) / ( N * (N - 1) )
def indice_coincidencia(texto: str) -> float:
    texto_normalizado = normalize_text(texto)                       # Normaliza el texto (solo letras A-Z, may√∫sculas)
    longitud = len(texto_normalizado)                               # Longitud del texto normalizado

    if longitud < 2:                                                # Si la longitud es menor que 2, no se puede calcular el IC  
        return 0.0

    frecuencias = Counter(texto_normalizado)                        # Cuenta las frecuencias de cada letra en el texto normalizado

    numerador = sum(f * (f - 1) for f in frecuencias.values())      # Numerador: sumatorio de f_i * (f_i - 1)
    denominador = longitud * (longitud - 1)                         # Denominador: N * (N - 1)

    return numerador / denominador                                  # Devuelve el √≠ndice de coincidencia calculado

# Estimaci√≥n de longitud de clave usando la f√≥rmula de Friedman
# F√≥rmula completa = m ‚âà (K0 - Kr) * N / ( N * (IC - Kr) + (K0 - IC) )
def estimar_longitud_clave_friedman(texto: str, idioma: str = "es", tam_alfabeto: int = 26) -> float:
    if idioma not in IC_IDIOMA:                                     # Verifica que el idioma es soportado
        raise ValueError("Idioma no soportado. Usa 'es' o 'en'.")   # Lanza excepci√≥n si el idioma no es v√°lido

    K0 = IC_IDIOMA[idioma]                                          # IC t√≠pico del idioma natural

    Kr = 1 / tam_alfabeto                                           # IC esperado para texto aleatorio

    texto_normalizado = normalize_text(texto)                       # Normaliza el texto (solo letras A-Z, may√∫sculas)
    longitud = len(texto_normalizado)                               # Longitud del texto normalizado

    if longitud < 2:                                                # Si la longitud es menor que 2, no se puede estimar la longitud de clave
        return 0.0

    IC = indice_coincidencia(texto_normalizado)                     # Calcula el IC del texto normalizado

    denominador = longitud * (IC - Kr) + (K0 - IC)                  # Denominador de la f√≥rmula

    if denominador <= 0:                                            # Caso en el que la f√≥rmula no es fiable
        return 0.0

    numerador = (K0 - Kr) * longitud                                # Numerador

    longitud_clave = numerador / denominador                        # Estimaci√≥n final de la longitud de clave

    return longitud_clave                                           # Devuelve la estimaci√≥n de la longitud de clave

Supongamos:

texto_plano.txt ‚Üí texto sin cifrar (en espa√±ol)

texto_cifrado.txt ‚Üí mismo texto cifrado con Vigen√®re (clave CAPITAN)

In [19]:
# Ruta a tus ficheros 
RUTA_TEXTO_PLANO = "texto.txt"
RUTA_TEXTO_CIFRADO = "texto_cifrado.txt"

# Leer los textos desde los archivos
with open(RUTA_TEXTO_PLANO, "r", encoding="utf-8") as archivo:   # Abre el archivo de texto plano en modo lectura
    texto_plano = archivo.read()                                 # Lee todo el contenido del archivo y lo almacena en la variable texto_palano

with open(RUTA_TEXTO_CIFRADO, "r", encoding="utf-8") as archivo: # Abre el archivo de texto cifrado en modo lectura
    texto_cifrado = archivo.read()                               # Leer todo el contenido y guardarlo en texto_cifrado

print("Primeros caracteres del texto en claro:")                 # Imprime los primeros 200 caracteres del texto plano
print(texto_plano[:200])  

print("\nPrimeros caracteres del texto cifrado:")                # Imprime los primeros 200 caracteres del texto cifrado
print(texto_cifrado[:200])


Primeros caracteres del texto en claro:
En un lugar de la Mancha, de cuyo nombre no quiero acordarme,
no ha mucho tiempo que viv√≠a un hidalgo de los de lanza en astillero,
adarga antigua, roc√≠n flaco y galgo corredor.
Una olla de algo m√°s v

Primeros caracteres del texto cifrado:
QVAHPFJETHVGAZTRUTIJYGFBSPSDWRRGSIGQKLSLFSTHRMMRGSZMUAWLZWMGQGJQHXZAHIAHLTGENKFYEYHWVQTGHDLHRCWKDLYXVGMLGLKLDRVMXPAEHGFRTGWSJJENKFXOEKIVAZAHEZOPCHVVLTHQKHIIUUFHGCVEZRBLEDBQIHPLVQURFXHRLHMQTUMCBXIDVRIT


**Comprobar que la clave CAPITAN cifra correctamente**

In [20]:
# Normalizar los textos
texto_plano_normalizado = normalize_text(texto_plano)                   # Normaliza el texto original
texto_cifrado_normalizado = normalize_text(texto_cifrado)               # Normaliza el texto cifrado del archivo

cifrado_generado = vigenere_encrypt(texto_plano_normalizado, clave)     # Cifra el texto plano normalizado con la clave dada

print("Cifrado generado (primeros 200 caracteres):")                    # Imprime los primeros 200 caracteres del cifrado generado
print(cifrado_generado[:200])

print("\nCifrado del fichero (primeros 200 caracteres):")               # Imprime los primeros 200 caracteres del texto cifrado normalizado
print(texto_cifrado_normalizado[:200])

# Verificar si coinciden los primeros 200 caracteres
print("\n¬øCoinciden los primeros 200 caracteres?", cifrado_generado[:200] == texto_cifrado_normalizado[:200])


Cifrado generado (primeros 200 caracteres):
QVAHPFJETHVGAZTRUTIJYGFBSPSDWRRGSIGQKLSLFSTHRMMRGSZMUAWLZWMGQGJQHXZAHIAHLTGENKFYEYHWVQTGHDLHRCWKDLYXVGMLGLKLDRVMXPAEHGFRTGWSJJENKFXOEKIVAZAHEZOPCHVVLTHQKHIIUUFHGCVEZRBLEDBQIHPLVQURFXHRLHMQTUMCBXIDVRIT

Cifrado del fichero (primeros 200 caracteres):
QVAHPFJETHVGAZTRUTIJYGFBSPSDWRRGSIGQKLSLFSTHRMMRGSZMUAWLZWMGQGJQHXZAHIAHLTGENKFYEYHWVQTGHDLHRCWKDLYXVGMLGLKLDRVMXPAEHGFRTGWSJJENKFXOEKIVAZAHEZOPCHVVLTHQKHIIUUFHGCVEZRBLEDBQIHPLVQURFXHRLHMQTUMCBXIDVRIT

¬øCoinciden los primeros 200 caracteres? True


**Demostraci√≥n te√≥rica: IC del texto sin cifrar vs cifrado**

Ahora vamos a calcular el √çndice de Coincidencia de ambos:

In [21]:
# Calcular el √≠ndice de coincidencia (IC) de los textos
IC_texto_plano = indice_coincidencia(texto_plano)                          # Calcula el IC del texto plano   
IC_texto_cifrado = indice_coincidencia(texto_cifrado)                      # Calcula el IC del texto cifrado

# Mostrar longitudes de los textos
print("Longitud del texto en claro:", len(normalize_text(texto_plano)))     # Imprime la longitud del texto plano normalizado
print("Longitud del texto cifrado  :", len(normalize_text(texto_cifrado)))  # Imprime la longitud del texto cifrado normalizado
print() 

# Mostrar los √≠ndices de coincidencia
print("IC(texto en claro)  =", IC_texto_plano)                              # Imprime el IC del texto plano
print("IC(texto cifrado)   =", IC_texto_cifrado)                            # Imprime el IC del texto cifrado
print("IC espa√±ol te√≥rico  ‚âà", IC_IDIOMA["es"])                             # Imprime el IC te√≥rico del espa√±ol
print("IC aleatorio (1/26) ‚âà", 1/26)                                        # Imprime el IC esperado para texto aleatorio



Longitud del texto en claro: 2250
Longitud del texto cifrado  : 2250

IC(texto en claro)  = 0.07474689985672645
IC(texto cifrado)   = 0.041259226322810136
IC espa√±ol te√≥rico  ‚âà 0.077
IC aleatorio (1/26) ‚âà 0.038461538461538464


Con esto se demuestra:
  - IC del texto en claro est√° cerca del IC del idioma (‚âà 0.077 en espa√±ol).
  - IC del texto cifrado con Vigen√®re est√° m√°s cerca del IC aleatorio (‚âà 0.038), aunque algo m√°s alto por ser clave de longitud 7.

**Demostraci√≥n del m√©todo de Friedman**

Aplicamos Friedman al texto en claro y al texto cifrado:

**SEGUIR EDITANDO POR AQUI**


In [None]:
m_plain_es = estimar_longitud_clave_friedman(texto_plano, idioma="es")
m_cipher_es = estimar_longitud_clave_friedman(texto_cifrado, idioma="es")
m_cipher_en = estimar_longitud_clave_friedman(texto_cifrado, idioma="en")

print("=== Friedman sobre texto en claro (espa√±ol) ===")
print("IC(plain) =", IC_texto_plano)
print("Estimaci√≥n m (espa√±ol) =", m_plain_es)

print("\n=== Friedman sobre texto cifrado (espa√±ol) ===")
print("IC(cipher) =", IC_texto_cifrado)
print("Estimaci√≥n m (espa√±ol) =", m_cipher_es)

print("\n=== Friedman sobre texto cifrado (ingl√©s) ===")
print("IC(cipher) =", IC_texto_cifrado)
print("Estimaci√≥n m (ingl√©s) =", m_cipher_en)


=== Friedman sobre texto en claro (espa√±ol) ===
IC(plain) = 0.07474689985672645
Estimaci√≥n m (espa√±ol) = 1.0620646048081186

=== Friedman sobre texto cifrado (espa√±ol) ===
IC(cipher) = 0.041259226322810136
Estimaci√≥n m (espa√±ol) = 13.697340121754154

=== Friedman sobre texto cifrado (ingl√©s) ===
IC(cipher) = 0.041259226322810136
Estimaci√≥n m (ingl√©s) = 9.804756919930876


A√ëADIR ANALISIS DE RESULTADOS

### 3.2. An√°lisis de Kasiski <a id="kasiski"></a>

El **m√©todo de Kasiski** se basa en:

1. Buscar **repeticiones** de secuencias de longitud 3 o m√°s en el criptograma.
2. Calcular las distancias (en n√∫mero de caracteres) entre apariciones consecutivas.
3. Calcular el **MCD** (m√°ximo com√∫n divisor) y factores de esas distancias.
4. Los divisores m√°s frecuentes son buenos candidatos a longitud de clave.

Implementamos funciones para:

- Encontrar repeticiones y distancias.
- Listar factores de las distancias.


In [14]:
from collections import defaultdict, Counter                                        # defaultdict: dict con valor por defecto; Counter: contador de frecuencias
from math import gcd                                                                # gcd = m√°ximo com√∫n divisor (ahora mismo NO se usa en tu c√≥digo)

def normalizar_texto(texto: str) -> str:                                            # Convierte a may√∫sculas y se queda solo con letras A-Z (t√≠pico en Vigen√®re/Kasiski)
    texto = texto.upper()                                                           # Pasa todo a may√∫sculas
    return "".join(c for c in texto if "A" <= c <= "Z")                             # Filtra solo letras (quita espacios, tildes, signos, etc.)

def kasiski_distancias(texto: str, longitud_min: int = 3, longitud_max: int = 6):
   
    texto_limpio = normalizar_texto(texto)                                          # Normaliza el texto para trabajar solo con A-Z
    posiciones_por_secuencia = defaultdict(list)                                    # Diccionario: secuencia -> lista de posiciones donde aparece

    for n in range(longitud_min, longitud_max + 1):                                 # Recorremos tama√±os de subcadena desde longitud_min hasta longitud_max Para cada longitud n
        for i in range(len(texto_limpio) - n + 1):                                  # Para cada posici√≥n inicial posible
            secuencia = texto_limpio[i:i+n]                                         # Extrae la subcadena de longitud n
            posiciones_por_secuencia[secuencia].append(i)                           # Guarda la posici√≥n donde aparece esa secuencia

    distancias_por_secuencia = {}                                                   # Aqu√≠ guardaremos: secuencia -> [distancias]
    for secuencia, lista_posiciones in posiciones_por_secuencia.items():            # Recorremos cada secuencia y sus posiciones
        if len(lista_posiciones) >= 2:                                              # Solo interesa si aparece al menos 2 veces
            distancias = []                                                         # Lista de distancias entre apariciones consecutivas
            for j in range(1, len(lista_posiciones)):                               # Desde la segunda aparici√≥n hasta la √∫ltima
                distancias.append(lista_posiciones[j] - lista_posiciones[j-1])      # Resta posiciones consecutivas
            if distancias:                                                          # Si hay alguna distancia calculada
                distancias_por_secuencia[secuencia] = distancias                    # Guarda la lista de distancias para esa secuencia

    return distancias_por_secuencia                                                 # Devuelve el diccionario final

def factorizar(n: int):
    
    return [d for d in range(2, n+1) if n % d == 0]                                 # Lista todos los divisores d (>=2) que dividen a n

def kasiski_estadisticas_factores(texto: str, longitud_min: int = 3, 
                                  longitud_max: int = 6):
    
    distancias_por_secuencia = kasiski_distancias(texto, longitud_min=longitud_min, 
                                                  longitud_max=longitud_max)        # Distancias
    conteo_factores = Counter()                                                     # Contador de factores (frecuencias)

    for secuencia, lista_distancias in distancias_por_secuencia.items():            # Para cada secuencia repetida
        for distancia in lista_distancias:                                          # Para cada distancia encontrada
            for factor in factorizar(distancia):                                    # Factoriza la distancia
                conteo_factores[factor] += 1                                        # Incrementa cu√°ntas veces aparece ese factor

    return distancias_por_secuencia, conteo_factores                                # Devuelve distancias y conteos

def kasiski_mejor_longitud_clave(texto_cifrado: str, longitud_min: int = 3, 
                                 longitud_max: int = 6):
    
    _, conteo_factores = kasiski_estadisticas_factores(texto_cifrado, 
                                                       longitud_min=longitud_min, 
                                                       longitud_max=longitud_max)  # Ejecuta Kasiski

    # Filtramos factores: descartamos los triviales y los demasiado grandes
    # (en textos peque√±os, factores grandes suelen ser ruido)

    factores_filtrados = {factor: cuenta for factor, 
                          cuenta in conteo_factores.items() if 2 <= factor <= 30}   # Filtrado
    if not factores_filtrados:                                                      # Si no queda ning√∫n candidato
        return None, conteo_factores                                                # No se puede estimar longitud de clave

    # Elegimos el factor con mayor frecuencia como mejor candidato de longitud de clave

    mejor_m = max(factores_filtrados, key=factores_filtrados.get)                   # factor con mayor conteo
    return mejor_m, conteo_factores                                                 # Devuelve la mejor longitud y el conteo completo


In [13]:
distances, factor_counts = kasiski_estadisticas_factores(               # Llama a la funci√≥n Kasiski que calcula distancias y cuenta factores
    texto_cifrado_normalizado,                                          # Texto cifrado ya normalizado (solo A-Z, sin espacios/signos)
    longitud_min=3,                                                     # Longitud m√≠nima de las secuencias repetidas a buscar (trigramas)
    longitud_max=6                                                      # Longitud m√°xima de las secuencias repetidas a buscar
)

print("Algunas secuencias repetidas y sus distancias:")                 # Muestra un t√≠tulo informativo por pantalla

for seq, ds in list(distances.items())[:10]:                            # Recorre como mucho las 10 primeras entradas del diccionario distances
    print(f"{seq} -> {ds}")                                             # Imprime la secuencia (seq) y su lista de distancias (ds)

print("\nFactores m√°s frecuentes (candidatos a longitud de clave):")    # Salto de l√≠nea + t√≠tulo para el ranking de factores

for factor, count in factor_counts.most_common(15):                     # Recorre los 15 factores m√°s repetidos (m√°s probables como long. de clave)
    print(f"{factor} -> {count}")                                       # Imprime el factor y cu√°ntas veces aparece

m_est, factor_counts = kasiski_mejor_longitud_clave(                    # Calcula la longitud de clave m√°s probable seg√∫n el factor m√°s frecuente
    texto_cifrado_normalizado                                           # Se aplica sobre el mismo texto cifrado normalizado
)                                                                       # Devuelve (m_est, factor_counts); factor_counts se recalcula internamente

print("Factores detectados por Kasiski (ordenados):")                   # T√≠tulo para volver a imprimir los factores ordenados por frecuencia

for f, c in factor_counts.most_common(15):                              # Recorre otra vez los 15 factores m√°s frecuentes
    print(f"{f} -> {c}")                                                # Imprime factor (f) y su frecuencia (c)

print("\nLongitud de clave estimada por Kasiski:", m_est)               # Muestra el resultado final: longitud de clave estimada



Algunas secuencias repetidas y sus distancias:
QVA -> [578]
JET -> [1549]
THV -> [567]
HVG -> [745]
GAZ -> [1109]
TRU -> [1500]
TIJ -> [280, 1089]
IJY -> [263, 332, 1000]
JYG -> [595]
PSD -> [1350]

Factores m√°s frecuentes (candidatos a longitud de clave):
17 -> 260
2 -> 199
3 -> 148
34 -> 122
4 -> 96
51 -> 91
5 -> 89
7 -> 68
68 -> 61
85 -> 51
6 -> 49
8 -> 46
13 -> 41
119 -> 40
14 -> 39
Factores detectados por Kasiski (ordenados):
17 -> 260
2 -> 199
3 -> 148
34 -> 122
4 -> 96
51 -> 91
5 -> 89
7 -> 68
68 -> 61
85 -> 51
6 -> 49
8 -> 46
13 -> 41
119 -> 40
14 -> 39

Longitud de clave estimada por Kasiski: 17


### Aplicaci√≥n del m√©todo de Kasiski al criptograma

Adem√°s del m√©todo de Friedman, aplicamos el m√©todo de Kasiski para estimar la longitud de la clave.
Hemos implementamos una b√∫squeda de secuencias repetidas de longitud entre 3 y 6
caracteres en el criptograma, y calculamos las distancias entre apariciones consecutivas de cada una
de dichas secuencias. A continuaci√≥n factorizamos esas distancias y contamos qu√© factores aparecen
con mayor frecuencia.

De este modo, la presencia reiterada de un mismo factor, as√≠ como de sus m√∫ltiplos, indica que una parte 
significativa de las repeticiones del criptograma est√° alineada con dicha periodicidad, 
lo que refuerza su plausibilidad como longitud de clave.

Por tanto, mientras que el m√©todo de Friedman sit√∫a la longitud de la clave en un rango aproximado, el m√©todo de Kasiski 
permite refinar esta estimaci√≥n y concluye
que la longitud de la clave m√°s plausible es:

Para nuestro ejemplo, el m√©todo de Friedman nos dio un aproximaci√≥n inical de 13. Esta estimaci√≥n de longitud esta basada en 
propiedades estadisticas globales de texto dando una longitud de clave posible que, aunque quiere aproximarse, dista en cuanto a 
la estimaci√≥n realizada por el metodo Kasiski; que nos proporciona una estimaci√≥n de 17 para nuestra clave.  Estimaci√≥n mucho
m√°s exacta, que la proporcionada por Friedman.

\[
m = 17
\]


### 3.3. Ruptura de las columnas como cifrados de C√©sar <a id="ruptura-cesar"></a>

Una vez tenemos un candidato para la longitud de la clave \(m\):

1. Dividimos el criptograma en \(m\) **columnas**, donde la columna \(j\)
   contiene los caracteres \(C_i\) tales que \(i \equiv j \pmod m\).
2. Cada columna se comporta como un **cifrado de C√©sar** aplicado sobre texto en claro.
3. Para cada desplazamiento posible (0‚Äì25) calculamos una medida de ajuste con las
   frecuencias t√≠picas del idioma (por ejemplo, un \(\chi^2\)).
4. Elegimos el desplazamiento que mejor se ajusta a las frecuencias esperadas.
5. Traducimos ese desplazamiento a una letra de clave.
Idea te√≥rica: por qu√© cada columna es un C√©sar

Sabemos que el Vigen√®re hace:

ùê∂<sub>ùëñ</suub> = ( ùëÉ<sub>ùëñ</sub> + ùêæ<sub>ùëñ mod m</sub>  )‚Äämod 26

Si fijamos una posici√≥n j de la clave (0 ‚â§ j < m), miramos todos los caracteres del criptograma que cumplen:

ùëñ ‚â° ùëó ( mod ùëö )

En esos √≠ndices, siempre se ha usado la misma letra de la clave ùêæ <sub>ùëó</sub>.
Por tanto, la relaci√≥n entre texto en claro y cifrado en esa columna es:

ùê∂<sub>ùë°</sub><sup>(ùëó)</sup> = ( ùëÉ<sub>ùë°</sub> <sup>(ùëó)</sup> + ùêæ<sub>ùëó</sub> ) mod 26

Eso es exactamente un cifrado de C√©sar con desplazamiento fijo ùêæ<sub>ùëó</sub>.

Conclusi√≥n:

Cada columna = C√©sar independiente.

Si averiguo el mejor desplazamiento para esa columna ‚Üí obtengo la letra ùêæ<sub>ùëó</sub>de la clave.
Implementamos ahora estas herramientas.


Paso 1: dividir el criptograma en columnas

In [None]:
def split_into_columns(text: str, key_len: int):
    """
    Divide el texto normalizado en 'key_len' columnas seg√∫n posici√≥n m√≥dulo key_len.
    col[j] contiene los caracteres C_i tales que i ‚â° j (mod key_len).
    """
    T = normalize_text(text)
    cols = ["" for _ in range(key_len)]
    for i, ch in enumerate(T):
        cols[i % key_len] += ch
    return cols

# Ejemplo con m = 7
m = m_est
columns = split_into_columns(texto_cifrado_normalizado, m)

for idx, col in enumerate(columns):
    print(f"Columna {idx}: longitud = {len(col)}; primeros 30 caracteres: {col[:30]}")


Paso 2: modelo de frecuencias (usaremos espa√±ol)

In [None]:
FRECUENCIAS_ESPANOL = {
    'A': 0.1253, 'B': 0.0142, 'C': 0.0468, 'D': 0.0586, 'E': 0.1368,
    'F': 0.0069, 'G': 0.0101, 'H': 0.0070, 'I': 0.0625, 'J': 0.0044,
    'K': 0.0002, 'L': 0.0497, 'M': 0.0315, 'N': 0.0671, 'O': 0.0868,
    'P': 0.0251, 'Q': 0.0088, 'R': 0.0687, 'S': 0.0798, 'T': 0.0463,
    'U': 0.0393, 'V': 0.0090, 'W': 0.0001, 'X': 0.0022, 'Y': 0.0090,
    'Z': 0.0052,
}


Paso 3: œá¬≤ para un desplazamiento de C√©sar

Para una columna y un desplazamiento shift:

Supongo que la clave tiene ese desplazamiento ‚Üí descifro la columna con ese shift.

Cuento las letras del resultado ‚Üí frecuencias observadas.

Calculo:

ùúí2 = ‚àë<sub>letra</sub> ( O ‚àí E )<sup>2</sup> / E

donde O = observada, E = esperada seg√∫n el modelo del idioma.

El shift con œá¬≤ m√≠nimo es el m√°s probable.

In [None]:
def chi_cuadrado_para_desplazamiento(columna: str, desplazamiento: int, modelo_frecuencias=FRECUENCIAS_ESPANOL) -> float:
    
    N = len(columna)                                                                    # N√∫mero total de caracteres de la columna
    if N == 0:                                                                          # Si la columna est√° vac√≠a, no se puede hacer an√°lisis estad√≠stico
        return float('inf')                                                             # Devuelve infinito para descartar esta opci√≥n

                                                                                        # Descifrado tipo C√©sar: se resta el desplazamiento a cada letra
    texto_descifrado = []                                                               # Lista donde se ir√°n almacenando las letras descifradas
    for caracter in columna:                                                            # Recorre cada letra cifrada de la columna
        valor_cifrado = char_to_int(caracter)                                           # Convierte la letra en un valor num√©rico (0‚Äì25)
        valor_plano = (valor_cifrado - desplazamiento) % ALPHABET_SIZE                  # Aplica el descifrado con m√≥dulo 26
        texto_descifrado.append(int_to_char(valor_plano))                               # Convierte de nuevo a letra y la a√±ade a la lista

    texto_descifrado = "".join(texto_descifrado)                                        # Une la lista de letras en un √∫nico string

    frecuencias_observadas = Counter(texto_descifrado)                                  # Cuenta las apariciones reales de cada letra en el texto obtenido

    chi2 = 0.0                                                                          # Inicializa el acumulador del estad√≠stico œá¬≤
    for letra, probabilidad_esperada in modelo_frecuencias.items():                     # Recorre cada letra del modelo ling√º√≠stico
        E = probabilidad_esperada * N                                                   # Frecuencia esperada absoluta para esa letra
        O = frecuencias_observadas.get(letra, 0)                                        # Frecuencia observada (0 si no aparece)
        if E > 0:                                                                       # Evita divisiones por cero
            chi2 += (O - E) ** 2 / E                                                    # A√±ade el t√©rmino correspondiente al estad√≠stico œá¬≤

    return chi2                                                                         # Devuelve el valor final de œá¬≤ (cuanto menor, mejor encaje con el espa√±ol)


def mejor_desplazamiento_columna(columna: str, modelo_frecuencias=FRECUENCIAS_ESPANOL):
  
    mejor_desplazamiento = None                                                         # Almacenar√° el desplazamiento √≥ptimo
    mejor_chi2 = float('inf')                                                           # Valor m√≠nimo de œá¬≤ encontrado hasta el momento

    for desplazamiento in range(ALPHABET_SIZE):                                         # Prueba todos los desplazamientos posibles (0‚Äì25)
        chi2_actual = chi_cuadrado_para_desplazamiento(columna, desplazamiento, 
                                                       modelo_frecuencias)              # Calcula œá¬≤
        if chi2_actual < mejor_chi2:                                                    # Si el ajuste es mejor que el anterior
            mejor_chi2 = chi2_actual                                                    # Actualiza el mejor valor de œá¬≤
            mejor_desplazamiento = desplazamiento                                       # Guarda el desplazamiento correspondiente

    return mejor_desplazamiento, mejor_chi2                                             # Devuelve el desplazamiento √≥ptimo y su œá¬≤ asociado


Paso 4: de los shifts a la clave completa

Como hemos dicho:

El shift que descifra la columna ‚Üí es el valor num√©rico de la letra de clave correspondiente.

Si el mejor shift para la columna j es s, entonces la letra de la clave es:

ùêæ
ùëó
=
ùëì
‚àí
1
(
ùë†
)
K
j
	‚Äã

=f
‚àí1
(s)

In [None]:
def guess_key_for_length(ciphertext: str, key_len: int, freq_model=SPANISH_FREQ):
    """
    A partir de una longitud de clave, rompe las columnas como C√©sar
    y reconstruye la clave completa.
    """
    cols = split_into_columns(ciphertext, key_len)
    key_chars = []
    for j, col in enumerate(cols):
        shift, chi2 = best_shift_for_column(col, freq_model)
        key_char = int_to_char(shift)
        key_chars.append(key_char)
        print(f"Columna {j}: mejor shift = {shift} ({key_char}), œá¬≤ = {chi2:.2f}")
    return "".join(key_chars)


Paso 5: aplicar con m = 7 a tu criptograma

Ahora ejecutas:

In [None]:
m = m_est
key_guess = guess_key_for_length(ciphertext_norm, m, SPANISH_FREQ)
print("\nClave aproximada encontrada:", key_guess)


ULTIMO PASO Ver el descifrado completo

Para rematar:

In [None]:
plaintext_candidate = vigenere_decrypt(ciphertext_norm, key_guess)
print(plaintext_candidate[:1000])


Detalles observados hasta este punto:
Si usamos un aclave muy grande con 26 caracteres:

La clave casi nunca est√° sincronizada con patrones internos del texto.

Las repeticiones aleatorias tienden a tener distancias que son m√∫ltiplos de n√∫meros peque√±os.

y nos encontaremnos con un 'm' que divide muchosn√∫meros peuq√±eos y aparecera como factor

## 4. Aplicaci√≥n al criptograma propuesto en las tareas de SPSI <a id="aplicacion-criptograma"></a>

En el enunciado de las tareas de SPSI se proporciona el siguiente criptograma
cifrado mediante un criptosistema de Vigen√®re. A partir de lo implementado
anteriormente, debemos averiguar:

- La **longitud de la clave**.
- La **clave**.
- El **mensaje en claro**.

En primer lugar, definimos el texto cifrado en una variable de Python y lo normalizamos.


In [None]:
ciphertext_raw = """UECWKDVLOTTVACKTPVGEZQMDAMRNPDDUXLBUICAMRHOECBHSPQLVIWO
FFEAILPNTESMLDRUURIFAEQTTPXADWIAWLACCRPBHSRZIVQWOFROGTT
NNXEVIVIBPDTTGAHVIACLAYKGJIEQHGECMESNNOCTHSGGNVWTQHKBPR
HMVUOYWLIAFIRIGDBOEBQLIGWARQHNLOISQKEPEIDVXXNETPAXNZGDX
WWEYQCTIGONNGJVHSQGEATHSYGSDVVOAQCXLHSPQMDMETRTMDUXTEQQ
JMFAEEAAIMEZREGIMUECICBXRVQRSMENNWTXTNSRNBPZHMRVRDYNECG
SPMEAVTENXKEQKCTTHSPCMQQHSQGTXMFPBGLWQZRBOEIZHQHGRTOBSG
TATTZRNFOSMLEDWESIWDRNAPBFOFHEGIXLFVOGUZLNUSRCRAZGZRTTA
YFEHKHMCQNTZLENPUCKBAYCICUBNRPCXIWEYCSIMFPRUTPLXSYCBGCC
UYCQJMWIEKGTUBRHVATTLEKVACBXQHGPDZEANNTJZTDRNSDTFEVPDXK
TMVNAIQMUQNOHKKOAQMTBKOFSUTUXPRTMXBXNPCLRCEAEOIAWGGVVUS
GIOEWLIQFOZKSPVMEBLOHLXDVCYSMGOPJEFCXMRUIGDXNCCRPMLCEWT
PZMOQQSAWLPHPTDAWEYJOGQSOAVERCTNQQEAVTUGKLJAXMRTGTIEAFW
PTZYIPKESMEAFCGJILSBPLDABNFVRJUXNGQSWIUIGWAAMLDRNNPDXGN
PTTGLUHUOBMXSPQNDKBDBTEECLECGRDPTYBVRDATQHKQJMKEFROCLXN
FKNSCWANNAHXTRGKCJTTRRUEMQZEAEIPAWEYPAJBBLHUEHMVUNFRPVM
EDWEKMHRREOGZBDBROGCGANIUYIBNZQVXTGORUUCUTNBOEIZHEFWNBI
GOZGTGWXNRHERBHPHGSIWXNPQMJVBCNEIDVVOAGLPONAPWYPXKEFKOC
MQTRTIDZBNQKCPLTTNOBXMGLNRRDNNNQKDPLTLNSUTAXMNPTXMGEZKA
EIKAGQ"""
ciphertext = normalize_text(ciphertext_raw)
len(ciphertext), ciphertext[:100]


### 4.1. IC global y estimaci√≥n de longitud de clave (Friedman)

Calculamos ahora el √≠ndice de coincidencia del criptograma y usamos la
f√≥rmula de Friedman para obtener una primera aproximaci√≥n de la longitud de la clave.


In [None]:
IC_cipher = index_of_coincidence(ciphertext)
friedman_estimate = friedman_key_length_estimate(ciphertext)

print("Longitud del criptograma:", len(ciphertext))
print("√çndice de coincidencia:", IC_cipher)
print("Estimaci√≥n de longitud de clave (Friedman):", friedman_estimate)


### 4.2. An√°lisis de Kasiski sobre el criptograma

A continuaci√≥n aplicamos el an√°lisis de Kasiski para apoyar la estimaci√≥n de la
longitud de la clave. Observamos los factores que aparecen con mayor frecuencia.


In [None]:
distances, factor_counts = kasiski_factor_stats(ciphertext, min_len=3)

print("Algunas secuencias repetidas y sus distancias:")
for seq, ds in list(distances.items())[:10]:
    print(seq, "->", ds)

print("\nFactores m√°s frecuentes (candidatos a longitud de clave):")
for factor, count in factor_counts.most_common(15):
    print(factor, "->", count)


### 4.3. Ruptura tentativa para longitudes de clave candidatas

Seleccionamos manualmente algunas longitudes de clave candidatas (por ejemplo, las m√°s
frecuentes seg√∫n Kasiski y cercanas a la estimaci√≥n de Friedman) y probamos a adivinar
la clave completa con el an√°lisis por columnas.


In [None]:
m = kasiski_best_key_length(ciphertext)[0]
print("\nLongitud de clave estimada por Kasiski:", m)
key_guess = guess_key_for_length(ciphertext, m, SPANISH_FREQ)
print("\nClave aproximada encontrada:", key_guess)

### 4.4. Descifrado con la clave candidata

Una vez tengamos una clave candidata plausible (por ejemplo, aquella que produzca
un texto en claro con apariencia de idioma natural), realizamos el descifrado completo.
En esta celda, el alumno puede fijar manualmente la longitud de clave y la clave
que considere m√°s razonable tras los an√°lisis anteriores.


In [None]:
plaintext_candidate = vigenere_decrypt(ciphertext, key_guess)
print(plaintext_candidate[:1000])


## 5. Conclusiones <a id="conclusiones"></a>

En este cuaderno se ha:

1. Implementado el **cifrado y descifrado de Vigen√®re** en Python.
2. Construido un peque√±o **laboratorio de criptoan√°lisis** que incluye:
   - C√°lculo del √≠ndice de coincidencia y aplicaci√≥n del m√©todo de Friedman.
   - An√°lisis de Kasiski para estimar la longitud de la clave.
   - Ruptura de cada columna como un cifrado de C√©sar empleando frecuencias de letras.
3. Aplicado las herramientas anteriores a un **criptograma real** propuesto en las tareas
   de SPSI, permitiendo:
   - Estimar la longitud de la clave.
   - Obtener una clave candidata.
   - Aproximarse al texto en claro.

Este enfoque reproduce las ideas cl√°sicas de la criptoan√°lisis manual, pero apoyadas
en herramientas computacionales que facilitan la experimentaci√≥n y el an√°lisis
sobre criptogramas m√°s largos.
