# Tarea de SPSI
------------------------------------------------------------------------------------

## Tarea 1 - Criptosistema de Vigenerè

El Criptosistema de Vigenère es un cifrado polialfabético que históricamente representó un salto significativo en la seguridad, al superar las limitaciones de los cifrados monoalfabéticos como el Cifrado César. Su principal característica es el uso de una clave para determinar el desplazamiento de cada letra del mensaje original, lo que lo hace mucho más resistente a los análisis de frecuencia.

Para esta implementación en Python, el enfoque principal ha sido garantizar la robustez y la claridad pedagógica del código, reflejando el principio de diseño de la criptografía práctica. La versión implementada se adhiere al alfabeto español (26 letras, A-Z), manejando el cifrado mediante la aritmética modular.

Se han tomado en consideración los siguientes aspectos cruciales para la implementación:

Normalización del Texto: Se ha incorporado una etapa de preprocesamiento del texto de entrada para eliminar tildes, signos de puntuación (como los que se eliminan en el ejemplo del Canvas de formateoDeTexto), espacios y convertir todo el texto a mayúsculas. Esto asegura que el algoritmo opere únicamente sobre el alfabeto base, evitando errores de índice modular.

Aritmética Modular (

$$\pmod{26}$$

): El corazón del algoritmo reside en la suma modular para el cifrado y la resta modular para el descifrado. Esta implementación utiliza el operador módulo de Python (%) para manejar la rotación del alfabeto de manera eficiente y precisa, asegurando que el resultado siempre caiga dentro del rango de [0, 25].

Manejo de la Clave: La clave debe repetirse cíclicamente sobre el mensaje original. El código gestiona esto de forma eficiente utilizando el operador módulo para determinar qué carácter de la clave corresponde a cada carácter del texto a cifrar o descifrar.

Así, el resultado es un par de funciones (cifrado y descifrado) que no solo cumplen con los requisitos funcionales del algoritmo, sino que también son limpias y fáciles de seguir, respetando las mejores prácticas de programación en Python para algoritmos criptográficos.

## Apartado a

En este apartado, se procede a la implementación del Criptosistema de Vigenère en Python, diseñando las funciones principales que permiten tanto la codificación como la decodificación de mensajes utilizando una clave de entrada.

En primer lugar definimos constantes que vamos a usar a lo largo de nuestra tarea.

In [None]:
import string
from collections import Counter

ALFABETO = [
    'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N',
    'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z'
]

LONGITUD_ALFABETO = len(ALFABETO)

FRECUENCIASINGLESAS = {
    'A': 8.34, 'B': 1.54, 'C': 2.73, 'D': 4.14, 'E': 12.6, 'F': 2.03,
    'G': 1.92, 'H': 6.11, 'I': 6.71, 'J': 0.23, 'K': 0.87, 'L': 4.24,
    'M': 2.53, 'N': 6.80, 'O': 7.7, 'P': 1.66, 'Q': 0.09, 'R': 5.68,
    'S': 6.11, 'T': 9.37, 'U': 2.85, 'V': 1.06, 'W': 2.34, 'X': 0.20,
    'Y': 2.04, 'Z': 0.06
}

### Método formateoDeTexto
Es un método que usamos con el objetivo de eliminar todos los caracteres prohibidos que pueda tener el texto que se pasa como argumento.

In [None]:
def formateoDeTexto(texto: str) -> str:
        texto_formateado = ""
        for letra in texto.upper():
            if letra == 'Ñ':
                texto_formateado += 'GN'
            elif letra in ALFABETO:
                texto_formateado += letra
        return texto_formateado

A continuación, vamos a probar dicho método, para que quede claro su utilidad:

In [None]:
texto1 = "¡Hola Mundo 2024! Esto es una prueba @."
esperado1 = "Hola Mundo Esto es una prueba "
resultado1 = formateoDeTexto(texto1)
resultado1

'HOLAMUNDOESTOESUNAPRUEBA'

### Método vigenere
Una vez tenemos ya el texto sin caracteres prohibidos, podemos usar el método que hemos creado del Algoritmo de Vigenere, el cual tiene la doble funcionalidad de cifrar si la variable cifrado es True, o descifrar en el caso contrario.

In [None]:
def vigenere(mensaje: str, clave: str, cifrado: bool) -> str:
        clave_formateada = formateoDeTexto(clave)
        if not clave_formateada:
            return mensaje

        longitudClave = len(clave_formateada)
        resultado = ""

        for i in range(len(mensaje)):
            letraMensaje = mensaje[i]
            letraClave = clave_formateada[i % longitudClave]

            valorLetraMensaje = ALFABETO.index(letraMensaje)
            valorLetraClave = ALFABETO.index(letraClave)

            if cifrado:
                valorCifrado = (valorLetraMensaje + valorLetraClave) % LONGITUD_ALFABETO
                letraCifrada = ALFABETO[valorCifrado]
                resultado+=(letraCifrada)
            else:
                valorDescifrado = (valorLetraMensaje - valorLetraClave) % LONGITUD_ALFABETO
                letraDescifrada = ALFABETO[valorDescifrado]
                resultado+=(letraDescifrada)

        return resultado


## Apartado b

En este apartado implementamos en Python un "laboratorio" con lo sucinto para poder poner en claro cualquier criptograma cifrado mediante un criptosistema de
Vigenere.

### Método calcularIndiceDeIncediencia


Calcula el IC del texto.

In [None]:
def calcularIndiceDeCoincidencias(texto):
  counts = Counter(texto)
  tamanioTexto = len(texto)

  if tamanioTexto <= 1: return 0

  numerator = sum(n * (n - 1) for n in counts.values())
  denominator = tamanioTexto * (tamanioTexto - 1)

  return numerator / denominator

### Método calcularChiCuadrado

Calcula el estadístico Chi-cuadrado comparando con frecuencias del inglés.

In [None]:
def calcularChiCuadrado(text):
  N = len(text)
  if N == 0:
      return 0.0

  conteoGeneral = Counter(text)
  valorChiCuadrado = 0.0

  for letra, frecuenciaEsperada in FRECUENCIASINGLESAS.items():
      conteoParticular = conteoGeneral.get(letra, 0)
      conteoEsperado = N * (frecuenciaEsperada / 100)

      if conteoEsperado == 0:
          continue

      valorChiCuadrado += ((conteoParticular - conteoEsperado) ** 2) / conteoEsperado

  return valorChiCuadrado

### Método longitudClave

Estima la longitud de la clave basándose en el Índice de Coincidencia promedio.

In [None]:
def longitudClave(textoCifrado: str, maximaLongitud: int = 20) -> int:
        mejorIC = 0.0
        mejorLongitud = 0

        print("Estimando longitud de clave")
        for longitud in range(1, maximaLongitud + 1):
            columnas = [""] * longitud
            for i, caracter in enumerate(textoCifrado):
                columnas[i % longitud] += caracter

            icPromedio = sum(calcularIndiceDeCoincidencias(col) for col in columnas) / longitud
            print(f"Longitud {longitud:2}: IC promedio = {icPromedio:.4f}")
            if icPromedio > mejorIC:
                mejorIC = icPromedio
                mejorLongitud = longitud

        print(f"\nLongitud más probable: {mejorLongitud} (IC = {mejorIC:.4f})")
        return mejorLongitud

### Método encontrarClave

Recupera la clave minimizando el Chi Cuadrado por columnas.

In [None]:
def encontrarClave(textoCifrado: str, longitudClave: int) -> str:
        columnas = [""] * longitudClave
        for i, caracter in enumerate(textoCifrado):
            columnas[i % longitudClave] += caracter

        clave = ""

        print("Estimando Clave")
        for i, col in enumerate(columnas):
            mejorChi = float('inf')
            mejorLetra = ''
            for indice in range(LONGITUD_ALFABETO):
                letraIndice = ALFABETO[indice]
                colDescifrada = vigenere(mensaje=col, clave=letraIndice, cifrado = False)
                valorChi = calcularChiCuadrado(colDescifrada)

                if valorChi < mejorChi:
                    mejorChi = valorChi
                    mejorLetra = letraIndice
            clave += mejorLetra
            print(f"Columna {i+1:2}/{longitudClave}: Letra de clave encontrada = '{mejorLetra}'")

        print(f"\nClave encontrada: {clave}\n")
        return clave

## Apartado c

En este apartado desciframos TEXTOAROMPER, para ellos hacemos uso de nuestro laboratorio creado en el apartado b.

In [None]:
TEXTOAROMPER = """UECWKDVLOTTVACKTPVGEZQMDAMRNPDDUXLBUICAMRHOECBHSPQLVIWO
FFEAILPNTESMLDRUURIFAEQTTPXADWIAWLACCRPBHSRZIVQWOFROGTT
NNXEVIVIBPDTTGAHVIACLAYKGJIEQHGECMESNNOCTHSGGNVWTQHKBPR
HMVUOYWLIAFIRIGDBOEBQLIGWARQHNLOISQKEPEIDVXXNETPAXNZGDX
WWEYQCTIGONNGJVHSQGEATHSYGSDVVOAQCXLHSPQMDMETRTMDUXTEQQ
JMFAEEAAIMEZREGIMUECICBXRVQRSMENNWTXTNSRNBPZHMRVRDYNECG
SPMEAVTENXKEQKCTTHSPCMQQHSQGTXMFPBGLWQZRBOEIZHQHGRTOBSG
TATTZRNFOSMLEDWESIWDRNAPBFOFHEGIXLFVOGUZLNUSRCRAZGZRTTA
YFEHKHMCQNTZLENPUCKBAYCICUBNRPCXIWEYCSIMFPRUTPLXSYCBGCC
UYCQJMWIEKGTUBRHVATTLEKVACBXQHGPDZEANNTJZTDRNSDTFEVPDXK
TMVNAIQMUQNOHKKOAQMTBKOFSUTUXPRTMXBXNPCLRCEAEOIAWGGVVUS
GIOEWLIQFOZKSPVMEBLOHLXDVCYSMGOPJEFCXMRUIGDXNCCRPMLCEWT
PZMOQQSAWLPHPTDAWEYJOGQSOAVERCTNQQEAVTUGKLJAXMRTGTIEAFW
PTZYIPKESMEAFCGJILSBPLDABNFVRJUXNGQSWIUIGWAAMLDRNNPDXGN
PTTGLUHUOBMXSPQNDKBDBTEECLECGRDPTYBVRDATQHKQJMKEFROCLXN
FKNSCWANNAHXTRGKCJTTRRUEMQZEAEIPAWEYPAJBBLHUEHMVUNFRPVM
EDWEKMHRREOGZBDBROGCGANIUYIBNZQVXTGORUUCUTNBOEIZHEFWNBI
GOZGTGWXNRHERBHPHGSIWXNPQMJVBCNEIDVVOAGLPONAPWYPXKEFKOC
MQTRTIDZBNQKCPLTTNOBXMGLNRRDNNNQKDPLTLNSUTAXMNPTXMGEZKA
EIKAGQ"""

def main():

    # 1. Formateo
    textoLimpio = formateoDeTexto(TEXTOAROMPER)

    # 2. Obtener longitud
    longitud = longitudClave(textoLimpio, maximaLongitud=20)

    # 3. Obtener clave
    clave = encontrarClave(textoLimpio, longitud)

    # 4. Descifrar
    textoPlano = vigenere(textoLimpio, clave, cifrado=False)

    print("\n--- RESULTADO ---")
    print(f"CLAVE: {clave}")
    print(f"TEXTO (original): {textoPlano}")

if __name__ == "__main__":
    main()

Estimando longitud de clave
Longitud  1: IC promedio = 0.0418
Longitud  2: IC promedio = 0.0415
Longitud  3: IC promedio = 0.0418
Longitud  4: IC promedio = 0.0418
Longitud  5: IC promedio = 0.0418
Longitud  6: IC promedio = 0.0407
Longitud  7: IC promedio = 0.0709
Longitud  8: IC promedio = 0.0416
Longitud  9: IC promedio = 0.0409
Longitud 10: IC promedio = 0.0414
Longitud 11: IC promedio = 0.0406
Longitud 12: IC promedio = 0.0403
Longitud 13: IC promedio = 0.0427
Longitud 14: IC promedio = 0.0694
Longitud 15: IC promedio = 0.0433
Longitud 16: IC promedio = 0.0412
Longitud 17: IC promedio = 0.0437
Longitud 18: IC promedio = 0.0394
Longitud 19: IC promedio = 0.0403
Longitud 20: IC promedio = 0.0420

Longitud más probable: 7 (IC = 0.0709)
Estimando Clave
Columna  1/7: Letra de clave encontrada = 'C'
Columna  2/7: Letra de clave encontrada = 'A'
Columna  3/7: Letra de clave encontrada = 'P'
Columna  4/7: Letra de clave encontrada = 'I'
Columna  5/7: Letra de clave encontrada = 'T'
Column