In [1]:
from google.colab import drive
drive.mount('/content/drive')


Mounted at /content/drive


In [2]:
# Instalar pycryptodome (para MD4)
!pip install pycryptodome

Collecting pycryptodome
  Downloading pycryptodome-3.22.0-cp37-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (3.4 kB)
Downloading pycryptodome-3.22.0-cp37-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (2.3 MB)
[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/2.3 MB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━[0m[91m╸[0m[90m━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.9/2.3 MB[0m [31m27.8 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.3/2.3 MB[0m [31m35.5 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pycryptodome
Successfully installed pycryptodome-3.22.0


In [3]:
from Crypto.Hash import MD4
import matplotlib.pyplot as plt
import time

In [4]:
from Crypto.Hash import MD4
import time
import os

# Función que implementa el hash MD4
def md4_hash(texto):
    if not isinstance(texto, str):
        raise ValueError("El texto debe ser una cadena (str)")

    start_time = time.time()
    hash_md4 = MD4.new()
    hash_md4.update(texto.encode("utf-8"))
    tiempo = (time.time() - start_time) * 1000  # Convertimos el tiempo a milisegundos
    return hash_md4.hexdigest(), tiempo

# Función para leer el archivo de texto
def leer_archivo(path):
    start_time = time.time()
    with open(path, "r", encoding="utf-8") as file:
        texto = file.read().strip()
    tiempo_lectura = (time.time() - start_time) * 1000  # Convertimos el tiempo a milisegundos
    return texto, tiempo_lectura

# Función principal
def main():
    # Ruta base de los archivos
    base_path = "/content/drive/MyDrive/Colab Notebooks/Archivos"

    # Archivos a procesar
    archivos = [
        "10_palabras.txt",
        "100_palabras.txt",
        "1000_palabras.txt",
        "10000_palabras.txt",
        "100000_palabras.txt",
        "1000000_palabras.txt",
        "10000000_palabras.txt"
    ]

    for archivo in archivos:
        archivo_path = os.path.join(base_path, archivo)

        # Verificar si el archivo existe en la ruta proporcionada
        if not os.path.exists(archivo_path):
            print(f"Archivo {archivo} no encontrado. Se omitirá.")
            continue

        print(f"\nProcesando archivo: {archivo}")

        # Paso 1: Leer el archivo con el texto
        texto, tiempo_lectura = leer_archivo(archivo_path)
        num_palabras = len(texto.split())
        num_caracteres_entrada = len(texto)
        print(f"T-E1 (Lectura): {tiempo_lectura:.2f} ms")
        print(f"#palabras: {num_palabras}, #caracteres_entrada: {num_caracteres_entrada}")

        # Paso 2: Generar el hash MD4
        hash_md4, tiempo_hash = md4_hash(texto)
        print(f"T-E2 (Generación de hash MD4): {tiempo_hash:.2f} ms")
        print(f"Hash MD4 de '{archivo}': {hash_md4}")

        # Paso 3: Calcular el tiempo total del proceso
        tiempo_total = tiempo_lectura + tiempo_hash

        # Mostrar los resultados finales
        print(f"T-Total (Proceso completo): {tiempo_total:.2f} ms")
        print(f"#caracteres_salida: {len(hash_md4)}\n")  # El tamaño del hash MD4 es fijo (32 caracteres hexadecimales)

if __name__ == "__main__":
    main()



Procesando archivo: 10_palabras.txt
T-E1 (Lectura): 416.68 ms
#palabras: 10, #caracteres_entrada: 65
T-E2 (Generación de hash MD4): 2.40 ms
Hash MD4 de '10_palabras.txt': 89829157f06006d9d06ce5d7cf1d8fdc
T-Total (Proceso completo): 419.08 ms
#caracteres_salida: 32


Procesando archivo: 100_palabras.txt
T-E1 (Lectura): 364.41 ms
#palabras: 100, #caracteres_entrada: 710
T-E2 (Generación de hash MD4): 0.08 ms
Hash MD4 de '100_palabras.txt': 86fec24ec64c8ff3bbebdeb818b89453
T-Total (Proceso completo): 364.50 ms
#caracteres_salida: 32


Procesando archivo: 1000_palabras.txt
T-E1 (Lectura): 351.81 ms
#palabras: 1000, #caracteres_entrada: 7069
T-E2 (Generación de hash MD4): 0.41 ms
Hash MD4 de '1000_palabras.txt': 9aea3e8f73b4b46cc38ee1f2294d3e9a
T-Total (Proceso completo): 352.22 ms
#caracteres_salida: 32


Procesando archivo: 10000_palabras.txt
T-E1 (Lectura): 308.49 ms
#palabras: 10000, #caracteres_entrada: 70257
T-E2 (Generación de hash MD4): 0.19 ms
Hash MD4 de '10000_palabras.txt': 5c9

# ¿Por qué tiene 32 caracteres?

El hash MD4 es de 128 bits.
En formato hexadecimal, cada carácter representa 4 bits, por lo que se necesitan 32 caracteres para representar esos 128 bits.