# Ejercicio Hashing and Password Cracking
Marco Jurado 20308

In [30]:
import hashlib
import logging

In [31]:
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

In [32]:
def generar_hash_sha1(texto):
    return hashlib.sha1(texto.encode()).hexdigest()

In [33]:
def leer_archivo(path, codificaciones=['utf-8', 'latin-1']):
    for codificacion in codificaciones:
        try:
            with open(path, 'r', encoding=codificacion) as file:
                contenido = file.read().splitlines()
                logging.info(f"Archivo {path} leído correctamente con codificación {codificacion}")
                return contenido
        except UnicodeDecodeError as e:
            logging.warning(f"Fallo al leer {path} con {codificacion}: {e}")
            continue
    error_msg = f"No se pudo leer el archivo {path} con las codificaciones proporcionadas."
    logging.error(error_msg)
    raise ValueError(error_msg)

In [42]:
def encontrar_contraseñas(hashes_objetivo, palabras):
    encontrados = {}
    contador = 0
    total_palabras = len(palabras)
    intervalo_progreso = int(total_palabras * 0.05)
    if intervalo_progreso == 0:
        intervalo_progreso = 1

    for palabra in palabras:
        contador += 1
        hash_generado = generar_hash_sha1(palabra)
        if hash_generado in hashes_objetivo:
            encontrados[hash_generado] = palabra
            logging.info(f"Encontrado: {palabra} -> {hash_generado}")

        if contador % intervalo_progreso == 0:
            porcentaje = (contador / total_palabras) * 100
            logging.info(f"{porcentaje:.2f}% completado")

    if contador % intervalo_progreso != 0:  # Capturar el último segmento de progreso
        porcentaje = (contador / total_palabras) * 100
        logging.info(f"{porcentaje:.2f}% completado")

    return encontrados

In [35]:
hashes_objetivo = set(leer_archivo('target_hashes.txt'))
palabras_basicas = leer_archivo('words.txt')
palabras_completas = leer_archivo('realhuman_phill.txt')

2024-04-25 18:31:28,079 - INFO - Archivo target_hashes.txt leído correctamente con codificación utf-8
2024-04-25 18:31:28,101 - INFO - Archivo words.txt leído correctamente con codificación utf-8
2024-04-25 18:31:39,658 - INFO - Archivo realhuman_phill.txt leído correctamente con codificación latin-1


In [36]:
palabras_totales = palabras_basicas + palabras_completas

In [37]:
len(palabras_totales)

64045222

In [43]:
resultados = encontrar_contraseñas(hashes_objetivo, palabras_totales)

2024-04-25 18:34:24,243 - INFO - 5.00% completado
2024-04-25 18:34:28,084 - INFO - 10.00% completado
2024-04-25 18:34:29,648 - INFO - Encontrado: abcdefghijklmnopqrstuvwxyz -> 32d10c7b8cf96570ca04ce37f2a19d84240d3a89
2024-04-25 18:34:31,803 - INFO - 15.00% completado
2024-04-25 18:34:35,559 - INFO - 20.00% completado
2024-04-25 18:34:39,273 - INFO - 25.00% completado
2024-04-25 18:34:42,973 - INFO - 30.00% completado
2024-04-25 18:34:46,779 - INFO - 35.00% completado
2024-04-25 18:34:50,571 - INFO - 40.00% completado
2024-04-25 18:34:54,304 - INFO - 45.00% completado
2024-04-25 18:34:58,369 - INFO - 50.00% completado
2024-04-25 18:35:02,223 - INFO - 55.00% completado
2024-04-25 18:35:06,079 - INFO - 60.00% completado
2024-04-25 18:35:10,008 - INFO - 65.00% completado
2024-04-25 18:35:13,746 - INFO - Encontrado: P4ssw0rd -> 264bc0768362a68984faea923efaa21f67f4d10a
2024-04-25 18:35:13,908 - INFO - 70.00% completado
2024-04-25 18:35:17,743 - INFO - 75.00% completado
2024-04-25 18:35:21,63

In [39]:
for hash_val, pass_val in resultados.items():
    print(f'Hash: {hash_val}, Contraseña: {pass_val}')

Hash: 32d10c7b8cf96570ca04ce37f2a19d84240d3a89, Contraseña: abcdefghijklmnopqrstuvwxyz
Hash: 264bc0768362a68984faea923efaa21f67f4d10a, Contraseña: P4ssw0rd
