# Verificación de Integridad de Archivos mediante Hash

En entornos reales, es fundamental asegurarse de que un archivo no se ha alterado durante su transmisión o almacenamiento. Una forma de hacerlo es generando un "hash" del archivo, que es una especie de huella digital única. Si dos equipos generan el mismo hash para un archivo, se puede asumir que el contenido es idéntico.

En esta práctica, usamos el algoritmo MD5 para calcular el hash de un archivo que se sube desde tu ordenador. Luego, este hash puede ser compartido y comparado con el de otro equipo para garantizar la integridad del archivo.

**Pasos del ejercicio:**

1. **Lectura del Archivo:**  
2. **Cálculo del Hash:**  
3. **Comparación:**  

In [None]:
import hashlib

def compute_hash_file(file_path, algorithm='md5'):
    """
    Calcula el hash de un archivo leído desde 'file_path' utilizando el algoritmo indicado.

    Parámetros:
      file_path (str): Ruta completa del archivo.
      algorithm (str): Algoritmo hash a utilizar (por ejemplo, 'md5' o 'sha256').

    Retorna:
      str: El hash calculado en formato hexadecimal.
    """
    # Crear el objeto hash correspondiente
    h = hashlib.new(algorithm)

    # Leer el archivo en modo binario, procesándolo en bloques de 4096 bytes
    with open(file_path, 'rb') as f:
        for chunk in iter(lambda: f.read(4096), b''):
            h.update(chunk)

    return h.hexdigest()

In [6]:
# Especifica la ruta del archivo que deseas procesar
# Ejemplo: "C:/ruta/a/tu/archivo.pdf" o "/home/usuario/archivo.docx"
file_original = 'CRIPTO/Data/Documento hash.docx'  # Modifica esto según la ubicación de tu archivo
file_copy = 'CRIPTO/Data/Documento hash copia.docx'# Modifica esto según la ubicación de tu archivo

# Calcular y mostrar los hashes MD5
hash_md5_original = compute_hash_file(file_original, 'md5')
hash_md5_copy = compute_hash_file(file_copy, 'md5')

print(f"Archivo: {file_original}")
print(f"MD5: {hash_md5_original}")
print(f"MD5: {hash_md5_copy}")

FileNotFoundError: [Errno 2] No such file or directory: 'CRIPTO/Data/Documento hash.docx'

### Caso real: Integridad del documento

In [None]:
import rsa

#Generar clave privada y pública
public_key, private_key = rsa.newkeys(1024)

#Creamos los ficheros de los claves .pem

with open ("public.pem", "wb") as f:
    f.write(public_key.save_pkcs1("PEM"))

with open ("private.pem", "wb") as f:
    f.write(private_key.save_pkcs1("PEM"))

#Cargamos las claves

with open ("public.pem", "rb") as f:
    public_key=rsa.PublicKey.load_pkcs1(f.read())

with open ("private.pem", "rb") as f:
    private_key=rsa.PrivateKey.load_pkcs1(f.read())

In [None]:
# Encriptamos hash

encrypted_hash = rsa.encrypt(hash_md5_original.encode(), public_key)
print(encrypted_hash)

In [None]:
# Desencritamos hash

clear_hash = rsa.decrypt(encrypted_hash, private_key)
print(clear_hash.decode())