In [48]:
import os
import tkinter as tk
import hashlib
from cryptography.hazmat.primitives import hashes
from cryptography.hazmat.primitives.asymmetric import dsa
from cryptography.hazmat.backends import default_backend
from cryptography.exceptions import InvalidSignature
from docx import Document

#Generar claves DSA
private_key_dsa = dsa.generate_private_key(key_size=1024, backend=default_backend())
public_key_dsa = private_key_dsa.public_key()

#Función para calcular el hash SHA-256 del contenido del archivo DOCX
def hash_docx(file_path):
    hasher = hashlib.sha256()
    doc = Document(file_path)
    for paragraph in doc.paragraphs:
        hasher.update(paragraph.text.encode('utf-8'))
    return hasher.digest()

#Función para firmar un hash
def sign_hash(private_key, hash_value):
    signature = private_key.sign(hash_value, hashes.SHA256())
    return signature

#Función para verificar la firma de un hash
def verify_signature(public_key, signature, hash_value):
    try:
        public_key.verify(signature, hash_value, hashes.SHA256())
        return True
    except InvalidSignature:
        return False

#Función para verificar si un archivo DOCX ha sido modificado
def verify_docx_modified(original_file, modified_file):
    #Calcular los hashes SHA-256 de ambos archivos
    original_hash = hash_docx(original_file)
    modified_hash = hash_docx(modified_file)
    
    #Firmar el hash del archivo original
    original_signature = sign_hash(private_key_dsa, original_hash)
    
    #Verificar la firma del archivo modificado con respecto al hash del original
    if verify_signature(public_key_dsa, original_signature, modified_hash):
        print("Firma válida")
    else:
        print("Firma inválida")

#Directorio donde se encuentran los documentos
base_dir = "C:\\Users\\ljcg2\\Desktop\\Codigos\\"

#Ejemplo de documento a verificar
original_doc_path = os.path.join(base_dir, "DocEjemplo.docx")
doc_modificado_path = os.path.join(base_dir, "DocEjemploMod.docx")
doc_no_modificado_path = os.path.join(base_dir, "DocEjemplo2.docx")

#Verificar documento modificado respecto al original
print(f"Verificando {doc_modificado_path} respecto a {original_doc_path}:")
verify_docx_modified(original_doc_path, doc_modificado_path)

#Verificar documento no modificado respecto al original
print(f"Verificando {doc_no_modificado_path} respecto a {original_doc_path}:")
verify_docx_modified(original_doc_path, doc_no_modificado_path)



Verificando C:\Users\ljcg2\Desktop\Codigos\DocEjemploMod.docx respecto a C:\Users\ljcg2\Desktop\Codigos\DocEjemplo.docx:
Firma inválida
Verificando C:\Users\ljcg2\Desktop\Codigos\DocEjemplo2.docx respecto a C:\Users\ljcg2\Desktop\Codigos\DocEjemplo.docx:
Firma válida


In [50]:
import os
import tkinter as tk
import hashlib
from cryptography.hazmat.primitives import hashes
from cryptography.hazmat.primitives.asymmetric import dsa
from cryptography.hazmat.backends import default_backend
from cryptography.exceptions import InvalidSignature
from PyPDF2 import PdfReader

#Generar claves DSA
private_key_dsa = dsa.generate_private_key(key_size=1024, backend=default_backend())
public_key_dsa = private_key_dsa.public_key()

#Función para calcular el hash SHA-256 del contenido del archivo PDF
def hash_pdf(file_path):
    hasher = hashlib.sha256()
    with open(file_path, 'rb') as f:
        pdf_reader = PdfReader(f)
        for page_num in range(len(pdf_reader.pages)):
            page_text = pdf_reader.pages[page_num].extract_text()
            if page_text:
                hasher.update(page_text.encode('utf-8'))
    return hasher.digest()

#Función para firmar un hash
def sign_hash(private_key, hash_value):
    signature = private_key.sign(hash_value, hashes.SHA256())
    return signature

#Función para verificar la firma de un hash
def verify_signature(public_key, signature, hash_value):
    try:
        public_key.verify(signature, hash_value, hashes.SHA256())
        return True
    except InvalidSignature:
        return False

#Función para verificar si un archivo PDF ha sido modificado
def verify_pdf_modified(original_file, modified_file):
    #Calcular los hashes SHA-256 de ambos archivos
    original_hash = hash_pdf(original_file)
    modified_hash = hash_pdf(modified_file)
    
    # Firmar el hash del archivo original
    original_signature = sign_hash(private_key_dsa, original_hash)
    
    #Verificar la firma del archivo modificado con respecto al hash del original
    if verify_signature(public_key_dsa, original_signature, modified_hash):
        print("Firma válida")
    else:
        print("Firma inválida")

#Directorio donde se encuentran los documentos
base_dir = "C:\\Users\\ljcg2\\Desktop\\Codigos\\"

#Ejemplo de documento a verificar
original_pdf_path = os.path.join(base_dir, "DocEjemplo.pdf")
pdf_modificado_path = os.path.join(base_dir, "DocEjemploMod.pdf")
pdf_no_modificado_path = os.path.join(base_dir, "DocEjemplo2.pdf")

# Verificar documento modificado respecto al original
print(f"Verificando {pdf_modificado_path} respecto a {original_pdf_path}:")
verify_pdf_modified(original_pdf_path, pdf_modificado_path)

# Verificar documento no modificado respecto al original
print(f"Verificando {pdf_no_modificado_path} respecto a {original_pdf_path}:")
verify_pdf_modified(original_pdf_path, pdf_no_modificado_path)



Verificando C:\Users\ljcg2\Desktop\Codigos\DocEjemploMod.pdf respecto a C:\Users\ljcg2\Desktop\Codigos\DocEjemplo.pdf:
Firma inválida
Verificando C:\Users\ljcg2\Desktop\Codigos\DocEjemplo2.pdf respecto a C:\Users\ljcg2\Desktop\Codigos\DocEjemplo.pdf:
Firma válida


In [4]:
import os
import tkinter as tk
from tkinter import filedialog, messagebox
import hashlib
from cryptography.hazmat.primitives import hashes
from cryptography.hazmat.primitives.asymmetric import dsa
from cryptography.hazmat.backends import default_backend
from cryptography.exceptions import InvalidSignature
from PyPDF2 import PdfReader

#Generar claves DSA
private_key_dsa = dsa.generate_private_key(key_size=1024, backend=default_backend())
public_key_dsa = private_key_dsa.public_key()

#Función para calcular el hash SHA-256 del contenido del archivo PDF
def hash_pdf(file_path):
    hasher = hashlib.sha256()
    with open(file_path, 'rb') as f:
        pdf_reader = PdfReader(f)
        for page_num in range(len(pdf_reader.pages)):
            page_text = pdf_reader.pages[page_num].extract_text()
            if page_text:
                hasher.update(page_text.encode('utf-8'))
    return hasher.digest()

#Función para firmar un hash
def sign_hash(private_key, hash_value):
    signature = private_key.sign(hash_value, hashes.SHA256())
    return signature

#Función para verificar la firma de un hash
def verify_signature(public_key, signature, hash_value):
    try:
        public_key.verify(signature, hash_value, hashes.SHA256())
        return True
    except InvalidSignature:
        return False

#Función para verificar si un archivo PDF ha sido modificado
def verify_pdf_modified(original_file, modified_file):
    # Calcular los hashes SHA-256 de ambos archivos
    original_hash = hash_pdf(original_file)
    modified_hash = hash_pdf(modified_file)
    
    #Firmar el hash del archivo original
    original_signature = sign_hash(private_key_dsa, original_hash)
    
    #Verificar la firma del archivo modificado con respecto al hash del original
    if verify_signature(public_key_dsa, original_signature, modified_hash):
        return "Firma válida"
    else:
        return "Firma inválida"

#Función para cargar un archivo
def load_file(entry):
    file_path = filedialog.askopenfilename(filetypes=[("PDF files", "*.pdf")])
    if file_path:
        entry.delete(0, tk.END)
        entry.insert(0, file_path)

#Función para verificar el archivo seleccionado
def verify_file():
    original_file = original_file_entry.get()
    modified_file = modified_file_entry.get()
    
    if not original_file or not modified_file:
        messagebox.showerror("Error", "Por favor seleccione ambos archivos.")
        return
    
    result = verify_pdf_modified(original_file, modified_file)
    messagebox.showinfo("Resultado de Verificación", result)

#Crear la ventana principal
root = tk.Tk()
root.title("Verificación de Archivos PDF")

#Crear el marco para la selección de archivos
frame = tk.Frame(root, padx=10, pady=10)
frame.pack(padx=10, pady=10)

#Etiqueta y campo de entrada para el archivo original
tk.Label(frame, text="Archivo PDF Original:").grid(row=0, column=0, sticky=tk.W)
original_file_entry = tk.Entry(frame, width=50)
original_file_entry.grid(row=0, column=1, padx=5)
tk.Button(frame, text="Cargar", command=lambda: load_file(original_file_entry)).grid(row=0, column=2)

#Etiqueta y campo de entrada para el archivo modificado
tk.Label(frame, text="Archivo PDF Modificado:").grid(row=1, column=0, sticky=tk.W)
modified_file_entry = tk.Entry(frame, width=50)
modified_file_entry.grid(row=1, column=1, padx=5)
tk.Button(frame, text="Cargar", command=lambda: load_file(modified_file_entry)).grid(row=1, column=2)

#Botón para verificar el archivo
tk.Button(root, text="Verificar Archivo", command=verify_file).pack(pady=10)

#Ejecutar la aplicación
root.mainloop()


In [5]:
import os
import tkinter as tk
from tkinter import filedialog, messagebox
import hashlib
from cryptography.hazmat.primitives import hashes
from cryptography.hazmat.primitives.asymmetric import dsa
from cryptography.hazmat.backends import default_backend
from cryptography.exceptions import InvalidSignature
from PyPDF2 import PdfReader

#Generar claves DSA
private_key_dsa = dsa.generate_private_key(key_size=1024, backend=default_backend())
public_key_dsa = private_key_dsa.public_key()

#Función para calcular el hash SHA-256 del contenido del archivo PDF
def hash_pdf(file_path):
    hasher = hashlib.sha256()
    with open(file_path, 'rb') as f:
        pdf_reader = PdfReader(f)
        for page_num in range(len(pdf_reader.pages)):
            page_text = pdf_reader.pages[page_num].extract_text()
            if page_text:
                hasher.update(page_text.encode('utf-8'))
    return hasher.digest()

#Función para firmar un hash
def sign_hash(private_key, hash_value):
    signature = private_key.sign(hash_value, hashes.SHA256())
    return signature

#Función para verificar la firma de un hash
def verify_signature(public_key, signature, hash_value):
    try:
        public_key.verify(signature, hash_value, hashes.SHA256())
        return True
    except InvalidSignature:
        return False

#Función para verificar si un archivo PDF ha sido modificado
def verify_pdf_modified(original_file, modified_file):
    try:
        #Calcular los hashes SHA-256 de ambos archivos
        original_hash = hash_pdf(original_file)
        modified_hash = hash_pdf(modified_file)
        
        #Firmar el hash del archivo original
        original_signature = sign_hash(private_key_dsa, original_hash)
        
        #Verificar la firma del archivo modificado con respecto al hash del original
        if verify_signature(public_key_dsa, original_signature, modified_hash):
            return "Firma válida"
        else:
            return "Firma inválida"
    except Exception as e:
        return f"Error al verificar el archivo: {e}"

#Función para cargar un archivo
def load_file(entry):
    file_path = filedialog.askopenfilename(filetypes=[("PDF files", "*.pdf")])
    if file_path:
        entry.delete(0, tk.END)
        entry.insert(0, file_path)

#Función para verificar el archivo seleccionado
def verify_file():
    original_file = original_file_entry.get()
    modified_file = modified_file_entry.get()
    
    if not original_file or not modified_file:
        messagebox.showerror("Error", "Por favor seleccione ambos archivos.")
        return
    
    if not os.path.isfile(original_file):
        messagebox.showerror("Error", f"El archivo original '{original_file}' no existe.")
        return
    
    if not os.path.isfile(modified_file):
        messagebox.showerror("Error", f"El archivo modificado '{modified_file}' no existe.")
        return
    
    result = verify_pdf_modified(original_file, modified_file)
    messagebox.showinfo("Resultado de Verificación", result)

#Crear la ventana principal
root = tk.Tk()
root.title("Verificación de Archivos PDF")
root.geometry("600x200")
root.resizable(False, False)

#Crear el marco para la selección de archivos
frame = tk.Frame(root, padx=10, pady=10)
frame.pack(padx=10, pady=10, fill=tk.X)

#Etiqueta y campo de entrada para el archivo original
tk.Label(frame, text="Archivo PDF Original:").grid(row=0, column=0, sticky=tk.W, padx=5, pady=5)
original_file_entry = tk.Entry(frame, width=50)
original_file_entry.grid(row=0, column=1, padx=5, pady=5)
tk.Button(frame, text="Cargar", command=lambda: load_file(original_file_entry)).grid(row=0, column=2, padx=5, pady=5)

#Etiqueta y campo de entrada para el archivo modificado
tk.Label(frame, text="Archivo PDF Modificado:").grid(row=1, column=0, sticky=tk.W, padx=5, pady=5)
modified_file_entry = tk.Entry(frame, width=50)
modified_file_entry.grid(row=1, column=1, padx=5, pady=5)
tk.Button(frame, text="Cargar", command=lambda: load_file(modified_file_entry)).grid(row=1, column=2, padx=5, pady=5)

#Botón para verificar el archivo
tk.Button(root, text="Verificar Archivo", command=verify_file).pack(pady=20)

#Ejecutar la aplicación
root.mainloop()


Directorio

In [3]:
import os
import tkinter as tk
from tkinter import filedialog, messagebox
import hashlib
from cryptography.hazmat.primitives import hashes
from cryptography.hazmat.primitives.asymmetric import dsa
from cryptography.hazmat.backends import default_backend
from cryptography.exceptions import InvalidSignature
from PyPDF2 import PdfReader

#Generar claves DSA
private_key_dsa = dsa.generate_private_key(key_size=1024, backend=default_backend())
public_key_dsa = private_key_dsa.public_key()

#Función para calcular el hash SHA-256 del contenido del archivo PDF
def hash_pdf(file_path):
    hasher = hashlib.sha256()
    with open(file_path, 'rb') as f:
        pdf_reader = PdfReader(f)
        for page_num in range(len(pdf_reader.pages)):
            page_text = pdf_reader.pages[page_num].extract_text()
            if page_text:
                hasher.update(page_text.encode('utf-8'))
    return hasher.digest()

#Función para firmar un hash
def sign_hash(private_key, hash_value):
    signature = private_key.sign(hash_value, hashes.SHA256())
    return signature

#Función para verificar la firma de un hash
def verify_signature(public_key, signature, hash_value):
    try:
        public_key.verify(signature, hash_value, hashes.SHA256())
        return True
    except InvalidSignature:
        return False

#Función para verificar si un archivo PDF ha sido modificado
def verify_pdf_modified(original_file, modified_file):
    try:
        # Calcular los hashes SHA-256 de ambos archivos
        original_hash = hash_pdf(original_file)
        modified_hash = hash_pdf(modified_file)
        
        # Firmar el hash del archivo original
        original_signature = sign_hash(private_key_dsa, original_hash)
        
        # Verificar la firma del archivo modificado con respecto al hash del original
        if verify_signature(public_key_dsa, original_signature, modified_hash):
            return "Firma válida"
        else:
            return "Firma inválida"
    except Exception as e:
        return f"Error al verificar el archivo: {e}"

#Función para cargar un directorio
def load_directory(entry):
    directory_path = filedialog.askdirectory()
    if directory_path:
        entry.delete(0, tk.END)
        entry.insert(0, directory_path)

#Función para verificar los archivos en los directorios seleccionados
def verify_directories():
    dir1 = dir1_entry.get()
    dir2 = dir2_entry.get()
    
    if not dir1 or not dir2:
        messagebox.showerror("Error", "Por favor seleccione ambos directorios.")
        return
    
    if not os.path.isdir(dir1):
        messagebox.showerror("Error", f"El directorio '{dir1}' no existe.")
        return
    
    if not os.path.isdir(dir2):
        messagebox.showerror("Error", f"El directorio '{dir2}' no existe.")
        return

    pdf_files_dir1 = [os.path.join(dir1, f) for f in os.listdir(dir1) if f.endswith('.pdf')]
    pdf_files_dir2 = [os.path.join(dir2, f) for f in os.listdir(dir2) if f.endswith('.pdf')]
    
    if not pdf_files_dir1 or not pdf_files_dir2:
        messagebox.showerror("Error", "Ambos directorios deben contener archivos PDF.")
        return
    
    result = []
    for file1 in pdf_files_dir1:
        for file2 in pdf_files_dir2:
            verification_result = verify_pdf_modified(file1, file2)
            result.append((file1, file2, verification_result))
    
    result_message = "\n".join([f"{os.path.basename(f1)} vs {os.path.basename(f2)}: {res}" for f1, f2, res in result])
    messagebox.showinfo("Resultado de Verificación", result_message)

#Crear la ventana principal
root = tk.Tk()
root.title("Verificación de Archivos PDF en Directorios")
root.geometry("600x250")
root.resizable(False, False)

#Crear el marco para la selección de directorios
frame = tk.Frame(root, padx=10, pady=10)
frame.pack(padx=10, pady=10, fill=tk.X)

#Etiqueta y campo de entrada para el directorio 1
tk.Label(frame, text="Directorio 1:").grid(row=0, column=0, sticky=tk.W, padx=5, pady=5)
dir1_entry = tk.Entry(frame, width=50)
dir1_entry.grid(row=0, column=1, padx=5, pady=5)
tk.Button(frame, text="Cargar", command=lambda: load_directory(dir1_entry)).grid(row=0, column=2, padx=5, pady=5)

#Etiqueta y campo de entrada para el directorio 2
tk.Label(frame, text="Directorio 2:").grid(row=1, column=0, sticky=tk.W, padx=5, pady=5)
dir2_entry = tk.Entry(frame, width=50)
dir2_entry.grid(row=1, column=1, padx=5, pady=5)
tk.Button(frame, text="Cargar", command=lambda: load_directory(dir2_entry)).grid(row=1, column=2, padx=5, pady=5)

#Botón para verificar los archivos en los directorios
tk.Button(root, text="Verificar Directorios", command=verify_directories).pack(pady=20)

#Ejecutar la aplicación
root.mainloop()


Creación de carpeta

In [1]:
import os
import shutil
import tkinter as tk
from tkinter import filedialog, messagebox
import hashlib
from cryptography.hazmat.primitives import hashes
from cryptography.hazmat.primitives.asymmetric import dsa
from cryptography.hazmat.backends import default_backend
from cryptography.exceptions import InvalidSignature
from PyPDF2 import PdfReader

#Generar claves DSA
private_key_dsa = dsa.generate_private_key(key_size=1024, backend=default_backend())
public_key_dsa = private_key_dsa.public_key()

#Función para calcular el hash SHA-256 del contenido del archivo PDF
def hash_pdf(file_path):
    hasher = hashlib.sha256()
    with open(file_path, 'rb') as f:
        pdf_reader = PdfReader(f)
        for page_num in range(len(pdf_reader.pages)):
            page_text = pdf_reader.pages[page_num].extract_text()
            if page_text:
                hasher.update(page_text.encode('utf-8'))
    return hasher.digest()

#Función para firmar un hash
def sign_hash(private_key, hash_value):
    signature = private_key.sign(hash_value, hashes.SHA256())
    return signature

#Función para verificar la firma de un hash
def verify_signature(public_key, signature, hash_value):
    try:
        public_key.verify(signature, hash_value, hashes.SHA256())
        return True
    except InvalidSignature:
        return False

#Función para verificar si un archivo PDF ha sido modificado
def verify_pdf_modified(original_file, modified_file):
    try:
        #Calcular los hashes SHA-256 de ambos archivos
        original_hash = hash_pdf(original_file)
        modified_hash = hash_pdf(modified_file)
        
        #Firmar el hash del archivo original
        original_signature = sign_hash(private_key_dsa, original_hash)
        
        #Verificar la firma del archivo modificado con respecto al hash del original
        if verify_signature(public_key_dsa, original_signature, modified_hash):
            return "Firma válida"
        else:
            return "Firma inválida"
    except Exception as e:
        return f"Error al verificar el archivo: {e}"

#Función para cargar un directorio
def load_directory(entry):
    directory_path = filedialog.askdirectory()
    if directory_path:
        entry.delete(0, tk.END)
        entry.insert(0, directory_path)

#Función para verificar los archivos en los directorios seleccionados y copiar archivos con firma inválida
def verify_and_copy_invalid_files():
    dir1 = dir1_entry.get()
    dir2 = dir2_entry.get()
    
    if not dir1 or not dir2:
        messagebox.showerror("Error", "Por favor seleccione ambos directorios.")
        return
    
    if not os.path.isdir(dir1):
        messagebox.showerror("Error", f"El directorio '{dir1}' no existe.")
        return
    
    if not os.path.isdir(dir2):
        messagebox.showerror("Error", f"El directorio '{dir2}' no existe.")
        return

    pdf_files_dir1 = [os.path.join(dir1, f) for f in os.listdir(dir1) if f.endswith('.pdf')]
    pdf_files_dir2 = [os.path.join(dir2, f) for f in os.listdir(dir2) if f.endswith('.pdf')]
    
    if not pdf_files_dir1 or not pdf_files_dir2:
        messagebox.showerror("Error", "Ambos directorios deben contener archivos PDF.")
        return

    #Crear directorio para los archivos copiados
    desktop_path = os.path.join(os.path.join(os.environ['USERPROFILE']), 'Desktop')
    copy_dir = os.path.join(desktop_path, 'Archivos_Firma_Invalida')
    os.makedirs(copy_dir, exist_ok=True)

    result = []
    for file2 in pdf_files_dir2:
        valid = False
        for file1 in pdf_files_dir1:
            verification_result = verify_pdf_modified(file1, file2)
            if verification_result == "Firma válida":
                valid = True
                break
        if not valid:
            shutil.copy(file2, copy_dir)
            result.append(f"{os.path.basename(file2)}: Firma inválida")

    if result:
        result_message = "\n".join(result)
    else:
        result_message = "No se encontraron archivos con firma inválida."

    messagebox.showinfo("Resultado de Verificación", result_message)

#Crear la ventana principal
root = tk.Tk()
root.title("Verificación de Archivos PDF en Directorios")
root.geometry("600x250")
root.resizable(False, False)

#Crear el marco para la selección de directorios
frame = tk.Frame(root, padx=10, pady=10)
frame.pack(padx=10, pady=10, fill=tk.X)

#Etiqueta y campo de entrada para el directorio 1
tk.Label(frame, text="Directorio 1:").grid(row=0, column=0, sticky=tk.W, padx=5, pady=5)
dir1_entry = tk.Entry(frame, width=50)
dir1_entry.grid(row=0, column=1, padx=5, pady=5)
tk.Button(frame, text="Cargar", command=lambda: load_directory(dir1_entry)).grid(row=0, column=2, padx=5, pady=5)

#Etiqueta y campo de entrada para el directorio 2
tk.Label(frame, text="Directorio 2:").grid(row=1, column=0, sticky=tk.W, padx=5, pady=5)
dir2_entry = tk.Entry(frame, width=50)
dir2_entry.grid(row=1, column=1, padx=5, pady=5)
tk.Button(frame, text="Cargar", command=lambda: load_directory(dir2_entry)).grid(row=1, column=2, padx=5, pady=5)

#Botón para verificar los archivos en los directorios y copiar archivos con firma inválida
tk.Button(root, text="Verificar y Copiar Archivos con Firma Inválida", command=verify_and_copy_invalid_files).pack(pady=20)

#Ejecutar la aplicación
root.mainloop()



Final

In [2]:
import os
import shutil
import tkinter as tk
from tkinter import filedialog, messagebox
import hashlib
from cryptography.hazmat.primitives import hashes
from cryptography.hazmat.primitives.asymmetric import dsa
from cryptography.hazmat.backends import default_backend
from cryptography.exceptions import InvalidSignature
from PyPDF2 import PdfReader

#Generar claves DSA
private_key_dsa = dsa.generate_private_key(key_size=1024, backend=default_backend())
public_key_dsa = private_key_dsa.public_key()

#Función para calcular el hash SHA-256 del contenido del archivo PDF
def hash_pdf(file_path):
    hasher = hashlib.sha256()
    with open(file_path, 'rb') as f:
        pdf_reader = PdfReader(f)
        for page_num in range(len(pdf_reader.pages)):
            page_text = pdf_reader.pages[page_num].extract_text()
            if page_text:
                hasher.update(page_text.encode('utf-8'))
    return hasher.digest()

#Función para firmar un hash
def sign_hash(private_key, hash_value):
    signature = private_key.sign(hash_value, hashes.SHA256())
    return signature

#Función para verificar la firma de un hash
def verify_signature(public_key, signature, hash_value):
    try:
        public_key.verify(signature, hash_value, hashes.SHA256())
        return True
    except InvalidSignature:
        return False

#Función para verificar si un archivo PDF ha sido modificado
def verify_pdf_modified(original_file, modified_file):
    try:
        # Calcular los hashes SHA-256 de ambos archivos
        original_hash = hash_pdf(original_file)
        modified_hash = hash_pdf(modified_file)
        
        # Firmar el hash del archivo original
        original_signature = sign_hash(private_key_dsa, original_hash)
        
        # Verificar la firma del archivo modificado con respecto al hash del original
        if verify_signature(public_key_dsa, original_signature, modified_hash):
            return "Firma válida"
        else:
            return "Firma inválida"
    except Exception as e:
        return f"Error al verificar el archivo: {e}"

#Función para cargar un archivo
def load_file(entry):
    file_path = filedialog.askopenfilename(filetypes=[("PDF files", "*.pdf")])
    if file_path:
        entry.delete(0, tk.END)
        entry.insert(0, file_path)

#Función para verificar el archivo seleccionado
def verify_file():
    original_file = original_file_entry.get()
    modified_file = modified_file_entry.get()
    
    if not original_file or not modified_file:
        messagebox.showerror("Error", "Por favor seleccione ambos archivos.")
        return
    
    if not os.path.isfile(original_file):
        messagebox.showerror("Error", f"El archivo original '{original_file}' no existe.")
        return
    
    if not os.path.isfile(modified_file):
        messagebox.showerror("Error", f"El archivo modificado '{modified_file}' no existe.")
        return
    
    result = verify_pdf_modified(original_file, modified_file)
    messagebox.showinfo("Resultado de Verificación", result)

#Función para cargar un directorio
def load_directory(entry):
    directory_path = filedialog.askdirectory()
    if directory_path:
        entry.delete(0, tk.END)
        entry.insert(0, directory_path)

#Función para verificar los archivos en los directorios seleccionados
def verify_directories():
    dir1 = dir1_entry.get()
    dir2 = dir2_entry.get()
    
    if not dir1 or not dir2:
        messagebox.showerror("Error", "Por favor seleccione ambos directorios.")
        return
    
    if not os.path.isdir(dir1):
        messagebox.showerror("Error", f"El directorio '{dir1}' no existe.")
        return
    
    if not os.path.isdir(dir2):
        messagebox.showerror("Error", f"El directorio '{dir2}' no existe.")
        return

    pdf_files_dir1 = [os.path.join(dir1, f) for f in os.listdir(dir1) if f.endswith('.pdf')]
    pdf_files_dir2 = [os.path.join(dir2, f) for f in os.listdir(dir2) if f.endswith('.pdf')]
    
    if not pdf_files_dir1 or not pdf_files_dir2:
        messagebox.showerror("Error", "Ambos directorios deben contener archivos PDF.")
        return
    
    result = []
    for file1 in pdf_files_dir1:
        for file2 in pdf_files_dir2:
            verification_result = verify_pdf_modified(file1, file2)
            result.append((file1, file2, verification_result))
    
    result_message = "\n".join([f"{os.path.basename(f1)} vs {os.path.basename(f2)}: {res}" for f1, f2, res in result])
    messagebox.showinfo("Resultado de Verificación", result_message)

#Función para verificar los archivos en los directorios seleccionados y copiar archivos con firma inválida
def verify_and_copy_invalid_files():
    dir1 = dir1_entry.get()
    dir2 = dir2_entry.get()
    
    if not dir1 or not dir2:
        messagebox.showerror("Error", "Por favor seleccione ambos directorios.")
        return
    
    if not os.path.isdir(dir1):
        messagebox.showerror("Error", f"El directorio '{dir1}' no existe.")
        return
    
    if not os.path.isdir(dir2):
        messagebox.showerror("Error", f"El directorio '{dir2}' no existe.")
        return

    pdf_files_dir1 = [os.path.join(dir1, f) for f in os.listdir(dir1) if f.endswith('.pdf')]
    pdf_files_dir2 = [os.path.join(dir2, f) for f in os.listdir(dir2) if f.endswith('.pdf')]
    
    if not pdf_files_dir1 or not pdf_files_dir2:
        messagebox.showerror("Error", "Ambos directorios deben contener archivos PDF.")
        return

    #Crear directorio para los archivos copiados
    desktop_path = os.path.join(os.path.join(os.environ['USERPROFILE']), 'Desktop')
    copy_dir = os.path.join(desktop_path, 'Archivos_Firma_Invalida')
    os.makedirs(copy_dir, exist_ok=True)

    result = []
    for file2 in pdf_files_dir2:
        valid = False
        for file1 in pdf_files_dir1:
            verification_result = verify_pdf_modified(file1, file2)
            if verification_result == "Firma válida":
                valid = True
                break
        if not valid:
            shutil.copy(file2, copy_dir)
            result.append(f"{os.path.basename(file2)}: Firma inválida")

    if result:
        result_message = "\n".join(result)
    else:
        result_message = "No se encontraron archivos con firma inválida."

    messagebox.showinfo("Resultado de Verificación", result_message)

#Función para mostrar la interfaz de validación de un solo archivo
def show_single_file_validation():
    #Crear la ventana principal
    single_file_window = tk.Tk()
    single_file_window.title("Verificación de Archivos PDF")
    single_file_window.geometry("600x250")
    single_file_window.resizable(False, False)

    #Crear el marco para la selección de archivos
    frame = tk.Frame(single_file_window, padx=10, pady=10)
    frame.pack(padx=10, pady=10, fill=tk.X)

    #Etiqueta y campo de entrada para el archivo original
    tk.Label(frame, text="Archivo PDF Original:").grid(row=0, column=0, sticky=tk.W, padx=5, pady=5)
    global original_file_entry
    original_file_entry = tk.Entry(frame, width=50)
    original_file_entry.grid(row=0, column=1, padx=5, pady=5)
    tk.Button(frame, text="Cargar", command=lambda: load_file(original_file_entry)).grid(row=0, column=2, padx=5, pady=5)

    #Etiqueta y campo de entrada para el archivo modificado
    tk.Label(frame, text="Archivo PDF Modificado:").grid(row=1, column=0, sticky=tk.W, padx=5, pady=5)
    global modified_file_entry
    modified_file_entry = tk.Entry(frame, width=50)
    modified_file_entry.grid(row=1, column=1, padx=5, pady=5)
    tk.Button(frame, text="Cargar", command=lambda: load_file(modified_file_entry)).grid(row=1, column=2, padx=5, pady=5)

    #Botón para verificar el archivo
    tk.Button(single_file_window, text="Verificar Archivo", command=verify_file).pack(pady=10)

    #Botón para regresar a la ventana de bienvenida
    tk.Button(single_file_window, text="Regresar", command=lambda: [single_file_window.destroy(), show_welcome_window()]).pack(pady=10)

#Función para mostrar la interfaz de validación de varios archivos
def show_multiple_files_validation():
    #Crear la ventana principal
    multi_file_window = tk.Tk()
    multi_file_window.title("Verificación de Archivos PDF en Directorios")
    multi_file_window.geometry("600x300")
    multi_file_window.resizable(False, False)

    #Crear el marco para la selección de directorios
    frame = tk.Frame(multi_file_window, padx=10, pady=10)
    frame.pack(padx=10, pady=10, fill=tk.X)

    #Etiqueta y campo de entrada para el directorio 1
    tk.Label(frame, text="Directorio 1:").grid(row=0, column=0, sticky=tk.W, padx=5, pady=5)
    global dir1_entry
    dir1_entry = tk.Entry(frame, width=50)
    dir1_entry.grid(row=0, column=1, padx=5, pady=5)
    tk.Button(frame, text="Cargar", command=lambda: load_directory(dir1_entry)).grid(row=0, column=2, padx=5, pady=5)

    #Etiqueta y campo de entrada para el directorio 2
    tk.Label(frame, text="Directorio 2:").grid(row=1, column=0, sticky=tk.W, padx=5, pady=5)
    global dir2_entry
    dir2_entry = tk.Entry(frame, width=50)
    dir2_entry.grid(row=1, column=1, padx=5, pady=5)
    tk.Button(frame, text="Cargar", command=lambda: load_directory(dir2_entry)).grid(row=1, column=2, padx=5, pady=5)

    #Preguntar si desea crear una carpeta para archivos con firmas inválidas
    def ask_create_folder():
        response = messagebox.askyesno("Crear Carpeta", "¿Desea crear una carpeta para los archivos con firmas inválidas?")
        if response:
            tk.Button(multi_file_window, text="Verificar y Copiar Archivos con Firma Inválida", command=verify_and_copy_invalid_files).pack(pady=20)
        else:
            tk.Button(multi_file_window, text="Verificar Directorios", command=verify_directories).pack(pady=20)
    
    ask_create_folder()

    #Botón para regresar a la ventana de bienvenida
    tk.Button(multi_file_window, text="Regresar", command=lambda: [multi_file_window.destroy(), show_welcome_window()]).pack(pady=10)

#Función para mostrar la ventana de bienvenida
def show_welcome_window():
    welcome_window = tk.Tk()
    welcome_window.title("Bienvenido")
    welcome_window.geometry("900x500")
    welcome_window.resizable(False, False)

    tk.Label(welcome_window, text="Hola, quieres verificar si un archivo PDF fue modificado o prefieres verificar si varios archivos PDF (en el mismo directorio) han sido modificados? ", font=("Helvetica", 10)).pack(pady=20)
    tk.Button(welcome_window, text="Verificar un solo archivo", command=lambda: [welcome_window.destroy(), show_single_file_validation()]).pack(pady=10)
    tk.Button(welcome_window, text="Verificar varios archivos", command=lambda: [welcome_window.destroy(), show_multiple_files_validation()]).pack(pady=10)

    welcome_window.mainloop()

#Mostrar la ventana de bienvenida
show_welcome_window()


Final de finales

In [1]:
import os
import shutil
import tkinter as tk
from tkinter import filedialog, messagebox
import hashlib
from openpyxl import load_workbook
from PyPDF2 import PdfReader

#Función para calcular el hash SHA-256 del contenido del archivo PDF
def calcular_hash_pdf(ruta_archivo):
    hasher = hashlib.sha256()
    with open(ruta_archivo, 'rb') as f:
        lector_pdf = PdfReader(f)
        for num_pagina in range(len(lector_pdf.pages)):
            texto_pagina = lector_pdf.pages[num_pagina].extract_text()
            if texto_pagina:
                hasher.update(texto_pagina.encode('utf-8'))
    return hasher.digest()

#Función para abrir el archivo PDF
def abrir_archivo(ruta_archivo):
    os.startfile(ruta_archivo)

#Función para cargar una carpeta y verificar los hashes de los archivos PDF
def cargar_carpeta_y_verificar():
    root = tk.Tk()
    root.withdraw()  

    ruta_carpeta = filedialog.askdirectory(title="Seleccionar carpeta con archivos PDF")
    if not ruta_carpeta:
        messagebox.showerror("Error", "No se ha seleccionado una carpeta con archivos PDF.")
        root.destroy()
        return

    archivo_excel = filedialog.askopenfilename(title="Seleccionar archivo Excel", filetypes=[("Excel files", "*.xlsx")])
    if not archivo_excel:
        messagebox.showerror("Error", "No se ha seleccionado un archivo Excel.")
        root.destroy()
        return

    try:
        wb = load_workbook(archivo_excel)
        hoja = wb.active

        archivos_validos = []
        archivos_invalidos = []

        for nombre_archivo in os.listdir(ruta_carpeta):
            if nombre_archivo.endswith('.pdf'):
                ruta_archivo = os.path.join(ruta_carpeta, nombre_archivo)
                hash_calculado = calcular_hash_pdf(ruta_archivo)
                hash_encontrado = False

                for fila in hoja.iter_rows(min_row=2):
                    hash_del_excel = bytes.fromhex(fila[1].value)  # Convertir el hash de hexadecimal a bytes
                    if hash_calculado == hash_del_excel:
                        hash_encontrado = True
                        break

                if hash_encontrado:
                    archivos_validos.append(nombre_archivo)
                else:
                    archivos_invalidos.append((nombre_archivo, ruta_archivo))

        #Mostrar el resultado en una nueva ventana
        ventana_resultados = tk.Toplevel()
        ventana_resultados.title("Resultados de Verificación")
        ventana_resultados.geometry("700x400")
        ventana_resultados.resizable(False, False)

        marco_resultados = tk.Frame(ventana_resultados)
        marco_resultados.pack(fill=tk.BOTH, expand=True)

        canvas = tk.Canvas(marco_resultados)
        scrollbar = tk.Scrollbar(marco_resultados, orient="vertical", command=canvas.yview)
        marco_scrollable = tk.Frame(canvas)

        marco_scrollable.bind(
            "<Configure>",
            lambda e: canvas.configure(
                scrollregion=canvas.bbox("all")
            )
        )

        canvas.create_window((0, 0), window=marco_scrollable, anchor="nw")
        canvas.configure(yscrollcommand=scrollbar.set)

        for nombre_archivo in archivos_validos:
            tk.Label(marco_scrollable, text=f"{nombre_archivo} - Firma Válida", fg="green", font=("Helvetica", 10)).pack(anchor="w", pady=2)

        for nombre_archivo, ruta_archivo in archivos_invalidos:
            label = tk.Label(marco_scrollable, text=f"{nombre_archivo} - Firma Inválida", fg="red", font=("Helvetica", 10), cursor="hand2")
            label.pack(anchor="w", pady=2)
            label.bind("<Button-1>", lambda e, ruta=ruta_archivo: abrir_archivo(ruta))

        canvas.pack(side="left", fill="both", expand=True)
        scrollbar.pack(side="right", fill="y")

        def cerrar_ventana_resultados():
            ventana_resultados.destroy()
            root.quit()

        ventana_resultados.protocol("WM_DELETE_WINDOW", cerrar_ventana_resultados)
        ventana_resultados.mainloop()

    except Exception as e:
        messagebox.showerror("Error", f"Error al leer el archivo Excel: {e}")
        root.destroy()
    finally:
        root.destroy()  #Cerrar la ventana principal de tkinter y terminar el programa

#Función para mostrar la ventana de bienvenida y empezar la verificación
def mostrar_ventana_bienvenida():
    ventana_bienvenida = tk.Tk()
    ventana_bienvenida.title("Bienvenido")
    ventana_bienvenida.geometry("700x350")
    ventana_bienvenida.resizable(False, False)
    tk.Label(ventana_bienvenida, text="Seleccione la carpeta con los documentos que desea verificar y el archivo Excel con los hashes originales:", font=("Helvetica", 10)).pack(pady=20)

    #Botón
    boton_seleccionar_carpeta = tk.Button(ventana_bienvenida, text="Seleccionar Carpeta", command=cargar_carpeta_y_verificar)
    boton_seleccionar_carpeta.config(height=3, width=50, font=("Helvetica", 12))
    boton_seleccionar_carpeta.pack(pady=10)

    def cerrar_ventana_bienvenida():
        ventana_bienvenida.destroy()
        ventana_bienvenida.quit()

    ventana_bienvenida.protocol("WM_DELETE_WINDOW", cerrar_ventana_bienvenida)

    ventana_bienvenida.mainloop()

# Mostrar la ventana de bienvenida
mostrar_ventana_bienvenida()




In [3]:
import requests
from bs4 import BeautifulSoup
import os

# URL de la página principal
url = 'https://siguealcongreso.org/monitoreo/sintema/lxiii/'

# Directorio donde se guardarán los archivos PDF
output_dir = 'documentos_pdf'
os.makedirs(output_dir, exist_ok=True)

# Obtener el contenido de la página
response = requests.get(url)
response.raise_for_status()
soup = BeautifulSoup(response.text, 'html.parser')

# Encontrar todos los enlaces "Leer documento"
links = soup.find_all('a', text='Leer documento')

# Descargar cada archivo PDF
for i, link in enumerate(links, start=1):
    pdf_url = link['href']
    pdf_response = requests.get(pdf_url)
    pdf_response.raise_for_status()
    
    # Nombre del archivo PDF basado en el número de secuencia
    pdf_filename = f'documento_{i}.pdf'
    pdf_path = os.path.join(output_dir, pdf_filename)
    
    # Guardar el archivo PDF
    with open(pdf_path, 'wb') as pdf_file:
        pdf_file.write(pdf_response.content)
    
    print(f'Descargado: {pdf_filename}')


  links = soup.find_all('a', text='Leer documento')


Descargado: documento_1.pdf
Descargado: documento_2.pdf
Descargado: documento_3.pdf
Descargado: documento_4.pdf
Descargado: documento_5.pdf
Descargado: documento_6.pdf
Descargado: documento_7.pdf
Descargado: documento_8.pdf
Descargado: documento_9.pdf
Descargado: documento_10.pdf
Descargado: documento_11.pdf
Descargado: documento_12.pdf
Descargado: documento_13.pdf
Descargado: documento_14.pdf
Descargado: documento_15.pdf
Descargado: documento_16.pdf
Descargado: documento_17.pdf
Descargado: documento_18.pdf
Descargado: documento_19.pdf
Descargado: documento_20.pdf
Descargado: documento_21.pdf
Descargado: documento_22.pdf
Descargado: documento_23.pdf
Descargado: documento_24.pdf
Descargado: documento_25.pdf
Descargado: documento_26.pdf
Descargado: documento_27.pdf
Descargado: documento_28.pdf
Descargado: documento_29.pdf
Descargado: documento_30.pdf
Descargado: documento_31.pdf
Descargado: documento_32.pdf
Descargado: documento_33.pdf
Descargado: documento_34.pdf
Descargado: documento_3

In [1]:
import os
import hashlib
import tkinter as tk
from tkinter import filedialog, messagebox
from PyPDF2 import PdfReader
from openpyxl import Workbook

# Función para calcular el hash SHA-256 del contenido del archivo PDF
def hash_pdf(file_path):
    hasher = hashlib.sha256()
    with open(file_path, 'rb') as f:
        pdf_reader = PdfReader(f)
        for page_num in range(len(pdf_reader.pages)):
            page_text = pdf_reader.pages[page_num].extract_text()
            if page_text:
                hasher.update(page_text.encode('utf-8'))
    return hasher.hexdigest()

# Función para cargar una carpeta y obtener los hashes de los archivos PDF
def load_directory_and_hash():
    root = tk.Tk()
    root.withdraw()  # Oculta la ventana principal de tkinter

    directory_path = filedialog.askdirectory()
    if directory_path:
        pdf_files = [f for f in os.listdir(directory_path) if f.endswith('.pdf')]
        if not pdf_files:
            messagebox.showwarning("Sin archivos PDF", "El directorio seleccionado no contiene archivos PDF.")
            return
        
        # Crear un nuevo libro de trabajo y seleccionar la hoja activa
        wb = Workbook()
        ws = wb.active
        ws.title = "Hashes PDF"

        # Añadir encabezados a la hoja de cálculo
        ws.append(["Nombre del Archivo", "Hash SHA-256"])

        # Iterar sobre los archivos PDF en la carpeta y calcular los hashes
        for pdf_file in pdf_files:
            file_path = os.path.join(directory_path, pdf_file)
            hash_value = hash_pdf(file_path)
            ws.append([pdf_file, hash_value])

        # Pedir al usuario que seleccione dónde guardar el archivo Excel
        output_file = filedialog.asksaveasfilename(defaultextension=".xlsx", filetypes=[("Excel files", "*.xlsx")])
        if output_file:
            wb.save(output_file)
            messagebox.showinfo("Guardado Exitoso", f"Se han guardado los hashes en:\n{output_file}")
        else:
            messagebox.showwarning("Guardado Cancelado", "No se ha seleccionado un archivo para guardar. La operación ha sido cancelada.")

# Función para mostrar la ventana de carga de carpeta
def show_load_directory_window():
    load_directory_and_hash()

# Mostrar la ventana para cargar una carpeta y calcular los hashes
show_load_directory_window()

