# **PREPARAR LIGANDOS**

In [None]:
#@title 🧪 Script para Preparar un Ligando (Ejecución Local)
#@markdown ---
#@markdown ### 1. Configuración de Rutas y Nombres (en tu PC)
#@markdown Introduce aquí la información de tu ligando.
#@markdown **IMPORTANTE:** Las rutas deben ser las de tu sistema WSL.

#@markdown **Ruta a la carpeta donde están guardados tus ligandos en WSL:**
LIGANDS_FOLDER = "" #@param {type:"string"}

#@markdown **Nombre del ligando que quieres preparar (sin la extensión):**
ligand_name = "" #@param {type:"string"}

#@markdown **Extensión de tus archivos de ligando:**
LIGAND_EXTENSION = ".sdf" #@param [".sdf", ".mol2", ".pdb", ".smi"]

#@markdown **Carpeta de salida para los archivos PDBQT en WSL:**
OUTPUT_DIR = "" #@param {type:"string"}

#@markdown **Nombre del archivo de salida (incluye .pdbqt):**
output_ligand_name = "" #@param {type:"string"}

#@markdown **Ruta al script de inicialización de Mamba/Conda en tu PC:**
#@markdown (Verifica que esta ruta sea correcta para tu sistema)
MAMBA_INIT_PATH = "" #@param {type:"string"}
#@markdown ---

import os

# --- 2. LÓGICA DEL SCRIPT ---

# Construir la ruta completa al archivo de entrada
INPUT_FILE = os.path.join(LIGANDS_FOLDER, ligand_name + LIGAND_EXTENSION)
# Construir la ruta completa al archivo de salida
OUTPUT_FILE = os.path.join(OUTPUT_DIR, output_ligand_name)

print(f"Buscando el archivo en tu PC: {INPUT_FILE}")

# Verificar si el archivo de entrada existe antes de continuar
if not os.path.exists(INPUT_FILE):
  print(f"❌ ERROR: No se encontró el archivo en la ruta especificada de tu PC.")
  print("Por favor, verifica que la carpeta, el nombre del ligando y la extensión son correctos.")
else:
  print(f"✔️ Archivo encontrado. Procediendo con la preparación...")

  # Asegurarse de que la carpeta de salida exista
  os.makedirs(OUTPUT_DIR, exist_ok=True)

  # Construir el comando para ejecutar en tu entorno local 'docking_vina'
  # Se añade "source [ruta] &&" para inicializar mamba primero.
  command = f"source {MAMBA_INIT_PATH} && micromamba run -n docking_vina mk_prepare_ligand.py -i '{INPUT_FILE}' -o '{OUTPUT_FILE}'"

  # Imprimir el comando que se va a ejecutar
  print("\n▶️  Ejecutando el siguiente comando en tu PC:")
  print(command)
  print("-" * 30)

  # Ejecutar el comando en la terminal de tu PC
  !{command}

  # --- 3. VERIFICACIÓN ---
  print("-" * 30)
  print(f"✅ Proceso completado.")
  # Verificar si el archivo de salida fue creado
  if os.path.exists(OUTPUT_FILE):
    print(f"📂 El ligando preparado se ha guardado como: '{OUTPUT_FILE}'.")
    !ls -l "{OUTPUT_FILE}"
  else:
    print(f"❌ ERROR: El archivo de salida no fue creado. Revisa los mensajes de error anteriores.")



# **PREPARAR RECEPTORES**

In [None]:
#@title 🔬 Script para Preparar un Receptor por Nombre (Ejecución Local)
#@markdown ---
#@markdown ### 1. Configuración de Rutas y Nombres (en tu PC/WSL)
#@markdown Introduce aquí la información de tu receptor.
#@markdown **IMPORTANTE:** Las rutas deben ser las de tu sistema WSL.

#@markdown **Ruta a la carpeta donde están guardados tus receptores en WSL:**
RECEPTORS_FOLDER = "" #@param {type:"string"}

#@markdown **Nombre del receptor que quieres preparar (sin la extensión):**
receptor_name = "" #@param {type:"string"}

#@markdown **Extensión de tu archivo de receptor:**
RECEPTOR_EXTENSION = ".pdb" #@param [".pdb", ".pdbqt", ".mol2"]

#@markdown **Carpeta de salida para el archivo PDBQT en WSL:**
OUTPUT_DIR = "" #@param {type:"string"}

#@markdown **Nombre del archivo de salida (incluye .pdbqt):**
output_receptor_name = "" #@param {type:"string"}

#@markdown **Ruta al script de inicialización de Mamba/Conda en tu PC:**
#@markdown (Verifica que esta ruta sea correcta para tu sistema, por ejemplo: `/home/tu_usuario/micromamba/etc/profile.d/mamba.sh`)
MAMBA_INIT_PATH = "" #@param {type:"string"}

#@markdown **Nombre del entorno Mamba/Conda donde está instalado `mk_prepare_receptor.py`:**
#@markdown (Por ejemplo: `bioconda_env` o `docking_vina`)
MAMBA_ENV_NAME = "" #@param {type:"string"}
#@markdown ---

import os

# --- 2. LÓGICA DEL SCRIPT ---

# Construir las rutas completas a los archivos
INPUT_FILE = os.path.join(RECEPTORS_FOLDER, receptor_name + RECEPTOR_EXTENSION)
# Ruta completa al archivo PDBQT que se creará
OUTPUT_PDBQT_FILE = os.path.join(OUTPUT_DIR, output_receptor_name)
# La "base" para los nombres de archivo de salida (sin la extensión .pdbqt)
output_basename_only = output_receptor_name.replace('.pdbqt', '')
OUTPUT_BASENAME = os.path.join(OUTPUT_DIR, output_basename_only)


print(f"Buscando el archivo en tu PC: {INPUT_FILE}")

# Verificar si el archivo de entrada existe
if not os.path.exists(INPUT_FILE):
  print(f"❌ ERROR: No se encontró el archivo en la ruta especificada de tu PC.")
  print("Por favor, verifica que la carpeta, el nombre del receptor y la extensión son correctos.")
else:
  print(f"✔️ Archivo encontrado. Procediendo con la preparación...")

  # Asegurarse de que la carpeta de salida exista
  os.makedirs(OUTPUT_DIR, exist_ok=True)

  # Construir el comando:
  # Se añade "source [ruta] &&" para inicializar mamba primero.
  # Luego se usa "micromamba run -n [nombre_entorno]" para ejecutar el script en el entorno correcto.
  # -i: archivo de entrada
  # -o: la "base" para los nombres de archivo de salida
  # -p: le dice al script que escriba el archivo .pdbqt
  command = f"source {MAMBA_INIT_PATH} && micromamba run -n {MAMBA_ENV_NAME} mk_prepare_receptor.py -i '{INPUT_FILE}' -o '{OUTPUT_BASENAME}' -p"

  # Imprimir el comando que se va a ejecutar
  print("\n▶️  Ejecutando el siguiente comando en tu PC:")
  print(command)
  print("-" * 30)

  # Ejecutar el comando en la terminal de tu PC
  !{command}

  # --- 3. VERIFICACIÓN ---
  print("-" * 30)
  print(f"✅ Proceso completado.")
  # Verificar si el archivo de salida fue creado
  if os.path.exists(OUTPUT_PDBQT_FILE):
    print(f"📂 El receptor preparado se ha guardado como: '{OUTPUT_PDBQT_FILE}'.")
    !ls -l "{OUTPUT_PDBQT_FILE}"
  else:
    print(f"❌ ERROR: El archivo de salida no fue creado. Revisa los mensajes de error anteriores.")


# **DOCKING VINA**

In [None]:
#@title 🚀 Script para Ejecutar Docking con AutoDock Vina (Ejecución Local)
#@markdown ---
#@markdown ### 1. Configuración del Docking (en tu PC/WSL)
#@markdown Introduce las rutas a tus archivos preparados y las coordenadas de la caja de búsqueda.
#@markdown **IMPORTANTE:** Las rutas deben ser las de tu sistema WSL.

#@markdown **Ruta al RECEPTOR preparado (.pdbqt) en WSL:**
RECEPTOR_FILE = "" #@param {type:"string"}

#@markdown **Ruta al LIGANDO preparado (.pdbqt) en WSL:**
LIGAND_FILE = "" #@param {type:"string"}

#@markdown **Carpeta de salida para los resultados en WSL:**
OUTPUT_DIR = "" #@param {type:"string"}

#@markdown **Nombre base para los archivos de salida (sin extensión):**
output_basename = "" #@param {type:"string"}

#@markdown **Ruta al script de inicialización de Mamba/Conda en tu PC:**
#@markdown (Verifica que esta ruta sea correcta para tu sistema, por ejemplo: `/home/tu_usuario/micromamba/etc/profile.d/mamba.sh`)
MAMBA_INIT_PATH = "" #@param {type:"string"}

#@markdown **Ruta al ejecutable `vina` dentro de tu entorno Mamba/Conda:**
#@markdown (Esta es la ruta exacta que has confirmado: `/home/paredes/micromamba/envs/docking_vina/bin/vina`)
VINA_EXECUTABLE_PATH = "" #@param {type:"string"}

#@markdown ---
#@markdown ### 2. Coordenadas de la Caja de Búsqueda (Grid Box)
#@markdown Estas coordenadas las debes obtener de un visualizador molecular (ej. ChimeraX).

#@markdown **Coordenadas del CENTRO de la caja:**
center_x = None #@param {type:"number"}
center_y = None #@param {type:"number"}
center_z = None #@param {type:"number"}

#@markdown **Dimensiones de la caja en Angstroms (tamaño):**
size_x = None #@param {type:"number"}
size_y = None #@param {type:"number"}
size_z = None #@param {type:"number"}

#@markdown ---
#@markdown ### 3. Parámetros de Vina
#@markdown `exhaustiveness` controla qué tan exhaustiva es la búsqueda (un valor más alto es más lento pero más preciso).
exhaustiveness = 10 #@param {type:"slider", min:1, max:32, step:1}
#@markdown `num_modes` es el número de poses de unión que se generarán.
num_modes = 20 #@param {type:"slider", min:1, max:20, step:1}
#@markdown **Número de núcleos de CPU a utilizar para el docking:**
#@markdown (Un valor de 0 usa todos los núcleos disponibles. Se recomienda no exceder los núcleos físicos de tu CPU.)
num_cpu_cores = 4 #@param {type:"slider", min:0, max:32, step:1}
#@markdown ---

import os

# --- 4. LÓGICA DEL SCRIPT ---

# Asegurarse de que la carpeta de salida exista
os.makedirs(OUTPUT_DIR, exist_ok=True)

# Definir nombres de archivos de salida usando el nombre base proporcionado
output_pdbqt_name = f"{output_basename}_out.pdbqt"
output_log_name = f"{output_basename}_log.txt"
config_file_name = "config_vina.txt" # Este archivo se creará en el mismo directorio donde ejecutas el script

# Rutas completas de salida
OUTPUT_PDBQT_FILE = os.path.join(OUTPUT_DIR, output_pdbqt_name)
OUTPUT_LOG_FILE = os.path.join(OUTPUT_DIR, output_log_name)

# Crear el archivo de configuración para Vina
config_content = f"""
receptor = {RECEPTOR_FILE}
ligand = {LIGAND_FILE}

out = {OUTPUT_PDBQT_FILE}

center_x = {center_x}
center_y = {center_y}
center_z = {center_z}

size_x = {size_x}
size_y = {size_y}
size_z = {size_z}

exhaustiveness = {exhaustiveness}
num_modes = {num_modes}
"""

with open(config_file_name, "w") as f:
    f.write(config_content)

print(f"✔️ Archivo de configuración '{config_file_name}' creado.")

# Construir y ejecutar el comando de Vina
# Se añade "source [ruta] &&" para inicializar mamba primero.
# Luego se llama directamente al ejecutable `vina` usando la ruta exacta proporcionada.
# Se incluye el parámetro --cpu para paralelizar el proceso.
# Se redirige la salida estándar (stdout) al archivo de registro usando '>'
command = f"source {MAMBA_INIT_PATH} && '{VINA_EXECUTABLE_PATH}' --config {config_file_name} --cpu {num_cpu_cores} > '{OUTPUT_LOG_FILE}'"

print("\n▶️  Ejecutando AutoDock Vina en tu PC...")
print(f"Comando: {command}")
print("-" * 30)
!{command}
print("-" * 30)

# --- 5. VERIFICACIÓN Y RESULTADOS ---
print("✅ Docking completado.")

# Verificar si el archivo de salida fue creado y mostrar un resumen
if os.path.exists(OUTPUT_LOG_FILE):
    print(f"📂 Archivo de registro guardado en: '{OUTPUT_LOG_FILE}'")
    print(f"⚛️  Poses de unión guardadas en: '{OUTPUT_PDBQT_FILE}'")
    print("\n🏆 Resumen de Afinidades de Unión (kcal/mol):")
    !grep -E "   [0-9]" "{OUTPUT_LOG_FILE}"
else:
    print(f"❌ ERROR: El archivo de registro no fue creado. Revisa los mensajes de error anteriores.")


# **SBVS CON VINA**

In [None]:
#@title 💊 Script Robusto, Paralelizado y Reanudable para Preparar Librería
#@markdown ---
#@markdown ### 1. Configuración de Rutas y Nombres (en tu PC)
#@markdown Introduce aquí la información de tu librería de ligandos.

#@markdown **Ruta completa al ejecutable de Micromamba en tu PC:**
#@markdown (Para encontrar la ruta, abre tu terminal WSL y ejecuta: `sudo find / -name micromamba -type f 2>/dev/null`)
MICROMAMBA_EXECUTABLE_PATH = "" #@param {type:"string"}

#@markdown **Ruta a tu archivo de librería (.sdf) en WSL:**
INPUT_SDF_FILE = "" #@param {type:"string"}

#@markdown **Carpeta de salida para los ligandos preparados (.pdbqt) en WSL:**
OUTPUT_PDBQT_FOLDER = "" #@param {type:"string"}

#@markdown **Número de núcleos de CPU a utilizar:**
#@markdown (Un valor de 0 usa todos los núcleos disponibles.)
num_cpu_cores = 4 #@param {type:"slider", min:0, max:32, step:1}
#@markdown ---

import os
import sys

# --- 2. VERIFICACIÓN DEL EJECUTABLE ---

# Verificar primero que la ruta a micromamba es válida
if not os.path.exists(MICROMAMBA_EXECUTABLE_PATH):
  print(f"❌ ERROR CRÍTICO: No se encontró el ejecutable de Micromamba en la ruta: '{MICROMAMBA_EXECUTABLE_PATH}'")
  print("   Por favor, abre tu terminal de WSL, ejecuta el comando 'sudo find / -name micromamba -type f 2>/dev/null' y pega la ruta correcta en el campo de arriba.")
  sys.exit("Ejecución detenida.")
else:
  print(f"✔️ El ejecutable de Micromamba fue encontrado en: {MICROMAMBA_EXECUTABLE_PATH}")
  print("-" * 30)


# --- 3. CREAR EL SCRIPT DE PREPARACIÓN (MÉTODO FIABLE) ---
# Este bloque de código escribe un script de Python (`prepare_library.py`) que
# luego será ejecutado dentro del entorno 'docking_vina'.

script_content = f"""
import os
import subprocess
import argparse
from rdkit import Chem
from tqdm import tqdm
from multiprocessing import Pool, cpu_count
import glob

# --- Función de trabajo para un solo ligando (MÉTODO FIABLE) ---
# Esta función crea un archivo SDF temporal y llama a mk_prepare_ligand.py
def prepare_single_ligand(args):
    mol_index, mol_block, output_folder, temp_dir = args

    mol = Chem.MolFromMolBlock(mol_block, removeHs=False)
    if mol is None:
        return False

    mol_name = mol.GetProp("_Name") if mol.HasProp("_Name") else f"mol_{{mol_index + 1}}"

    temp_sdf_path = os.path.join(temp_dir, f"{{mol_name}}.sdf")
    output_pdbqt_path = os.path.join(output_folder, f"{{mol_name}}.pdbqt")

    try:
        # Escribir el SDF temporal
        with Chem.SDWriter(temp_sdf_path) as writer:
            writer.write(mol)

        # Llamar a la herramienta externa, que es más robusta
        command = f"mk_prepare_ligand.py -i '{{temp_sdf_path}}' -o '{{output_pdbqt_path}}'"
        subprocess.run(command, shell=True, check=True, capture_output=True, text=True, executable='/bin/bash')

        os.remove(temp_sdf_path)
        return True
    except Exception:
        if os.path.exists(temp_sdf_path):
            os.remove(temp_sdf_path)
        return False

# --- Función principal del script ---
def main(input_file, output_folder, num_cpus):
    os.makedirs(output_folder, exist_ok=True)
    temp_sdf_dir = "temp_parallel_prep"
    os.makedirs(temp_sdf_dir, exist_ok=True)

    print(f"✔️ Archivo encontrado. Leyendo todas las moléculas en memoria...")

    supplier = Chem.SDMolSupplier(input_file, removeHs=False)
    all_mols = [(i, mol) for i, mol in enumerate(supplier) if mol is not None]

    # --- LÓGICA DE REANUDACIÓN ---
    print("🔎 Verificando ligandos ya procesados...")
    existing_pdbqt = glob.glob(os.path.join(output_folder, '*.pdbqt'))
    completed_ligands = {{os.path.basename(f).replace('.pdbqt', '') for f in existing_pdbqt}}

    tasks_to_process = []
    for i, mol in all_mols:
        mol_name = mol.GetProp("_Name") if mol.HasProp("_Name") else f"mol_{{i + 1}}"
        if mol_name not in completed_ligands:
            tasks_to_process.append((i, Chem.MolToMolBlock(mol), output_folder, temp_sdf_dir))

    print(f"✔️ {{len(all_mols)}} moléculas encontradas en el archivo SDF.")
    print(f"👍 {{len(completed_ligands)}} ligandos ya estaban procesados.")

    if not tasks_to_process:
        print("🎉 ¡No hay ligandos nuevos que procesar! La preparación ya está completa.")
        return

    if num_cpus == 0:
        num_cpus = cpu_count()

    print(f"🚀 Iniciando preparación para los {{len(tasks_to_process)}} ligandos restantes en paralelo con {{num_cpus}} CPUs...")

    with Pool(processes=num_cpus) as pool:
        results = list(tqdm(pool.imap_unordered(prepare_single_ligand, tasks_to_process), total=len(tasks_to_process), desc="Procesando moléculas"))

    successful_count = results.count(True)
    error_count = len(results) - successful_count

    subprocess.run(f"rm -rf {{temp_sdf_dir}}", shell=True)

    print("-" * 30)
    print(f"✅ Proceso de preparación completado.")
    print(f"👍 Moléculas procesadas con éxito en esta sesión: {{successful_count}}")
    print(f"👎 Moléculas con errores (ignoradas) en esta sesión: {{error_count}}")
    print(f"📂 Los archivos .pdbqt están en la carpeta: '{{output_folder}}'.")

if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Prepara una librería de ligandos de SDF a PDBQT en paralelo.")
    parser.add_argument('--input', required=True, help="Ruta al archivo SDF de entrada.")
    parser.add_argument('--output', required=True, help="Ruta a la carpeta de salida para los PDBQT.")
    parser.add_argument('--cpu', type=int, default=0, help="Número de CPUs a utilizar (0 para todos los disponibles).")
    args = parser.parse_args()

    main(args.input, args.output, args.cpu)
"""

# Escribir el contenido al archivo prepare_library.py
try:
    with open("prepare_library.py", "w") as f:
        f.write(script_content)
    print("✔️ Script 'prepare_library.py' creado con éxito.")
except Exception as e:
    print(f"❌ ERROR al crear el script de Python: {e}")
    sys.exit()

print("-" * 30)

# --- 4. EJECUTAR EL SCRIPT EN EL ENTORNO LOCAL ---

# Construir el comando para ejecutar el script de Python dentro del entorno 'docking_vina'
command = (
    f"{MICROMAMBA_EXECUTABLE_PATH} run -n docking_vina python prepare_library.py "
    f"--input '{INPUT_SDF_FILE}' --output '{OUTPUT_PDBQT_FOLDER}' --cpu {num_cpu_cores}"
)

print("▶️  Ejecutando el script de preparación en tu entorno 'docking_vina'...")
print(command)
print("-" * 30)

# Ejecutar el comando
!{command}


In [None]:
#@title 🚀 Script Optimizado para SBVS Paralelo y Reanudable (Ejecución Local)
#@markdown ---
#@markdown ### 1. Configuración del Cribado Virtual (en tu PC/WSL)
#@markdown Revisa que las rutas a tus archivos y carpetas en WSL sean correctas.

#@markdown **Ruta completa al ejecutable de Micromamba en tu PC:**
#@markdown (Para encontrar la ruta, abre tu terminal WSL y ejecuta: `sudo find / -name micromamba -type f 2>/dev/null`)
MICROMAMBA_EXECUTABLE_PATH = "" #@param {type:"string"}

#@markdown **Ruta al RECEPTOR preparado (.pdbqt) en WSL:**
RECEPTOR_FILE = "" #@param {type:"string"}

#@markdown **Ruta a la CARPETA con todos los LIGANDOS preparados (.pdbqt) en WSL:**
LIGANDS_FOLDER = "" #@param {type:"string"}

#@markdown **Carpeta de salida para los resultados del cribado en WSL:**
OUTPUT_DIR = "" #@param {type:"string"}

#@markdown ---
#@markdown ### 2. Coordenadas de la Caja de Búsqueda (Grid Box)
center_x = None #@param {type:"number"}
center_y = None #@param {type:"number"}
center_z = None #@param {type:"number"}
size_x = None #@param {type:"number"}
size_y = None #@param {type:"number"}
size_z = None #@param {type:"number"}

#@markdown ---
#@markdown ### 3. Parámetros de Smina y Paralelización
#@markdown **Función de Puntuación (Scoring Function):**
scoring_function = "vinardo" #@param ["vina", "vinardo", "ad4"]
#@markdown `exhaustiveness` controla qué tan exhaustiva es la búsqueda.
exhaustiveness = 1 #@param {type:"slider", min:1, max:32, step:1}
#@markdown `num_modes` es el número de poses de unión que se generarán.
num_modes = 2 #@param {type:"slider", min:1, max:20, step:1}
#@markdown **Número de procesos paralelos a utilizar:**
#@markdown (Un valor de 0 usa todos los núcleos disponibles.)
num_python_workers = 4 #@param {type:"slider", min:0, max:32, step:1}
#@markdown ---

import os
import sys

# --- 4. VERIFICACIÓN Y CREACIÓN DEL SCRIPT DE EJECUCIÓN ---

# Verificar primero que la ruta a micromamba es válida
if not os.path.exists(MICROMAMBA_EXECUTABLE_PATH):
  print(f"❌ ERROR CRÍTICO: No se encontró el ejecutable de Micromamba en la ruta: '{MICROMAMBA_EXECUTABLE_PATH}'")
  sys.exit("Ejecución detenida. Corrige la ruta a Micromamba.")
else:
  print(f"✔️ El ejecutable de Micromamba fue encontrado en: {MICROMAMBA_EXECUTABLE_PATH}")

# Este bloque de código escribe un script de Python (`run_sbvs.py`) que
# será ejecutado completamente dentro del entorno 'docking_vina'.
script_content = f"""
import os
import sys
import glob
import pandas as pd
import subprocess
import argparse
from multiprocessing import Pool, cpu_count
from tqdm import tqdm

# --- Función de trabajo para un solo ligando ---
def run_docking_task(args):
    (ligand_path, receptor_file, output_dir, center_x, center_y, center_z,
     size_x, size_y, size_z, exhaustiveness, num_modes, scoring) = args

    ligand_basename = os.path.basename(ligand_path).replace('.pdbqt', '')
    output_pdbqt_file = os.path.join(output_dir, f"{{ligand_basename}}_out.pdbqt")
    output_log_file = os.path.join(output_dir, f"{{ligand_basename}}_log.txt")

    # Comando para ejecutar smina con los parámetros especificados
    command = [
        "smina", "--receptor", receptor_file, "--ligand", ligand_path,
        "--out", output_pdbqt_file, "--center_x", str(center_x),
        "--center_y", str(center_y), "--center_z", str(center_z),
        "--size_x", str(size_x), "--size_y", str(size_y), "--size_z", str(size_z),
        "--exhaustiveness", str(exhaustiveness), "--num_modes", str(num_modes),
        "--scoring", scoring, "--cpu", "1"
    ]

    try:
        # Ejecutar el comando y redirigir la salida al archivo de log
        result = subprocess.run(command, check=True, capture_output=True, text=True)
        with open(output_log_file, 'w') as f:
            f.write(result.stdout)
    except subprocess.CalledProcessError as e:
        # Si falla, escribir el error en el log para diagnóstico
        with open(output_log_file, 'w') as f:
            f.write(f"Error procesando {{ligand_basename}}\\n\\n--- STDERR ---\\n{{e.stderr}}")

# --- Función para obtener SMILES desde un PDBQT usando Open Babel ---
def get_smiles_from_pdbqt(ligand_name, ligands_folder):
    pdbqt_path = os.path.join(ligands_folder, f"{{ligand_name}}.pdbqt")
    if not os.path.exists(pdbqt_path):
        return "Archivo PDBQT no encontrado"

    try:
        command = ["obabel", "-ipdbqt", pdbqt_path, "-osmi"]
        result = subprocess.run(command, check=True, capture_output=True, text=True)
        return result.stdout.split()[0]
    except Exception:
        return "Error al procesar SMILES"

# --- Función principal del script ---
def main(args):
    os.makedirs(args.output_dir, exist_ok=True)

    all_ligand_files = glob.glob(os.path.join(args.ligands_folder, '*.pdbqt'))

    if not all_ligand_files:
        print(f"❌ ERROR: No se encontraron archivos .pdbqt en la carpeta: {{args.ligands_folder}}")
        return

    # Lógica de reanudación: Comprueba qué archivos ya tienen un log
    existing_logs = glob.glob(os.path.join(args.output_dir, '*_log.txt'))
    completed_ligands = {{os.path.basename(log).replace('_log.txt', '') for log in existing_logs}}
    ligands_to_process = [f for f in all_ligand_files if os.path.basename(f).replace('.pdbqt', '') not in completed_ligands]

    print(f"✔️ {{len(all_ligand_files)}} ligandos encontrados en total.")
    print(f"👍 {{len(completed_ligands)}} ligandos ya estaban completados.")

    if not ligands_to_process:
        print("🎉 ¡No hay ligandos nuevos que procesar! El cribado ya está completo.")
    else:
        num_cpus = args.cpu if args.cpu > 0 else cpu_count()
        print(f"🚀 Iniciando cribado para los {{len(ligands_to_process)}} ligandos restantes en paralelo usando {{num_cpus}} procesos...")

        # Crear la lista de tareas para el pool de procesos
        tasks = [(
            ligand_path, args.receptor_file, args.output_dir,
            args.center_x, args.center_y, args.center_z,
            args.size_x, args.size_y, args.size_z,
            args.exhaustiveness, args.num_modes, args.scoring
        ) for ligand_path in ligands_to_process]

        with Pool(processes=num_cpus) as pool:
            list(tqdm(pool.imap_unordered(run_docking_task, tasks), total=len(tasks), desc="Procesando ligandos"))

    print("\\n✅ Cribado virtual completado.")
    print("-" * 30)

    # Análisis de resultados
    print("📊 Analizando y clasificando los resultados...")
    results_data = []
    log_files = glob.glob(os.path.join(args.output_dir, '*_log.txt'))

    for log_file in log_files:
        ligand_name = os.path.basename(log_file).replace('_log.txt', '')
        try:
            with open(log_file, 'r') as f:
                for line in f:
                    if line.strip().startswith('1 '):
                        parts = line.split()
                        affinity = float(parts[1])
                        results_data.append({{'Ligando': ligand_name, 'Mejor Afinidad (kcal/mol)': affinity}})
                        break
        except (IOError, IndexError, ValueError):
            results_data.append({{'Ligando': ligand_name, 'Mejor Afinidad (kcal/mol)': 'Error'}})

    if results_data:
        df_results = pd.DataFrame(results_data)
        df_results['Mejor Afinidad (kcal/mol)'] = pd.to_numeric(df_results['Mejor Afinidad (kcal/mol)'], errors='coerce')
        df_results.dropna(subset=['Mejor Afinidad (kcal/mol)'], inplace=True)

        df_sorted = df_results.sort_values(by='Mejor Afinidad (kcal/mol)', ascending=True).reset_index(drop=True)

        df_filtered = df_sorted[df_sorted['Mejor Afinidad (kcal/mol)'] < -7.0].copy()

        print("🧬 Generando códigos SMILES para los resultados...")
        if not df_filtered.empty:
            df_filtered['SMILES'] = df_filtered['Ligando'].apply(lambda name: get_smiles_from_pdbqt(name, args.ligands_folder))
        df_sorted['SMILES'] = df_sorted['Ligando'].apply(lambda name: get_smiles_from_pdbqt(name, args.ligands_folder))

        pd.set_option('display.max_rows', None)
        pd.set_option('display.max_columns', None)
        pd.set_option('display.width', 2000)
        pd.set_option('display.max_colwidth', None)

        if not df_filtered.empty:
            print("\\n🏆 Tabla de Resultados con Score < -7.0 (Mejores candidatos) 🏆")
            print(df_filtered.to_string())

            csv_path_filtered = os.path.join(args.output_dir, 'resumen_mejores_candidatos.csv')
            df_filtered.to_csv(csv_path_filtered, index=False)
            print(f"\\n📄 Resumen de mejores candidatos guardado en: {{csv_path_filtered}}")
        else:
            print("\\n⚠️ No se encontraron ligandos con una afinidad de unión menor a -7.0 kcal/mol.")

        csv_path_all = os.path.join(args.output_dir, 'resumen_todos_los_resultados.csv')
        df_sorted.to_csv(csv_path_all, index=False)
        print(f"\\n📄 Resumen completo con todos los resultados guardado en: {{csv_path_all}}")

if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Realiza un cribado virtual en paralelo con Smina.")
    parser.add_argument('--receptor_file', required=True)
    parser.add_argument('--ligands_folder', required=True)
    parser.add_argument('--output_dir', required=True)
    parser.add_argument('--center_x', type=float, required=True)
    parser.add_argument('--center_y', type=float, required=True)
    parser.add_argument('--center_z', type=float, required=True)
    parser.add_argument('--size_x', type=float, required=True)
    parser.add_argument('--size_y', type=float, required=True)
    parser.add_argument('--size_z', type=float, required=True)
    parser.add_argument('--exhaustiveness', type=int, default=8)
    parser.add_argument('--num_modes', type=int, default=10)
    parser.add_argument('--scoring', type=str, default='vina')
    parser.add_argument('--cpu', type=int, default=0)
    args = parser.parse_args()
    main(args)
"""

# Escribir el contenido al archivo run_sbvs.py
try:
    with open("run_sbvs.py", "w") as f:
        f.write(script_content)
    print("✔️ Script de ejecución 'run_sbvs.py' creado con éxito.")
except Exception as e:
    print(f"❌ ERROR al crear el script de Python: {e}")
    sys.exit()

print("-" * 30)

# --- 5. EJECUTAR EL SCRIPT EN EL ENTORNO LOCAL ---
# Construir el comando para ejecutar el script de Python dentro del entorno 'docking_vina'
command = (
    f"{MICROMAMBA_EXECUTABLE_PATH} run -n docking_vina python run_sbvs.py "
    f"--receptor_file '{RECEPTOR_FILE}' "
    f"--ligands_folder '{LIGANDS_FOLDER}' "
    f"--output_dir '{OUTPUT_DIR}' "
    f"--center_x {center_x} "
    f"--center_y {center_y} "
    f"--center_z {center_z} "
    f"--size_x {size_x} "
    f"--size_y {size_y} "
    f"--size_z {size_z} "
    f"--exhaustiveness {exhaustiveness} "
    f"--num_modes {num_modes} "
    f"--scoring {scoring_function} "
    f"--cpu {num_python_workers}"
)

print("▶️  Ejecutando el script de cribado virtual en tu entorno 'docking_vina'...")
print("Este proceso puede tardar mucho tiempo. Puedes desconectarte de Colab y el proceso seguirá en tu PC.")
print("-" * 30)

# Ejecutar el comando
!{command}

# DOCKING REFINADO 100 PRIMEROS LIGANDOS

In [None]:
#@title 🎯 Script para Re-Docking de Refinamiento con Smina (Ejecución Local)
#@markdown ---
#@markdown ### 1. Configuración del Re-Docking (en tu PC/WSL)
#@markdown Introduce las rutas al CSV del primer cribado y a tus archivos.

#@markdown **Ruta completa al ejecutable de Micromamba en tu PC:**
MICROMAMBA_EXECUTABLE_PATH = "" #@param {type:"string"}

#@markdown **Ruta al archivo CSV con los resultados del primer cribado:**
CSV_RESULTS_FILE = "" #@param {type:"string"}

#@markdown **Ruta al RECEPTOR preparado (.pdbqt) en WSL:**
RECEPTOR_FILE = "" #@param {type:"string"}

#@markdown **Ruta a la CARPETA con TODOS los LIGANDOS preparados (.pdbqt):**
LIGANDS_FOLDER = "" #@param {type:"string"}

#@markdown **Carpeta de salida para los resultados REFINADOS:**
OUTPUT_DIR_REFINED = "" #@param {type:"string"}

#@markdown ---
#@markdown ### 2. Coordenadas de la Caja de Búsqueda (Grid Box)
#@markdown Deben ser las mismas que usaste en el cribado inicial.
center_x = None #@param {type:"number"}
center_y = None #@param {type:"number"}
center_z = None #@param {type:"number"}
size_x = None #@param {type:"number"}
size_y = None #@param {type:"number"}
size_z = None #@param {type:"number"}

#@markdown ---
#@markdown ### 3. Parámetros de Re-Docking
#@markdown **Función de Puntuación (Scoring Function):**
scoring_function = "vinardo" #@param ["vina", "vinardo", "ad4"]
#@markdown **Número de mejores candidatos a re-analizar:**
num_candidates_to_refine = 50 #@param {type:"slider", min:10, max:500, step:10}
#@markdown **`exhaustiveness` para el docking de alta precisión:**
exhaustiveness_refined = 10 #@param {type:"slider", min:2, max:64, step:2}
#@markdown **`num_modes` para el docking de alta precisión:**
num_modes_refined = 3 #@param {type:"slider", min:1, max:20, step:1}
#@markdown **Número de procesos paralelos a utilizar:**
num_python_workers = 4 #@param {type:"slider", min:0, max:32, step:1}
#@markdown ---

import os
import sys

# --- 4. VERIFICACIÓN Y DEPENDENCIAS ---

# Verificar primero que la ruta a micromamba es válida
if not os.path.exists(MICROMAMBA_EXECUTABLE_PATH):
  print(f"❌ ERROR CRÍTICO: No se encontró el ejecutable de Micromamba en la ruta: '{MICROMAMBA_EXECUTABLE_PATH}'")
  sys.exit("Ejecución detenida. Corrige la ruta a Micromamba.")
else:
  print(f"✔️ El ejecutable de Micromamba fue encontrado en: {MICROMAMBA_EXECUTABLE_PATH}")
  # Instalar pandas en el entorno de jupyter (colab_connect) para que esta celda pueda leer el CSV
  print("🔧 Verificando dependencias para esta celda (pandas)...")
  !{MICROMAMBA_EXECUTABLE_PATH} install -n colab_connect -c conda-forge -y pandas
  # Asegurarse de que smina esté instalado en el entorno de trabajo
  print("🔧 Verificando dependencias para el docking (smina)...")
  !{MICROMAMBA_EXECUTABLE_PATH} install -n docking_vina -c conda-forge -c bioconda -y smina
  print("✅ Dependencias listas.")

import pandas as pd

# --- 5. CREACIÓN DEL SCRIPT DE EJECUCIÓN ---

# Este bloque de código escribe un script de Python (`run_redocking.py`) que
# será ejecutado completamente dentro del entorno 'docking_vina'.
script_content = f"""
import os
import sys
import glob
import pandas as pd
import subprocess
import argparse
from multiprocessing import Pool, cpu_count
from tqdm import tqdm

# --- Función de trabajo para un solo ligando ---
def run_docking_task(args):
    (ligand_path, receptor_file, output_dir, center_x, center_y, center_z,
     size_x, size_y, size_z, exhaustiveness, num_modes, scoring) = args

    ligand_basename = os.path.basename(ligand_path).replace('.pdbqt', '')
    output_pdbqt_file = os.path.join(output_dir, f"{{ligand_basename}}_out.pdbqt")
    output_log_file = os.path.join(output_dir, f"{{ligand_basename}}_log.txt")

    command = [
        "smina", "--receptor", receptor_file, "--ligand", ligand_path,
        "--out", output_pdbqt_file, "--center_x", str(center_x),
        "--center_y", str(center_y), "--center_z", str(center_z),
        "--size_x", str(size_x), "--size_y", str(size_y), "--size_z", str(size_z),
        "--exhaustiveness", str(exhaustiveness), "--num_modes", str(num_modes),
        "--scoring", scoring, "--cpu", "1"
    ]

    try:
        result = subprocess.run(command, check=True, capture_output=True, text=True)
        with open(output_log_file, 'w') as f:
            f.write(result.stdout)
    except subprocess.CalledProcessError as e:
        with open(output_log_file, 'w') as f:
            f.write(f"Error procesando {{ligand_basename}}\\n\\n--- STDERR ---\\n{{e.stderr}}")

# --- Función para obtener SMILES desde un PDBQT usando Open Babel ---
def get_smiles_from_pdbqt(ligand_name, ligands_folder):
    pdbqt_path = os.path.join(ligands_folder, f"{{ligand_name}}.pdbqt")
    if not os.path.exists(pdbqt_path):
        return "Archivo PDBQT no encontrado"

    try:
        command = ["obabel", "-ipdbqt", pdbqt_path, "-osmi"]
        result = subprocess.run(command, check=True, capture_output=True, text=True)
        return result.stdout.split()[0]
    except Exception:
        return "Error al procesar SMILES"

# --- Función principal del script ---
def main(args):
    os.makedirs(args.output_dir, exist_ok=True)

    # --- LÓGICA DE SELECCIÓN DE CANDIDATOS ---
    try:
        df_initial_results = pd.read_csv(args.csv_file)
    except FileNotFoundError:
        print(f"❌ ERROR: No se encontró el archivo CSV de resultados en: {{args.csv_file}}")
        return

    df_initial_results['Mejor Afinidad (kcal/mol)'] = pd.to_numeric(df_initial_results['Mejor Afinidad (kcal/mol)'], errors='coerce')
    df_initial_results.dropna(subset=['Mejor Afinidad (kcal/mol)'], inplace=True)
    df_sorted = df_initial_results.sort_values(by='Mejor Afinidad (kcal/mol)', ascending=True)

    df_top_candidates = df_sorted.head(args.num_candidates)
    top_ligand_names = df_top_candidates['Ligando'].tolist()

    ligands_to_process = [os.path.join(args.ligands_folder, f"{{name}}.pdbqt") for name in top_ligand_names]
    ligands_to_process = [f for f in ligands_to_process if os.path.exists(f)]

    if not ligands_to_process:
        print("❌ ERROR: No se encontró ninguno de los archivos PDBQT de los mejores candidatos.")
        return

    print(f"✔️ {{len(ligands_to_process)}} mejores candidatos seleccionados para el re-docking de refinamiento.")

    num_cpus = args.cpu if args.cpu > 0 else cpu_count()
    print(f"🚀 Iniciando re-docking en paralelo usando {{num_cpus}} procesos...")

    tasks = [(
        ligand_path, args.receptor_file, args.output_dir,
        args.center_x, args.center_y, args.center_z,
        args.size_x, args.size_y, args.size_z,
        args.exhaustiveness, args.num_modes, args.scoring
    ) for ligand_path in ligands_to_process]

    with Pool(processes=num_cpus) as pool:
        list(tqdm(pool.imap_unordered(run_docking_task, tasks), total=len(tasks), desc="Re-Docking de candidatos"))

    print("\\n✅ Re-Docking de refinamiento completado.")
    print("-" * 30)

    # --- ANÁLISIS DE RESULTADOS REFINADOS ---
    print("📊 Analizando y clasificando los resultados refinados...")
    results_data = []
    log_files = glob.glob(os.path.join(args.output_dir, '*_log.txt'))

    for log_file in log_files:
        ligand_name = os.path.basename(log_file).replace('_log.txt', '')
        try:
            with open(log_file, 'r') as f:
                for line in f:
                    if line.strip().startswith('1 '):
                        parts = line.split()
                        affinity = float(parts[1])
                        results_data.append({{'Ligando': ligand_name, 'Afinidad Refinada (kcal/mol)': affinity}})
                        break
        except (IOError, IndexError, ValueError):
            results_data.append({{'Ligando': ligand_name, 'Afinidad Refinada (kcal/mol)': 'Error'}})

    if results_data:
        df_results = pd.DataFrame(results_data)
        df_results['Afinidad Refinada (kcal/mol)'] = pd.to_numeric(df_results['Afinidad Refinada (kcal/mol)'], errors='coerce')
        df_sorted = df_results.sort_values(by='Afinidad Refinada (kcal/mol)', ascending=True).reset_index(drop=True)

        print("🧬 Generando códigos SMILES para los resultados refinados...")
        df_sorted['SMILES'] = df_sorted['Ligando'].apply(lambda name: get_smiles_from_pdbqt(name, args.ligands_folder))

        pd.set_option('display.max_rows', None)
        pd.set_option('display.max_columns', None)
        pd.set_option('display.width', 2000)
        pd.set_option('display.max_colwidth', None)

        print("\\n🏆 Tabla de Resultados del Docking Refinado 🏆")
        print(df_sorted.to_string())

        csv_path = os.path.join(args.output_dir, 'resumen_resultados_refinados.csv')
        df_sorted.to_csv(csv_path, index=False)
        print(f"\\n📄 Resumen refinado guardado en: {{csv_path}}")

if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Realiza un re-docking de refinamiento en paralelo.")
    parser.add_argument('--csv_file', required=True)
    parser.add_argument('--receptor_file', required=True)
    parser.add_argument('--ligands_folder', required=True)
    parser.add_argument('--output_dir', required=True)
    parser.add_argument('--num_candidates', type=int, default=100)
    parser.add_argument('--center_x', type=float, required=True)
    parser.add_argument('--center_y', type=float, required=True)
    parser.add_argument('--center_z', type=float, required=True)
    parser.add_argument('--size_x', type=float, required=True)
    parser.add_argument('--size_y', type=float, required=True)
    parser.add_argument('--size_z', type=float, required=True)
    parser.add_argument('--exhaustiveness', type=int, default=32)
    parser.add_argument('--num_modes', type=int, default=20)
    parser.add_argument('--scoring', type=str, default='vinardo')
    parser.add_argument('--cpu', type=int, default=0)
    args = parser.parse_args()
    main(args)
"""

# Escribir el contenido al archivo run_redocking.py
try:
    with open("run_redocking.py", "w") as f:
        f.write(script_content)
    print("✔️ Script de ejecución 'run_redocking.py' creado con éxito.")
except Exception as e:
    print(f"❌ ERROR al crear el script de Python: {e}")
    sys.exit()

print("-" * 30)

# --- 6. EJECUTAR EL SCRIPT EN EL ENTORNO LOCAL ---
# Construir el comando para ejecutar el script de Python dentro del entorno 'docking_vina'
command = (
    f"{MICROMAMBA_EXECUTABLE_PATH} run -n docking_vina python run_redocking.py "
    f"--csv_file '{CSV_RESULTS_FILE}' "
    f"--receptor_file '{RECEPTOR_FILE}' "
    f"--ligands_folder '{LIGANDS_FOLDER}' "
    f"--output_dir '{OUTPUT_DIR_REFINED}' "
    f"--num_candidates {num_candidates_to_refine} "
    f"--center_x {center_x} "
    f"--center_y {center_y} "
    f"--center_z {center_z} "
    f"--size_x {size_x} "
    f"--size_y {size_y} "
    f"--size_z {size_z} "
    f"--exhaustiveness {exhaustiveness_refined} "
    f"--num_modes {num_modes_refined} "
    f"--scoring {scoring_function} "
    f"--cpu {num_python_workers}"
)

print("▶️  Ejecutando el script de re-docking en tu entorno 'docking_vina'...")
print("-" * 30)

# Ejecutar el comando
!{command}

