# Generacion de Smiles del Catalogo multitarget

El código comienza importando las bibliotecas necesarias, incluyendo rdkit y pandas. A continuación, define la variable sdf_file con la ruta al archivo SDF de Enamine. Luego, carga un archivo CSV llamado 'catalogomultitarget.csv' en un DataFrame llamado df_catalogo, que contiene información sobre los Catalog ID. Se inicializan listas vacías para almacenar los resultados y se itera a través de los Catalog ID en el DataFrame df_catalogo. Para cada Catalog ID, se busca la correspondiente molécula en el archivo SDF y se recupera el SMILES de esa molécula, almacenándolo en una lista. Se crea un nuevo DataFrame llamado df_resultados con dos columnas: 'Catalog ID' y 'SMILES', y se llenan las columnas con los valores obtenidos. Los resultados se guardan en un archivo CSV llamado 'smilesmultitarget.csv' y en un archivo pickle llamado 'smilesmultitarget.pickle'. Durante el proceso de recuperación, se imprime en la consola los Catalog ID y sus correspondientes SMILES, si se encuentran. Para ejecutar este código, es necesario tener el archivo SDF 'Enamine.sdf' y el archivo CSV 'catalogomultitarget.csv' en la misma carpeta que el código. Luego, se ejecuta el código para recuperar los SMILES de las moléculas y almacenar los resultados en archivos CSV y pickle.

## Requisitos previos:
Asegúrate de tener un entorno de Python con las siguientes bibliotecas instaladas: matplotlib, pandas, seaborn, scikit-learn, imbalanced-learn, optuna.

In [None]:
from rdkit import Chem
import pandas as pd

Ejecucion codigo

In [None]:
sdf_file = 'Enamine.sdf'

df_catalogo = pd.read_csv('catalogomultitarget.csv')

catalog_ids = []
smiles_list = []


for catalog_id_to_find in df_catalogo['Catalog_ID']:  
    smiles = None
    for molecule in Chem.SDMolSupplier(sdf_file):
        if molecule is not None:
            current_catalog_id = molecule.GetProp('Catalog ID')  
            if current_catalog_id == catalog_id_to_find:
                smiles = Chem.MolToSmiles(molecule)
                break  
    catalog_ids.append(catalog_id_to_find)
    smiles_list.append(smiles if smiles is not None else '')

    if smiles is not None:
        print(f"Catalog ID '{catalog_id_to_find}': SMILES '{smiles}'")
    else:
        print(f"No se encontró un SMILES para el Catalog ID '{catalog_id_to_find}'")


df_resultados = pd.DataFrame({'Catalog ID': catalog_ids, 'SMILES': smiles_list})


df_resultados.to_csv('smilesmultitarget.csv', index=False)


df_resultados.to_pickle('smilesmultitarget.pickle')

Script elaborado por Nelson Alejandro Amaya Orozco, como trabajo de grado, para el grupo de investigacion RamirezLAB