<h1 style="text-align: center;">Seminario N¬∞4:</h1>
<h1 style="text-align: center;">Compilaci√≥n de sets de datos para QSAR</h1>


## üéØ  Objetivos

* Conocer el manejo de bases de datos disponibles para poder llevar cabo un an√°lisis sistem√°tico de relaciones estructura-actividad (SAR).
* Aplicar los conocimientos adquiridos en las actividades previas (Sem. y TP N¬∞1 a 3) a un caso de estudio concreto y cl√≠nicamente relevante.
* Construir un conjunto de datos a ser utilizado en el TP N¬∞4 para construir modelos de QSAR.

## üîç Introducci√≥n a las bases de datos qu√≠micas en QSAR

El desarrollo de modelos de relaciones cuantitativas estructura-actividad (QSAR) requiere contar con **conjuntos de datos curados, estructurados y relevantes**, tanto desde el punto de vista qu√≠mico como biol√≥gico. Afortunadamente, existen numerosas **bases de datos p√∫blicas** que centralizan informaci√≥n sobre compuestos bioactivos, sus estructuras qu√≠micas, propiedades fisicoqu√≠micas y actividades biol√≥gicas medidas experimentalmente.

Entre las m√°s utilizadas en qu√≠mica medicinal y para el dise√±o de f√°rmacos, se destacan:

- **PubChem**: a cargo del National Center for Biotechnology Information (NCBI); contiene millones de compuestos, bioensayos y datos experimentales.
- **ChEMBL**: a cargo del European Molecular Biology Laboratory del European Bioinformatics Institute (EMBL-EBI), con datos extra√≠dos de literatura cient√≠fica.
- **DrugBank**, **BindingDB**, **ZINC**, **PDB**, entre otras.

Cada una tiene caracter√≠sticas particulares, pero en esta actividad emplearemos ChEMBL: https://www.ebi.ac.uk/chembl/.


---

## üì¶ ¬øQu√© es ChEMBL?

**ChEMBL** es una base de datos de bioactividad de compuestos qu√≠micos con inter√©s farmac√©utico/farmacol√≥gico, generada y mantenida por el EMBL-EBI. Algunos tipos de datos que re√∫ne son:

- Informaci√≥n estructural y propiedades biofarmac√©uticas (SMILES, InChI, peso molecular, logP, etc.) de compuestos.
- Informaci√≥n farmacol√≥gica (mecanismo de acci√≥n, fase cl√≠nica, nombre comercial).
- Actividades biol√≥gicas (IC‚ÇÖ‚ÇÄ, K·µ¢, EC‚ÇÖ‚ÇÄ, etc.) contra blancos moleculares definidos.
- Ensayos experimentales reportados en literatura, con conexi√≥n directa a la bibliograf√≠a.

<img src="ChEMBL.png" alt="Figura 1" width="600"/>

Los compuestos est√°n organizados en torno a **blancos terap√©uticos** (enzimas, receptores, transportadores) y pueden tener distintas **acciones farmacol√≥gicas** como agonistas, antagonistas, inhibidores u otros mecanismos.

Esto la convierte en una **fuente valiosa para desarrollar modelos QSAR**, ya que ofrece datos confiables y bien clasificados, fundamentales para correlacionar estructuras, propiedades y actividad biol√≥gica.

---

## üéØ ¬øQu√© haremos en este seminario?

En esta clase aprenderemos a:

1. **Buscar, filtrar y compilar datos desde ChEMBL**, seleccionando un blanco biol√≥gico cl√≠nicamente relevante.
2. **Procesar y limpiar los datos**: por ejemplo, al eliminar duplicados, entradas inv√°lidas o incompletas.
3. **Visualizar estructuras y propiedades moleculares**, y preparar los datos para su an√°lisis.
4. **Explorar el espacio qu√≠mico de los ligandos** para evaluar diferencias y semejanzas estructurales y de propiedades.
5. **Construir un conjunto de datos estructurado** para su uso posterior en modelos QSAR (TP N¬∞4).

---


### üîß Instalaci√≥n de ChEMBL en Python

Para poder acceder a la base de datos **ChEMBL** sin necesidad de trabajar en la p√°gina web, vamos a utilizar un **m√≥dulo oficial** que nos permite hacer consultas directas usando funciones simples.

Podemos instalarlo ejecutando la siguiente celda de c√≥digo:

In [None]:
!pip install chembl_webresource_client

Adem√°s, como lo hemos hecho siempre, vamos a importar algunas **funciones espec√≠ficas** que hemos preparado para esta clase a trav√©s del siguiente c√≥digo:

In [None]:
!pip install numpy==1.24.4
!pip install chemplot
from FuncionesSem4 import *

### üîé B√∫squeda de informaci√≥n sobre un f√°rmaco conocido

La siguiente funci√≥n permite buscar compuestos en ChEMBL utilizando su nombre comercial o gen√©rico, y devuelve **toda** la informaci√≥n disponible para cada mol√©cula.


In [None]:
df_farmaco = buscar_info_nombre_comercial("propranolol")
itables.show(df_farmaco)

### üß¨ Buscar informaci√≥n sobre un blanco terap√©utico conocido

Adem√°s de f√°rmacos, podr√≠amos desear conocer informaci√≥n sobre blancos terap√©uticos. La siguiente funci√≥n permite buscar dichos datos en ChEMBL utilizando una palabra clave de receptores, enzimas, canales, etc., y devuelve **toda** la informaci√≥n asociada. 


In [None]:
df_target = buscar_info_target("adrenergic")
itables.show(df_target)

Ahora que ya conocemos a grandes rasgos c√≥mo acceder y qu√© informaci√≥n podemos obtener de ChEMBL, podemos enfocarnos en un caso cl√≠nico concreto: **f√°rmacos adren√©rgicos**.

<h1 style="text-align: center;">Caso de estudio: F√°rmacos adren√©rgicos</h1>

## üîç Exploraci√≥n de ligandos adren√©rgicos en fase cl√≠nica


üìå **Objetivo**: Obtener todos los ligandos (agonistas y antagonistas) de los cuatro principales receptores adren√©rgicos humanos (Œ±1, Œ±2, Œ≤1 y Œ≤2) que se encuentran en fase 4 de desarrollo cl√≠nico (es decir, ya est√°n aprobados o disponibles comercialmente), poseen estructura qu√≠mica conocida (SMILES disponibles), y tienen definido su mecanismo de acci√≥n farmacol√≥gica como agonistas o antagonistas.

La funci√≥n que vamos a utilizar hace todo eso autom√°ticamente y nos devuelve un √∫nico DataFrame con la siguiente informaci√≥n para cada compuesto:

* Su identificador ChEMBL ID,
* Su nombre comercial (si est√° disponible),
* Su estructura qu√≠mica (SMILES),
* El receptor en el que act√∫a,
* El tipo de acci√≥n (agonista o antagonista),



In [None]:
receptores = {
    "A1": "CHEMBL2094251", 
    "A2": "CHEMBL2095158",
    "B1": "CHEMBL213",
    "B2": "CHEMBL210"
}

df_ligandos = obtener_agonistas_antagonistas_adrenergicos(receptores)
itables.show(df_ligandos)

üì∏ **Visualizar** sus estructuras qu√≠micas puede ser muy √∫til. 

Para esto, vamos a utilizar la siguiente funci√≥n que nos permite representar un conjunto de mol√©culas alineadas y organizadas por receptor, tipo de acci√≥n y nombre comercial.

Si queremos visualizar TODOS los resultados, la ejecutamos de la siguiente manera:

In [None]:
# Mostrar ambos tipos de acci√≥n para todos los receptores
dibujar_moleculas(df_ligandos)

üì∏ Tambi√©n podr√≠amos definir qu√© datos dibujar. Por ejemplo, solamente agonistas de todos los receptores.

In [None]:
# Mostrar todos los agonistas 
dibujar_moleculas(df_ligandos, tipo_accion="AGONIST")

üì∏ O ser m√°s espec√≠ficos a√∫n, y dibujar solamente aquellos con cierta actividad sobre blanco(s) en particular.

In [None]:
# Mostrar todos los agonistas de B2
dibujar_moleculas(df_ligandos, receptores_seleccionados=["B2"], tipo_accion="AGONIST")

#### üí° Analice las siguientes estructuras, ¬øidentifican caracter√≠sticas comunes? ¬øCu√°l/es?

#### üí° Ejecute las siguientes funciones para comparar la estructura de epinefrina (prototipo) con el de algunos de los f√°rmacos aprobados. ¬øQu√© estrategias de dise√±o logran identificar? ¬øCon qu√© fin creen que se han aplicado?


In [None]:
ids_moleculas = ["RIMITEROL", "ISOETHARINE HYDROCHLORIDE", "BITOLTEROL MESYLATE"]  
comparar_moleculas_con_template(df_ligandos, ids_moleculas, smiles_template="CNCC(O)c1ccccc1")

In [None]:
ids_moleculas = ["FENOTEROL", "METAPROTERENOL SULFATE", "TERBUTALINE SULFATE", "REPROTEROL"]  
comparar_moleculas_con_template(df_ligandos, ids_moleculas, smiles_template="CNCC(O)c1ccccc1")

In [None]:
ids_moleculas = ["ALBUTEROL", "PIRBUTEROL ACETATE", "CLENBUTEROL"]
comparar_moleculas_con_template(df_ligandos, ids_moleculas, smiles_template="CNCCO")

In [None]:
ids_moleculas = ["ALBUTEROL", "ALBUTEROL SULFATE", "LEVALBUTEROL HYDROCHLORIDE", "LEVALBUTEROL TARTRATE"]
comparar_moleculas_con_template(df_ligandos, ids_moleculas, smiles_template="CNCCO")

Desde el inicio del cuatrimestre, hemos enfatizado la importancia de las **propiedades** de los f√°rmacos (o potenciales f√°rmacos) y su relaci√≥n con la estructura qu√≠mica y la actividad biol√≥gica. Hemos discutido, adem√°s, ciertos valores de referencia que la mayor√≠a de los f√°rmacos comparten. Estas caracter√≠sticas comunes, que definen la viabilidad de un compuesto como potencial f√°rmaco, se agrupan bajo lo que se conoce como las propiedades **"drug-like"**.

Una de las teor√≠as m√°s com√∫nmente aplicadas en el proceso de dise√±o de f√°rmacos es la de **Lipinski**, que establece una serie de reglas o l√≠mites para propiedades drug-like clave, como el **peso molecular** (<500), el **logP** (<5), la cantidad de **grupos donores** (<5) **y aceptores** (<10) **de puente hidr√≥geno**, y la **flexibilidad** (<10 enlaces rotables), que suelen ser caracter√≠sticas comunes en los f√°rmacos orales efectivos. Seg√∫n las reglas de Lipinski, un compuesto con m√°s de uno de estos par√°metros fuera de los rangos establecidos es menos probable que sea un buen candidato para ser un f√°rmaco oral.

A continuaci√≥n, analizaremos las propiedades de varios ligandos aprobados para su uso cl√≠nico y las compararemos con las propiedades "drug-like" propuestas por Lipinski, observando c√≥mo se alinean con lo que hemos aprendido hasta ahora sobre dise√±o de f√°rmacos

In [None]:
df_ligandos = calcular_propiedades(df_ligandos)
itables.show(df_ligandos)

Para facilitar el an√°lisis, ve√°moslo gr√°ficamente... ¬øCumplen con las reglas de Lipinski?

In [None]:
graficar_distribucion_descriptores(df_ligandos)

Ya hemos analizado los f√°rmacos adren√©rgicos que se encuentran aprobados para su uso cl√≠nico. Sin embargo, como dijimos al inicio, en ChEMBL tambi√©n podemos obtener informaci√≥n de todas las mol√©culas que han sido evaluadas frente a estos blancos terap√©uticos, hayan llegado o no a fase cl√≠nica. 

## üîç Exploraci√≥n de ligandos adren√©rgicos en fase exploratoria, precl√≠nica y/o cl√≠nica


Comencemos por extraer todos los ligandos que posean alg√∫n tipo de reporte de actividad frente a los 4 receptores adren√©rgicos, independientemente de si han avanzado o no hacia ensayos cl√≠nicos.

In [None]:
df_adrenergicos = descargar_ligandos_adrenergicos(receptores, df_ligandos)
df_adrenergicos

Como observan en la tabla, muchos ligandos pueden tener varios tipos de actividad biol√≥gica reportada (IC50, Ki, Kd, EC50, % de inhibici√≥n, etc.). 
Contemos entonces cu√°ntos ligandos *√∫nicos* hay reportado para cada receptor:

In [None]:
contar_ligandos_unicos_por_receptor(df_adrenergicos)

Asimismo, pueden existir ligandos que hayan sido evaluados frente a varios receptores, con resultados de actividad biol√≥gica id√©ntica, similar o diferente. 

In [None]:
df_pivot = actividad_por_receptor(df_adrenergicos, tipo_actividad="IC50")
itables.show(df_pivot)

#### **Espacio Qu√≠mico**

En el √°mbito de la qu√≠mica computacional y el dise√±o de f√°rmacos, uno de los principales retos es comprender la relaci√≥n entre la estructura molecular y sus propiedades. Una de las estrategias empleadas es visualizarlas en un **espacio qu√≠mico**, en el que cada mol√©cula se representa como un punto en un espacio multidimensional, basado en sus propiedades. Sin embargo, la representaci√≥n de este espacio puede ser dif√≠cil de manejar debido a su alta dimensionalidad, especialmente cuando estamos trabajando con cientos o miles de compuestos.

Una de las t√©cnicas m√°s utilizadas para abordar este problema es la *reducci√≥n de dimensionalidad*, que nos permite proyectar este espacio qu√≠mico multidimensional en una forma m√°s comprensible y visualmente interpretable, manteniendo la mayor cantidad de informaci√≥n posible sobre las relaciones estructurales de las mol√©culas. Entre las herramientas m√°s poderosas en este campo se encuentra *UMAP* (Uniform Manifold Approximation and Projection). UMAP es un algoritmo de reducci√≥n de dimensionalidad no lineal que se ha destacado por su capacidad para preservar las relaciones locales y globales en los datos, lo que lo hace ideal para representar estructuras qu√≠micas complejas.

En particular, el uso de UMAP permite representar un conjunto de estructuras de manera que **las mol√©culas qu√≠micamente similares se agrupen en el espacio reducido, mientras que las mol√©culas dis√≠miles se separen**. Esto facilita la visualizaci√≥n de clusters o patrones que podr√≠an no ser evidentes en la estructura original de los datos.

Para facilitar a√∫n m√°s la interpretaci√≥n visual de estos datos, se han desarrollado herramientas como los **mapas qu√≠micos** o **chemplots**, que permiten representar gr√°ficamente, intuitivamente y est√©ticamente agradables estos espacios qu√≠micos reducidos. 

Veamos un ejemplo de este tipo de mapas, aplicado a los ligandos adren√©rgicos que filtramos. Primero, deberemos instalar el m√≥dulo *chemplot*, luego aplicar la reducci√≥n de dimensionalidad mediante UMAP (puede llevar un par de minutos), y finalmente graficar el resultado.

In [None]:
!pip install chemplot

In [None]:
df_adrenergicos_chemspace = determinar_chemspace(df_adrenergicos)
df_adrenergicos_chemspace

In [None]:
graficar_espacio_quimico(df_adrenergicos_chemspace)

#### **Preparaci√≥n de datos para QSAR: agonistas Œ≤2 como f√°rmacos broncodilatadores**

Para poder llevar adelante un an√°lisis de relaciones cuantitativas estructura-actividad (QSAR), es fundamental trabajar con un conjunto de mol√©culas que compartan ciertas caracter√≠sticas. Idealmente, estas mol√©culas deben tener afinidad por el mismo blanco terap√©utico, actuar mediante un mecanismo de acci√≥n similar, presentar cierto grado de semejanza estructural entre s√≠, y contar con datos de actividad biol√≥gica medidos bajo condiciones experimentales comparables. Esto asegura que las variaciones en la actividad puedan atribuirse, en buena medida, a diferencias estructurales y no a otros factores externos.

Con este objetivo en mente, y enfoc√°ndonos en compuestos activos sobre el receptor adren√©rgico Œ≤2, vamos a aislar un subconjunto representativo de mol√©culas que cumplan con estos criterios. Este conjunto ser√° utilizado en el TP N¬∞4 como base para construir y evaluar modelos QSAR, facilitando as√≠ la interpretaci√≥n y la predicci√≥n de relaciones estructura-actividad en este sistema biol√≥gico de inter√©s.

Comencemos por separar ligandos con actividad frente a receptores beta de aquellos activos frente al receptor alfa.

In [None]:
df_alfa, df_beta = separar_alfa_beta(df_adrenergicos_chemspace)

In [None]:
df_alfa

In [None]:
graficar_espacio_quimico_con_filtro(df_adrenergicos_chemspace, df_alfa)

In [None]:
df_beta

In [None]:
graficar_espacio_quimico_con_filtro(df_adrenergicos_chemspace, df_beta)

Y ahora, aislemos solamente a los que tienen actividad frente al receptor Œ≤2.

In [None]:
df_beta1, df_beta2 = separar_beta1_beta2(df_beta)

In [None]:
df_beta1

In [None]:
graficar_espacio_quimico_con_filtro(df_adrenergicos_chemspace, df_beta1)

In [None]:
df_beta2

In [None]:
graficar_espacio_quimico_con_filtro(df_adrenergicos_chemspace, df_beta2)

Recordemos que uno de los requisitos fundamentales para realizar un an√°lisis QSAR apropiado es que la potencia o actividad biol√≥gica de las mol√©culas est√© expresada en el mismo tipo de par√°metro y en las mismas unidades. Esto permite una comparaci√≥n directa entre compuestos y asegura la coherencia de los modelos. Por esta raz√≥n, vamos a seleccionar exclusivamente aquellos ligandos del receptor adren√©rgico Œ≤2 que tengan valores de IC50 reportados, ya que este es uno de los par√°metros m√°s com√∫nmente utilizados en la literatura para cuantificar actividad biol√≥gica.

In [None]:
df_beta2_IC50 = aislar_actividad_biologica(df_beta2, tipo='IC50')
itables.show(df_beta2_IC50)

Ahora nos enfrentamos a un problema. Como vemos en la tabla, en la columna *action_type*, muy pocos ligandos tienen informado su mecanismo de acci√≥n frente al receptor Œ≤2 adren√©rgico, lo que a priori dificultar√≠a la identificaci√≥n de mol√©culas que act√∫an como agonistas o antagonistas de este blanco terap√©utico. Sin embargo, al comparar las estructuras qu√≠micas de ligandos con distinto mecanismo, podemos encontrar una diferencia crucial que nos ayudar√° a clasificarlos. 

Ejecuten las siguientes funciones e intenten descifrar dicha diferencia:

In [None]:
#Agonistas Œ≤2 
ids_moleculas = ["ISOPROTERENOL", "ALBUTEROL","CLENBUTEROL"] 
comparar_moleculas_con_template(df_beta2_IC50, ids_moleculas, smiles_template="CNCCO")

In [None]:
#Antagonistas Œ≤2 
ids_moleculas = ["TIMOLOL", "CARVEDILOL", "PROPRANOLOL HYDROCHLORIDE", "ATENOLOL"]
comparar_moleculas_con_template(df_beta2_IC50, ids_moleculas, smiles_template="CNCCO")

Efectivamente, est√° ampliamente reportado que los antagonistas ... mientras que los agonistas ...

Entonces, aprovechemos estas diferencias estructurales para filtrar ligandos y clasificarlos como agonistas o antagonistas del receptor Œ≤2 adren√©rgico.

In [None]:
df_beta2_antagonists = filtrar_por_grupo_funcional(df_beta2_IC50, smarts='OCC(O)CNC')
itables.show(df_beta2_antagonists)

In [None]:
graficar_espacio_quimico_con_filtro(df_adrenergicos_chemspace, df_beta2_antagonists)

In [None]:
df_beta2_agonists = filtrar_por_grupo_funcional(df_beta2_IC50, smarts='c1ccccc1C(O)CNC')
itables.show(df_beta2_agonists)

In [None]:
graficar_espacio_quimico_con_filtro(df_adrenergicos_chemspace, df_beta2_agonists)

Al igual que hicimos previamente, podr√≠amos analizar y comparar las propiedades fisicoqu√≠micas de estos ligandos.

In [None]:
df_beta2_antagonists = calcular_propiedades(df_beta2_antagonists)
itables.show(df_beta2_antagonists)

In [None]:
ver_rangos_propiedades(df_beta2_antagonists)

In [None]:
df_beta2_agonists = calcular_propiedades(df_beta2_agonists)
itables.show(df_beta2_agonists)

In [None]:
ver_rangos_propiedades(df_beta2_agonists)

In [None]:
graficar_distribucion_descriptores(df_beta2_agonists, "MolWt")

Como podemos observar, muchas mol√©culas poseen propiedades drug-like que exceden los l√≠mites t√≠picamente asociados a f√°rmacos. Podr√≠amos, entonces, seleccionar solamente aquellos que s√≠ cumplan con las reglas de Lipinski, y emplear as√≠ dicho set para el posterior estudio de QSAR (TP N¬∞4).


In [None]:
criterios = {
    'MolLogP': (0, 5),
    'MolWt': (0, 500),
    'NumHAcceptors': (0, 10),
    'NumHDonors': (0, 5),
    'NumRotatableBonds': (0, 10)
}

df_beta2_agonists_lipinski = filtrar_multiples_propiedades(df_beta2_agonists, criterios)
itables.show(df_beta2_agonists_lipinski)

In [None]:
graficar_espacio_quimico_con_filtro(df_adrenergicos_chemspace, df_beta2_agonists_lipinski)

Hasta ahora, ven√≠amos analizando la distribuci√≥n de cada descriptor molecular de forma individual. Sin embargo, ¬øqu√© ocurre si queremos compararlos entre s√≠ o utilizarlos juntos en un modelo matem√°tico, como en un an√°lisis QSAR?

In [None]:
graficar_distribucion_descriptores_all(df_beta2_agonists_lipinski, "IC50_value_nM")

Como se puede observar en los gr√°ficos, cada descriptor tiene un rango de valores muy diferente. Esta disparidad puede generar problemas al momento de construir modelos, ya que los descriptores con valores num√©ricamente mayores pueden tener una influencia desproporcionada en las ecuaciones, independientemente de su verdadera relevancia biol√≥gica o qu√≠mica. En otras palabras, el modelo podr√≠a "pensar" que un descriptor es m√°s importante solo porque sus valores son m√°s grandes en escala.

Para evitar este sesgo, utilizamos una t√©cnica conocida como normalizaci√≥n de datos. Esta consiste en transformar los valores de cada descriptor para que compartan un mismo rango (por ejemplo, entre 0 y 1), conservando las diferencias relativas entre mol√©culas. De esta manera, todos los descriptores contribuyen en igualdad de condiciones al modelo QSAR.

A continuaci√≥n, ejecutaremos las siguientes funciones para visualizar claramente la diferencia antes y despu√©s de normalizar los datos.

In [None]:
df_beta2_agonists_lipinski_norm = normalizar_desde_columna(df_beta2_agonists_lipinski, "IC50_value_nM")
itables.show(df_beta2_agonists_lipinski_norm)

In [None]:
graficar_distribucion_descriptores_all(df_beta2_agonists_lipinski_norm, "IC50_value_nM_norm")

In [None]:
df_beta2_agonists_lipinski_norm.to_csv("df_beta2_agonists_lipinski_norm.csv", index=False) #Guardamos el archivo para usar la pr√≥xima clase

Por √∫ltimo, analicemos las estructuras de este set de compuestos e intentemos establecer algunas relaciones estructura-actividad (SAR), previo al TP de la pr√≥xima semana.

In [None]:
mostrar_y_guardar_moleculas_alineadas(df=df_beta2_agonists_lipinski_norm, grupo_funcional_smiles='CC(O)CNCC', mols_per_image=70, mols_per_row=5)

In [None]:
ids_de_interes = ["CHEMBL1160723", "CHEMBL434"] # Isomer√≠a
mostrar_moleculas_por_id(df_beta2_agonists_lipinski_norm, ids_de_interes, grupo_funcional_smiles="CNCCO")

In [None]:
ids_de_interes = ["CHEMBL388570", "CHEMBL229476", "CHEMBL229477", "CHEMBL389390"] # Isomer√≠a
mostrar_moleculas_por_id(df_beta2_agonists_lipinski_norm, ids_de_interes, grupo_funcional_smiles="CC(O)CNCC")

In [None]:
ids_de_interes = ["CHEMBL4280606", "CHEMBL4279962", "CHEMBL4279531","CHEMBL4285281"] # Restricci√≥n + Isomer√≠a
mostrar_moleculas_por_id(df_beta2_agonists_lipinski_norm, ids_de_interes, grupo_funcional_smiles="CC(O)CNCC")

In [None]:
ids_de_interes = ["CHEMBL229476", "CHEMBL1800960"] # Homolog√≠a superior
mostrar_moleculas_por_id(df_beta2_agonists_lipinski_norm, ids_de_interes, grupo_funcional_smiles="CNCCO")

In [None]:
ids_de_interes = ["CHEMBL229614", "CHEMBL228996", "CHEMBL1800934", "CHEMBL229476", "CHEMBL1800962"] # Tama√±os, sustituciones, orientaciones.
mostrar_moleculas_por_id(df_beta2_agonists_lipinski_norm, ids_de_interes, grupo_funcional_smiles="CNCCO")

In [None]:
ids_de_interes = ["CHEMBL4280606", "CHEMBL3747487", "CHEMBL3746885", "CHEMBL3747244", "CHEMBL3746280"] # Tama√±os, restricciones conformacionales, sustituciones, orientaciones.
mostrar_moleculas_por_id(df_beta2_agonists_lipinski_norm, ids_de_interes, grupo_funcional_smiles="CNCCO")