## Análisis de núcleos base (_scaffolds_)
### Diversidad y relaciones estructura-actividad
En este ejercicio, revisamos los conceptos básicos de análisis de núcleos base por medio del concepto de _scaffold_ desarrollado por Bemis y Murcko (1).

1. Bemis GW, Murcko AM. The properties of known drugs. 1. Molecular frameworks. J. Med. Chem., 1996, 39 (15),2887–2893.

#### 1. Importar librerías

In [1]:
import pandas as pd
from rdkit import Chem #librería para manipular estructuras químicas
from rdkit.Chem.Draw import IPythonConsole #necesario para visualizar estructuras en el notebook
from rdkit.Chem.Scaffolds.MurckoScaffold import GetScaffoldForMol as BMS #función para calcular BMS
import os

In [10]:
hipertension = pd.read_csv("hipertension_compounds.csv")
hipertension.head()

Unnamed: 0,SMILES,NAME,CLASS
0,NS(=O)(=O)C1=C(Cl)C=C2NC=NS(=O)(=O)C2=C1,Clorotiazida,Diuréticos tiazídicos
1,NS(=O)(=O)C1=C(Cl)C=C2NCNS(=O)(=O)C2=C1,Hidroclorotiazida,Diuréticos tiazídicos
2,NS(=O)(=O)C1=C(Cl)C=CC(=C1)C1(O)NC(=O)C2=CC=CC...,Clortalidona,Diuréticos tiazídicos
3,NS(=O)(=O)C1=CC2=C(NC(CC3=CC=CC=C3)NS2(=O)=O)C...,Bendroflumetazida,Diuréticos tiazídicos
4,NS(=O)(=O)C1=CC2=C(NCNS2(=O)=O)C=C1C(F)(F)F,Hidroflumetiazida,Diuréticos tiazídicos


In [11]:
hipertension.count()

SMILES    48
NAME      48
CLASS     48
dtype: int64

In [12]:
hipertension.columns

Index(['SMILES', 'NAME', 'CLASS'], dtype='object')

In [13]:
def BMS_smi(smi):
    #Se define el string como la variable smi
        #smi = "O(C)c1cc(O)c2C(=O)c3c(C)cc(OC)cc3Oc2c1"
    #Se define el string llamado smi a una molecula
    mol = Chem.MolFromSmiles(smi)
    #Resultado de la funcion de BMS sobre mol definido como scaff
    scaff = BMS(mol)
    #El resultado en forma de smiles se define como out, ya que es lo que esta regresando en return
    out = Chem.MolToSmiles(scaff)
    return out

In [14]:
BMS_smi(hipertension.SMILES[0])

'O=S1(=O)N=CNc2ccccc21'

In [15]:
hipertension["Scaffold"]= hipertension.SMILES.map(BMS_smi)
hipertension

Unnamed: 0,SMILES,NAME,CLASS,Scaffold
0,NS(=O)(=O)C1=C(Cl)C=C2NC=NS(=O)(=O)C2=C1,Clorotiazida,Diuréticos tiazídicos,O=S1(=O)N=CNc2ccccc21
1,NS(=O)(=O)C1=C(Cl)C=C2NCNS(=O)(=O)C2=C1,Hidroclorotiazida,Diuréticos tiazídicos,O=S1(=O)NCNc2ccccc21
2,NS(=O)(=O)C1=C(Cl)C=CC(=C1)C1(O)NC(=O)C2=CC=CC...,Clortalidona,Diuréticos tiazídicos,O=C1NC(c2ccccc2)c2ccccc21
3,NS(=O)(=O)C1=CC2=C(NC(CC3=CC=CC=C3)NS2(=O)=O)C...,Bendroflumetazida,Diuréticos tiazídicos,O=S1(=O)NC(Cc2ccccc2)Nc2ccccc21
4,NS(=O)(=O)C1=CC2=C(NCNS2(=O)=O)C=C1C(F)(F)F,Hidroflumetiazida,Diuréticos tiazídicos,O=S1(=O)NCNc2ccccc21
5,CC1NC2=CC(Cl)=C(C=C2C(=O)N1C1=CC=CC=C1C)S(N)(=...,Metolazona,Diuréticos tiazídicos,O=C1c2ccccc2NCN1c1ccccc1
6,CC1CC2=CC=CC=C2N1NC(=O)C1=CC(=C(Cl)C=C1)S(N)(=...,Indapamida,Diuréticos tiazídicos,O=C(NN1CCc2ccccc21)c1ccccc1
7,CC1=CC=CC(C)=C1NC(=O)C1=CC(=C(Cl)C=C1O)S(N)(=O)=O,Xipamida,Diuréticos tiazídicos,O=C(Nc1ccccc1)c1ccccc1
8,[H][C@@]12CC[C@@]3(CCC(=O)O3)[C@@]1(C)CC[C@@]1...,Espironolactona,Inhibidores de Aldosterona,O=C1C=C2CC[C@@H]3[C@H](CCC4[C@H]3CC[C@@]43CCC(...
9,NC(=N)NC(=O)C1=NC(Cl)=C(N)N=C1N,Amilorida,Inhibidores de Aldosterona,c1cnccn1


In [16]:
len(hipertension.Scaffold.unique())

36

In [17]:
hipertension

Unnamed: 0,SMILES,NAME,CLASS,Scaffold
0,NS(=O)(=O)C1=C(Cl)C=C2NC=NS(=O)(=O)C2=C1,Clorotiazida,Diuréticos tiazídicos,O=S1(=O)N=CNc2ccccc21
1,NS(=O)(=O)C1=C(Cl)C=C2NCNS(=O)(=O)C2=C1,Hidroclorotiazida,Diuréticos tiazídicos,O=S1(=O)NCNc2ccccc21
2,NS(=O)(=O)C1=C(Cl)C=CC(=C1)C1(O)NC(=O)C2=CC=CC...,Clortalidona,Diuréticos tiazídicos,O=C1NC(c2ccccc2)c2ccccc21
3,NS(=O)(=O)C1=CC2=C(NC(CC3=CC=CC=C3)NS2(=O)=O)C...,Bendroflumetazida,Diuréticos tiazídicos,O=S1(=O)NC(Cc2ccccc2)Nc2ccccc21
4,NS(=O)(=O)C1=CC2=C(NCNS2(=O)=O)C=C1C(F)(F)F,Hidroflumetiazida,Diuréticos tiazídicos,O=S1(=O)NCNc2ccccc21
5,CC1NC2=CC(Cl)=C(C=C2C(=O)N1C1=CC=CC=C1C)S(N)(=...,Metolazona,Diuréticos tiazídicos,O=C1c2ccccc2NCN1c1ccccc1
6,CC1CC2=CC=CC=C2N1NC(=O)C1=CC(=C(Cl)C=C1)S(N)(=...,Indapamida,Diuréticos tiazídicos,O=C(NN1CCc2ccccc21)c1ccccc1
7,CC1=CC=CC(C)=C1NC(=O)C1=CC(=C(Cl)C=C1O)S(N)(=O)=O,Xipamida,Diuréticos tiazídicos,O=C(Nc1ccccc1)c1ccccc1
8,[H][C@@]12CC[C@@]3(CCC(=O)O3)[C@@]1(C)CC[C@@]1...,Espironolactona,Inhibidores de Aldosterona,O=C1C=C2CC[C@@H]3[C@H](CCC4[C@H]3CC[C@@]43CCC(...
9,NC(=N)NC(=O)C1=NC(Cl)=C(N)N=C1N,Amilorida,Inhibidores de Aldosterona,c1cnccn1


In [18]:
hipertension.to_csv("hipertension_compounds_Scaffolds.csv", index=None)