# Ligandos Cocristalizados para *Cross docking**

### Obtención una conformación minimizada de cada ligando cocristalizado con la proteína

**Esta libreta tiene como objetivo determinar cuántos ligandos únicos han sido cocristalizados con la proteína en el sitio activo y generar conformaciones minimizadas de dichos ligandos para posteriormente realizar un _cross docking_ con dichas moléculas y todas las conformaciones disponibles de la porteína.**

> Puntos clave de esta libreta:
- Se extrae de la tabla de datos principal de la proteína las conformaciones que poseen a algún ligando en el sitio activo.
- Se crea un set de moléculas usando identificador PDB de cada molécula (cada molécula es designada con un id de 3 letras).
- Se usa el id de cada molécula (LIG) para obtener los datos de la página `http://www.rcsb.org/ligand/LIG`, correspondiente a cada ligando. Con ello obtenemos:
    - El smile isomérico de la molécula.
    - El InChI
    - El InChI Key
- Usamos el **InChI** para obtener los datos de cada molécula desde _**PUBCHEM**_ y _**CHEMBL**_.
- Guardamos los datos en un diccionario y a su vez lo exportamos a un archivo pinckle.

In [1]:
import pickle

In [5]:
# Cargamos el diccionario de ligandos únicos, de él sólo nos interesa obtener la lista de nombres
# Lectura del diccionario con pickle
nombre_archivo = './B_DATOS/LIGS_CDK2_crys_pubchem_chembl_data.pkl'
with open(nombre_archivo, 'rb') as dic_file:
    dic_ligs_crys_prot = pickle.load(open(nombre_archivo, 'rb'))
    lista_de_ligs_cdk2 = dic_ligs_crys_prot.keys()

In [6]:
lista_de_ligs_cdk2

dict_keys(['L0F', 'T3C', 'HGW', 'X88', 'UN4', 'IM9', 'HH5', 'T2A', '404', '0BY', '2KD', '48K', 'EZV', 'DT1', 'QQ2', '0BX', 'Z04', 'ES4', 'X72', 'MHR', 'FRV', 'HJK', 'JWS', 'NU5', '07Z', 'FB8', 'DT4', '03Z', 'JYM', 'I1P', 'CMG', 'X1N', 'A07', '2A6', '5SC', '5BP', 'C75', 'Z14', 'LS5', 'LZ8', 'ADP', 'X02', 'I73', 'SU9', 'HHT', 'RRC', '22Z', 'D6I', 'X36', 'SCZ', 'EFQ', 'X03', 'SC9', '371', '5JE', '19K', 'X4B', 'LZ3', 'Z19', '55S', '3I6', 'CK8', '61K', 'F9Z', '1Y6', 'CK4', 'CK9', 'ZIP', 'LZD', 'LIA', '106', 'XA0', 'HHN', 'SC8', 'Z62', 'T3E', '3QS', 'X01', 'X63', 'LZ1', '2AN', '02Z', 'SCJ', 'C53', 'C85', 'ATP', '16K', 'HDY', '20K', '2BZ', 'RFZ', '23D', 'T6Q', 'X9I', 'B49', 'SCF', '1RO', 'LS2', '62K', 'TBS', 'U32', 'PDY', 'ESJ', 'PVB', 'MFZ', 'MBP', 'LZ4', 'NNN', 'LZB', 'D23', 'N69', 'HDU', 'CT8', '09K', 'Z30', 'RJI', '7YG', 'D31', 'X62', 'X6A', '3TI', 'PO5', 'AEQ', '4QE', '514', 'LS4', 'N76', 'X96', 'NS9', '11K', 'LZE', '107', '529', 'CK7', 'R0N', '42K', 'SCE', '25Z', 'DT2', 'X76', 'INR', 'H

In [12]:
# creamos el directorio donde guardaremos los ligandos
ligs_dir = '../ARCHIVOS/CRISTALES/LIGS_CDK2'
input_dir = F'{ligs_dir}/IN_POCKET_NON_PREP'
output_dir = F'{ligs_dir}/LIGS_PREP_CROSS_DK_317'

# Creamos el directorio de salida
import os
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

In [13]:
# Ahora procedemos a usar OpenBabel, como en los ensayos anteriores

Gen3D
To illustrate how some of the above methods might be used in practice, consider the gen3d operation. This operation (invoked using --gen3d at the commandline) generates 3D structures for 0D or 2D structures using the following series of steps, all of which have been described above:

- Use the OBBuilder to create a 3D structure using rules and fragment templates
- Do 250 steps of a steepest descent geometry optimization with the MMFF94 forcefield
- Do 200 iterations of a Weighted Rotor conformational search (optimizing each conformer with 25 steps of a steepest descent)
- Do 250 steps of a conjugate gradient geometry optimization

In [36]:
%%bash -s "$input_dir" "$output_dir" "{' '.join(lista_de_ligs_cdk2)}" 
for i in $3
do 
echo $i
obabel -ipdb ${1}/*${i}*.pdb -omol2 -O ${2}/${i}.mol2 -c --gen3d -p 7.0
done

L0F
T3C
HGW
X88
UN4
IM9
HH5
T2A
404
0BY
2KD
48K
EZV
DT1
QQ2
0BX
Z04
ES4
X72
MHR
FRV
HJK
JWS
NU5
07Z
FB8
DT4
03Z
JYM
I1P
CMG
X1N
A07
2A6
5SC
5BP
C75
Z14
LS5
LZ8
ADP
X02
I73
SU9
HHT
RRC
22Z
D6I
X36
SCZ
EFQ
X03
SC9
371
5JE
19K
X4B
LZ3
Z19
55S
3I6
CK8
61K
F9Z
1Y6
CK4
CK9
ZIP
LZD
LIA
106
XA0
HHN
SC8
Z62
T3E
3QS
X01
X63
LZ1
2AN
02Z
SCJ
C53
C85
ATP
16K
HDY
20K
2BZ
RFZ
23D
T6Q
X9I
B49
SCF
1RO
LS2
62K
TBS
U32
PDY
ESJ
PVB
MFZ
MBP
LZ4
NNN
LZB
D23
N69
HDU
CT8
09K
Z30
RJI
7YG
D31
X62
X6A
3TI
PO5
AEQ
4QE
514
LS4
N76
X96
NS9
11K
LZE
107
529
CK7
R0N
42K
SCE
25Z
DT2
X76
INR
HHQ
PM1
T7Z
SZL
PMU
LZA
9Z2
HDT
45K
MFR
09Z
CK6
MTW
RC8
D05
LZ7
4SP
26D
CIG
NW1
9ZB
X66
MFP
B98
O1Z
TIY
P48
X3A
1CD
27Z
HMD
X46
4CK
X19
FC8
X64
X67
VAR
SQ9
X43
X14
CK5
LS3
Z46
5BN
HGK
LQ5
D42
X75
LZC
56Z
LZ5
889
CT9
X86
UCN
18K
X07
FRT
C96
1CK
0S0
6ZK
HH8
Z67
BYP
HHB
LS1
18Z
C94
X0A
TJF
FAP
A28
X42
N41
56H
04Z
6SC
U55
BLZ
PY8
99Z
N20
X84
Y8L
N5B
HGH
X40
BRY
1YG
SCW
I17
G6T
6AE
EZR
ZXC
1QK
OLO
24Z
DTQ
A27
X87
U73
06Z
LZM
CK2
03K
75X


1 molecule converted
1 molecule converted
*** Open Babel Error  in OpenAndSetFormat
  Cannot open ../ARCHIVOS/CRISTALES/LIGS_CDK2/IN_POCKET_NON_PREP/*HGW*.pdb
0 molecules converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
bash: línea 1: 24812 Violación de segmento  (`core' generado) obabel -ipdb ${1}/*${i}*.pdb -omol2 -O ${2}/${i}.mol2 -c --gen3d -p 7.0
1 molecule converted
1 molecule converted
1 molecule converted
2 molecules converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
2 molecules converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
2 molecules converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule converted
1 molecule