
# **Preparação – Instale os pacotes necessários**


Utilizaremos as seguintes bibliotecas e ferramentas para realizar as tarefas mencionadas:


**Biopython:** Esta biblioteca será utilizada para a manipulação dos arquivos PDB, permitindo o acesso e processamento das estruturas moleculares.

**Py3Dmol:** Será empregado para a visualização interativa da estrutura da proteína e para configurar a grade de pesquisa utilizada no processo de docking.

**Miniconda:** Utilizaremos esta versão minimalista e gratuita do Conda para facilitar o gerenciamento dos pacotes de software e ambientes necessários ao projeto.

**OpenBabel:** Essa ferramenta será empregada para a parametrização do(s) ligante(s), preparando-os para a etapa de docking.

**MGLtools:** Será utilizado para parametrizar a proteína alvo, empregando as cargas de Gasteiger, essenciais para o processo de docking.

**PDB2PQR:** Neste pipeline, o PDB2PQR será empregado para realizar a parametrização da proteína, tornando-a pronta para a etapa de docking.

**Autodock Vina:** Esta ferramenta será utilizada para executar o processo de atracamento molecular, possibilitando a predição das interações ligante-proteína.

*Após realizar uma série de testes, chegamos à seguinte configuração recomendada para o ambiente Google Colab neste laboratório*

A instalação dos pacotes Biopython, Py3Dmol e PDB2PQR pode ser feita da seguinte forma:

In [None]:
!pip install py3Dmol
!pip install biopython
!pip install pdb2pqr
!pip install kora
!pip install rdkit-pypi
!pip install nglview
!pip install ipywidgets

Collecting py3Dmol
  Downloading py3Dmol-2.0.3-py2.py3-none-any.whl (12 kB)
Installing collected packages: py3Dmol
Successfully installed py3Dmol-2.0.3
Collecting biopython
  Downloading biopython-1.81-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (3.1 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m3.1/3.1 MB[0m [31m9.5 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: biopython
Successfully installed biopython-1.81
Collecting pdb2pqr
  Downloading pdb2pqr-3.6.1-py2.py3-none-any.whl (208 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m208.2/208.2 kB[0m [31m3.5 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting mmcif-pdbx>=1.1.2 (from pdb2pqr)
  Downloading mmcif_pdbx-2.0.1-py2.py3-none-any.whl (20 kB)
Collecting propka>=3.5 (from pdb2pqr)
  Downloading propka-3.5.0-py3-none-any.whl (98 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m98.7/98.7 kB[0m [31m4.8 MB/s[0m eta [36m0:00:00[0m
Collecting docu

In [None]:
# Importando py3Dmol para visualização interativa de estruturas moleculares em 3D
import py3Dmol

In [None]:
# Verificando se pdb2pqr foi instalado corretamente
!pdb2pqr30 -h

usage: pdb2pqr
       [-h]
       [--ff {AMBER,CHARMM,PARSE,TYL06,PEOEPB,SWANSON}]
       [--userff USERFF]
       [--clean]
       [--nodebump]
       [--noopt]
       [--keep-chain]
       [--assign-only]
       [--ffout {AMBER,CHARMM,PARSE,TYL06,PEOEPB,SWANSON}]
       [--usernames USERNAMES]
       [--apbs-input APBS_INPUT]
       [--pdb-output PDB_OUTPUT]
       [--ligand LIGAND]
       [--whitespace]
       [--neutraln]
       [--neutralc]
       [--drop-water]
       [--include-header]
       [--titration-state-method {propka}]
       [--with-ph PH]
       [-f FILENAMES]
       [-r REFERENCE]
       [-c CHAINS]
       [-i TITRATE_ONLY]
       [-t THERMOPHILES]
       [-a ALIGNMENT]
       [-m MUTATIONS]
       [-p PARAMETERS]
       [-o PH]
       [-w WINDOW WINDOW WINDOW]
       [-g GRID GRID GRID]
       [--mutator MUTATOR]
       [--mutator-option MUTATOR_OPTIONS]
       [-d]
       [-l]
       [-k]
       [-q]
       [--protonate-all]
       [--version]
       input_path
   

vamos instalar o miniconda para poder instalar OpenBabel e MGLtools

In [None]:
# Instalando Miniconda usando a biblioteca conda-colab
!pip install -q condacolab
import condacolab
condacolab.install()


⏬ Downloading https://github.com/conda-forge/miniforge/releases/download/23.1.0-1/Mambaforge-23.1.0-1-Linux-x86_64.sh...
📦 Installing...
📌 Adjusting configuration...
🩹 Patching environment...
⏲ Done in 0:00:16
🔁 Restarting kernel...


In [None]:
# Configurando o caminho para o Miniconda
import sys
sys.path.append('/root/miniconda3/lib/python3.7/site-packages')

# Instalando MGLtools e OpenBabel do repositório bioconda usando Miniconda
!conda install -c conda-forge -c bioconda mgltools openbabel zlib --yes

Collecting package metadata (current_repodata.json): - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - 

Finalmente, baixe e instale o Autodock Vina

In [None]:
# Baixando e extraindo o Autodock Vina do SCRIPPS
# Em seguida, configuramos um alias para o vina ser tratado como um binário nativo
%%bash
wget https://vina.scripps.edu/wp-content/uploads/sites/55/2020/12/autodock_vina_1_1_2_linux_x86.tgz
tar xzvf autodock_vina_1_1_2_linux_x86.tgz

autodock_vina_1_1_2_linux_x86/
autodock_vina_1_1_2_linux_x86/LICENSE
autodock_vina_1_1_2_linux_x86/bin/
autodock_vina_1_1_2_linux_x86/bin/vina
autodock_vina_1_1_2_linux_x86/bin/vina_split


--2023-08-10 13:44:29--  https://vina.scripps.edu/wp-content/uploads/sites/55/2020/12/autodock_vina_1_1_2_linux_x86.tgz
Resolving vina.scripps.edu (vina.scripps.edu)... 192.26.252.19
Connecting to vina.scripps.edu (vina.scripps.edu)|192.26.252.19|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 1238242 (1.2M) [application/x-gzip]
Saving to: ‘autodock_vina_1_1_2_linux_x86.tgz’

     0K .......... .......... .......... .......... ..........  4% 1.86M 1s
    50K .......... .......... .......... .......... ..........  8% 3.67M 0s
   100K .......... .......... .......... .......... .......... 12%  158M 0s
   150K .......... .......... .......... .......... .......... 16% 3.83M 0s
   200K .......... .......... .......... .......... .......... 20%  164M 0s
   250K .......... .......... .......... .......... .......... 24%  165M 0s
   300K .......... .......... .......... .......... .......... 28%  263M 0s
   350K .......... .......... .......... .......... .......... 

In [None]:
# Configurando o caminho para o Autodock Vina
import os
os.environ['PATH'] += ":/content/autodock_vina_1_1_2_linux_x86/bin"


In [None]:
# Verificando se o Autodock Vina foi instalado corretamente
!vina --help




Input:
  --receptor arg        rigid part of the receptor (PDBQT)
  --flex arg            flexible side chains, if any (PDBQT)
  --ligand arg          ligand (PDBQT)

Search space (required):
  --center_x arg        X coordinate of the center
  --center_y arg        Y coordinate of the center
  --center_z arg        Z coordinate of the center
  --size_x arg          size in the X dimension (Angstroms)
  --size_y arg          size in the Y dimension (Angstroms)
  --size_z arg          size in the Z dimension (Angstroms)

Output (optional):
  --out arg             output models (PDBQT), the default is chosen based on 
                        the ligand file name
  --log arg             optionally, write log file

Misc (optional):
  --cpu arg                 the number of CPUs to use (the default is to try to
                            detect the number of CPUs or, failing that, use 1)
  --seed arg                explicit random seed
  --exhaustiveness arg (=8) exhaustiveness of the glo

# **Parte 1 - Preparação do Receptor**


Nesta etapa, procederemos com a preparação do receptor para o processo de Redocking. Siga as instruções abaixo:

1. Baixe o arquivo do receptor no formato PDB da fonte desejada, [clique aqui](https://www.rcsb.org/) e escolha o alvo molecular de interesse.

2. Utilizando a biblioteca py3Dmol, visualize a estrutura da proteína a partir do arquivo PDB baixado.

3. Realize eventuais pré-processamentos, como remoção de água e íons desnecessários, e extraia somente os resíduos proteicos relevantes.

4. Salve a versão modificada do receptor em um novo arquivo PDB e realize a parametrização necessária.

5. Extraia o ligante cocristalizado, e em seguida, realize a parametrização e obtenção das coordenadas espaciais.

6. Verifique se todos os arquivos necessários estão disponíveis para o processo de Redocking.

*Assegure-se de seguir as diretrizes apropriadas para a preparação do receptor, considerando os requisitos específicos do AutoDock e seguindo as melhores práticas para a preparação de proteínas para o docking.*

In [None]:
import urllib.request

#@title **Passo 1. Digite o ID PDB de interesse**
#@markdown Digite o ID PDB da proteína de interesse.

pdb_id = input("Digite o ID PDB: ")

def baixar_pdb(pdb_id):
    url = f"https://files.rcsb.org/download/{pdb_id}.pdb"
    nome_arquivo = f"{pdb_id}.pdb"
    urllib.request.urlretrieve(url, nome_arquivo)
    print(f"O arquivo {nome_arquivo} foi baixado com sucesso!")

baixar_pdb(pdb_id)

Digite o ID PDB: 3guu
O arquivo 3guu.pdb foi baixado com sucesso!


In [None]:
import py3Dmol
import os
from ipywidgets import widgets, interact

#@title Visualizar a Proteína

def visualize_pdb(pdb_filename):
    with open(pdb_filename, 'r') as pdb_file:
        pdb_data = pdb_file.read()

    view = py3Dmol.view(width=800, height=600)
    view.addModel(pdb_data, 'pdb')

    # Define o estilo para os resíduos de proteínas
    view.setStyle({'cartoon': {'color': 'spectrum'}})

    # Define o estilo para os resíduos não proteicos (representação de bastão)
    view.setStyle({'hetflag': True}, {'stick': {}})

    # Define o estilo para moléculas de água (esferas transparentes)
    view.setStyle({'resn': 'HOH'}, {'sphere': {'opacity': 0.5}})

    # Define o estilo para os demais ligantes (representação de bastão)
    view.setStyle({'hetflag': True, 'resn': '!HOH'}, {'stick': {}})

    view.zoomTo()
    view.show()

# Obtém a lista de arquivos .pdb no diretório atual
pdb_files = [file for file in os.listdir() if file.endswith(".pdb")]

# Cria um dropdown para selecionar o arquivo .pdb
pdb_dropdown = widgets.Dropdown(
    options=pdb_files,
    description='PDB file:',
    style={'description_width': 'initial'}
)
display(pdb_dropdown)

def visualize_selected_pdb(b):
    pdb_filename = pdb_dropdown.value
    visualize_pdb(pdb_filename)

# Botão para iniciar a visualização da proteína
button = widgets.Button(description="Visualizar")
display(button)
button.on_click(visualize_selected_pdb)

Dropdown(description='PDB file:', options=('3guu.pdb',), style=DescriptionStyle(description_width='initial'), …

Button(description='Visualizar', style=ButtonStyle())

In [None]:
import os
import ipywidgets as widgets
from IPython.display import display

#@title **Passo 2. Extraia residuos não proteícos**
#@markdown Esse processo irá resultar na geração de uma estrutura de proteína limpa, específica para o docking molecular.\
#@markdown As cadeias individuais da proteína serão extraídas e salvas em arquivos separados.

# Obtém a lista de arquivos .pdb no diretório atual
pdb_files = [file for file in os.listdir() if file.endswith(".pdb")]

# Cria um dropdown para selecionar o arquivo .pdb
pdb_dropdown = widgets.Dropdown(
    options=pdb_files,
    description='PDB file:',
    style={'description_width': 'initial'}
)
display(pdb_dropdown)

# Botão para iniciar a extração da proteína
button = widgets.Button(description="Extrair proteína")
display(button)

def separate_chain(pdb_file):
    chains = set()
    with open(pdb_file, 'r') as f:
        for line in f:
            if line.startswith('ATOM'):
                chain_id = line[21]
                chains.add(chain_id)

    file_base = os.path.splitext(pdb_file)[0]

    for chain_id in chains:
        chain_file = f"{file_base}_chain_{chain_id}.pdb"
        with open(chain_file, 'w') as f_out, open(pdb_file, 'r') as f_in:
            for line in f_in:
                if line.startswith('ATOM') and line[21] == chain_id:
                    f_out.write(line)

        print(f"+ Chain {chain_id} extracted from {pdb_file} --> {chain_file}")

def extract_protein(b):
    pdb_file = pdb_dropdown.value
    separate_chain(pdb_file)

button.on_click(extract_protein)

Dropdown(description='PDB file:', options=('3guu.pdb',), style=DescriptionStyle(description_width='initial'), …

Button(description='Extrair proteína', style=ButtonStyle())

+ Chain B extracted from 3guu.pdb --> 3guu_chain_B.pdb
+ Chain A extracted from 3guu.pdb --> 3guu_chain_A.pdb


**Preparação da Proteína Alvo para Formação de Ligações de Hidrogênio com o Ligante**

Neste estágio crucial do pipeline, é essencial garantir que a proteína alvo contenha todos os hidrogênios polares necessários para estabelecer ligações de hidrogênio com o ligante. É importante ressaltar que muitas estruturas proteicas disponíveis não possuem hidrogênios atribuídos, o que torna imprescindível adicioná-los para garantir a precisão e efetividade do nosso experimento.

**Opções de Procedimento 3A ou 3B:**
*Aqui, oferecemos duas opções distintas para prosseguir com seu experimento:*

1 - Adicione os hidrogênios polares à sua proteína e parametrize-a com cargas e tipos de átomos Gasteiger usando MGLTools (esta é a opção padrão para a maioria dos usuários do AutoDock).





In [None]:
#@title **Passo 3A. Parametrizando a proteina utilizando o MGLtools para converter a proteina para PDBQT.**

import os

# Lista todos os arquivos .pdb no diretório atual
pdb_files = [f for f in os.listdir('.') if f.endswith('.pdb')]

# Verifica se existem arquivos .pdb disponíveis
if not pdb_files:
    print("Nenhum arquivo .pdb disponível no diretório.")
else:
    print("Arquivos .pdb disponíveis:")
    for i, pdb_file in enumerate(pdb_files):
        print(f"{i+1}. {pdb_file}")

    # Solicita ao usuário que escolha um arquivo .pdb
    selection = input("Digite o número do arquivo .pdb que deseja selecionar: ")

    try:
        selection = int(selection)
        if 1 <= selection <= len(pdb_files):
            chosen_pdb = pdb_files[selection-1]
            print(f"Arquivo selecionado: {chosen_pdb}")

            # Parametriza e adiciona cargas Gasteiger à proteína usando MGLtools
            os.system(f"prepare_receptor4.py -r {chosen_pdb} -o {chosen_pdb}.pdbqt -A hydrogens -U nphs_lps -v")
        else:
            print("Seleção inválida.")
    except ValueError:
        print("Entrada inválida. Digite um número válido.")

Arquivos .pdb disponíveis:
1. 5ikr.pdb
2. 5ikr_chain_B.pdb
3. 5ikr_chain_A.pdb
Digite o número do arquivo .pdb que deseja selecionar: 3
Arquivo selecionado: 5ikr_chain_A.pdb


2 - **Realize a adição dos hidrogênios polares à proteína e faça a parametrização com base no pKa de cada aminoácido em um pH desejado, utilizando o campo de força de sua escolha. Essa etapa pode ser feita utilizando o pdb2pqr, seguida pela exclusão dos hidrogênios apolares e conversão do arquivo para o formato PDBQT utilizando o MGLtools.**

No processo mencionado, o pdb2pqr gera um arquivo intermediário chamado PQR, que é uma modificação do formato PDB, permitindo a adição de parâmetros de carga e raio aos dados existentes. Essa informação permanece inalterada durante o uso do MGLtools.


In [None]:
#@title **Passo 3B. Parametrizando a proteina utilizando o pdb2pqr e em seguida obtendo o PDBQT com MGLtools**

import os
import shutil

# Lista todos os arquivos .pdb no diretório atual
pdb_files = [f for f in os.listdir('.') if f.endswith('.pdb')]

# Verifica se existem arquivos .pdb disponíveis
if not pdb_files:
    print("Nenhum arquivo .pdb disponível no diretório.")
else:
    print("Arquivos .pdb disponíveis:")
    for i, pdb_file in enumerate(pdb_files):
        print(f"{i+1}. {pdb_file}")

    # Solicita ao usuário que escolha um arquivo .pdb
    selection = input("Digite o número do arquivo .pdb que deseja selecionar: ")

    try:
        selection = int(selection)
        if 1 <= selection <= len(pdb_files):
            chosen_pdb = pdb_files[selection-1]
            print(f"Arquivo selecionado: {chosen_pdb}")

            # Cria o diretório de docking com o nome correto
            dock_dir = f"redocking"
            os.makedirs(dock_dir, exist_ok=True)

            # Solicita ao usuário o pH de trabalho
            ph = input("Digite o pH de trabalho: ")

            # Solicita ao usuário o campo de força desejado
            force_fields = ['AMBER', 'CHARMM', 'OPLS', 'GROMACS']  # Lista de campos de força suportados
            print("Campos de força disponíveis:")
            for i, force_field in enumerate(force_fields):
                print(f"{i+1}. {force_field}")
            force_field_selection = input("Digite o número do campo de força desejado: ")

            try:
                force_field_selection = int(force_field_selection)
                if 1 <= force_field_selection <= len(force_fields):
                    chosen_force_field = force_fields[force_field_selection-1]
                    print(f"Campo de força selecionado: {chosen_force_field}")

                    # Executa o pdb2pqr para parametrizar o receptor com o campo de força e pH especificados
                    os.system(f"pdb2pqr30 --ff {chosen_force_field} --chain A --titration-state-method propka --with-ph {ph} {chosen_pdb} {dock_dir}/{chosen_pdb[:-4]}.pqr")

                    # Converte o arquivo .pqr em um arquivo .pdbqt excluindo hidrogênios não polares
                    os.system(f"prepare_receptor4.py -r {dock_dir}/{chosen_pdb[:-4]}.pqr -o {dock_dir}/{chosen_pdb[:-4]}.pdbqt -A checkhydrogens -U nphs_lps -v")

                    print(f"Arquivo {chosen_pdb[:-4]}.pdbqt gerado com sucesso.")

                else:
                    print("Seleção inválida para o campo de força.")
            except ValueError:
                print("Entrada inválida para o campo de força. Digite um número válido.")

        else:
            print("Seleção inválida para o arquivo .pdb.")
    except ValueError:
        print("Entrada inválida para o arquivo .pdb. Digite um número válido.")

# Lista todos os arquivos .pdbqt no diretório de docking
dock_dir = f"redocking"  # Nome do diretório de docking
pdbqt_files = [f for f in os.listdir(dock_dir) if f.endswith('.pdbqt')]

# Verifica se existem arquivos .pdbqt disponíveis
if not pdbqt_files:
    print("Nenhum arquivo .pdbqt disponível no diretório de docking.")
else:
    print("Arquivos .pdbqt disponíveis:")
    for i, pdbqt_file in enumerate(pdbqt_files):
        print(f"{i+1}. {pdbqt_file}")

    # Solicita ao usuário que escolha um arquivo .pdbqt
    selection = input("Digite o número do arquivo .pdbqt que deseja selecionar: ")

    try:
        selection = int(selection)
        if 1 <= selection <= len(pdbqt_files):
            chosen_pdbqt = pdbqt_files[selection-1]
            print(f"Arquivo selecionado: {chosen_pdbqt}")

            # Move o arquivo .pdbqt para o diretório de docking
            shutil.move(f"{dock_dir}/{chosen_pdbqt}", f"{dock_dir}/{chosen_pdbqt}")

            # Cria uma cópia do arquivo .pdbqt no diretório atual
            shutil.copy(f"{dock_dir}/{chosen_pdbqt}", chosen_pdbqt)

            print(f"Arquivo {chosen_pdbqt} gerado e salvo no diretório {dock_dir}.")
            print(f"Cópia do arquivo {chosen_pdbqt} criada no diretório atual.")

        else:
            print("Seleção inválida para o arquivo .pdbqt.")
    except ValueError:
        print("Entrada inválida para o arquivo .pdbqt. Digite um número válido.")

Arquivos .pdb disponíveis:
1. 3guu.pdb
2. 3guu_chain_B.pdb
3. 3guu_chain_A.pdb
Digite o número do arquivo .pdb que deseja selecionar: 3
Arquivo selecionado: 3guu_chain_A.pdb
Digite o pH de trabalho: 7
Campos de força disponíveis:
1. AMBER
2. CHARMM
3. OPLS
4. GROMACS
Digite o número do campo de força desejado: 1
Campo de força selecionado: AMBER
Arquivo 3guu_chain_A.pdbqt gerado com sucesso.
Arquivos .pdbqt disponíveis:
1. 3guu_chain_A.pdbqt
Digite o número do arquivo .pdbqt que deseja selecionar: 1
Arquivo selecionado: 3guu_chain_A.pdbqt
Arquivo 3guu_chain_A.pdbqt gerado e salvo no diretório redocking.
Cópia do arquivo 3guu_chain_A.pdbqt criada no diretório atual.


In [None]:
#@title Visualize o alvo PDBQT

import py3Dmol
import os
from ipywidgets import widgets, interact

def visualize_pdb(pdb_filename, representation):
    with open(pdb_filename, 'r') as pdb_file:
        pdb_data = pdb_file.read()

    view = py3Dmol.view(width=800, height=600)
    view.addModel(pdb_data, 'pdb')

    if representation == 'cartoon':
        view.setStyle({'cartoon': {'color': 'spectrum'}})
    elif representation == 'sticks':
        view.setStyle({'stick': {}})

    view.zoomTo()
    view.show()

# Obtém o diretório de docking criado anteriormente
dock_dir = [dir for dir in os.listdir() if dir.startswith("redocking")]
if not dock_dir:
    print("Diretório de docking não encontrado. Execute o código anterior para criar o diretório.")
    exit()

# Obtém a lista de arquivos .pdbqt no diretório de docking
pdbqt_files = [file for file in os.listdir(dock_dir[0]) if file.endswith(".pdbqt")]

# Cria um dropdown para selecionar o arquivo .pdbqt
pdbqt_dropdown = widgets.Dropdown(
    options=pdbqt_files,
    description='PDBQT file:',
    style={'description_width': 'initial'}
)
display(pdbqt_dropdown)

# Cria um dropdown para selecionar a representação
representation_dropdown = widgets.Dropdown(
    options=['cartoon', 'sticks'],
    description='Representation:',
    style={'description_width': 'initial'}
)
display(representation_dropdown)

def visualize_selected_pdbqt(b):
    pdbqt_filename = os.path.join(dock_dir[0], pdbqt_dropdown.value)
    representation = representation_dropdown.value
    visualize_pdb(pdbqt_filename, representation)

# Botão para iniciar a visualização do arquivo .pdbqt
button = widgets.Button(description="Visualizar")
display(button)
button.on_click(visualize_selected_pdbqt)

Diretório de docking não encontrado. Execute o código anterior para criar o diretório.


IndexError: ignored

In [None]:
#@title **Passo 4. Extrair o ligante co-cristalizado para redocking**
#@markdown Verifique no **Protein Data Bank (PDB)** as informações sobre o ligante co-cristalizado.

#@markdown Anote o nome do resíduo e a cadeia do ligante.


import os
import ipywidgets as widgets
from IPython.display import display


def extract_ligand_residue(pdb_filename, ligand_resname, chain_id=None):
    with open(pdb_filename, 'r') as pdb_file:
        pdb_data = pdb_file.readlines()

    ligand_residues = []

    for line in pdb_data:
        if line.startswith("HETATM"):
            resname = line[17:20].strip()
            chain = line[21]
            if resname == ligand_resname and (chain_id is None or chain == chain_id):
                ligand_residues.append(line)

    return ligand_residues


def write_ligand_pdb(pdb_filename, ligand_residues):
    pdb_basename = os.path.splitext(pdb_filename)[0]
    ligand_pdb_filename = f"{pdb_basename}_ligante.pdb"

    with open(ligand_pdb_filename, 'w') as ligand_pdb_file:
        ligand_pdb_file.writelines(ligand_residues)

    print(f"Arquivo {ligand_pdb_filename} gerado com sucesso!")


pdb_files = [file for file in os.listdir('.') if file.endswith('.pdb')]
pdb_dropdown = widgets.Dropdown(
    options=pdb_files,
    description='Arquivo PDB:'
)

ligand_resname_input = widgets.Text(
    description='Resíduo do Ligante:'
)

chain_id_input = widgets.Text(
    description='Cadeia do Ligante:'
)

run_button = widgets.Button(description='Extrair')


def run_button_clicked(b):
    pdb_filename = pdb_dropdown.value
    ligand_resname = ligand_resname_input.value
    chain_id = chain_id_input.value

    ligand_residues = extract_ligand_residue(pdb_filename, ligand_resname, chain_id)
    if ligand_residues:
        print("Resíduos do ligante encontrados:")
        for residue in ligand_residues:
            print(residue.strip())
        write_ligand_pdb(pdb_filename, ligand_residues)
    else:
        print("Nenhum resíduo do ligante encontrado para o resíduo e cadeia especificados.")


run_button.on_click(run_button_clicked)

display(pdb_dropdown, ligand_resname_input, chain_id_input, run_button)

Dropdown(description='Arquivo PDB:', options=('3guu.pdb', '3guu_chain_B.pdb', '3guu_chain_A.pdb'), value='3guu…

Text(value='', description='Resíduo do Ligante:')

Text(value='', description='Cadeia do Ligante:')

Button(description='Extrair', style=ButtonStyle())

Resíduos do ligante encontrados:
HETATM 6538  OH2 1PE A 442       0.938  36.194  18.658  1.00 30.31           O
HETATM 6539  C12 1PE A 442       1.907  35.883  17.641  1.00 26.29           C
HETATM 6540  C22 1PE A 442       3.008  36.920  17.731  1.00 25.82           C
HETATM 6541  OH3 1PE A 442       3.412  37.297  16.417  1.00 26.09           O
HETATM 6542  C13 1PE A 442       4.225  39.286  15.360  1.00 20.86           C
HETATM 6543  C23 1PE A 442       3.060  38.634  16.077  1.00 23.44           C
HETATM 6544  OH4 1PE A 442       3.890  40.656  15.153  1.00 21.26           O
HETATM 6545  C14 1PE A 442       4.406  42.606  13.723  1.00 17.81           C
HETATM 6546  C24 1PE A 442       4.857  41.252  14.260  1.00 17.39           C
HETATM 6547  OH5 1PE A 442       5.513  43.245  13.068  1.00 17.89           O
HETATM 6548  C15 1PE A 442       6.324  45.060  11.665  1.00 18.53           C
HETATM 6549  C25 1PE A 442       5.104  44.366  12.293  1.00 17.27           C
HETATM 6550  OH6 1P

In [None]:
#@title Visualize o ligante co-cristalizado
import py3Dmol
import os
from ipywidgets import widgets, interact

def visualize_pdb(pdb_filename):
    with open(pdb_filename, 'r') as pdb_file:
        pdb_data = pdb_file.read()

    view = py3Dmol.view(width=800, height=600)
    view.addModel(pdb_data, 'pdb')

    # Define o estilo para os resíduos de proteínas
    view.setStyle({'cartoon': {'color': 'spectrum'}})

    # Define o estilo para os resíduos não proteicos (representação de bastão)
    view.setStyle({'hetflag': True}, {'stick': {}})

    # Define o estilo para moléculas de água (esferas transparentes)
    view.setStyle({'resn': 'HOH'}, {'sphere': {'opacity': 0.5}})

    # Define o estilo para os demais ligantes (representação de bastão)
    view.setStyle({'hetflag': True, 'resn': '!HOH'}, {'stick': {}})

    view.zoomTo()
    view.show()

# Obtém a lista de arquivos .pdb no diretório atual
pdb_files = [file for file in os.listdir() if file.endswith(".pdb")]

# Cria um dropdown para selecionar o arquivo .pdb
pdb_dropdown = widgets.Dropdown(
    options=pdb_files,
    description='PDB file:',
    style={'description_width': 'initial'}
)
display(pdb_dropdown)

def visualize_selected_pdb(b):
    pdb_filename = pdb_dropdown.value
    visualize_pdb(pdb_filename)

# Botão para iniciar a visualização da proteína
button = widgets.Button(description="Visualizar")
display(button)
button.on_click(visualize_selected_pdb)

Dropdown(description='PDB file:', options=('3guu_ligante.pdb', '3guu.pdb', '3guu_chain_B.pdb', '3guu_chain_A.p…

Button(description='Visualizar', style=ButtonStyle())

In [None]:
#@title **Passo 5. Parametrize o ligante co-cristalizado com definição de pH e diretório de destino.**
#@markdown Este código realiza a conversão de arquivos PDB (Protein Data Bank) para arquivos PDBQT (AutoDock)
#@markdown com a capacidade de especificar um pH específico para as moléculas.

#@markdown O formato PDBQT é utilizado para realizar dockings moleculares com a ferramenta AutoDock Vina.

import openbabel
import os
import ipywidgets as widgets
from IPython.display import display
import tkinter as tk
from tkinter import filedialog

def convert_pdb_to_pdbqt(pdb_filename, pdbqt_filename, pH):
    conv = openbabel.OBConversion()
    conv.SetInAndOutFormats("pdb", "pdbqt")

    mol = openbabel.OBMol()
    conv.ReadFile(mol, pdb_filename)

    # Configure o pH desejado
    mol.SetTitle(f"pH={pH:.1f}")

    conv.WriteFile(mol, pdbqt_filename)

# Obter a lista de arquivos .pdb no diretório atual
pdb_files = [file for file in os.listdir('.') if file.endswith('.pdb')]

# Criar um dropdown para selecionar o arquivo .pdb
pdb_dropdown = widgets.Dropdown(
    options=pdb_files,
    description='Arquivo PDB:'
)

# Caixa de entrada para o pH de trabalho
pH_input = widgets.FloatText(
    description='pH:'
)

# Caixa de entrada para o diretório de destino
directory_input = widgets.Text(
    value='redocking',
    description='Diretório de destino:'
)

# Botão para iniciar a conversão
button = widgets.Button(description='Converter')

def convert_button_clicked(b):
    pdb_filename = pdb_dropdown.value
    pdbqt_filename = pdb_filename.replace('.pdb', '.pdbqt')
    pH = pH_input.value
    destination_directory = directory_input.value

    pdbqt_filepath = os.path.join(destination_directory, pdbqt_filename)

    convert_pdb_to_pdbqt(pdb_filename, pdbqt_filepath, pH)
    print(f"Conversão concluída. Arquivo {pdbqt_filepath} gerado com sucesso!")

# Associar a função ao evento de clique do botão
button.on_click(convert_button_clicked)

# Exibir os widgets
display(pdb_dropdown, pH_input, directory_input, button)

Dropdown(description='Arquivo PDB:', options=('3guu_ligante.pdb', '3guu.pdb', '3guu_chain_B.pdb', '3guu_chain_…

FloatText(value=0.0, description='pH:')

Text(value='redocking', description='Diretório de destino:')

Button(description='Converter', style=ButtonStyle())

Conversão concluída. Arquivo redocking/3guu_ligante.pdbqt gerado com sucesso!




In [None]:
#@title **Passo 6. Gerar o arquivo conf.txt com as coordenadas espaciais**

#@markdown Neste passo, é necessário especificar a proteína, o receptor, o resíduo do ligante e a cadeia a serem utilizados no processo.

#@markdown Também é necessário definir os parâmetros de exaustividade (exhaustiveness) e número de modos (num_modes).

#@markdown O **resíduo do ligante** e a **cadeia** especificados serão utilizados para determinar as coordenadas do ligante cocristalizado, que
#@markdown servirão como base para o processo de *docking* molecular.


import ipywidgets as widgets
from IPython.display import display
import os
import shutil

def get_ligand_coordinates(pdb_filename, ligand_resname, chain_id=None):
    with open(pdb_filename, 'r') as pdb_file:
        pdb_data = pdb_file.readlines()

    ligand_coordinates = []

    for line in pdb_data:
        if line.startswith("HETATM"):
            resname = line[17:20].strip()
            chain = line[21]
            if resname == ligand_resname and (chain_id is None or chain == chain_id):
                x = float(line[30:38].strip())
                y = float(line[38:46].strip())
                z = float(line[46:54].strip())
                ligand_coordinates.append((x, y, z))

    return ligand_coordinates

def calculate_grid_parameters(ligand_coordinates, padding=10.0):
    min_x = min(coord[0] for coord in ligand_coordinates)
    max_x = max(coord[0] for coord in ligand_coordinates)
    min_y = min(coord[1] for coord in ligand_coordinates)
    max_y = max(coord[1] for coord in ligand_coordinates)
    min_z = min(coord[2] for coord in ligand_coordinates)
    max_z = max(coord[2] for coord in ligand_coordinates)

    center_x = (max_x + min_x) / 2.0
    center_y = (max_y + min_y) / 2.0
    center_z = (max_z + min_z) / 2.0

    size_x = max_x - min_x + padding
    size_y = max_y - min_y + padding
    size_z = max_z - min_z + padding

    return center_x, center_y, center_z, size_x, size_y, size_z

def generate_conf_file(receptor_pdbqt, ligand_coordinates, padding=10.0, exhaustiveness=16, num_modes=30):
    center_x, center_y, center_z, size_x, size_y, size_z = calculate_grid_parameters(ligand_coordinates, padding)

    conf_data = f"""
receptor = {receptor_pdbqt}
out = out.pdbqt

center_x = {center_x}
center_y = {center_y}
center_z = {center_z}

size_x = {size_x}
size_y = {size_y}
size_z = {size_z}

exhaustiveness = {exhaustiveness}
num_modes = {num_modes}
"""

    return conf_data

def display_conf_file(conf_data):
    print(conf_data)

pdb_files = [file for file in os.listdir('.') if file.endswith('.pdb')]
pdb_dropdown = widgets.Dropdown(
    options=pdb_files,
    description='Arquivo PDB:'
)

receptor_files = [file for file in os.listdir('.') if file.endswith('.pdbqt')]
receptor_dropdown = widgets.Dropdown(
    options=receptor_files,
    description='Arquivo Receptor PDBQT:'
)

ligand_resname_input = widgets.Text(
    description='Resíduo do Ligante:'
)

chain_id_input = widgets.Text(
    description='Cadeia do Ligante'
)
exhaustiveness_input = widgets.IntText(
    value=16,
    description='Exhaustiveness:'
)

num_modes_input = widgets.IntText(
    value=30,
    description='Num Modes:'
)

run_button = widgets.Button(description='Executar')

def run_button_clicked(b):
    pdb_filename = pdb_dropdown.value
    receptor_pdbqt = receptor_dropdown.value
    ligand_resname = ligand_resname_input.value
    chain_id = chain_id_input.value
    exhaustiveness = exhaustiveness_input.value
    num_modes = num_modes_input.value

    ligand_coordinates = get_ligand_coordinates(pdb_filename, ligand_resname, chain_id)

    # Cria o diretório de docking com o nome correto
    dock_dir = f"redocking"
    os.makedirs(dock_dir, exist_ok=True)

    conf_data = generate_conf_file(receptor_pdbqt, ligand_coordinates, exhaustiveness=exhaustiveness, num_modes=num_modes)

    conf_file_path = os.path.join(dock_dir, 'conf.txt')
    with open(conf_file_path, 'w') as conf_file:
        conf_file.write(conf_data)

    display_conf_file(conf_data)

run_button.on_click(run_button_clicked)

display(pdb_dropdown, receptor_dropdown, ligand_resname_input, chain_id_input, exhaustiveness_input, num_modes_input, run_button)

Dropdown(description='Arquivo PDB:', options=('3guu_ligante.pdb', '3guu.pdb', '3guu_chain_B.pdb', '3guu_chain_…

Dropdown(description='Arquivo Receptor PDBQT:', options=('3guu_chain_A.pdbqt',), value='3guu_chain_A.pdbqt')

Text(value='', description='Resíduo do Ligante:')

Text(value='', description='Cadeia do Ligante')

IntText(value=16, description='Exhaustiveness:')

IntText(value=30, description='Num Modes:')

Button(description='Executar', style=ButtonStyle())


receptor = 3guu_chain_A.pdbqt
out = out.pdbqt

center_x = 3.8815
center_y = 42.054500000000004
center_z = 13.502

size_x = 15.887
size_y = 22.342999999999996
size_z = 20.312

exhaustiveness = 16
num_modes = 30



# **Parte 2 - Redocking molecular**

In [None]:
#@title Mudar o diretorio para o Redocking

import os

# Definir o caminho para o diretório desejado
dock_dir = "/content/redocking"

# Mudar para o diretório desejado
os.chdir(dock_dir)

In [None]:
#@title **Passo 7. Gerar script vina_vs.sh para rodar o Autodock Vina**

import os
import subprocess

# Obter o caminho do diretório atual
current_dir = os.getcwd()

# Definir o nome e o caminho do arquivo do script shell
script_filename = os.path.join(current_dir, "vina_vs.sh")

# Definir o conteúdo do script shell
script_content = '''\
#!/bin/bash
for f in *.pdbqt; do
    b=$(basename "$f" .pdbqt)
    echo "Processing ligand $b"
    vina --config conf.txt --ligand "$f" --out "${b}_out.pdbqt" --log "${b}_log.txt"
done
'''

# Criar o arquivo do script shell
with open(script_filename, 'w') as script_file:
    script_file.write(script_content)

# Dar permissão de execução ao arquivo do script shell
subprocess.run(["chmod", "+x", script_filename])

CompletedProcess(args=['chmod', '+x', '/content/redocking/vina_vs.sh'], returncode=0)

In [None]:
#@title Obter a lista de arquivos no diretório atual
#@markdown Confira se tem todos os arquivos necessários para rodar o Autodock Vina.

#@markdown **receptor.pdbqt**;

#@markdown **ligante.pdbqt**;

#@markdown **conf.txt**;

#@markdown **vina_vs.sh**

import os

files = os.listdir()

# Exibir os nomes dos arquivos
for file in files:
    print(file)


conf.txt
3guu_ligante.pdbqt
3guu_chain_A.pdbqt
3guu_chain_A.pqr
vina_vs.sh
3guu_chain_A.log


In [None]:
#@title **Executar o Autodock Vina**
!bash vina_vs.sh

Processing ligand 3guu_chain_A
#################################################################
# If you used AutoDock Vina in your work, please cite:          #
#                                                               #
# O. Trott, A. J. Olson,                                        #
# AutoDock Vina: improving the speed and accuracy of docking    #
# with a new scoring function, efficient optimization and       #
# multithreading, Journal of Computational Chemistry 31 (2010)  #
# 455-461                                                       #
#                                                               #
# DOI 10.1002/jcc.21334                                         #
#                                                               #
# Please see http://vina.scripps.edu for more information.      #
#################################################################

Detected 2 CPUs
Reading input ... 

Parse error on line 1 in file "3guu_chain_A.pdbqt": Unknown or inappropria

**Validação do Redocking Molecular através da Análise de Sobreposição e RMSD**

*Nesta etapa do pipeline, procederemos à validação do Redocking molecular por meio de uma análise criteriosa da sobreposição entre as estruturas e do valor do RMSD.*

A sobreposição entre as estruturas obtidas durante o processo de Redocking será minuciosamente examinada, e o valor do RMSD será calculado para avaliar a precisão das predições.

Considerando os resultados, se o valor do RMSD for menor que 2.0 Å (Angströms), poderemos afirmar que o Redocking foi validado com sucesso.

Essa etapa é crucial para assegurar a confiabilidade das técnicas empregadas e obter insights relevantes sobre a acurácia do Redocking molecular realizado. Os resultados obtidos aqui influenciarão diretamente no prosseguimento do pipeline e nas conclusões finais do experimento.

In [None]:
#@title **Passo 8. Extrair as poses do *Redocking***


import os
import ipywidgets as widgets

def extract_poses(file_path, output_directory):
    with open(file_path, 'r') as file:
        content = file.read()

    poses = content.split('MODEL')  # Dividir o conteúdo em poses individuais

    for i, pose in enumerate(poses[1:], start=1):
        pose_content = 'MODEL' + pose

        # Salvar cada pose em um arquivo separado
        pose_file_path = os.path.join(output_directory, f'pose_{i}.pdbqt')
        with open(pose_file_path, 'w') as pose_file:
            pose_file.write(pose_content)

        print(f"Pose {i} extraída e salva como {pose_file_path}")

# Obter a lista de arquivos .pdbqt no diretório atual
pdbqt_files = [file for file in os.listdir('.') if file.endswith('.pdbqt')]

# Criar um dropdown para selecionar o arquivo .pdbqt
pdbqt_dropdown = widgets.Dropdown(
    options=pdbqt_files,
    description='Arquivo PDBQT:'
)

# Especificar o diretório de saída para as poses extraídas
output_directory = '.'

# Botão para iniciar a extração das poses
button = widgets.Button(description='Extrair Poses')

def extract_button_clicked(b):
    pdbqt_filename = pdbqt_dropdown.value
    file_path = os.path.join('.', pdbqt_filename)
    extract_poses(file_path, output_directory)

# Associar a função ao evento de clique do botão
button.on_click(extract_button_clicked)

# Exibir o dropdown e o botão
display(pdbqt_dropdown, button)

Dropdown(description='Arquivo PDBQT:', options=('3guu_ligante.pdbqt', '3guu_chain_A.pdbqt', '3guu_ligante_out.…

Button(description='Extrair Poses', style=ButtonStyle())

Pose 1 extraída e salva como ./pose_1.pdbqt
Pose 2 extraída e salva como ./pose_2.pdbqt
Pose 3 extraída e salva como ./pose_3.pdbqt
Pose 4 extraída e salva como ./pose_4.pdbqt
Pose 5 extraída e salva como ./pose_5.pdbqt
Pose 6 extraída e salva como ./pose_6.pdbqt
Pose 7 extraída e salva como ./pose_7.pdbqt
Pose 8 extraída e salva como ./pose_8.pdbqt
Pose 9 extraída e salva como ./pose_9.pdbqt
Pose 10 extraída e salva como ./pose_10.pdbqt
Pose 11 extraída e salva como ./pose_11.pdbqt
Pose 12 extraída e salva como ./pose_12.pdbqt
Pose 13 extraída e salva como ./pose_13.pdbqt
Pose 14 extraída e salva como ./pose_14.pdbqt
Pose 15 extraída e salva como ./pose_15.pdbqt


In [None]:
#@title **Conversão de arquivos PDBQT para PDB usando Openbabel**

#@markdown Nesta etapa, iremos converter os arquivos selecionados do
#@markdown formato .pdbqt para .pdb. Além disso, serão adicionados hidrogênios a esses arquivos,
#@markdown a fim de possibilitar o cálculo posterior do RMSD (*Root-Mean-Square-Deviation*)


import os
import glob
import openbabel

# Função para converter o arquivo .pdbqt para .pdb e adicionar hidrogênios
def convert_pdbqt_to_pdb(input_path, output_path):
    # Criar objetos Open Babel para o arquivo de entrada (pdbqt) e o arquivo de saída (pdb)
    pdbqt = openbabel.OBMol()
    conv = openbabel.OBConversion()
    conv.SetInAndOutFormats("pdbqt", "pdb")
    conv.ReadFile(pdbqt, input_path)

    # Escrever a estrutura convertida para o arquivo de saída
    conv.WriteFile(pdbqt, output_path)

    # Criar um novo objeto para a molécula convertida com os hidrogênios adicionados
    conv = openbabel.OBConversion()
    conv.SetInAndOutFormats("pdb", "pdb")
    mol = openbabel.OBMol()
    conv.ReadFile(mol, output_path)

    # Adicionar percepção de conectividade antes de adicionar hidrogênios
    mol.AddHydrogens()

    # Escrever a estrutura com hidrogênios adicionados para o arquivo de saída final
    conv.WriteFile(mol, output_path)

# Listar todos os arquivos .pdbqt presentes no diretório de trabalho
arquivos_pdbqt = glob.glob("*.pdbqt")

# Verificar se existem arquivos .pdbqt disponíveis
if not arquivos_pdbqt:
    print("Nenhum arquivo .pdbqt encontrado no diretório de trabalho.")
    exit()

# Exibir o menu com os arquivos .pdbqt disponíveis
print("Arquivos .pdbqt disponíveis para conversão:")
for i, arquivo in enumerate(arquivos_pdbqt, 1):
    print(f"{i}. {arquivo}")

# Solicitar ao usuário que selecione o arquivo .pdbqt de entrada
opcao = int(input("Digite o número correspondente ao arquivo .pdbqt que deseja converter: "))

# Verificar se a opção selecionada é válida
if opcao not in range(1, len(arquivos_pdbqt) + 1):
    print("Opção inválida.")
    exit()

# Obter o caminho completo do arquivo .pdbqt de entrada
input_file = os.path.abspath(arquivos_pdbqt[opcao - 1])

# Obter o nome do arquivo sem o caminho e a extensão
file_name_without_ext = os.path.splitext(os.path.basename(input_file))[0]

# Concatenar o caminho do diretório de trabalho com o nome do arquivo .pdb convertido
output_file = os.path.join(os.getcwd(), file_name_without_ext + "_with_hydrogens.pdb")

# Converter o arquivo .pdbqt para .pdb e adicionar hidrogênios
convert_pdbqt_to_pdb(input_file, output_file)

print("Conversão concluída. Arquivo .pdb com hidrogênios salvo como:", output_file)


Arquivos .pdbqt disponíveis para conversão:
1. pose_1.pdbqt
2. pose_2.pdbqt
Digite o número correspondente ao arquivo .pdbqt que deseja converter: 2
Conversão concluída. Arquivo .pdb com hidrogênios salvo como: /content/redocking/pose_2_with_hydrogens.pdb


In [None]:
#@title **Cálcular o RMSD do ligante co-cristalizado da etapa de redocking**

#@markdown Nesta etapa, iremos cálcular o RMSD (*Root-Mean-Square-Deviation*)
#@markdown entre o ligante co-cristalizado e a melhor pose do redocking.

import os
import numpy as np
from Bio import PDB

def align_and_calculate_rmsd(reference_structure, mobile_structure):
    # Filtra apenas os átomos pesados (não hidrogênio)
    def filter_heavy_atoms(structure):
        return [atom for atom in structure.get_atoms() if atom.element != "H"]

    fixed_atoms = filter_heavy_atoms(reference_structure)
    moving_atoms = filter_heavy_atoms(mobile_structure)

    # Realiza o alinhamento dos átomos pesados
    super_imposer = PDB.Superimposer()
    super_imposer.set_atoms(fixed_atoms, moving_atoms)
    super_imposer.apply(mobile_structure.get_atoms())

    # Calcula o RMSD
    rmsd = np.sqrt(np.mean(np.square(super_imposer.rms)))

    return rmsd

# Diretório padrão para as estruturas PDB
directory = '/content/redocking'

# Listar arquivos .pdb disponíveis no diretório
available_pdb_files = [file for file in os.listdir(directory) if file.endswith(".pdb")]
print("Arquivos .pdb disponíveis no diretório:")
for idx, file in enumerate(available_pdb_files, start=1):
    print(f"{idx}. {file}")

# Solicitar ao usuário o número dos arquivos de referência e móvel a serem usados
reference_idx = int(input("Digite o número do arquivo de referência (PDB): ")) - 1
mobile_idx = int(input("Digite o número do arquivo móvel (PDB): ")) - 1

# Obter os caminhos completos dos arquivos selecionados
reference_file = os.path.join(directory, available_pdb_files[reference_idx])
mobile_file = os.path.join(directory, available_pdb_files[mobile_idx])

# Carregar as duas estruturas PDB selecionadas
parser = PDB.PDBParser(QUIET=True)
reference_structure = parser.get_structure("reference", reference_file)
mobile_structure = parser.get_structure("mobile", mobile_file)

# Alinhar as estruturas móveis na estrutura de referência, ignorando os átomos de hidrogênio
rmsd = align_and_calculate_rmsd(reference_structure[0], mobile_structure[0])

# Imprimir o valor do RMSD
print("O valor do RMSD entre as duas estruturas é:", rmsd)

# Criar um arquivo .txt para salvar o valor do RMSD
output_txt = os.path.join(directory, "rmsd_result.txt")
with open(output_txt, "w") as file:
    file.write(f"RMSD entre as estruturas: {rmsd:.4f}")

print(f"O valor do RMSD foi salvo em: {output_txt}")


Arquivos .pdb disponíveis no diretório:
1. pose_1_with_hydrogens.pdb
2. pose_2_with_hydrogens.pdb
Digite o número do arquivo de referência (PDB): 1
Digite o número do arquivo móvel (PDB): 2
O valor do RMSD entre as duas estruturas é: 0.8322487246336618
O valor do RMSD foi salvo em: /content/redocking/rmsd_result.txt


In [None]:
#@title Exibir o ligante cocristalizado com a melhor pose

from google.colab import output
output.enable_custom_widget_manager()
import numpy as np
from Bio import PDB
import nglview as nv
import tempfile
import os
import ipywidgets as widgets
import glob

def align_structures(reference_structure, mobile_structure):
    # Filtra apenas os átomos pesados (não hidrogênio)
    def filter_heavy_atoms(structure):
        return [atom for atom in structure.get_atoms() if atom.element != "H"]

    fixed_atoms = filter_heavy_atoms(reference_structure)
    moving_atoms = filter_heavy_atoms(mobile_structure)

    # Realiza o alinhamento dos átomos pesados
    super_imposer = PDB.Superimposer()
    super_imposer.set_atoms(fixed_atoms, moving_atoms)
    super_imposer.apply(mobile_structure.get_atoms())

# Função para carregar os arquivos .pdb e visualizar a estrutura
def load_and_visualize_pdb_files(_):
    reference_file = reference_file_widget.value
    mobile_file = mobile_file_widget.value

    # Carregue as duas estruturas PDB
    parser = PDB.PDBParser(QUIET=True)
    reference_structure = parser.get_structure("reference", reference_file)
    mobile_structure = parser.get_structure("mobile", mobile_file)

    # Alinhe as estruturas móveis na estrutura de referência, ignorando os átomos de hidrogênio
    align_structures(reference_structure[0], mobile_structure[0])

    # Salve a estrutura móvel alinhada em um arquivo temporário
    temp_pdb_file = tempfile.NamedTemporaryFile(suffix=".pdb", delete=False)
    io = PDB.PDBIO()
    io.set_structure(mobile_structure)
    io.save(temp_pdb_file.name)
    temp_pdb_file.close()

    # Visualize o resultado com NGLview
    view = nv.show_structure_file(reference_file)
    view.add_component(temp_pdb_file.name, default_representation=True)
    view.center()
    view._remote_call("setSize", target="Widget", args=["100%", "500px"]) # Ajuste o tamanho do visualizador

    # Remova o arquivo temporário após a visualização
    os.remove(temp_pdb_file.name)

    display(view)

# Obtenha a lista de arquivos .pdb no diretório atual
pdb_files = glob.glob("*.pdb")

# Crie o menu suspenso com as opções dos arquivos .pdb disponíveis
reference_file_widget = widgets.Dropdown(options=pdb_files)
mobile_file_widget = widgets.Dropdown(options=pdb_files)

# Crie o botão "Visualizar"
visualize_button = widgets.Button(description="Visualizar")
visualize_button.on_click(load_and_visualize_pdb_files)

# Exiba o menu suspenso e o botão para o usuário
widgets.VBox([widgets.Label("Escolha os arquivos .pdb:"), reference_file_widget, mobile_file_widget, visualize_button])




VBox(children=(Label(value='Escolha os arquivos .pdb:'), Dropdown(options=('pose_1_with_hydrogens.pdb', '3guu_…

NGLWidget()

In [None]:
#Voltar para o diretório anterior
os.chdir("..")

In [None]:
#@title Crie um diretório chamado "docking" e copie os arquivos
#@markdown Insira o nome dos arquivos:

#@markdown **receptor.pdbqt e conf.txt**


import os
import shutil

# Diretório de origem e destino
diretorio_origem = '/content/redocking'
diretorio_destino = '/content/docking'

# Verificar se o diretório de origem existe
if not os.path.exists(diretorio_origem):
    print("O diretório de origem não existe. Verifique o caminho e tente novamente.")
else:
    # Criar o diretório de destino se ainda não existir
    if not os.path.exists(diretorio_destino):
        os.mkdir(diretorio_destino)
        print(f"Diretório '{diretorio_destino}' criado com sucesso!")

    # Listar os arquivos no diretório de origem
    arquivos_no_diretorio = os.listdir(diretorio_origem)

    # Exibir a lista de arquivos para o usuário escolher
    print("Arquivos disponíveis no diretório de origem:")
    for i, arquivo in enumerate(arquivos_no_diretorio, start=1):
        print(f"{i}. {arquivo}")

    # Solicitar ao usuário que escolha os arquivos a serem copiados
    escolha = input("Digite os números dos arquivos separados por vírgula (exemplo: 1,2): ")

    # Converter a entrada em uma lista de números inteiros
    numeros_escolhidos = [int(x.strip()) for x in escolha.split(',') if x.strip().isdigit()]

    # Copiar os arquivos escolhidos para o diretório de destino
    for numero in numeros_escolhidos:
        if 1 <= numero <= len(arquivos_no_diretorio):
            arquivo_escolhido = arquivos_no_diretorio[numero - 1]
            caminho_origem = os.path.join(diretorio_origem, arquivo_escolhido)
            caminho_destino = os.path.join(diretorio_destino, arquivo_escolhido)
            shutil.copy(caminho_origem, caminho_destino)
            print(f"Arquivo '{arquivo_escolhido}' copiado para o diretório '{diretorio_destino}' com sucesso!")
        else:
            print(f"O número {numero} não corresponde a nenhum arquivo válido.")


O diretório de origem não existe. Verifique o caminho e tente novamente.


**Preparação dos Ligantes para o AutoDock Vina**

Após validar a técnica de docking molecular com o redocking, vamos agora proceder à preparação dos ligantes para o AutoDock Vina. Siga atentamente as instruções abaixo:

1. Insira o(s) SMILES do(s) ligante(s).

2. Utilize o Openbabel para converter os SMILES em um formato 3D MOL2 e, em seguida, realize uma minimização de energia do conformero utilizando a força de campo GAFF. Posteriormente, faça a conversão para o formato PDBQT, ajustando o pH conforme necessário.

3. Verifique se todos os arquivos necessários para executar o AutoDock Vina estão presentes no diretório de trabalho.

Assegure-se de seguir as diretrizes apropriadas para o preparo do ligante, levando em consideração os requisitos específicos do AutoDock Vina e seguindo as melhores práticas para a preparação dos ligantes para o *docking*.

# **Parte 3 - *Docking* molecular**

In [None]:
#@title Criar uma pasta "ligands"
#@markdown Insira o codigo SMILES quando solicitado

import os
from pathlib import Path

#Vamos primeiro criar um caminho para a pasta onde salvaremos os ligantes
#Observe que a pasta HOME para um tempo de execução hospedado no colab é /content/
ligandpath = Path("/content/ligands/")

#Agora, criamos a pasta usando o comando os.makedirs()
#A condicional if serve apenas para verificar se a pasta já existe
#Nesse caso, o python retorna um erro
if not os.path.exists(ligandpath):
    os.makedirs(ligandpath)
    print("O caminho dos ligantes foi criado com sucesso")

# Obter o SMILES e o nome do arquivo do usuário
smiles = input("Digite o SMILES da molécula: ")
nome_arquivo = input("Digite o nome do arquivo (sem extensão): ")

# Salvar o SMILES no arquivo dentro do diretório de ligantes
arquivo_path = ligandpath / (nome_arquivo + ".smiles")
arquivo_path.write_text(smiles)

print(f"SMILES salvo com sucesso no arquivo: {arquivo_path}")


O caminho dos ligantes foi criado com sucesso
Digite o SMILES da molécula: O=C1C23C(CCC3C(CC(OC(C)=O)CC(C)=C)(C)O1)(C)C4=CCC5C(C)(C)C(OC6OCC(OC7C(O)C(OC8C(O)C(OC)C(O)C(CO)O8)C(O)C(CO)O7)C(O)C6OC9OCC(OC%10C(O)C(OC%11C(O)C(OC)C(O)C(CO)O%11)C(O)C(CO)O%10)C(O)C9O)CCC5(C)C4CC2
Digite o nome do arquivo (sem extensão): 7-ENO-LACTONE-C3
SMILES salvo com sucesso no arquivo: /content/ligands/7-ENO-LACTONE-C3.smiles


In [None]:
#@title Use o seguinte visualizador para carregar seus SMILES como uma molécula 3D
#@markdown Visualize os ligantes

import os
import ipywidgets
import py3Dmol
import kora.install.rdkit
from rdkit import Chem
from rdkit.Chem import AllChem
from pathlib import Path
import glob

def MolTo3DView(mol, size=(300, 300), style="stick", surface=False, opacity=0.5):
    assert style in ('line', 'stick', 'sphere', 'carton')
    mblock = Chem.MolToMolBlock(mol)
    viewer = py3Dmol.view(width=size[0], height=size[1])
    viewer.addModel(mblock, 'mol')
    viewer.setStyle({style:{}})
    if surface:
        viewer.addSurface(py3Dmol.SAS, {'opacity': opacity})
    viewer.zoomTo()
    return viewer

def smi2conf(smiles):
    '''Convert SMILES to rdkit.Mol with 3D coordinates'''
    mol = Chem.MolFromSmiles(smiles)
    if mol is not None:
        mol = Chem.AddHs(mol)
        AllChem.EmbedMolecule(mol)
        AllChem.MMFFOptimizeMolecule(mol, maxIters=200)
        return mol
    else:
        return None

# Diretório dos arquivos .smiles
ligandpath = "/content/ligands"

# Listar todos os arquivos .smiles presentes no diretório
arquivos_smiles = glob.glob(os.path.join(ligandpath, "*.smiles"))

# Verificar se existem arquivos .smiles disponíveis
if not arquivos_smiles:
    print("Nenhum arquivo .smiles encontrado no diretório.")
else:
    # Criar um dropdown (menu suspenso) para selecionar o arquivo .smiles
    dropdown = ipywidgets.Dropdown(
        options=[os.path.basename(file) for file in arquivos_smiles],
        description='Arquivo .smiles:',
    )
    display(dropdown)

def on_visualizar_button_clicked(b):
    arquivo_path = os.path.join(ligandpath, dropdown.value)
    # Verificar se o arquivo existe e, se sim, visualizá-lo
    if os.path.exists(arquivo_path):
        smiles = Path(arquivo_path).read_text()
        conf = smi2conf(smiles)
        if conf:
            viewer = MolTo3DView(conf)
            viewer.show()
        else:
            print("Erro ao converter o arquivo .smiles para molécula 3D.")
    else:
        print("O arquivo não existe. Por favor, verifique o nome do arquivo.")

# Criar um botão para iniciar a visualização do arquivo selecionado
visualizar_button = ipywidgets.Button(description="Visualizar")
visualizar_button.on_click(on_visualizar_button_clicked)
display(visualizar_button)


Dropdown(description='Arquivo .smiles:', options=('7-ENO-LACTONE-C3.smiles',), value='7-ENO-LACTONE-C3.smiles'…

Button(description='Visualizar', style=ButtonStyle())

ValueError: ignored

ValueError: ignored

In [None]:
#@title **Converter SMILES em MOL2**

#@markdown Essa célula será utilizada para conversão dos SMILES em MOL2 utilizando o Openbabel


# -*- coding: utf-8 -*-
import os

def convert_smiles_to_mol2(input_smiles, output_mol2):
    cmd = "obabel {} -O {} --gen3d --best --canonical --minimize --ff GAFF --steps 10000 --sd".format(input_smiles, output_mol2)
    os.system(cmd)

def main():
    ligands_dir = "/content/ligands"
    smiles_files = [f for f in os.listdir(ligands_dir) if f.endswith('.smiles')]

    if not smiles_files:
        print("Nenhum arquivo .smiles encontrado na pasta /content/ligands.")
        return

    print("Arquivos .smiles encontrados na pasta /content/ligands:")
    for idx, smiles_file in enumerate(smiles_files):
        print("{}. {}".format(idx + 1, smiles_file))

    for smiles_file in smiles_files:
        input_smiles = os.path.join(ligands_dir, smiles_file)
        output_mol2 = os.path.join(ligands_dir, os.path.splitext(smiles_file)[0] + ".mol2")
        convert_smiles_to_mol2(input_smiles, output_mol2)

    print("Conversão e minimização de energia concluídas para todos os arquivos .smiles.")
    print("Os arquivos .mol2 foram salvos na pasta /content.")

if __name__ == "__main__":
    main()


Arquivos .smiles encontrados na pasta /content/ligands:
1. 7-ENO-LACTONE-C3.smiles
Conversão e minimização de energia concluídas para todos os arquivos .smiles.
Os arquivos .mol2 foram salvos na pasta /content.


In [None]:
#@title **Converter MOL2 em PDBQT**
#@markdown Vamos converter os ligantes utilizando a ferramenta Openbabel em pH de trabalho

import openbabel
import os
import ipywidgets as widgets
from IPython.display import display
import tkinter as tk
from tkinter import filedialog

def convert_mol2_to_pdbqt(mol2_filename, pdbqt_filename, pH):
    conv = openbabel.OBConversion()
    conv.SetInAndOutFormats("mol2", "pdbqt")

    mol = openbabel.OBMol()
    conv.ReadFile(mol, mol2_filename)

    # Configure o pH desejado
    mol.SetTitle(f"pH={pH:.1f}")

    conv.WriteFile(mol, pdbqt_filename)

# Obter a lista de arquivos .mol2 no diretório /content/ligands
ligands_dir = '/content/ligands'
mol2_files = [file for file in os.listdir(ligands_dir) if file.endswith('.mol2')]

if not mol2_files:
    print("Nenhum arquivo .mol2 encontrado na pasta /content/ligands.")
else:
    print("Arquivos .mol2 encontrados na pasta /content/ligands:")
    for idx, mol2_file in enumerate(mol2_files):
        print(f"{idx + 1}. {mol2_file}")

    # Caixa de entrada para o pH de trabalho
    pH_input = widgets.FloatText(
        description='pH:'
    )

    # Caixa de entrada para o diretório de destino
    directory_input = widgets.Text(
        value='/content/docking',
        description='Diretório de destino:'
    )

    # Botão para iniciar a conversão
    button = widgets.Button(description='Converter')

    def convert_button_clicked(b):
        pH = pH_input.value
        destination_directory = directory_input.value

        for mol2_file in mol2_files:
            mol2_filepath = os.path.join(ligands_dir, mol2_file)
            pdbqt_filename = mol2_file.replace('.mol2', '.pdbqt')
            pdbqt_filepath = os.path.join(destination_directory, pdbqt_filename)

            convert_mol2_to_pdbqt(mol2_filepath, pdbqt_filepath, pH)
            print(f"Conversão concluída. Arquivo {pdbqt_filepath} gerado com sucesso!")

    # Associar a função ao evento de clique do botão
    button.on_click(convert_button_clicked)

    # Exibir os widgets
    display(pH_input, directory_input, button)


Arquivos .mol2 encontrados na pasta /content/ligands:
1. 7-ENO-LACTONE-C3.mol2


FloatText(value=0.0, description='pH:')

Text(value='/content/docking', description='Diretório de destino:')

Button(description='Converter', style=ButtonStyle())

Conversão concluída. Arquivo /content/docking/7-ENO-LACTONE-C3.pdbqt gerado com sucesso!




In [None]:
#@title **Mudar para o diretorio de trabalho "Docking"**


import os

# Definir o caminho para o diretório desejado
dock_dir = "/content/docking"

# Mudar para o diretório desejado
os.chdir(dock_dir)

In [None]:
#@title **Gerar script vina_vs.sh para rodar o Autodock Vina**

import os
import subprocess

# Obter o caminho do diretório atual
current_dir = os.getcwd()

# Definir o nome e o caminho do arquivo do script shell
script_filename = os.path.join(current_dir, "vina_vs.sh")

# Definir o conteúdo do script shell
script_content = '''\
#! /bin/bash
for f in *.pdbqt; do
    b=`basename $f .pdbqt`
    echo Processing ligand $b
    mkdir -p $b
    vina --config conf.txt --ligand $f --out ${b}/out.pdbqt --log ${b}/log.txt
done

'''

# Criar o arquivo do script shell
with open(script_filename, 'w') as script_file:
    script_file.write(script_content)

# Dar permissão de execução ao arquivo do script shell
subprocess.run(["chmod", "+x", script_filename])

CompletedProcess(args=['chmod', '+x', '/content/docking/vina_vs.sh'], returncode=0)

In [None]:
#@title **Obter a lista de arquivos no diretório atual**
#@markdown Confira se tem todos os arquivos necessários para rodar o Autodock Vina.

#@markdown **receptor.pdbqt**;
#@markdown **ligantes.pdbqt**;
#@markdown **conf.txt**;
#@markdown **vina_vs.sh**


import os

files = os.listdir()

# Exibir os nomes dos arquivos
for file in files:
    print(file)


7-ENO-LACTONE-C3.pdbqt
conf.txt
Cluster_1.pdbqt
vina_vs.sh


In [None]:
#@title **Executar o Autodock Vina**
!bash vina_vs.sh

Processing ligand 7-ENO-LACTONE-C3
#################################################################
# If you used AutoDock Vina in your work, please cite:          #
#                                                               #
# O. Trott, A. J. Olson,                                        #
# AutoDock Vina: improving the speed and accuracy of docking    #
# with a new scoring function, efficient optimization and       #
# multithreading, Journal of Computational Chemistry 31 (2010)  #
# 455-461                                                       #
#                                                               #
# DOI 10.1002/jcc.21334                                         #
#                                                               #
# Please see http://vina.scripps.edu for more information.      #
#################################################################

Detected 2 CPUs
Reading input ... done.
Setting up the scoring function ... done.
Analyzing the binding si

**Finalização do Pipeline - Salvando o Trabalho no Google Drive**

Agora que concluímos todo o trabalho, é hora de salvar os resultados no Google Drive.

Passo 1: Por favor, substitua o nome padrão "docking_5ikr" pelo nome de sua preferência antes de prosseguir.

Passo 2: É importante notar que existem algumas pastas/arquivos pré-definidas que devem ser ignoradas. Caso necessário, atualize essa lista para evitar sobrecarregar seu espaço no Google Drive.

Com essas etapas concluídas, você pode prosseguir e salvar todo o trabalho realizado no Google Drive para garantir a segurança e o compartilhamento adequado dos resultados obtidos.

In [None]:
#Voltar para o diretório anterior
os.chdir("..")

In [None]:
import zipfile
import os

# Diretório atual
current_dir = os.getcwd()

# Nome do arquivo zip
zip_filename = "/content/drive/MyDrive/daniel_CalA.zip"

# Lista de pastas a serem ignoradas
ignored_folders = ["autodock_vina_1_1_2_linux_x86.tgz", "condacolab_install.log", "sample_data", ".conf", "autodock_vina_1_1_2_linux_x86", "drive"]

# Função para verificar se um caminho pertence a uma pasta ignorada
def is_ignored(path):
    for folder in ignored_folders:
        if folder in path:
            return True
    return False

# Criação do arquivo zip
with zipfile.ZipFile(zip_filename, 'w') as zipf:
    # Percorre todos os arquivos e subdiretórios do diretório atual
    for root, dirs, files in os.walk(current_dir):
        # Remove as pastas ignoradas da lista de diretórios
        dirs[:] = [d for d in dirs if not is_ignored(os.path.join(root, d))]

        for file in files:
            # Caminho completo para o arquivo
            file_path = os.path.join(root, file)

            # Verifica se o arquivo pertence a uma pasta ignorada
            if is_ignored(file_path):
                # Ignora o arquivo se pertencer a uma pasta ignorada
                continue

            # Adiciona o arquivo ao arquivo zip
            zipf.write(file_path, os.path.relpath(file_path, current_dir))
            print(f"Arquivo adicionado: {file_path}")

print("Arquivos compactados com sucesso!")


Arquivo adicionado: /content/3guu_ligante.pdb
Arquivo adicionado: /content/3guu_chain_A.pdbqt
Arquivo adicionado: /content/3guu.pdb
Arquivo adicionado: /content/3guu_chain_B.pdb
Arquivo adicionado: /content/vina_vs.sh
Arquivo adicionado: /content/3guu_chain_A.pdb
Arquivo adicionado: /content/redocking/pose_4.pdbqt
Arquivo adicionado: /content/redocking/conf.txt
Arquivo adicionado: /content/redocking/pose_1_with_hydrogens.pdb
Arquivo adicionado: /content/redocking/pose_14.pdbqt
Arquivo adicionado: /content/redocking/3guu_ligante_log.txt
Arquivo adicionado: /content/redocking/pose_15.pdbqt
Arquivo adicionado: /content/redocking/pose_12.pdbqt
Arquivo adicionado: /content/redocking/pose_10.pdbqt
Arquivo adicionado: /content/redocking/pose_7.pdbqt
Arquivo adicionado: /content/redocking/3guu_ligante.pdbqt
Arquivo adicionado: /content/redocking/pose_1.pdbqt
Arquivo adicionado: /content/redocking/3guu_chain_A_log.txt
Arquivo adicionado: /content/redocking/pose_3.pdbqt
Arquivo adicionado: /cont