# Práctica 6: MODELADO DE PROTEÍNAS PARA EL DISEÑO RACIONAL DE FÁRMACOS
## 1. Introducción

Las estructuras de las proteínas determinan con qué moléculas va a interaccionar y, por tanto, su función. Actualmente, los métodos de determinación de secuencias de proteínas están muy optimizados, pero no los de [estructuras tridimensionales](https://pdb101.rcsb.org/learn/guide-to-understanding-pdb-data/methods-for-determining-structure). Actualmente las técnicas que proporcionan información de las estructuras de macromoléculas biológicas son:

* [Resonancia Magnética Nuclear (RMN)](https://www.youtube.com/watch?v=t8JIBwLsCGA)
* [Crio-Microscopia Electrónica](https://www.youtube.com/watch?v=vLo7oqfRa74)
* [Cristalografía de rayos X](https://www.youtube.com/watch?v=RUok4O9oovQ) (esta técnica la veremos en más detalle en la asignatura de Técnicas Instrumentales Avanzadas)

Podemos obtener la estructura final de la macromolécula por medio de estas estas técnicas, pero es un proceso muy laboriosas y con un alto coste económico.

En los años 1960, los experimentos pioneros de [Anfinsen](https://www.bbvaopenmind.com/ciencia/biociencias/anfinsen-y-la-arquitectura-de-las-proteinas/) con la ribinucleasa fueron claves para demostrar algo que actualmente esta totalmente admitido: el plegamiento tridimensional final de la proteína esta dictado por su secuencia de aminoácidos. Estos experimentos se realizaron con la proteína **ribonucleasa**, a la que sometió a desnaturalización, es decir a la perdida de sus estructura tridimensional, tratándola con urea.  Cuando se eliminaba la urea, se lograba  de nuevo la estructura tridimensional de la proteína. Al ser esta una enzima se podía comprobar fácilmente  que se obtenía la proteína original mediante ensayos de actividad.  

Durante más de 50 años, los científicos han diseñado diferentes protocolos para poder calcular la estructura tridimensional de las proteínas a partir de la secuencia. Una de las iniciativas más importantes es Critical Assessment of protein Structure Prediction [(CASP)](https://predictioncenter.org/casp14/index.cgi).

# CASP14 y Alpha Fold 2
CASP14 marcó un aumento extraordinario en la precisión de los cálculos de estructuras tridimensionales de proteínas y a ello contribuyo la aparición del método avanzado de [Deep Learning](https://www.xataka.com/robotica-e-ia/deep-learning-que-es-y-por-que-va-a-ser-una-tecnologia-clave-en-el-futuro-de-la-inteligencia-artificial) **AlphaFold2**. Los modelos construidos con este método demostraron alcanzar prácticamente la precisión experimental (GDT_TS>90) para ~2/3 de los objetivos y de alta precisión (GDT_TS>80) para casi el 90% de los objetivos.




---




## 2. ColabFold v1.5.2: AlphaFold2 utilizando MMseqs2
En esta práctica vamos a utilizar el cuaderno desarrollado por Mirdita, Schütze, Moriwaki, Heo, Ovchinnikov y Steinegger
y cuyos detalles podéis encontrar en la publicación ["*ColabFold - Making protein folding accessible to all*"](https://www.nature.com/articles/s41592-022-01488-1). De esta forma estos autores han facilitado utilizar herramientas complejas de predicción de estructuras cómo [AlphaFold2](https://www.nature.com/articles/s41586-021-03819-2) y [Alphafold2-multimer](https://www.biorxiv.org/content/10.1101/2021.10.04.463034v1). En este cuaderno en concreto las alineaciones/plantillas de secuencia se generan a través de [MMseqs2](https://github.com/soedinglab/mmseqs2) y [HHsearch](https://github.com/soedinglab/hh-suite).

#### **Hemos traducido el cuaderno al español para facilitar su uso a los estudiantes del grado de Bioténología de la UAL.**
<img src="https://raw.githubusercontent.com/sokrypton/ColabFold/main/.github/ColabFold_Marv_Logo_Small.png" height="200" align="right" style="height:240px">

Para más detalles sobre este cuaderno, consultar ColabFold GitHub y leer el manuscrito

[Mirdita M, Schütze K, Moriwaki Y, Heo L, Ovchinnikov S, Steinegger M. ColabFold: Making protein folding accessible to all.
*Nature Methods*, 2022](https://www.nature.com/articles/s41592-022-01488-1)

In [None]:
#@title Input protein sequence(s), then hit `Runtime` -> `Run all`
from google.colab import files
import os
import re
import hashlib
import random

from sys import version_info
python_version = f"{version_info.major}.{version_info.minor}"

def add_hash(x,y):
  return x+"_"+hashlib.sha1(y.encode()).hexdigest()[:5]

query_sequence = '' #@param {type:"string"}
#@markdown  - Use `:` to specify inter-protein chainbreaks for **modeling complexes** (supports homo- and hetro-oligomers). For example **PI...SK:PI...SK** for a homodimer
jobname = 'test' #@param {type:"string"}
# number of models to use
num_relax = 0 #@param [0, 1, 5] {type:"raw"}
#@markdown - specify how many of the top ranked structures to relax using amber
template_mode = "none" #@param ["none", "pdb70","custom"]
#@markdown - `none` = no template information is used. `pdb70` = detect templates in pdb70. `custom` - upload and search own templates (PDB or mmCIF format, see [notes below](#custom_templates))

use_amber = num_relax > 0

# remove whitespaces
query_sequence = "".join(query_sequence.split())

basejobname = "".join(jobname.split())
basejobname = re.sub(r'\W+', '', basejobname)
jobname = add_hash(basejobname, query_sequence)

# check if directory with jobname exists
def check(folder):
  if os.path.exists(folder):
    return False
  else:
    return True
if not check(jobname):
  n = 0
  while not check(f"{jobname}_{n}"): n += 1
  jobname = f"{jobname}_{n}"

# make directory to save results
os.makedirs(jobname, exist_ok=True)

# save queries
queries_path = os.path.join(jobname, f"{jobname}.csv")
with open(queries_path, "w") as text_file:
  text_file.write(f"id,sequence\n{jobname},{query_sequence}")

if template_mode == "pdb70":
  use_templates = True
  custom_template_path = None
elif template_mode == "custom":
  custom_template_path = os.path.join(jobname,f"template")
  os.makedirs(custom_template_path, exist_ok=True)
  uploaded = files.upload()
  use_templates = True
  for fn in uploaded.keys():
    os.rename(fn,os.path.join(custom_template_path,fn))
else:
  custom_template_path = None
  use_templates = False

print("jobname",jobname)
print("sequence",query_sequence)
print("length",len(query_sequence.replace(":","")))

In [None]:
#@title Install dependencies
%%bash -s $use_amber $use_templates $python_version

set -e

USE_AMBER=$1
USE_TEMPLATES=$2
PYTHON_VERSION=$3

if [ ! -f COLABFOLD_READY ]; then
  echo "installing colabfold..."
  # install dependencies
  # We have to use "--no-warn-conflicts" because colab already has a lot preinstalled with requirements different to ours
  pip install -q --no-warn-conflicts "colabfold[alphafold-minus-jax] @ git+https://github.com/sokrypton/ColabFold" "tensorflow-cpu==2.11.0"
  pip uninstall -yq jax jaxlib
  pip install -q "jax[cuda]==0.3.25" -f https://storage.googleapis.com/jax-releases/jax_cuda_releases.html


  # for debugging
  ln -s /usr/local/lib/python3.*/dist-packages/colabfold colabfold
  ln -s /usr/local/lib/python3.*/dist-packages/alphafold alphafold
  touch COLABFOLD_READY
fi

# setup conda
if [ ${USE_AMBER} == "True" ] || [ ${USE_TEMPLATES} == "True" ]; then
  if [ ! -f CONDA_READY ]; then
    echo "installing conda..."
    wget -qnc https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
    bash Miniconda3-latest-Linux-x86_64.sh -bfp /usr/local 2>&1 1>/dev/null
    rm Miniconda3-latest-Linux-x86_64.sh
    conda config --set auto_update_conda false
    touch CONDA_READY
  fi
fi
# setup template search
if [ ${USE_TEMPLATES} == "True" ] && [ ! -f HH_READY ]; then
  echo "installing hhsuite..."
  conda install -y -q -c conda-forge -c bioconda kalign2=2.04 hhsuite=3.3.0 python="${PYTHON_VERSION}" 2>&1 1>/dev/null
  touch HH_READY
fi
# setup openmm for amber refinement
if [ ${USE_AMBER} == "True" ] && [ ! -f AMBER_READY ]; then
  echo "installing amber..."
  conda install -y -q -c conda-forge openmm=7.5.1 python="${PYTHON_VERSION}" pdbfixer cryptography==38.0.4 2>&1 1>/dev/null
  touch AMBER_READY
fi

In [None]:
#@markdown ### MSA options (custom MSA upload, single sequence, pairing mode)
msa_mode = "mmseqs2_uniref_env" #@param ["mmseqs2_uniref_env", "mmseqs2_uniref","single_sequence","custom"]
pair_mode = "unpaired_paired" #@param ["unpaired_paired","paired","unpaired"] {type:"string"}
#@markdown - "unpaired_paired" = pair sequences from same species + unpaired MSA, "unpaired" = seperate MSA for each chain, "paired" - only use paired sequences.

# decide which a3m to use
if "mmseqs2" in msa_mode:
  a3m_file = os.path.join(jobname,f"{jobname}.a3m")

elif msa_mode == "custom":
  a3m_file = os.path.join(jobname,f"{jobname}.custom.a3m")
  if not os.path.isfile(a3m_file):
    custom_msa_dict = files.upload()
    custom_msa = list(custom_msa_dict.keys())[0]
    header = 0
    import fileinput
    for line in fileinput.FileInput(custom_msa,inplace=1):
      if line.startswith(">"):
         header = header + 1
      if not line.rstrip():
        continue
      if line.startswith(">") == False and header == 1:
         query_sequence = line.rstrip()
      print(line, end='')

    os.rename(custom_msa, a3m_file)
    queries_path=a3m_file
    print(f"moving {custom_msa} to {a3m_file}")

else:
  a3m_file = os.path.join(jobname,f"{jobname}.single_sequence.a3m")
  with open(a3m_file, "w") as text_file:
    text_file.write(">1\n%s" % query_sequence)

In [None]:
#@markdown ### Advanced settings
model_type = "auto" #@param ["auto", "alphafold2_ptm", "alphafold2_multimer_v1", "alphafold2_multimer_v2", "alphafold2_multimer_v3"]
#@markdown - if `auto` selected, will use `alphafold2_ptm` for monomer prediction and `alphafold2_multimer_v3` for complex prediction.
#@markdown Any of the mode_types can be used (regardless if input is monomer or complex).
num_recycles = "auto" #@param ["auto", "0", "1", "3", "6", "12", "24", "48"]
recycle_early_stop_tolerance = "auto" #@param ["auto", "0.0", "0.5", "1.0"]
#@markdown - if `auto` selected, will use 20 recycles if `model_type=alphafold2_multimer_v3` (with tol=0.5), all else 3 recycles (with tol=0.0).

#@markdown #### Sample settings
#@markdown -  enable dropouts and increase number of seeds to sample predictions from uncertainty of the model.
#@markdown -  decrease `max_msa` to increase uncertainity
max_msa = "auto" #@param ["auto", "512:1024", "256:512", "64:128", "32:64", "16:32"]
num_seeds = 1 #@param [1,2,4,8,16] {type:"raw"}
use_dropout = False #@param {type:"boolean"}

num_recycles = None if num_recycles == "auto" else int(num_recycles)
recycle_early_stop_tolerance = None if recycle_early_stop_tolerance == "auto" else float(recycle_early_stop_tolerance)
if max_msa == "auto": max_msa = None

#@markdown #### Save settings
save_all = False #@param {type:"boolean"}
save_recycles = False #@param {type:"boolean"}
save_to_google_drive = False #@param {type:"boolean"}
#@markdown -  if the save_to_google_drive option was selected, the result zip will be uploaded to your Google Drive
dpi = 200 #@param {type:"integer"}
#@markdown - set dpi for image resolution

if save_to_google_drive:
  from pydrive.drive import GoogleDrive
  from pydrive.auth import GoogleAuth
  from google.colab import auth
  from oauth2client.client import GoogleCredentials
  auth.authenticate_user()
  gauth = GoogleAuth()
  gauth.credentials = GoogleCredentials.get_application_default()
  drive = GoogleDrive(gauth)
  print("You are logged into Google Drive and are good to go!")

#@markdown Don't forget to hit `Runtime` -> `Run all` after updating the form.

In [None]:
#@title Run Prediction
display_images = True #@param {type:"boolean"}

import sys
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)
from Bio import BiopythonDeprecationWarning
warnings.simplefilter(action='ignore', category=BiopythonDeprecationWarning)
from pathlib import Path
from colabfold.download import download_alphafold_params, default_data_dir
from colabfold.utils import setup_logging
from colabfold.batch import get_queries, run, set_model_type
from colabfold.plot import plot_msa_v2

import os
import numpy as np
try:
  K80_chk = os.popen('nvidia-smi | grep "Tesla K80" | wc -l').read()
except:
  K80_chk = "0"
  pass
if "1" in K80_chk:
  print("WARNING: found GPU Tesla K80: limited to total length < 1000")
  if "TF_FORCE_UNIFIED_MEMORY" in os.environ:
    del os.environ["TF_FORCE_UNIFIED_MEMORY"]
  if "XLA_PYTHON_CLIENT_MEM_FRACTION" in os.environ:
    del os.environ["XLA_PYTHON_CLIENT_MEM_FRACTION"]

from colabfold.colabfold import plot_protein
from pathlib import Path
import matplotlib.pyplot as plt

# For some reason we need that to get pdbfixer to import
if use_amber and f"/usr/local/lib/python{python_version}/site-packages/" not in sys.path:
    sys.path.insert(0, f"/usr/local/lib/python{python_version}/site-packages/")

def input_features_callback(input_features):
  if display_images:
    plot_msa_v2(input_features)
    plt.show()
    plt.close()

def prediction_callback(protein_obj, length,
                        prediction_result, input_features, mode):
  model_name, relaxed = mode
  if not relaxed:
    if display_images:
      fig = plot_protein(protein_obj, Ls=length, dpi=150)
      plt.show()
      plt.close()

result_dir = jobname
if 'logging_setup' not in globals():
    setup_logging(Path(os.path.join(jobname,"log.txt")))
    logging_setup = True

queries, is_complex = get_queries(queries_path)
model_type = set_model_type(is_complex, model_type)

if "multimer" in model_type and max_msa is not None:
  use_cluster_profile = False
else:
  use_cluster_profile = True

download_alphafold_params(model_type, Path("."))
results = run(
    queries=queries,
    result_dir=result_dir,
    use_templates=use_templates,
    custom_template_path=custom_template_path,
    num_relax=num_relax,
    msa_mode=msa_mode,
    model_type=model_type,
    num_models=5,
    num_recycles=num_recycles,
    recycle_early_stop_tolerance=recycle_early_stop_tolerance,
    num_seeds=num_seeds,
    use_dropout=use_dropout,
    model_order=[1,2,3,4,5],
    is_complex=is_complex,
    data_dir=Path("."),
    keep_existing_results=False,
    rank_by="auto",
    pair_mode=pair_mode,
    stop_at_score=float(100),
    prediction_callback=prediction_callback,
    dpi=dpi,
    zip_results=False,
    save_all=save_all,
    max_msa=max_msa,
    use_cluster_profile=use_cluster_profile,
    input_features_callback=input_features_callback,
    save_recycles=save_recycles,
)
results_zip = f"{jobname}.result.zip"
os.system(f"zip -r {results_zip} {jobname}")

In [None]:
#@title Display 3D structure {run: "auto"}
import py3Dmol
import glob
import matplotlib.pyplot as plt
from colabfold.colabfold import plot_plddt_legend
from colabfold.colabfold import pymol_color_list, alphabet_list
rank_num = 1 #@param ["1", "2", "3", "4", "5"] {type:"raw"}
color = "lDDT" #@param ["chain", "lDDT", "rainbow"]
show_sidechains = False #@param {type:"boolean"}
show_mainchains = False #@param {type:"boolean"}

tag = results["rank"][0][rank_num - 1]
jobname_prefix = ".custom" if msa_mode == "custom" else ""
pdb_filename = f"{jobname}/{jobname}{jobname_prefix}_unrelaxed_{tag}.pdb"
pdb_file = glob.glob(pdb_filename)

def show_pdb(rank_num=1, show_sidechains=False, show_mainchains=False, color="lDDT"):
  model_name = f"rank_{rank_num}"
  view = py3Dmol.view(js='https://3dmol.org/build/3Dmol.js',)
  view.addModel(open(pdb_file[0],'r').read(),'pdb')

  if color == "lDDT":
    view.setStyle({'cartoon': {'colorscheme': {'prop':'b','gradient': 'roygb','min':50,'max':90}}})
  elif color == "rainbow":
    view.setStyle({'cartoon': {'color':'spectrum'}})
  elif color == "chain":
    chains = len(queries[0][1]) + 1 if is_complex else 1
    for n,chain,color in zip(range(chains),alphabet_list,pymol_color_list):
       view.setStyle({'chain':chain},{'cartoon': {'color':color}})

  if show_sidechains:
    BB = ['C','O','N']
    view.addStyle({'and':[{'resn':["GLY","PRO"],'invert':True},{'atom':BB,'invert':True}]},
                        {'stick':{'colorscheme':f"WhiteCarbon",'radius':0.3}})
    view.addStyle({'and':[{'resn':"GLY"},{'atom':'CA'}]},
                        {'sphere':{'colorscheme':f"WhiteCarbon",'radius':0.3}})
    view.addStyle({'and':[{'resn':"PRO"},{'atom':['C','O'],'invert':True}]},
                        {'stick':{'colorscheme':f"WhiteCarbon",'radius':0.3}})
  if show_mainchains:
    BB = ['C','O','N','CA']
    view.addStyle({'atom':BB},{'stick':{'colorscheme':f"WhiteCarbon",'radius':0.3}})

  view.zoomTo()
  return view

show_pdb(rank_num, show_sidechains, show_mainchains, color).show()
if color == "lDDT":
  plot_plddt_legend().show()

In [None]:
#@title Plots {run: "auto"}
from IPython.display import display, HTML
import base64
from html import escape

# see: https://stackoverflow.com/a/53688522
def image_to_data_url(filename):
  ext = filename.split('.')[-1]
  prefix = f'data:image/{ext};base64,'
  with open(filename, 'rb') as f:
    img = f.read()
  return prefix + base64.b64encode(img).decode('utf-8')

pae = image_to_data_url(os.path.join(jobname,f"{jobname}{jobname_prefix}_pae.png"))
cov = image_to_data_url(os.path.join(jobname,f"{jobname}{jobname_prefix}_coverage.png"))
plddt = image_to_data_url(os.path.join(jobname,f"{jobname}{jobname_prefix}_plddt.png"))
display(HTML(f"""
<style>
  img {{
    float:left;
  }}
  .full {{
    max-width:100%;
  }}
  .half {{
    max-width:50%;
  }}
  @media (max-width:640px) {{
    .half {{
      max-width:100%;
    }}
  }}
</style>
<div style="max-width:90%; padding:2em;">
  <h1>Plots for {escape(jobname)}</h1>
  <img src="{pae}" class="full" />
  <img src="{cov}" class="half" />
  <img src="{plddt}" class="half" />
</div>
"""))


In [None]:
#@title Package and download results
#@markdown If you are having issues downloading the result archive, try disabling your adblocker and run this cell again. If that fails click on the little folder icon to the left, navigate to file: `jobname.result.zip`, right-click and select \"Download\" (see [screenshot](https://pbs.twimg.com/media/E6wRW2lWUAEOuoe?format=jpg&name=small)).

if msa_mode == "custom":
  print("Don't forget to cite your custom MSA generation method.")

files.download(f"{jobname}.result.zip")

if save_to_google_drive == True and drive:
  uploaded = drive.CreateFile({'title': f"{jobname}.result.zip"})
  uploaded.SetContentFile(f"{jobname}.result.zip")
  uploaded.Upload()
  print(f"Uploaded {jobname}.result.zip to Google Drive with ID {uploaded.get('id')}")

#4. Instrucciones e información adicional
**Quick start**
1. Pega la secuencia de tu(s) proteína(s) en el campo de entrada.
2. Pulsa "Runtime" -> "Run all".
3. El pipeline consta de 5 pasos. Los pasos que se están ejecutando actualmente se indican mediante un círculo con una señal de alto al lado.

**Contenido del fichero zip de resultados**

1. Estructuras en formato PDB ordenadas por el valor medio de pLDDT y, en el caso de complejos, por el valor de pTMscore. (norelajada y relajada si la opción `use_amber` está habilitada).
2. Representación de la calidad del modelo.
3. Representación de la covertura del MSA (Multiple Sequence Alignement).
4. Fichero log de los parametros.
5. MSA de entrada en formato A3M.
6. Un `predicted_aligned_error_v1.json` utilizando [AlphaFold-DB's format](https://alphafold.ebi.ac.uk/faq#faq-7) y un `scores.json` para cada modelo que contiene una matriz (lista de listas) para PAE, una lista con el pLDDT promedio y el pTMscore.
7. Un fichero BibTeX con las citas para todas las herramientas y bases de datos usadas.

Al final del trabajo, aparecerá un cuadro de descarga con un archivo `jobname.result.zip`. Además, si se seleccionó la opción `save_to_google_drive`, `jobname.result.zip` se cargará en tu Google Drive.


**Generación de MSA para complejos**

Para la predicción de complejos usamos MSA emparejados y no emparejados. El MSA no apareado se genera de la misma manera que para la predicción de estructuras de proteínas mediante la búsqueda de UniRef100 y las secuencias ambientales con tres iteraciones cada una.

El MSA emparejado se genera buscando en la base de datos UniRef100 y emparejando los mejores resultados que comparten el mismo identificador taxonómico NCBI (= especie o subespecie). Solo emparejamos secuencias si todas las secuencias de consulta están presentes para el respectivo identificador  taxonómico.

**Usar un MSA personalizado como entrada**

Para predecir la estructura con un MSA personalizado (formato A3M): (1) Cambie msa_mode: a "personalizado", (2) Espere a que aparezca un cuadro de carga al final del cuadro "Proteína de entrada...". Sube tu A3M. La primera entrada fasta del A3M debe ser la secuencia de consulta sin espacios.

Podemos utilizar el servidor [HHblits Toolkit server](https://toolkit.tuebingen.mpg.de/tools/hhblits) como una alternativa para la generación de MSA. Después de enviar tu consulta, haz clic en "Consultar plantilla MSA" -> "Descargar A3M completo". Descarga el archivo A3M y cárgalo en este cuaderno.

**Comparación con AlphaFold2 y Alphafold2 completa de Colab**

Este cuaderno reemplaza la detección de homología y el emparejamiento MSA de AlphaFold2 con MMseqs2. Para una comparación con [AlphaFold2 Colab](https://colab.research.google.com/github/deepmind/alphafold/blob/main/notebooks/AlphaFold.ipynb) y el sistema completo de [AlphaFold2](https://github.com/deepmind/alphafold) leer el artículo [preprint](https://www.biorxiv.org/content/10.1101/2021.08.15.456425v1).

**Solución de problemas**
* Verifique que el tipo de `Runtime` esté configurado en GPU en `Runtime` -> `Change Runtime type`.
* Intente reiniciar la sesión `Runtime`-> `Factory reset runtime`.
* Verifica la secuencia de entrada.

**Problemas conocidos**
* Google Colab asigna diferentes tipos de GPU con diferentes cantidades de memoria. Algunos podrían no tener suficiente memoria para predecir la estructura de una secuencia larga.
* Su navegador puede bloquear la ventana emergente para descargar el archivo de resultados. En su lugar, puedes elegir la opción `save_to_google_drive` para subir a Google Drive ell archivo o descargarlo manualmente con el siguiente procedimiento: haga clic en el ícono de la carpeta pequeña a la izquierda, navegue hasta el archivo:`jobname.result.zip`, click derecho y selecciona   \"Download\" (ver [screenshot](https://pbs.twimg.com/media/E6wRW2lWUAEOuoe?format=jpg&name=small)).

**Limitaciones**
* Recursos informáticos: nuestra API MMseqs2 puede gestionar entre 20 000 y 50 000 solicitudes al día.
* MSA: MMseqs2 es muy preciso y sensible, pero puede encontrar menos coincidencias en comparación con HHblits/HMMer buscado en BFD o Mgnify.
* Recomendamos usar adicionalmente la [pipeline AlphaFold2](https://github.com/deepmind/alphafold) completa.


**Descripción de las representaciones gráficas**
* **Número de secuencias por posición**: queremos ver al menos 30 secuencias por posición, para obtener el mejor rendimiento, idealmente 100 secuencias.
* **IDDT previsto por posición**: confianza del modelo (sobre 100) en cada posición. Cuanto más alto, mejor.
* **Error de alineación previsto**: para los homooligómeros, esta podría ser una métrica útil para evaluar la confianza del modelo en la interfaz. Cuanto más bajo, mejor.

**Bugs**
- Si encuentra algún error, informe el problema a https://github.com/sokrypton/ColabFold/issues


**Licencia**

El código fuente de ColabFold está bajo licencia[MIT](https://raw.githubusercontent.com/sokrypton/ColabFold/main/LICENSE). Además, este cuaderno utiliza el código fuente de AlphaFold2 y sus parámetros bajo licencia[Apache 2.0](https://raw.githubusercontent.com/deepmind/alphafold/main/LICENSE) y [CC BY 4.0](https://creativecommons.org/licenses/by-sa/4.0/) respectivamente. Para leer más sobre la licencia de AlphaFold [here](https://github.com/deepmind/alphafold).

**Acknowledgments**
- Agradecemos al equipo de AlphaFold por desarrollar un modelo excelente y abrir el software.

- [Söding Lab](https://www.mpibpc.mpg.de/soeding) por proporcionar los recursos computacionales para el servidor MMseqs2

- Richard Evans por ayudar a comparar el soporte de multímero Alphafold de Colab Gold

- [David Koes](https://github.com/dkoes) por su asombrosa aplicación [py3Dmol](https://3dmol.csb.pitt.edu/), ¡sin los cuales estos cuadernos serían bastante aburridos!

- Do-Yoon Kim por crear el logo de ColabFold.

- Un colab por Sergey Ovchinnikov ([@sokrypton](https://twitter.com/sokrypton)), Milot Mirdita ([@milot_mirdita](https://twitter.com/milot_mirdita)) y Martin Steinegger ([@thesteinegger](https://twitter.com/thesteinegger)).
