# üß¨ M√≥dulo 4: Modelado de Prote√≠nas y Docking Molecular
## Actividad 4.1: Fundamentos de Estructura de Prote√≠nas

<div align="center">
  
**Universidad de Caldas - Departamento de Qu√≠mica**  
*Introducci√≥n a la Qu√≠mica Computacional (173G7G)*  
**Profesor:** Jos√© Mauricio Rodas Rodr√≠guez

[![Open in Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/maurorodas/Quimica_computacional_173G7G/blob/main/modulo_04_modelado_proteinas_docking/01_fundamentos_estructura_proteinas.ipynb)

</div>

---

## üéØ Objetivos de Aprendizaje

Al finalizar esta actividad, ser√°s capaz de:
- Comprender los niveles de estructura proteica (primaria, secundaria, terciaria, cuaternaria)
- Descargar estructuras desde PDB y AlphaFold Database
- Visualizar prote√≠nas en 3D con Py3Dmol
- Analizar estructuras con BioPython
- Extraer secuencias y analizar calidad estructural
- Interpretar valores de confianza (pLDDT) en modelos de AlphaFold

---

## 1. Instalaci√≥n de Dependencias

In [None]:
# Instalaci√≥n de paquetes necesarios
!pip install biopython py3Dmol requests numpy pandas matplotlib

In [None]:
# Importaci√≥n de bibliotecas
import requests
import py3Dmol
from Bio import PDB
from Bio.PDB import *
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from pathlib import Path

print("Bibliotecas importadas correctamente")

## 2. Niveles de Estructura Proteica

Las prote√≠nas tienen cuatro niveles de organizaci√≥n estructural:

1. **Estructura Primaria**: Secuencia de amino√°cidos
2. **Estructura Secundaria**: H√©lices Œ±, l√°minas Œ≤, loops
3. **Estructura Terciaria**: Plegamiento 3D completo
4. **Estructura Cuaternaria**: Ensamblaje de m√∫ltiples cadenas

## 3. Descarga de Estructuras desde PDB

In [None]:
def descargar_pdb(pdb_id, output_dir="estructuras"):
    """
    Descarga un archivo PDB desde RCSB
    
    Args:
        pdb_id: C√≥digo PDB de 4 caracteres
        output_dir: Directorio de salida
    
    Returns:
        Path al archivo descargado
    """
    Path(output_dir).mkdir(exist_ok=True)
    
    url = f"https://files.rcsb.org/download/{pdb_id}.pdb"
    response = requests.get(url)
    
    if response.status_code == 200:
        output_path = Path(output_dir) / f"{pdb_id}.pdb"
        with open(output_path, 'w') as f:
            f.write(response.text)
        print(f"‚úì Estructura {pdb_id} descargada correctamente")
        return output_path
    else:
        print(f"‚úó Error al descargar {pdb_id}")
        return None

In [None]:
# Ejemplo: Descargar lisozima (1AKI)
pdb_file = descargar_pdb("1AKI")

## 4. Visualizaci√≥n 3D con Py3Dmol

In [None]:
def visualizar_proteina(pdb_file, style="cartoon", color="spectrum"):
    """
    Visualiza una prote√≠na usando Py3Dmol
    """
    with open(pdb_file, 'r') as f:
        pdb_data = f.read()
    
    view = py3Dmol.view(width=800, height=600)
    view.addModel(pdb_data, 'pdb')
    
    if style == "cartoon":
        view.setStyle({'cartoon': {'color': color}})
    elif style == "stick":
        view.setStyle({'stick': {}})
    elif style == "sphere":
        view.setStyle({'sphere': {}})
    
    view.zoomTo()
    return view

In [None]:
# Visualizar la prote√≠na descargada
view = visualizar_proteina(pdb_file, style="cartoon", color="spectrum")
view.show()

## 5. An√°lisis de Estructura con BioPython

In [None]:
# Parsear el archivo PDB
parser = PDB.PDBParser(QUIET=True)
structure = parser.get_structure("proteina", pdb_file)

# Informaci√≥n b√°sica
print(f"ID de la estructura: {structure.id}")
print(f"N√∫mero de modelos: {len(structure)}")

# Informaci√≥n de cadenas
for model in structure:
    print(f"\nModelo: {model.id}")
    for chain in model:
        num_residuos = len(list(chain.get_residues()))
        print(f"  Cadena {chain.id}: {num_residuos} residuos")

## 6. Extracci√≥n de Secuencia

In [None]:
def extraer_secuencia(structure, chain_id='A'):
    """
    Extrae la secuencia de amino√°cidos de una cadena
    """
    from Bio.PDB.Polypeptide import PPBuilder
    
    ppb = PPBuilder()
    for chain in structure[0]:
        if chain.id == chain_id:
            for pp in ppb.build_peptides(chain):
                return pp.get_sequence()
    return None

# Extraer secuencia de la cadena A
secuencia = extraer_secuencia(structure, 'A')
print(f"Secuencia (primeros 50 residuos): {secuencia[:50]}")
print(f"Longitud total: {len(secuencia)} residuos")

## 7. An√°lisis de Estructura Secundaria

In [None]:
# Usar DSSP para an√°lisis de estructura secundaria (si est√° disponible)
# Nota: DSSP debe estar instalado en el sistema

try:
    from Bio.PDB.DSSP import DSSP
    
    model = structure[0]
    dssp = DSSP(model, pdb_file, dssp='mkdssp')
    
    # Contar elementos de estructura secundaria
    helix_count = sum(1 for res in dssp if res[2] == 'H')
    sheet_count = sum(1 for res in dssp if res[2] == 'E')
    coil_count = sum(1 for res in dssp if res[2] == '-')
    
    print(f"H√©lices Œ±: {helix_count} residuos")
    print(f"L√°minas Œ≤: {sheet_count} residuos")
    print(f"Loops/coils: {coil_count} residuos")
    
except:
    print("DSSP no est√° disponible. Inst√°lalo para an√°lisis de estructura secundaria.")

## 8. Descarga desde AlphaFold Database

In [None]:
def descargar_alphafold(uniprot_id, output_dir="estructuras"):
    """
    Descarga una estructura predicha por AlphaFold
    
    Args:
        uniprot_id: ID de UniProt
        output_dir: Directorio de salida
    """
    Path(output_dir).mkdir(exist_ok=True)
    
    url = f"https://alphafold.ebi.ac.uk/files/AF-{uniprot_id}-F1-model_v4.pdb"
    response = requests.get(url)
    
    if response.status_code == 200:
        output_path = Path(output_dir) / f"AF-{uniprot_id}.pdb"
        with open(output_path, 'w') as f:
            f.write(response.text)
        print(f"‚úì Estructura AlphaFold {uniprot_id} descargada")
        return output_path
    else:
        print(f"‚úó Error al descargar {uniprot_id} de AlphaFold")
        return None

In [None]:
# Ejemplo: Descargar prote√≠na humana
# P53_HUMAN = P04637
af_file = descargar_alphafold("P04637")

## 9. An√°lisis de Confianza en Modelos AlphaFold

In [None]:
def analizar_plddt(pdb_file):
    """
    Analiza los valores de pLDDT (confianza) en un modelo de AlphaFold
    """
    parser = PDB.PDBParser(QUIET=True)
    structure = parser.get_structure("AF", pdb_file)
    
    plddt_values = []
    residue_numbers = []
    
    for model in structure:
        for chain in model:
            for residue in chain:
                for atom in residue:
                    if atom.name == 'CA':  # Solo carbono alfa
                        plddt_values.append(atom.bfactor)
                        residue_numbers.append(residue.id[1])
                        break
    
    return residue_numbers, plddt_values

In [None]:
if af_file:
    residues, plddt = analizar_plddt(af_file)
    
    plt.figure(figsize=(12, 4))
    plt.plot(residues, plddt, linewidth=2)
    plt.axhline(y=70, color='r', linestyle='--', label='Confianza alta (>70)')
    plt.axhline(y=50, color='orange', linestyle='--', label='Confianza media (50-70)')
    plt.xlabel('N√∫mero de Residuo')
    plt.ylabel('pLDDT Score')
    plt.title('Confianza del Modelo AlphaFold (pLDDT)')
    plt.legend()
    plt.grid(True, alpha=0.3)
    plt.show()
    
    print(f"pLDDT promedio: {np.mean(plddt):.2f}")
    print(f"Residuos con alta confianza (>70): {sum(p > 70 for p in plddt)}")
    print(f"Residuos con baja confianza (<50): {sum(p < 50 for p in plddt)}")

## 10. Ejercicios Pr√°cticos

### Ejercicio 1
Descarga la estructura de la prote√≠na spike del SARS-CoV-2 (PDB: 6VXX) y visual√≠zala.

### Ejercicio 2
Compara una estructura experimental del PDB con su correspondiente predicci√≥n de AlphaFold.

### Ejercicio 3
Analiza la distribuci√≥n de elementos de estructura secundaria en una prote√≠na de tu elecci√≥n.

In [None]:
# Espacio para tus ejercicios

## Referencias

1. Berman et al. (2000). The Protein Data Bank. *Nucleic Acids Research*
2. Jumper et al. (2021). Highly accurate protein structure prediction with AlphaFold. *Nature*
3. BioPython Documentation: https://biopython.org/
4. RCSB PDB: https://www.rcsb.org/

---

## üìö Recursos Adicionales

### Bases de Datos
- [Protein Data Bank (PDB)](https://www.rcsb.org/)
- [AlphaFold Database](https://alphafold.ebi.ac.uk/)
- [UniProt](https://www.uniprot.org/)

### Tutoriales
- [BioPython Tutorial](https://biopython.org/wiki/Documentation)
- [PDB File Format](http://www.wwpdb.org/documentation/file-format)
- [Py3Dmol Documentation](https://3dmol.csb.pitt.edu/)

---

## ‚úÖ Verificaci√≥n de Aprendizaje

Al finalizar esta actividad deber√≠as ser capaz de:

- ‚úÖ Descargar estructuras de prote√≠nas desde PDB y AlphaFold
- ‚úÖ Visualizar y analizar estructuras en 3D
- ‚úÖ Extraer secuencias y analizar estructura secundaria
- ‚úÖ Interpretar valores de confianza (pLDDT)
- ‚úÖ Identificar regiones estructuradas y desordenadas

---

<div align="center">

## üéâ ¬°Felicitaciones!

Has completado la **Actividad 4.1: Fundamentos de Estructura de Prote√≠nas**

[![Siguiente](https://img.shields.io/badge/Actividad_4.2_‚û°Ô∏è-Modelado_por_Homolog√≠a-green.svg)](02_modelado_homologia.ipynb)

---

üìö **[Volver al M√≥dulo 4](README.md)** | üè† **[Inicio del Curso](../README.md)**

---

**Universidad de Caldas - Departamento de Qu√≠mica**  
*Qu√≠mica Computacional 173G7G*

</div>