# üß¨ Simulaci√≥n y An√°lisis de Alanina Dip√©ptido - Tutorial Completo

## Introducci√≥n Detallada

### ¬øQu√© es la Alanina Dip√©ptido?

La **alanina dip√©ptido** (tambi√©n llamada Ace-Ala-Nme) es una mol√©cula peque√±a compuesta por:
- **Ace**: Grupo acetilo (CH‚ÇÉ-CO-) en el extremo N-terminal
- **Ala**: Un residuo de alanina (amino√°cido m√°s simple con cadena lateral -CH‚ÇÉ)
- **Nme**: Grupo N-metil amida (-NH-CH‚ÇÉ) en el extremo C-terminal

**Total**: ~22 √°tomos solamente

### ¬øPor qu√© es Importante para Aprender MD?

1. **Sistema peque√±o = simulaciones r√°pidas**
   - En tu computadora personal: minutos, no d√≠as
   - Ideal para aprender sin esperar

2. **Muestra comportamientos complejos a pesar de su tama√±o**
   - Puede adoptar conformaciones tipo Œ±-h√©lice
   - Puede adoptar conformaciones tipo Œ≤-sheet
   - Transiciones entre conformaciones

3. **Bien estudiado en la literatura**
   - Hay datos experimentales para comparar
   - Es un "benchmark" est√°ndar en el campo

4. **Introduce conceptos clave**
   - √Ångulos diedros (œÜ, œà)
   - Diagrama de Ramachandran
   - Espacio conformacional

### Objetivos Espec√≠ficos de Este Tutorial:

| Fase | Objetivo | Aprenderemos |
|------|----------|-------------|
| **Setup** | Descargar y preparar | Manejo de archivos PDB, topolog√≠as |
| **Simulaci√≥n** | Ejecutar MD | Campos de fuerza, integradores, termodin√°mica |
| **An√°lisis 1** | Estabilidad | RMSD, convergencia, energ√≠as |
| **An√°lisis 2** | Conformaciones | √Ångulos diedros, Ramachandran |
| **An√°lisis 3** | Movimientos | PCA, modos principales |
| **Visualizaci√≥n** | Ver resultados | Gr√°ficos 2D/3D, interpretaci√≥n |

### ¬øQu√© NO haremos (pero podr√≠as hacer despu√©s)?

- Solvente expl√≠cito (usaremos impl√≠cito para simplicidad)
- Simulaciones largas (solo 20 ps, lo suficiente para aprender)
- Free energy calculations (tema avanzado)
- M√∫ltiples r√©plicas (solo 1 simulaci√≥n)

---

**Tiempo estimado**: 30-45 minutos (simulaci√≥n + an√°lisis)

**Prerequisitos**:
- OpenMM instalado (`conda activate openmm-env`)
- Conexi√≥n a internet (para descargar PDB)
- Paciencia y curiosidad üß™

---

## üì¶ Paso 1: Importar Librer√≠as - Explicaci√≥n Exhaustiva

### Filosof√≠a: ¬øPor qu√© tantas librer√≠as?

Una simulaci√≥n molecular no es una sola operaci√≥n, es un **pipeline completo**:

```
Estructura PDB ‚Üí Preparaci√≥n ‚Üí Simulaci√≥n ‚Üí Trayectoria ‚Üí An√°lisis ‚Üí Resultados
```

Cada etapa requiere herramientas especializadas:

- **OpenMM**: El "motor" que simula f√≠sica molecular
- **MDTraj/MDAnalysis**: Los "mec√°nicos" que analizan la trayectoria
- **NumPy/Pandas**: Los "matem√°ticos" que hacen c√°lculos
- **Matplotlib/Seaborn**: Los "artistas" que visualizan

Vamos a importar cada una **explicando en detalle** qu√© hace y por qu√© la necesitamos.

In [None]:
# =============================================================================
# SECCI√ìN 1: LIBRER√çAS PARA SIMULACI√ìN MOLECULAR
# =============================================================================

import openmm as mm
# ¬øQU√â ES OpenMM?
# - Un motor de simulaci√≥n de din√°micas moleculares de alto rendimiento
# - Desarrollado por Stanford y financiado por NIH
# - Usa GPU (CUDA/OpenCL) para acelerar c√°lculos
#
# ¬øQU√â HACE?
# - Calcula fuerzas entre √°tomos usando potenciales f√≠sicos (ecuaciones)
# - Integra las ecuaciones de movimiento de Newton (F = ma)
# - Mueve los √°tomos paso a paso en el tiempo
#
# ¬øPOR QU√â 'as mm'?
# - Para escribir 'mm.LangevinIntegrator()' en lugar de 'openmm.LangevinIntegrator()'
# - Es una convenci√≥n com√∫n en la comunidad OpenMM

from openmm import app, unit
# ¬øQU√â ES 'app'?
# - Subm√≥dulo de OpenMM con clases de "aplicaci√≥n" de alto nivel
# - Incluye: PDBFile (leer PDB), ForceField (campos de fuerza), 
#           Simulation (orquestar todo), DCDReporter (guardar trayectorias)
#
# ¬øQU√â ES 'unit'?
# - Sistema de unidades de OpenMM para evitar errores
# - En f√≠sica molecular usamos unidades espec√≠ficas:
#   * Longitud: nan√≥metros (nm) o angstroms (√Ö)
#   * Tiempo: picosegundos (ps) o femtosegundos (fs)
#   * Temperatura: Kelvin (K)
#   * Energ√≠a: kilojoules/mol (kJ/mol) o kilocalories/mol (kcal/mol)
#
# EJEMPLO SIN UNIDADES (MAL):
#   temperature = 300  # ¬øKelvin? ¬øCelsius? ¬øFahrenheit? Ambiguo!
#
# EJEMPLO CON UNIDADES (BIEN):
#   temperature = 300 * unit.kelvin  # Expl√≠cito, sin ambig√ºedades
#
# ¬øPOR QU√â ES CR√çTICO?
# - OpenMM internamente usa nm, ps, kJ/mol
# - Si das 300 sin unidades, asume 300 nm de distancia (¬°ERROR!)
# - Con unidades, OpenMM convierte autom√°ticamente

print("‚úÖ OpenMM importado correctamente")
print(f"   Versi√≥n: {mm.__version__}")
print(f"   Ubicaci√≥n: {mm.__file__}")

In [None]:
# =============================================================================
# SECCI√ìN 2: LIBRER√çAS PARA AN√ÅLISIS DE TRAYECTORIAS
# =============================================================================

import mdtraj as md
# ¬øQU√â ES MDTraj?
# - Librer√≠a especializada para leer y analizar trayectorias de MD
# - Escrita en C++ con interfaz Python (muy r√°pida)
# - Desarrollada por Stanford (mismo grupo que OpenMM)
#
# ¬øQU√â PUEDE HACER?
# 1. Leer formatos: DCD, XTC, TRR, NetCDF, PDB, etc.
# 2. Calcular geom√©tricos:
#    - RMSD (cu√°nto se desv√≠a la estructura)
#    - Distancias entre √°tomos
#    - √Ångulos (bond angles, dihedral angles)
#    - Radios de giro
#    - √Årea superficial accesible al solvente (SASA)
# 3. Manipular trayectorias:
#    - Alinear estructuras (superpose)
#    - Extraer frames espec√≠ficos
#    - Convertir entre formatos
#
# ¬øPOR QU√â ES R√ÅPIDA?
# - Usa NumPy arrays internamente
# - Operaciones vectorizadas (procesa m√∫ltiples frames a la vez)
# - Core en C++ compilado
#
# EJEMPLO DE USO:
#   traj = md.load('trajectory.dcd', top='structure.pdb')
#   rmsd = md.rmsd(traj, traj, frame=0)  # RMSD respecto al frame 0

import MDAnalysis as mda
# ¬øQU√â ES MDAnalysis?
# - Otra librer√≠a para an√°lisis de MD (alternativa/complementaria a MDTraj)
# - Filosof√≠a diferente: m√°s orientada a objetos, m√°s flexible
# - Maneja trayectorias como "universos" con "√°tomos" seleccionables
#
# ¬øPOR QU√â USAR LAS DOS?
# - MDTraj: mejor para c√°lculos geom√©tricos simples y r√°pidos
# - MDAnalysis: mejor para selecciones complejas y an√°lisis custom
#
# EJEMPLO DE DIFERENCIA:
# MDTraj:   backbone = traj.topology.select('backbone')
# MDAnalysis: backbone = u.select_atoms('backbone')
#             backbone.positions  # acceso directo a coordenadas
#
# En este tutorial usaremos principalmente MDTraj (m√°s simple)

from MDAnalysis.analysis import rms, align
# Importamos m√≥dulos espec√≠ficos de MDAnalysis:
# - 'rms': para calcular RMSD de formas m√°s sofisticadas
# - 'align': para alinear trayectorias completas
# Estos son √∫tiles para an√°lisis avanzados

print("‚úÖ MDTraj y MDAnalysis importados")
print(f"   MDTraj versi√≥n: {md.__version__}")
print(f"   MDAnalysis versi√≥n: {mda.__version__}")

In [None]:
# =============================================================================
# SECCI√ìN 3: LIBRER√çAS CIENT√çFICAS FUNDAMENTALES
# =============================================================================

import numpy as np
# ¬øQU√â ES NumPy?
# - LA librer√≠a fundamental para computaci√≥n cient√≠fica en Python
# - "Numerical Python"
# - Proporciona arrays multidimensionales eficientes
#
# ¬øPOR QU√â ES ESENCIAL?
# En MD, TODO son arrays:
# - Coordenadas: array de shape (n_frames, n_atoms, 3)
#   Ejemplo: traj.xyz ‚Üí (100 frames, 22 √°tomos, 3 coordenadas xyz)
# - Energ√≠as: array de shape (n_frames,)
# - Distancias: array de shape (n_frames, n_pairs)
#
# ¬øQU√â OPERACIONES HAREMOS?
# - np.mean(): promedios
# - np.std(): desviaci√≥n est√°ndar
# - np.sqrt(): ra√≠z cuadrada
# - np.degrees(): convertir radianes a grados
# - np.argmin(), np.argmax(): encontrar √≠ndices de m√≠n/m√°x
#
# DIFERENCIA CLAVE:
# Lista de Python: [1, 2, 3, 4, 5]
#   operaci√≥n: [x**2 for x in lista]  ‚Üí lento, requiere loop
# NumPy array:    np.array([1, 2, 3, 4, 5])
#   operaci√≥n: array**2                ‚Üí r√°pido, vectorizado

import pandas as pd
# ¬øQU√â ES Pandas?
# - Librer√≠a para manejo de datos tabulares (tablas)
# - Piensa en Excel pero program√°tico y mucho m√°s poderoso
# - Estructura principal: DataFrame (tabla con filas y columnas nombradas)
#
# ¬øPARA QU√â LO USAREMOS?
# OpenMM guarda logs de simulaci√≥n en archivos de texto:
# Step,Time,Potential Energy,Kinetic Energy,Temperature
# 0,0.0,-50.2,25.1,298.5
# 100,0.2,-51.3,24.9,299.2
#
# Con Pandas:
# df = pd.read_csv('log.txt')
# df['Temperature'].mean()  ‚Üí temperatura promedio
# df.plot(x='Time', y='Potential Energy')  ‚Üí gr√°fico autom√°tico
#
# VENTAJAS:
# - Manejo f√°cil de datos con etiquetas
# - Operaciones estad√≠sticas simples
# - Integraci√≥n con Matplotlib para gr√°ficos
# - Exportar a CSV, Excel, etc.

from scipy import stats
# ¬øQU√â ES SciPy?
# - "Scientific Python" - funciones cient√≠ficas avanzadas
# - Construida sobre NumPy
# - M√≥dulos para: estad√≠stica, optimizaci√≥n, interpolaci√≥n, √°lgebra lineal, etc.
#
# ¬øPOR QU√â 'stats'?
# - Subm√≥dulo de estad√≠stica
# - Nos permitir√°:
#   * Calcular correlaciones: stats.pearsonr(x, y)
#   * Hacer tests: stats.ttest_ind(grupo1, grupo2)
#   * Ajustar distribuciones: stats.norm.fit(datos)
#
# NOTA: En este tutorial b√°sico no lo usaremos mucho,
#       pero es bueno tenerlo disponible para an√°lisis avanzados

from sklearn.decomposition import PCA
# ¬øQU√â ES scikit-learn?
# - LA librer√≠a de machine learning en Python
# - Contiene algoritmos para clasificaci√≥n, regresi√≥n, clustering, etc.
#
# ¬øQU√â ES PCA?
# - Principal Component Analysis (An√°lisis de Componentes Principales)
# - T√©cnica de reducci√≥n de dimensionalidad
#
# ¬øPOR QU√â ES √öTIL EN MD?
# Problema: Una trayectoria tiene MUCHAS dimensiones:
# - 22 √°tomos √ó 3 coordenadas = 66 dimensiones
# - 100 frames = 6,600 n√∫meros para visualizar
# - Imposible graficar en 2D
#
# Soluci√≥n con PCA:
# - Encuentra las direcciones de m√°ximo movimiento
# - PC1 (Componente Principal 1) = direcci√≥n de mayor varianza
# - PC2 = segunda direcci√≥n (ortogonal a PC1)
# - Proyectamos 66D ‚Üí 2D preservando ~80% de la informaci√≥n
# - Ahora S√ç podemos hacer un scatter plot
#
# INTERPRETACI√ìN:
# - PC1 podr√≠a ser: "apertura/cierre de la mol√©cula"
# - PC2 podr√≠a ser: "rotaci√≥n de un grupo metilo"
# Los componentes capturan movimientos COLECTIVOS importantes

print("‚úÖ Librer√≠as cient√≠ficas importadas")
print(f"   NumPy versi√≥n: {np.__version__}")
print(f"   Pandas versi√≥n: {pd.__version__}")

In [None]:
# =============================================================================
# SECCI√ìN 4: LIBRER√çAS PARA VISUALIZACI√ìN
# =============================================================================

import matplotlib.pyplot as plt
# ¬øQU√â ES Matplotlib?
# - LA librer√≠a est√°ndar para gr√°ficos en Python
# - Inspirada en MATLAB (de ah√≠ el nombre)
# - Puede crear pr√°cticamente cualquier tipo de gr√°fico 2D
#
# ¬øQU√â TIPOS DE GR√ÅFICOS HAREMOS?
# 1. plt.plot(x, y)     ‚Üí L√≠neas (energ√≠a vs tiempo)
# 2. plt.scatter(x, y)  ‚Üí Puntos (Ramachandran)
# 3. plt.hist(datos)    ‚Üí Histogramas (distribuciones)
# 4. plt.bar(x, altura) ‚Üí Barras (varianza de PCA)
#
# ¬øPOR QU√â 'pyplot'?
# - Es la interfaz tipo MATLAB (simple y directa)
# - Alternativa: interfaz orientada a objetos (m√°s compleja pero m√°s flexible)
#
# ANATOM√çA DE UN GR√ÅFICO:
# fig, ax = plt.subplots()  ‚Üí Crear figura y ejes
# ax.plot(x, y)             ‚Üí Dibujar datos
# ax.set_xlabel('Tiempo')   ‚Üí Etiquetar eje x
# ax.set_ylabel('Energ√≠a')  ‚Üí Etiquetar eje y  
# plt.show()                ‚Üí Mostrar

import seaborn as sns
# ¬øQU√â ES Seaborn?
# - Librer√≠a de visualizaci√≥n construida SOBRE Matplotlib
# - Hace gr√°ficos m√°s bonitos con menos c√≥digo
# - Especializada en visualizaci√≥n estad√≠stica
#
# ¬øPOR QU√â USARLO SI TENEMOS MATPLOTLIB?
# Compara:
#
# Matplotlib (feo por defecto):
#   plt.scatter(x, y)
#   # Resultado: puntos azules b√°sicos, fondo blanco
#
# Seaborn (bonito por defecto):
#   sns.scatterplot(x=x, y=y)
#   # Resultado: colores agradables, grid, estilo profesional
#
# CARACTER√çSTICAS:
# - Paletas de colores perceptualmente uniformes
# - Temas elegantes (darkgrid, whitegrid, etc.)
# - Gr√°ficos estad√≠sticos complejos en 1 l√≠nea
# - Integraci√≥n perfecta con Pandas DataFrames

import nglview as nv
# ¬øQU√â ES NGLView?
# - Visor 3D de mol√©culas INTERACTIVO para Jupyter notebooks
# - Basado en NGL (WebGL molecular graphics)
# - Permite rotar, hacer zoom, cambiar representaciones
#
# ¬øQU√â PUEDE MOSTRAR?
# - Estructuras est√°ticas (PDB)
# - Trayectorias completas (animaciones)
# - M√∫ltiples estilos:
#   * cartoon: Œ±-h√©lices y Œ≤-sheets
#   * ball+stick: bolas y palitos
#   * licorice: palitos (sin bolas)
#   * surface: superficie molecular
#   * ribbon: cinta del backbone
#
# COMPARACI√ìN CON OTROS VISORES:
# - VMD: m√°s poderoso pero requiere instalaci√≥n separada
# - PyMOL: mejor para figuras de publicaci√≥n
# - NGLView: perfecto para exploraci√≥n interactiva en notebooks
#
# EJEMPLO DE USO:
#   view = nv.show_mdtraj(traj)
#   view.add_representation('cartoon')
#   # Ahora puedes rotar con el mouse

print("‚úÖ Librer√≠as de visualizaci√≥n importadas")

In [None]:
# =============================================================================
# SECCI√ìN 5: CONFIGURACI√ìN DE VISUALIZACI√ìN
# =============================================================================

plt.style.use('seaborn-v0_8-darkgrid')
# ¬øQU√â HACE ESTO?
# - Cambia el "tema" de TODOS los gr√°ficos de Matplotlib
# - 'seaborn-v0_8-darkgrid' significa:
#   * Estilo tipo Seaborn (elegante)
#   * Versi√≥n 0.8 (compatibilidad)
#   * darkgrid = fondo gris claro con l√≠neas de cuadr√≠cula
#
# ¬øPOR QU√â ES IMPORTANTE?
# Sin esto: gr√°ficos con fondo blanco, colores b√°sicos, sin cuadr√≠cula
# Con esto: gr√°ficos profesionales autom√°ticamente
#
# OTROS ESTILOS DISPONIBLES:
# - 'default': estilo b√°sico de Matplotlib
# - 'ggplot': estilo de R/ggplot2
# - 'bmh': estilo Bayesian Methods for Hackers
# - 'fivethirtyeight': estilo del sitio web 538
# Prueba diferentes estilos cambiando este valor

sns.set_palette("husl")
# ¬øQU√â ES UNA PALETA DE COLORES?
# - Una secuencia de colores predefinida
# - Usada cuando graficas m√∫ltiples series
#
# ¬øPOR QU√â 'husl'?
# - HUSL = Human-friendly HSL (Hue, Saturation, Lightness)
# - Es "perceptualmente uniforme":
#   * Los colores son igualmente distinguibles para el ojo humano
#   * No hay colores que se "pierdan" o dominen
# - Funciona bien para:
#   * Personas con daltonismo (colorblindness-friendly)
#   * Impresi√≥n en blanco y negro (contraste preservado)
#   * Proyectores (colores se mantienen distinguibles)
#
# OTRAS PALETAS:
# - 'deep': colores profundos y saturados
# - 'muted': colores apagados (menos llamativos)
# - 'bright': colores brillantes
# - 'pastel': colores pastel suaves
# - 'dark': colores oscuros
#
# CU√ÅNDO IMPORTA:
# Si graficas 5 l√≠neas, usar√° 5 colores de la paleta autom√°ticamente

%matplotlib inline
# ¬øQU√â ES ESTO?
# - Un "comando m√°gico" de IPython/Jupyter (nota el %)
# - No es c√≥digo Python normal, es espec√≠fico de notebooks
#
# ¬øQU√â HACE?
# - Le dice a Jupyter: "muestra los gr√°ficos aqu√≠ en el notebook"
# - Los gr√°ficos aparecen como im√°genes PNG debajo de la celda
#
# ¬øQU√â PASAR√çA SIN ESTO?
# - Los gr√°ficos se abrir√≠an en ventanas separadas
# - No se guardar√≠an con el notebook
# - Ser√≠a imposible compartir notebooks con gr√°ficos
#
# ALTERNATIVAS:
# - %matplotlib notebook ‚Üí gr√°ficos interactivos (zoom, pan)
# - %matplotlib widget ‚Üí versi√≥n moderna de notebook
# Pero 'inline' es lo m√°s com√∫n y confiable

print("‚úÖ Configuraci√≥n de visualizaci√≥n establecida")
print("   - Estilo: seaborn-darkgrid")
print("   - Paleta: husl")
print("   - Backend: inline")

In [None]:
# =============================================================================
# SECCI√ìN 6: UTILIDADES Y VERIFICACI√ìN
# =============================================================================

import urllib.request
# ¬øPARA QU√â ES ESTO?
# - Para descargar archivos desde URLs (internet)
# - Parte de la librer√≠a est√°ndar de Python (no requiere instalaci√≥n)
#
# ¬øPOR QU√â LO NECESITAMOS?
# Vamos a descargar la estructura PDB autom√°ticamente:
# url = "https://files.rcsb.org/download/1ALA.pdb"
# urllib.request.urlretrieve(url, 'alanina.pdb')
#
# VENTAJA:
# - El notebook es completamente aut√≥nomo
# - No necesitas descargar archivos manualmente
# - Cualquiera puede ejecutarlo y obtendr√° los mismos resultados
#
# ALTERNATIVA:
# Podr√≠as usar: requests.get(url).content
# Pero urllib es m√°s simple para archivos √∫nicos

import warnings
warnings.filterwarnings('ignore')
# ¬øQU√â HACE ESTO?
# - Suprime mensajes de advertencia (warnings) de Python
#
# ¬øPOR QU√â?
# Algunas librer√≠as (especialmente MDAnalysis) muestran advertencias como:
# "DeprecationWarning: funci√≥n X ser√° removida en versi√≥n Y"
# Estas advertencias:
# - Son importantes para desarrolladores de librer√≠as
# - NO son importantes para usuarios finales (nosotros)
# - Ensucian la salida del notebook
#
# ‚ö†Ô∏è ADVERTENCIA IMPORTANTE:
# - Usa esto SOLO en notebooks exploratorios/educativos
# - En c√≥digo de producci√≥n, SIEMPRE lee las advertencias
# - Las advertencias pueden indicar:
#   * Bugs en tu c√≥digo
#   * Incompatibilidades de versiones
#   * Problemas futuros cuando actualices librer√≠as
#
# SI TIENES PROBLEMAS:
# Comenta esta l√≠nea (ponle # adelante) para ver todas las advertencias

print("\n" + "="*70)
print("üéâ TODAS LAS LIBRER√çAS IMPORTADAS EXITOSAMENTE")
print("="*70)
print("\nüìä Resumen de versiones:")
print(f"   ‚Ä¢ OpenMM:      {mm.__version__}")
print(f"   ‚Ä¢ MDTraj:      {md.__version__}")
print(f"   ‚Ä¢ MDAnalysis:  {mda.__version__}")
print(f"   ‚Ä¢ NumPy:       {np.__version__}")
print(f"   ‚Ä¢ Pandas:      {pd.__version__}")
print("\n‚úÖ Est√°s listo para comenzar la simulaci√≥n")
print("="*70 + "\n")

# ¬øPOR QU√â IMPRIMIR LAS VERSIONES?
# 1. Confirma que todas las importaciones funcionaron
# 2. Documenta el entorno computacional (reproducibilidad)
# 3. Ayuda a depurar si alguien tiene problemas
# 4. Algunos bugs solo existen en versiones espec√≠ficas
#
# REPRODUCIBILIDAD EN CIENCIA:
# Si publicas resultados, DEBES reportar:
# - Versiones de software (OpenMM 8.0.0)
# - Sistema operativo (Ubuntu 22.04)
# - Hardware (GPU NVIDIA RTX 3080)
# Esto permite que otros repliquen tus resultados exactamente