# üß¨ Simulaci√≥n y An√°lisis de Alanina Dip√©ptido

## Introducci√≥n

La **alanina dip√©ptido** (Ace-Ala-Nme) es uno de los sistemas m√°s simples para aprender din√°micas moleculares. Es lo suficientemente peque√±o para simulaciones r√°pidas, pero lo suficientemente complejo para mostrar comportamientos interesantes.

### ¬øPor qu√© Alanina Dip√©ptido?
- ‚úÖ Sistema peque√±o (~22 √°tomos)
- ‚úÖ Simula r√°pidamente
- ‚úÖ Muestra conformaciones importantes (Œ±-h√©lice, Œ≤-sheet)
- ‚úÖ Ideal para aprender an√°lisis conformacional

### Objetivos de este Notebook:
1. Descargar y preparar la estructura
2. Configurar y ejecutar una simulaci√≥n MD con OpenMM
3. Analizar la trayectoria (RMSD, √°ngulos diedros)
4. Crear diagrama de Ramachandran
5. Realizar an√°lisis de componentes principales (PCA)
6. Visualizar resultados

---

## üì¶ Paso 1: Importar Librer√≠as

Primero importamos todas las librer√≠as necesarias para la simulaci√≥n y an√°lisis.

In [None]:
# Librer√≠as para simulaci√≥n molecular
import openmm as mm                    # Motor de simulaci√≥n OpenMM
from openmm import app, unit           # Herramientas de aplicaci√≥n y unidades

# Librer√≠as para an√°lisis de trayectorias
import mdtraj as md                    # An√°lisis de trayectorias MD
import MDAnalysis as mda               # Alternativa para an√°lisis
from MDAnalysis.analysis import rms, align

# Librer√≠as cient√≠ficas
import numpy as np                     # Operaciones num√©ricas
import pandas as pd                    # Manejo de datos tabulares
from scipy import stats                # Estad√≠stica
from sklearn.decomposition import PCA  # An√°lisis de componentes principales

# Librer√≠as para visualizaci√≥n
import matplotlib.pyplot as plt        # Gr√°ficos 2D
import seaborn as sns                  # Gr√°ficos estad√≠sticos elegantes
import nglview as nv                   # Visualizaci√≥n 3D de mol√©culas

# Configuraci√≥n de estilo de gr√°ficos
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")
%matplotlib inline

# Utilidades
import urllib.request                  # Descargar archivos de internet
import warnings
warnings.filterwarnings('ignore')      # Suprimir advertencias menores

print("‚úÖ Todas las librer√≠as importadas correctamente")
print(f"   OpenMM versi√≥n: {mm.__version__}")
print(f"   MDTraj versi√≥n: {md.__version__}")

## üì• Paso 2: Descargar la Estructura

Descargamos la estructura de alanina dip√©ptido desde el Protein Data Bank (PDB).

**¬øQu√© es un archivo PDB?**
- Es un formato de texto que contiene coordenadas 3D de √°tomos
- Incluye informaci√≥n sobre la topolog√≠a molecular
- Es el est√°ndar internacional para estructuras biomoleculares

In [None]:
def descargar_pdb(pdb_id="1ALA", output_file="alanine_dipeptide.pdb"):
    """
    Descarga una estructura PDB desde RCSB.
    
    La funci√≥n:
    1. Construye la URL del PDB
    2. Descarga el archivo
    3. Lo guarda localmente
    """
    url = f"https://files.rcsb.org/download/{pdb_id}.pdb"
    print(f"üì• Descargando {pdb_id} desde RCSB PDB...")
    
    try:
        urllib.request.urlretrieve(url, output_file)
        print(f"‚úÖ Estructura guardada en: {output_file}")
        return output_file
    except Exception as e:
        print(f"‚ùå Error: {e}")
        return None

# Descargar la estructura
pdb_file = descargar_pdb("1ALA", "alanine_dipeptide.pdb")

## üîç Paso 3: Explorar la Estructura

Antes de simular, veamos qu√© contiene nuestra estructura.

In [None]:
# Cargar con MDTraj para an√°lisis inicial
traj_inicial = md.load(pdb_file)

print("üìä Informaci√≥n de la estructura:")
print(f"   N√∫mero de √°tomos: {traj_inicial.n_atoms}")
print(f"   N√∫mero de residuos: {traj_inicial.n_residues}")
print(f"   Residuos: {[r.name for r in traj_inicial.topology.residues]}")
print(f"\n   Topolog√≠a:")
print(traj_inicial.topology)

## üé® Visualizaci√≥n Inicial de la Estructura

Visualicemos la estructura 3D antes de simular.

In [None]:
# Crear visualizaci√≥n interactiva con NGLView
view = nv.show_mdtraj(traj_inicial)

# Personalizar la visualizaci√≥n
view.clear_representations()  # Limpiar visualizaci√≥n por defecto
view.add_representation('ball+stick', selection='all')  # Modelo de bolas y palitos
view.add_representation('cartoon', selection='protein', color='cyan')  # Cartoon para prote√≠na

# Mostrar
view

## ‚öôÔ∏è Paso 4: Configurar el Sistema de Simulaci√≥n

Ahora configuramos OpenMM para realizar la simulaci√≥n.

### Componentes de una Simulaci√≥n:
1. **Topolog√≠a**: Conectividad de √°tomos
2. **Campo de Fuerza**: Par√°metros de energ√≠a
3. **Integrador**: Algoritmo para evolucionar el sistema
4. **Sistema**: Condiciones de simulaci√≥n

In [None]:
# 1. Cargar estructura con OpenMM
pdb = app.PDBFile(pdb_file)
print("‚úÖ Estructura cargada")

# 2. Seleccionar campo de fuerza
# AMBER14 es un campo de fuerza popular para prote√≠nas
# Incluye par√°metros para todos los amino√°cidos
forcefield = app.ForceField('amber14-all.xml', 'implicit/gbn2.xml')
print("‚úÖ Campo de fuerza AMBER14 cargado")

# 3. Crear el sistema molecular
system = forcefield.createSystem(
    pdb.topology,
    nonbondedMethod=app.NoCutoff,      # Sin corte de interacciones (sistema peque√±o)
    constraints=app.HBonds,             # Restringir enlaces con hidr√≥geno
    rigidWater=True,                    # Agua r√≠gida (m√°s eficiente)
    implicitSolvent=app.GBn2            # Solvente impl√≠cito (sin agua expl√≠cita)
)
print("‚úÖ Sistema molecular creado")

# 4. Configurar integrador de Langevin
# El integrador de Langevin simula un ba√±o t√©rmico (ensemble NVT)
temperature = 300 * unit.kelvin         # Temperatura: 300 K (temperatura ambiente)
friction = 1.0 / unit.picosecond        # Coeficiente de fricci√≥n
timestep = 2.0 * unit.femtosecond       # Paso de tiempo: 2 fs

integrator = mm.LangevinIntegrator(temperature, friction, timestep)
print(f"‚úÖ Integrador configurado (T={temperature}, dt={timestep})")

# 5. Crear objeto de simulaci√≥n
simulation = app.Simulation(pdb.topology, system, integrator)
simulation.context.setPositions(pdb.positions)
print("‚úÖ Simulaci√≥n inicializada")

## ‚ö° Paso 5: Minimizaci√≥n de Energ√≠a

Antes de simular, minimizamos la energ√≠a para eliminar contactos malos (√°tomos muy cercanos).

**¬øPor qu√© minimizar?**
- Las estructuras experimentales pueden tener √°tomos superpuestos
- Evita fuerzas extremas que desestabilizar√≠an la simulaci√≥n
- Encuentra la conformaci√≥n de m√≠nima energ√≠a local

In [None]:
# Obtener energ√≠a inicial
state = simulation.context.getState(getEnergy=True)
energia_inicial = state.getPotentialEnergy()
print(f"‚ö° Energ√≠a inicial: {energia_inicial}")

# Minimizar energ√≠a
print("\nüîß Minimizando energ√≠a...")
simulation.minimizeEnergy(maxIterations=500)

# Obtener energ√≠a final
state = simulation.context.getState(getEnergy=True)
energia_final = state.getPotentialEnergy()
print(f"‚úÖ Energ√≠a final: {energia_final}")
print(f"üìâ Cambio de energ√≠a: {energia_final - energia_inicial}")

## üå°Ô∏è Paso 6: Equilibraci√≥n del Sistema

Equilibramos el sistema para que alcance la temperatura deseada.

**¬øQu√© es la equilibraci√≥n?**
- Permite que el sistema se adapte a las condiciones de simulaci√≥n
- La temperatura y energ√≠a se estabilizan
- T√≠picamente 0.1-1 ns dependiendo del sistema

In [None]:
# Equilibraci√≥n: 2000 pasos = 4 ps (2 fs/paso * 2000)
print("üå°Ô∏è  Equilibrando sistema...")
equilibration_steps = 2000
simulation.step(equilibration_steps)
print(f"‚úÖ Equilibraci√≥n completada ({equilibration_steps} pasos = {equilibration_steps * 2} fs)")

## üöÄ Paso 7: Simulaci√≥n de Producci√≥n

¬°Ahora s√≠! Ejecutamos la simulaci√≥n principal y guardamos la trayectoria.

**Par√°metros de producci√≥n:**
- Duraci√≥n: 20 ps (10,000 pasos √ó 2 fs)
- Guardamos cada 100 pasos = cada 0.2 ps
- Total de frames: 100

In [None]:
# Configurar nombres de archivos de salida
output_dcd = "alanine_trajectory.dcd"  # Archivo de trayectoria (formato binario)
output_pdb = "alanine_final.pdb"        # Estructura final

# Configurar reporteros (guardan informaci√≥n durante la simulaci√≥n)
# Reportero 1: Guardar trayectoria en formato DCD
simulation.reporters.append(
    app.DCDReporter(output_dcd, 100)  # Guardar cada 100 pasos
)

# Reportero 2: Imprimir estad√≠sticas en pantalla
simulation.reporters.append(
    app.StateDataReporter(
        'simulation_log.txt',
        100,                              # Reportar cada 100 pasos
        step=True,                        # N√∫mero de paso
        time=True,                        # Tiempo de simulaci√≥n
        potentialEnergy=True,             # Energ√≠a potencial
        kineticEnergy=True,               # Energ√≠a cin√©tica
        totalEnergy=True,                 # Energ√≠a total
        temperature=True,                 # Temperatura
        speed=True                        # Velocidad de simulaci√≥n
    )
)

print("üöÄ Iniciando simulaci√≥n de producci√≥n...")
print("   Esto puede tomar 1-2 minutos...")

# Ejecutar simulaci√≥n
production_steps = 10000
simulation.step(production_steps)

# Guardar estructura final
positions = simulation.context.getState(getPositions=True).getPositions()
app.PDBFile.writeFile(simulation.topology, positions, open(output_pdb, 'w'))

print("\n‚úÖ Simulaci√≥n completada exitosamente!")
print(f"   Trayectoria guardada en: {output_dcd}")
print(f"   Estructura final en: {output_pdb}")
print(f"   Tiempo total simulado: {production_steps * 2} fs = {production_steps * 2 / 1000} ps")

---

# üìä AN√ÅLISIS DE LA TRAYECTORIA

Ahora que tenemos la trayectoria, ¬°analic√©mosla!

---

## üìà Paso 8: Cargar y Analizar Energ√≠as

Primero veamos c√≥mo evolucion√≥ la energ√≠a durante la simulaci√≥n.

In [None]:
# Leer el archivo de log
data = pd.read_csv('simulation_log.txt', sep=',', skiprows=0)

# Limpiar nombres de columnas (quitar espacios)
data.columns = data.columns.str.strip()

print("üìä Datos de simulaci√≥n:")
print(data.head())
print(f"\n   Total de frames: {len(data)}")

In [None]:
# Graficar energ√≠as a lo largo del tiempo
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# Energ√≠a Potencial
axes[0, 0].plot(data['Time (ps)'], data['Potential Energy (kJ/mole)'], 
                color='blue', linewidth=1.5)
axes[0, 0].set_xlabel('Tiempo (ps)', fontsize=12)
axes[0, 0].set_ylabel('Energ√≠a Potencial (kJ/mol)', fontsize=12)
axes[0, 0].set_title('Energ√≠a Potencial vs Tiempo', fontsize=14, fontweight='bold')
axes[0, 0].grid(True, alpha=0.3)

# Energ√≠a Cin√©tica
axes[0, 1].plot(data['Time (ps)'], data['Kinetic Energy (kJ/mole)'], 
                color='red', linewidth=1.5)
axes[0, 1].set_xlabel('Tiempo (ps)', fontsize=12)
axes[0, 1].set_ylabel('Energ√≠a Cin√©tica (kJ/mol)', fontsize=12)
axes[0, 1].set_title('Energ√≠a Cin√©tica vs Tiempo', fontsize=14, fontweight='bold')
axes[0, 1].grid(True, alpha=0.3)

# Energ√≠a Total
axes[1, 0].plot(data['Time (ps)'], data['Total Energy (kJ/mole)'], 
                color='green', linewidth=1.5)
axes[1, 0].set_xlabel('Tiempo (ps)', fontsize=12)
axes[1, 0].set_ylabel('Energ√≠a Total (kJ/mol)', fontsize=12)
axes[1, 0].set_title('Energ√≠a Total vs Tiempo', fontsize=14, fontweight='bold')
axes[1, 0].grid(True, alpha=0.3)

# Temperatura
axes[1, 1].plot(data['Time (ps)'], data['Temperature (K)'], 
                color='orange', linewidth=1.5)
axes[1, 1].axhline(y=300, color='red', linestyle='--', label='Target (300 K)')
axes[1, 1].set_xlabel('Tiempo (ps)', fontsize=12)
axes[1, 1].set_ylabel('Temperatura (K)', fontsize=12)
axes[1, 1].set_title('Temperatura vs Tiempo', fontsize=14, fontweight='bold')
axes[1, 1].legend()
axes[1, 1].grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig('energia_analisis.png', dpi=300, bbox_inches='tight')
plt.show()

print("\nüìä Estad√≠sticas de Energ√≠a:")
print(f"   Energ√≠a Potencial promedio: {data['Potential Energy (kJ/mole)'].mean():.2f} ¬± {data['Potential Energy (kJ/mole)'].std():.2f} kJ/mol")
print(f"   Temperatura promedio: {data['Temperature (K)'].mean():.2f} ¬± {data['Temperature (K)'].std():.2f} K")

## üé¨ Paso 9: Visualizar la Trayectoria

Veamos c√≥mo se movi√≥ la mol√©cula durante la simulaci√≥n.

In [None]:
# Cargar trayectoria con MDTraj
traj = md.load(output_dcd, top=pdb_file)

print(f"üìä Informaci√≥n de la trayectoria:")
print(f"   N√∫mero de frames: {traj.n_frames}")
print(f"   Tiempo total: {traj.n_frames * 0.2} ps")
print(f"   N√∫mero de √°tomos: {traj.n_atoms}")

# Visualizar trayectoria completa
view_traj = nv.show_mdtraj(traj)
view_traj.clear_representations()
view_traj.add_representation('cartoon', selection='protein', color='blue')
view_traj.add_representation('licorice', selection='protein')
view_traj

## üìè Paso 10: An√°lisis RMSD (Root Mean Square Deviation)

El RMSD mide cu√°nto se desv√≠a la estructura de la posici√≥n inicial.

**Interpretaci√≥n:**
- RMSD bajo (< 1 √Ö): Estructura estable
- RMSD alto (> 3 √Ö): Cambio conformacional significativo
- RMSD creciente: Sistema explorando nuevas conformaciones

In [None]:
# Calcular RMSD respecto al primer frame
# Alineamos primero para remover traslaciones y rotaciones
traj_aligned = traj.superpose(traj, frame=0)

# Calcular RMSD de todos los √°tomos
rmsd_all = md.rmsd(traj_aligned, traj_aligned, frame=0) * 10  # Convertir nm a √Ö

# Calcular RMSD solo del backbone (cadena principal)
backbone_atoms = traj.topology.select('backbone')
rmsd_backbone = md.rmsd(traj_aligned, traj_aligned, frame=0, atom_indices=backbone_atoms) * 10

# Graficar RMSD
fig, ax = plt.subplots(figsize=(12, 6))

time = np.arange(len(rmsd_all)) * 0.2  # Tiempo en ps

ax.plot(time, rmsd_all, label='Todos los √°tomos', linewidth=2, alpha=0.7)
ax.plot(time, rmsd_backbone, label='Backbone', linewidth=2, alpha=0.7)

ax.set_xlabel('Tiempo (ps)', fontsize=14)
ax.set_ylabel('RMSD (√Ö)', fontsize=14)
ax.set_title('RMSD vs Tiempo - Alanina Dip√©ptido', fontsize=16, fontweight='bold')
ax.legend(fontsize=12)
ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig('rmsd_analysis.png', dpi=300, bbox_inches='tight')
plt.show()

print(f"\nüìä Estad√≠sticas RMSD:")
print(f"   RMSD promedio (todos): {rmsd_all.mean():.3f} ¬± {rmsd_all.std():.3f} √Ö")
print(f"   RMSD promedio (backbone): {rmsd_backbone.mean():.3f} ¬± {rmsd_backbone.std():.3f} √Ö")
print(f"   RMSD m√°ximo: {rmsd_all.max():.3f} √Ö")

## üîÑ Paso 11: Diagrama de Ramachandran

El diagrama de Ramachandran muestra los √°ngulos diedros œÜ (phi) y œà (psi) del backbone.

**¬øQu√© nos dice?**
- **Regi√≥n Œ±-helix**: œÜ ‚âà -60¬∞, œà ‚âà -45¬∞
- **Regi√≥n Œ≤-sheet**: œÜ ‚âà -120¬∞, œà ‚âà +120¬∞
- **Regi√≥n PPII**: œÜ ‚âà -60¬∞, œà ‚âà +150¬∞

Para alanina dip√©ptido, esperamos ver transiciones entre estas regiones.

In [None]:
# Calcular √°ngulos diedros phi y psi
phi_angles = md.compute_phi(traj)[1]  # [1] porque devuelve (indices, angulos)
psi_angles = md.compute_psi(traj)[1]

# Convertir de radianes a grados
phi_degrees = np.degrees(phi_angles).flatten()
psi_degrees = np.degrees(psi_angles).flatten()

print(f"üìê √Ångulos calculados:")
print(f"   Phi: {len(phi_degrees)} valores")
print(f"   Psi: {len(psi_degrees)} valores")

# Crear diagrama de Ramachandran
fig, ax = plt.subplots(figsize=(10, 10))

# Scatter plot de phi vs psi
scatter = ax.scatter(phi_degrees, psi_degrees, 
                     c=time[:len(phi_degrees)],  # Color por tiempo
                     cmap='viridis', 
                     alpha=0.6, 
                     s=50,
                     edgecolors='black',
                     linewidth=0.5)

# A√±adir colorbar
cbar = plt.colorbar(scatter, ax=ax)
cbar.set_label('Tiempo (ps)', fontsize=12)

# Marcar regiones caracter√≠sticas
# Regi√≥n Œ±-helix
ax.plot(-60, -45, 'r*', markersize=20, label='Œ±-helix')
# Regi√≥n Œ≤-sheet
ax.plot(-120, 120, 'b*', markersize=20, label='Œ≤-sheet')
# Regi√≥n PPII
ax.plot(-60, 150, 'g*', markersize=20, label='PPII')

# Configurar ejes
ax.set_xlabel('œÜ (Phi) - grados', fontsize=14)
ax.set_ylabel('œà (Psi) - grados', fontsize=14)
ax.set_title('Diagrama de Ramachandran - Alanina Dip√©ptido', 
             fontsize=16, fontweight='bold')
ax.set_xlim(-180, 180)
ax.set_ylim(-180, 180)
ax.axhline(0, color='gray', linestyle='--', alpha=0.3)
ax.axvline(0, color='gray', linestyle='--', alpha=0.3)
ax.legend(fontsize=12, loc='upper left')
ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig('ramachandran_plot.png', dpi=300, bbox_inches='tight')
plt.show()

print(f"\nüìä Estad√≠sticas de √°ngulos diedros:")
print(f"   Phi promedio: {phi_degrees.mean():.2f}¬∞ ¬± {phi_degrees.std():.2f}¬∞")
print(f"   Psi promedio: {psi_degrees.mean():.2f}¬∞ ¬± {psi_degrees.std():.2f}¬∞")

## üìä Paso 12: An√°lisis de Componentes Principales (PCA)

PCA nos ayuda a identificar los movimientos m√°s importantes de la mol√©cula.

**¬øQu√© es PCA?**
- Reduce la dimensionalidad de los datos
- Identifica las direcciones de mayor varianza
- PC1 = movimiento m√°s importante
- PC2 = segundo movimiento m√°s importante

In [None]:
# Preparar datos para PCA
# Usamos solo el backbone para simplificar
backbone_xyz = traj_aligned.xyz[:, backbone_atoms, :]

# Reshape: (n_frames, n_atoms * 3)
n_frames, n_atoms, _ = backbone_xyz.shape
data_pca = backbone_xyz.reshape(n_frames, -1)

print(f"üîç Preparando PCA:")
print(f"   Shape de datos: {data_pca.shape}")
print(f"   ({n_frames} frames, {n_atoms} √°tomos √ó 3 coordenadas)")

# Aplicar PCA
pca = PCA(n_components=5)  # Calculamos 5 componentes principales
pc_coords = pca.fit_transform(data_pca)

# Varianza explicada
variance_ratio = pca.explained_variance_ratio_

print(f"\nüìä Varianza explicada por cada PC:")
for i, var in enumerate(variance_ratio, 1):
    print(f"   PC{i}: {var*100:.2f}%")
print(f"\n   Total (PC1-PC5): {variance_ratio.sum()*100:.2f}%")

In [None]:
# Visualizar PCA
fig, axes = plt.subplots(1, 2, figsize=(16, 6))

# Gr√°fico 1: Varianza explicada
axes[0].bar(range(1, 6), variance_ratio * 100, alpha=0.7, color='steelblue')
axes[0].plot(range(1, 6), np.cumsum(variance_ratio * 100), 
             'ro-', linewidth=2, markersize=8, label='Acumulada')
axes[0].set_xlabel('Componente Principal', fontsize=12)
axes[0].set_ylabel('Varianza Explicada (%)', fontsize=12)
axes[0].set_title('Varianza Explicada por PCA', fontsize=14, fontweight='bold')
axes[0].legend(fontsize=11)
axes[0].grid(True, alpha=0.3)

# Gr√°fico 2: Proyecci√≥n en PC1 vs PC2
scatter = axes[1].scatter(pc_coords[:, 0], pc_coords[:, 1], 
                         c=time[:len(pc_coords)], 
                         cmap='plasma', 
                         alpha=0.7,
                         s=60,
                         edgecolors='black',
                         linewidth=0.5)

cbar = plt.colorbar(scatter, ax=axes[1])
cbar.set_label('Tiempo (ps)', fontsize=12)

axes[1].set_xlabel(f'PC1 ({variance_ratio[0]*100:.1f}% varianza)', fontsize=12)
axes[1].set_ylabel(f'PC2 ({variance_ratio[1]*100:.1f}% varianza)', fontsize=12)
axes[1].set_title('Proyecci√≥n en Espacio de Componentes Principales', 
                  fontsize=14, fontweight='bold')
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig('pca_analysis.png', dpi=300, bbox_inches='tight')
plt.show()

## üé® Paso 13: Visualizar Movimiento a lo largo de PC1

Veamos c√≥mo se mueve la mol√©cula a lo largo del primer componente principal.

In [None]:
# Encontrar los extremos de PC1
pc1_min_idx = np.argmin(pc_coords[:, 0])
pc1_max_idx = np.argmax(pc_coords[:, 0])

print(f"üé¨ Extremos de PC1:")
print(f"   M√≠nimo: frame {pc1_min_idx} (tiempo {pc1_min_idx * 0.2:.1f} ps)")
print(f"   M√°ximo: frame {pc1_max_idx} (tiempo {pc1_max_idx * 0.2:.1f} ps)")

# Crear trayectoria con solo estos extremos
extreme_frames = traj[[pc1_min_idx, pc1_max_idx]]

# Visualizar
view_pc1 = nv.show_mdtraj(extreme_frames)
view_pc1.clear_representations()
view_pc1.add_representation('cartoon', selection='protein', color='cyan')
view_pc1.add_representation('licorice', selection='protein')
view_pc1

## üìã Paso 14: Resumen y Conclusiones

Generemos un reporte final con todas las m√©tricas.

In [None]:
# Crear reporte final
print("="*70)
print("üìä REPORTE FINAL - SIMULACI√ìN DE ALANINA DIP√âPTIDO")
print("="*70)

print("\nüîß PAR√ÅMETROS DE SIMULACI√ìN:")
print(f"   Campo de fuerza: AMBER14")
print(f"   Solvente: Impl√≠cito (GBn2)")
print(f"   Temperatura: 300 K")
print(f"   Timestep: 2 fs")
print(f"   Duraci√≥n: {production_steps * 2 / 1000} ps")
print(f"   Frames guardados: {traj.n_frames}")

print("\n‚ö° ENERG√çAS:")
print(f"   Energ√≠a potencial promedio: {data['Potential Energy (kJ/mole)'].mean():.2f} ¬± {data['Potential Energy (kJ/mole)'].std():.2f} kJ/mol")
print(f"   Temperatura promedio: {data['Temperature (K)'].mean():.2f} ¬± {data['Temperature (K)'].std():.2f} K")

print("\nüìè ESTABILIDAD ESTRUCTURAL:")
print(f"   RMSD promedio (todos): {rmsd_all.mean():.3f} ¬± {rmsd_all.std():.3f} √Ö")
print(f"   RMSD promedio (backbone): {rmsd_backbone.mean():.3f} ¬± {rmsd_backbone.std():.3f} √Ö")
print(f"   RMSD m√°ximo: {rmsd_all.max():.3f} √Ö")

print("\nüìê √ÅNGULOS DIEDROS:")
print(f"   Phi (œÜ) promedio: {phi_degrees.mean():.2f}¬∞ ¬± {phi_degrees.std():.2f}¬∞")
print(f"   Psi (œà) promedio: {psi_degrees.mean():.2f}¬∞ ¬± {psi_degrees.std():.2f}¬∞")

print("\nüîç AN√ÅLISIS PCA:")
print(f"   PC1 explica: {variance_ratio[0]*100:.2f}% de la varianza")
print(f"   PC2 explica: {variance_ratio[1]*100:.2f}% de la varianza")
print(f"   PC1+PC2 explican: {(variance_ratio[0]+variance_ratio[1])*100:.2f}% de la varianza total")

print("\nüìÅ ARCHIVOS GENERADOS:")
print(f"   ‚úÖ {output_dcd} - Trayectoria")
print(f"   ‚úÖ {output_pdb} - Estructura final")
print(f"   ‚úÖ simulation_log.txt - Log de simulaci√≥n")
print(f"   ‚úÖ energia_analisis.png - Gr√°ficos de energ√≠a")
print(f"   ‚úÖ rmsd_analysis.png - An√°lisis RMSD")
print(f"   ‚úÖ ramachandran_plot.png - Diagrama de Ramachandran")
print(f"   ‚úÖ pca_analysis.png - An√°lisis PCA")

print("\n" + "="*70)
print("üéâ ¬°An√°lisis completado exitosamente!")
print("="*70)

## üéì Conclusiones y Aprendizajes

### ¬øQu√© aprendimos?

1. **Configuraci√≥n de simulaciones**: C√≥mo preparar un sistema molecular
2. **Minimizaci√≥n y equilibraci√≥n**: Por qu√© son necesarias
3. **An√°lisis de energ√≠as**: C√≥mo verificar estabilidad
4. **RMSD**: Medir desviaciones estructurales
5. **Ramachandran**: Analizar conformaciones del backbone
6. **PCA**: Identificar movimientos colectivos

### Pr√≥ximos pasos:

- Aumentar el tiempo de simulaci√≥n (100 ps - 1 ns)
- Simular en agua expl√≠cita
- Analizar clustering de conformaciones
- Calcular free energy landscapes
- Probar con sistemas m√°s grandes (prote√≠nas)

### Recursos adicionales:

- [OpenMM Documentation](http://docs.openmm.org/)
- [MDTraj Tutorials](http://mdtraj.org/)
- [Best Practices in MD](https://www.mdanalysis.org/)

---

**¬°Felicidades!** Has completado tu primera simulaci√≥n de din√°mica molecular üéâ