# üß¨ M√≥dulo 2: Representaci√≥n y Visualizaci√≥n Molecular
## Actividad 2.3: RDKit y OpenBabel

<div align="center">
  
**Universidad de Caldas - Departamento de Qu√≠mica**  
*Introducci√≥n a la Qu√≠mica Computacional (173G7G)*  
**Profesor:** Jos√© Mauricio Rodas Rodr√≠guez

[![Open in Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/maurorodas/Quimica_computacional_173G7G/blob/main/modulo_02_representacion_molecular/03_rdkit_openbabel.ipynb)

</div>

---

## üéØ Objetivos de Aprendizaje

Al finalizar esta actividad, ser√°s capaz de:
- Dominar las bibliotecas RDKit y OpenBabel para qu√≠mica computacional
- Manipular estructuras moleculares program√°ticamente
- Calcular descriptores y propiedades moleculares
- Realizar transformaciones y modificaciones estructurales
- Optimizar geometr√≠as moleculares
- Integrar herramientas de quimioinform√°tica en flujos de trabajo

---

## üìö Contenido

1. [Introducci√≥n a RDKit](#1-rdkit-intro)
2. [Creaci√≥n y Manipulaci√≥n de Mol√©culas](#2-manipulacion)
3. [C√°lculo de Descriptores Moleculares](#3-descriptores)
4. [Modificaci√≥n de Estructuras](#4-modificacion)
5. [OpenBabel: Conversi√≥n Universal](#5-openbabel)
6. [Generaci√≥n de Conformaciones 3D](#6-conformaciones)
7. [Propiedades Fisicoqu√≠micas](#7-propiedades)
8. [Ejercicios Pr√°cticos](#8-ejercicios)

---

---

## üì¶ Instalaci√≥n e Importaci√≥n

In [None]:
# Instalaci√≥n en Google Colab
import sys
if 'google.colab' in sys.modules:
    !pip install rdkit -q
    !pip install openbabel-wheel -q
    !pip install py3Dmol -q
    print("‚úì Librer√≠as instaladas")

In [None]:
# Importar librer√≠as
import numpy as np
import pandas as pd
from rdkit import Chem
from rdkit.Chem import AllChem, Descriptors, Lipinski, Crippen, MolSurf
from rdkit.Chem import Draw, rdMolDescriptors, rdmolops
from rdkit.Chem.Draw import IPythonConsole
import matplotlib.pyplot as plt
from IPython.display import display, HTML, Image
import warnings
warnings.filterwarnings('ignore')

# Configuraci√≥n para visualizaci√≥n
IPythonConsole.ipython_useSVG = True

print(f"‚úì RDKit versi√≥n: {Chem.rdBase.rdkitVersion}")
print("‚úì Bibliotecas importadas correctamente")

---

## 1. Introducci√≥n a RDKit <a id="1-rdkit-intro"></a>

### ¬øQu√© es RDKit?

**RDKit** (RDKit: Open-Source Cheminformatics Software) es la biblioteca m√°s popular para quimioinform√°tica en Python.

### üéØ Caracter√≠sticas Principales

- üß™ **Manipulaci√≥n molecular**: Crear, editar y analizar mol√©culas
- üìä **Descriptores**: Calcular >200 descriptores moleculares
- üîç **B√∫squedas**: Subestructuras y similitud molecular
- üé® **Visualizaci√≥n**: Dibujar estructuras 2D de alta calidad
- ‚öõÔ∏è **Conformaciones**: Generar geometr√≠as 3D
- üíä **Drug-likeness**: Filtros de Lipinski, Veber, etc.
- üß¨ **Fingerprints**: Para b√∫squedas de similitud

### üìö ¬øPor qu√© RDKit?

| Ventaja | Descripci√≥n |
|---------|-------------|
| **Open Source** | Gratuito y c√≥digo abierto |
| **R√°pido** | Implementaci√≥n en C++ |
| **Completo** | Amplia funcionalidad |
| **Documentado** | Excelente documentaci√≥n |
| **Comunidad** | Activa y solidaria |

---

## 2. Creaci√≥n y Manipulaci√≥n de Mol√©culas <a id="2-manipulacion"></a>

### üìñ Formas de crear mol√©culas en RDKit

RDKit puede crear mol√©culas desde m√∫ltiples formatos:

In [None]:
# 1. Desde SMILES
mol_smiles = Chem.MolFromSmiles("CC(=O)Oc1ccccc1C(=O)O")  # Aspirina

# 2. Desde InChI
mol_inchi = Chem.MolFromInchi("InChI=1S/C2H6O/c1-2-3/h3H,2H2,1H3")  # Etanol

# 3. Desde archivo MOL
# mol_file = Chem.MolFromMolFile("molecula.mol")

# 4. Desde PDB
# mol_pdb = Chem.MolFromPDBFile("proteina.pdb")

# 5. Creaci√≥n manual con SMARTS
pattern = Chem.MolFromSmarts("[OH]")  # Patr√≥n de hidroxilo

print("‚úÖ Mol√©culas creadas desde diferentes formatos")
print(f"   ‚Ä¢ Aspirina: {Chem.MolToSmiles(mol_smiles)}")
print(f"   ‚Ä¢ Etanol: {Chem.MolToSmiles(mol_inchi)}")

# Visualizar
img = Draw.MolsToGridImage([mol_smiles, mol_inchi], 
                           molsPerRow=2, 
                           subImgSize=(300,300),
                           legends=["Aspirina", "Etanol"])
display(img)

### üî¨ Informaci√≥n B√°sica de la Mol√©cula

In [None]:
# Analizar la estructura de la aspirina
mol = Chem.MolFromSmiles("CC(=O)Oc1ccccc1C(=O)O")

print("üìä Informaci√≥n b√°sica de la Aspirina\n")
print("=" * 60)

# F√≥rmula molecular
formula = rdMolDescriptors.CalcMolFormula(mol)
print(f"F√≥rmula molecular: {formula}")

# N√∫mero de √°tomos
num_atoms = mol.GetNumAtoms()
num_heavy_atoms = mol.GetNumHeavyAtoms()
print(f"Total de √°tomos: {num_atoms}")
print(f"√Åtomos pesados: {num_heavy_atoms}")

# N√∫mero de enlaces
num_bonds = mol.GetNumBonds()
print(f"Total de enlaces: {num_bonds}")

# Peso molecular
mol_weight = Descriptors.MolWt(mol)
print(f"Peso molecular: {mol_weight:.2f} g/mol")

# Anillos
num_rings = rdMolDescriptors.CalcNumRings(mol)
num_aromatic_rings = rdMolDescriptors.CalcNumAromaticRings(mol)
print(f"Anillos totales: {num_rings}")
print(f"Anillos arom√°ticos: {num_aromatic_rings}")

print("\n" + "=" * 60)

# Iterar sobre √°tomos
print("\nüî¨ √Åtomos en la mol√©cula:\n")
for atom in mol.GetAtoms():
    idx = atom.GetIdx()
    symbol = atom.GetSymbol()
    hybridization = atom.GetHybridization()
    aromatic = atom.GetIsAromatic()
    print(f"   √Åtomo {idx}: {symbol:2s} | Hibridaci√≥n: {hybridization} | Arom√°tico: {aromatic}")

display(mol)

### üé® Personalizaci√≥n de Visualizaci√≥n

In [None]:
# Resaltar subestructuras
mol = Chem.MolFromSmiles("CC(=O)Oc1ccccc1C(=O)O")  # Aspirina

# Buscar grupos funcionales
pattern_ester = Chem.MolFromSmarts("C(=O)O[C]")
pattern_carboxyl = Chem.MolFromSmarts("C(=O)[OH]")
pattern_aromatic = Chem.MolFromSmarts("c1ccccc1")

# Encontrar coincidencias
match_ester = mol.GetSubstructMatch(pattern_ester)
match_carboxyl = mol.GetSubstructMatch(pattern_carboxyl)
match_aromatic = mol.GetSubstructMatch(pattern_aromatic)

print("üîç Grupos funcionales encontrados en Aspirina:\n")
print(f"   ‚Ä¢ √âster: √°tomos {match_ester}")
print(f"   ‚Ä¢ √Åcido carbox√≠lico: √°tomos {match_carboxyl}")
print(f"   ‚Ä¢ Anillo arom√°tico: √°tomos {match_aromatic}")

# Visualizar con resaltado
from rdkit.Chem import rdDepictor
rdDepictor.Compute2DCoords(mol)

# Diferentes visualizaciones
imgs = []
legends = []

# Original
imgs.append(Draw.MolToImage(mol, size=(300,300)))
legends.append("Aspirina")

# Resaltar √©ster
imgs.append(Draw.MolToImage(mol, size=(300,300), highlightAtoms=match_ester))
legends.append("Grupo √©ster")

# Resaltar √°cido
imgs.append(Draw.MolToImage(mol, size=(300,300), highlightAtoms=match_carboxyl))
legends.append("√Åcido carbox√≠lico")

# Resaltar arom√°tico
imgs.append(Draw.MolToImage(mol, size=(300,300), highlightAtoms=match_aromatic))
legends.append("Anillo arom√°tico")

# Mostrar en grid
fig, axes = plt.subplots(2, 2, figsize=(12, 12))
axes = axes.flatten()

for i, (img, legend) in enumerate(zip(imgs, legends)):
    axes[i].imshow(img)
    axes[i].axis('off')
    axes[i].set_title(legend, fontsize=14, fontweight='bold')

plt.tight_layout()
plt.show()

---

## 3. C√°lculo de Descriptores Moleculares <a id="3-descriptores"></a>

Los **descriptores moleculares** son propiedades num√©ricas que caracterizan las mol√©culas.

### üìä Tipos de Descriptores

- **Topol√≥gicos**: Basados en la conectividad
- **Geom√©tricos**: Basados en la geometr√≠a 3D
- **Electr√≥nicos**: Distribuci√≥n de carga
- **Fisicoqu√≠micos**: LogP, PSA, etc.

In [None]:
# Calcular descriptores para varios f√°rmacos
farmacos = {
    "Aspirina": "CC(=O)Oc1ccccc1C(=O)O",
    "Ibuprofeno": "CC(C)Cc1ccc(cc1)C(C)C(=O)O",
    "Paracetamol": "CC(=O)Nc1ccc(cc1)O",
    "Cafe√≠na": "CN1C=NC2=C1C(=O)N(C(=O)N2C)C",
    "Vitamina C": "O=C1OC(C(O)=C1O)C(O)C(O)CO"
}

# Funci√≥n para calcular m√∫ltiples descriptores
def calcular_descriptores(smiles):
    mol = Chem.MolFromSmiles(smiles)
    if mol is None:
        return None
    
    descriptores = {
        'Peso Molecular': Descriptors.MolWt(mol),
        'LogP': Descriptors.MolLogP(mol),
        'HBA (Aceptores H)': Descriptors.NumHAcceptors(mol),
        'HBD (Donadores H)': Descriptors.NumHDonors(mol),
        'PSA (√Ö¬≤)': Descriptors.TPSA(mol),
        '√Åtomos pesados': mol.GetNumHeavyAtoms(),
        'Enlaces rotables': Descriptors.NumRotatableBonds(mol),
        'Anillos arom√°ticos': Descriptors.NumAromaticRings(mol),
        'Fracci√≥n sp¬≥': Descriptors.FractionCSP3(mol),
    }
    
    return descriptores

# Calcular para todos los f√°rmacos
resultados = {}
for nombre, smiles in farmacos.items():
    resultados[nombre] = calcular_descriptores(smiles)

# Crear DataFrame
df = pd.DataFrame(resultados).T
print("üìä Descriptores Moleculares de F√°rmacos Comunes\n")
print("=" * 100)
print(df.round(2))
print("=" * 100)

# Visualizar comparaci√≥n
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# Peso molecular
axes[0, 0].bar(df.index, df['Peso Molecular'], color='steelblue')
axes[0, 0].set_ylabel('Peso Molecular (g/mol)')
axes[0, 0].set_title('Peso Molecular')
axes[0, 0].tick_params(axis='x', rotation=45)

# LogP (Lipofilicidad)
axes[0, 1].bar(df.index, df['LogP'], color='coral')
axes[0, 1].set_ylabel('LogP')
axes[0, 1].set_title('Lipofilicidad (LogP)')
axes[0, 1].axhline(y=5, color='r', linestyle='--', label='L√≠mite Lipinski')
axes[0, 1].legend()
axes[0, 1].tick_params(axis='x', rotation=45)

# Donadores y Aceptores de H
x = np.arange(len(df))
width = 0.35
axes[1, 0].bar(x - width/2, df['HBD (Donadores H)'], width, label='Donadores H', color='green')
axes[1, 0].bar(x + width/2, df['HBA (Aceptores H)'], width, label='Aceptores H', color='orange')
axes[1, 0].set_ylabel('Cantidad')
axes[1, 0].set_title('Enlaces de Hidr√≥geno')
axes[1, 0].set_xticks(x)
axes[1, 0].set_xticklabels(df.index, rotation=45)
axes[1, 0].legend()

# PSA
axes[1, 1].bar(df.index, df['PSA (√Ö¬≤)'], color='purple')
axes[1, 1].set_ylabel('PSA (≈≤)')
axes[1, 1].set_title('√Årea de Superficie Polar')
axes[1, 1].axhline(y=140, color='r', linestyle='--', label='L√≠mite permeabilidad')
axes[1, 1].legend()
axes[1, 1].tick_params(axis='x', rotation=45)

plt.tight_layout()
plt.show()

### üíä Regla de los Cinco de Lipinski

La **Regla de Lipinski** predice si un compuesto ser√° biodisponible oralmente:

1. Peso molecular ‚â§ 500 Da
2. LogP ‚â§ 5
3. Donadores de H ‚â§ 5
4. Aceptores de H ‚â§ 10

In [None]:
# Evaluar Regla de Lipinski
def evaluar_lipinski(smiles):
    mol = Chem.MolFromSmiles(smiles)
    if mol is None:
        return None
    
    MW = Descriptors.MolWt(mol)
    LogP = Descriptors.MolLogP(mol)
    HBA = Descriptors.NumHAcceptors(mol)
    HBD = Descriptors.NumHDonors(mol)
    
    reglas = {
        'Peso Molecular ‚â§ 500': MW <= 500,
        'LogP ‚â§ 5': LogP <= 5,
        'HBA ‚â§ 10': HBA <= 10,
        'HBD ‚â§ 5': HBD <= 5
    }
    
    cumple_todo = all(reglas.values())
    
    return {
        'MW': MW,
        'LogP': LogP,
        'HBA': HBA,
        'HBD': HBD,
        'Reglas': reglas,
        'Aprueba': cumple_todo
    }

# Evaluar f√°rmacos
print("üíä Evaluaci√≥n de la Regla de Lipinski\n")
print("=" * 80)

for nombre, smiles in farmacos.items():
    resultado = evaluar_lipinski(smiles)
    aprueba = "‚úÖ APRUEBA" if resultado['Aprueba'] else "‚ùå NO APRUEBA"
    
    print(f"\n{nombre} - {aprueba}")
    print(f"   MW: {resultado['MW']:.1f} | LogP: {resultado['LogP']:.2f} | HBA: {resultado['HBA']} | HBD: {resultado['HBD']}")
    
    violaciones = [regla for regla, cumple in resultado['Reglas'].items() if not cumple]
    if violaciones:
        print(f"   Violaciones: {', '.join(violaciones)}")

print("\n" + "=" * 80)

# Visualizar mol√©culas
mols = [Chem.MolFromSmiles(s) for s in farmacos.values()]
img = Draw.MolsToGridImage(mols, molsPerRow=3, subImgSize=(250,250),
                           legends=list(farmacos.keys()))
display(img)

---

## 4. Modificaci√≥n de Estructuras <a id="4-modificacion"></a>

RDKit permite modificar estructuras moleculares program√°ticamente.

In [None]:
# Modificaciones comunes de estructuras

# 1. Agregar hidr√≥genos expl√≠citos
mol = Chem.MolFromSmiles("CCO")
mol_h = Chem.AddHs(mol)

print("üî¨ Modificaciones Estructurales\n")
print("=" * 60)
print(f"Etanol sin H expl√≠citos: {mol.GetNumAtoms()} √°tomos")
print(f"Etanol con H expl√≠citos: {mol_h.GetNumAtoms()} √°tomos")

# 2. Remover hidr√≥genos
mol_no_h = Chem.RemoveHs(mol_h)
print(f"Despu√©s de remover H: {mol_no_h.GetNumAtoms()} √°tomos")

# 3. Fragmentaci√≥n molecular
mol_frag = Chem.MolFromSmiles("CC(=O)O.Na")  # Acetato de sodio
frags = Chem.GetMolFrags(mol_frag, asMols=True)
print(f"\nFragmentos en acetato de sodio: {len(frags)}")
for i, frag in enumerate(frags):
    print(f"   Fragmento {i+1}: {Chem.MolToSmiles(frag)}")

# 4. Neutralizaci√≥n de cargas (simplificada)
mol_charged = Chem.MolFromSmiles("CC(=O)[O-]")  # Ion acetato
print(f"\nAntes de neutralizar: {Chem.MolToSmiles(mol_charged)}")

# 5. Remover estereoqu√≠mica
mol_stereo = Chem.MolFromSmiles("C[C@H](O)C")  # 2-propanol quiral
mol_no_stereo = Chem.RemoveStereochemistry(mol_stereo)
print(f"\nCon estereoqu√≠mica: {Chem.MolToSmiles(mol_stereo)}")
print(f"Sin estereoqu√≠mica: {Chem.MolToSmiles(mol_no_stereo)}")

print("=" * 60)

# Visualizar
mols = [mol, mol_h, frags[0], mol_charged, mol_stereo]
legends = ["Etanol", "Etanol + H", "Acetato", "Ion acetato", "2-propanol quiral"]
img = Draw.MolsToGridImage(mols, molsPerRow=3, subImgSize=(200,200),
                           legends=legends)
display(img)

---

## 5. OpenBabel: Conversi√≥n Universal <a id="5-openbabel"></a>

**OpenBabel** es una biblioteca complementaria que maneja m√°s de 100 formatos qu√≠micos.

### üéØ Ventajas de OpenBabel

- üìÅ Soporta >100 formatos diferentes
- üîÑ Conversi√≥n entre formatos
- ‚öõÔ∏è Generaci√≥n de coordenadas 3D
- üî¨ C√°lculo de propiedades

In [None]:
# Intentar importar OpenBabel
try:
    from openbabel import openbabel as ob
    from openbabel import pybel
    
    print("‚úÖ OpenBabel importado correctamente")
    print(f"   Versi√≥n: {ob.OBReleaseVersion()}")
    
    # Crear mol√©cula con OpenBabel
    mol_ob = pybel.readstring("smi", "CC(=O)O")
    
    print(f"\nüß™ Mol√©cula creada: {mol_ob.formula}")
    print(f"   Peso molecular: {mol_ob.molwt:.2f} g/mol")
    print(f"   Carga total: {mol_ob.charge}")
    
    # Generar 3D
    mol_ob.make3D()
    print("\n‚úÖ Coordenadas 3D generadas")
    
    # Convertir a diferentes formatos
    formatos = ['mol', 'pdb', 'xyz', 'inchi']
    print("\nüìù Conversiones a diferentes formatos:\n")
    
    for formato in formatos:
        output = mol_ob.write(formato)
        print(f"--- {formato.upper()} ---")
        print(output[:200] if len(output) > 200 else output)
        print()
    
except ImportError:
    print("‚ö†Ô∏è OpenBabel no est√° instalado")
    print("   En Google Colab, ejecuta: !pip install openbabel-wheel")
    print("   En local, ejecuta: conda install -c conda-forge openbabel")

### üîÑ Comparaci√≥n RDKit vs OpenBabel

| Caracter√≠stica | RDKit | OpenBabel |
|----------------|-------|-----------|
| **Formatos** | ~20 formatos | >100 formatos |
| **Velocidad** | Muy r√°pida | Moderada |
| **Descriptores** | Muy completa | B√°sica |
| **Python API** | Excelente | Buena |
| **Visualizaci√≥n** | Excelente | B√°sica |
| **Uso recomendado** | An√°lisis y quimioinform√°tica | Conversi√≥n de formatos |

üí° **Mejor pr√°ctica**: Usar RDKit como principal y OpenBabel para formatos especiales.

---

## 6. Generaci√≥n de Conformaciones 3D <a id="6-conformaciones"></a>

### ‚öõÔ∏è Conformaciones Moleculares

Las mol√©culas pueden adoptar diferentes formas espaciales (conformaciones) con diferentes energ√≠as.

In [None]:
# Generar conformaciones 3D con RDKit
mol = Chem.MolFromSmiles("CCCCCC")  # Hexano

# Agregar hidr√≥genos
mol = Chem.AddHs(mol)

print("üß¨ Generaci√≥n de Conformaciones 3D para Hexano\n")
print("=" * 60)

# Generar m√∫ltiples conformaciones
num_confs = AllChem.EmbedMultipleConfs(mol, numConfs=10, randomSeed=42)
print(f"‚úÖ Generadas {num_confs} conformaciones")

# Optimizar geometr√≠as con MMFF
print("\n‚ö° Optimizando geometr√≠as con campo de fuerza MMFF...")
results = []
for conf_id in range(num_confs):
    # Optimizar con MMFF
    converged = AllChem.MMFFOptimizeMolecule(mol, confId=conf_id)
    
    # Calcular energ√≠a
    ff = AllChem.MMFFGetMoleculeForceField(mol, AllChem.MMFFGetMoleculeProperties(mol), confId=conf_id)
    energy = ff.CalcEnergy()
    
    results.append({
        'Conformaci√≥n': conf_id + 1,
        'Energ√≠a (kcal/mol)': energy,
        'Convergi√≥': 'S√≠' if converged == 0 else 'No'
    })

# Mostrar resultados
df_conf = pd.DataFrame(results)
print("\nüìä Energ√≠as de las conformaciones:\n")
print(df_conf.to_string(index=False))

# Encontrar conformaci√≥n de menor energ√≠a
min_energy_idx = df_conf['Energ√≠a (kcal/mol)'].idxmin()
min_energy = df_conf.loc[min_energy_idx, 'Energ√≠a (kcal/mol)']
print(f"\nüéØ Conformaci√≥n de menor energ√≠a: #{min_energy_idx + 1}")
print(f"   Energ√≠a: {min_energy:.4f} kcal/mol")

print("=" * 60)

# Visualizar distribuci√≥n de energ√≠as
plt.figure(figsize=(10, 6))
plt.bar(df_conf['Conformaci√≥n'], df_conf['Energ√≠a (kcal/mol)'], color='steelblue')
plt.axhline(y=min_energy, color='r', linestyle='--', label=f'M√≠nima: {min_energy:.2f}')
plt.xlabel('Conformaci√≥n')
plt.ylabel('Energ√≠a (kcal/mol)')
plt.title('Energ√≠as de Conformaciones de Hexano')
plt.legend()
plt.grid(axis='y', alpha=0.3)
plt.tight_layout()
plt.show()

### üìê Propiedades Geom√©tricas 3D

In [None]:
# Calcular propiedades geom√©tricas 3D
mol = Chem.MolFromSmiles("CC(C)C(=O)O")  # √Åcido isobut√≠rico
mol = Chem.AddHs(mol)
AllChem.EmbedMolecule(mol, randomSeed=42)
AllChem.MMFFOptimizeMolecule(mol)

print("üìê Propiedades Geom√©tricas 3D\n")
print("=" * 60)

# Distancias entre √°tomos
conf = mol.GetConformer()
print("\nüî¨ Distancias interat√≥micas (√Ö):\n")

for i in range(min(5, mol.GetNumAtoms())):
    for j in range(i+1, min(5, mol.GetNumAtoms())):
        atom_i = mol.GetAtomWithIdx(i).GetSymbol()
        atom_j = mol.GetAtomWithIdx(j).GetSymbol()
        distance = Chem.rdMolTransforms.GetBondLength(conf, i, j)
        print(f"   {atom_i}({i}) - {atom_j}({j}): {distance:.3f} √Ö")

# √Ångulos
print("\nüìê √Ångulos de enlace (grados):\n")
for bond in list(mol.GetBonds())[:3]:
    atom1_idx = bond.GetBeginAtomIdx()
    atom2_idx = bond.GetEndAtomIdx()
    
    # Buscar un tercer √°tomo conectado
    atom1 = mol.GetAtomWithIdx(atom1_idx)
    neighbors = [x.GetIdx() for x in atom1.GetNeighbors() if x.GetIdx() != atom2_idx]
    
    if neighbors:
        atom0_idx = neighbors[0]
        angle = Chem.rdMolTransforms.GetAngleDeg(conf, atom0_idx, atom1_idx, atom2_idx)
        print(f"   √Åtomo {atom0_idx}-{atom1_idx}-{atom2_idx}: {angle:.2f}¬∞")

print("\n" + "=" * 60)

# Remover H para visualizaci√≥n
mol_no_h = Chem.RemoveHs(mol)
display(mol_no_h)

---

## 7. Propiedades Fisicoqu√≠micas <a id="7-propiedades"></a>

### üìä C√°lculo Completo de Propiedades

In [None]:
# Calcular propiedades fisicoqu√≠micas extensivas
def propiedades_completas(smiles, nombre="Mol√©cula"):
    mol = Chem.MolFromSmiles(smiles)
    if mol is None:
        return None
    
    print(f"\n{'=' * 70}")
    print(f"  {nombre}")
    print(f"{'=' * 70}\n")
    
    # Informaci√≥n b√°sica
    print("üìã INFORMACI√ìN B√ÅSICA")
    print(f"   SMILES: {Chem.MolToSmiles(mol)}")
    print(f"   F√≥rmula: {rdMolDescriptors.CalcMolFormula(mol)}")
    print(f"   Peso molecular: {Descriptors.MolWt(mol):.2f} g/mol")
    print(f"   √Åtomos pesados: {mol.GetNumHeavyAtoms()}")
    
    # Propiedades estructurales
    print("\nüî¨ PROPIEDADES ESTRUCTURALES")
    print(f"   Enlaces rotables: {Descriptors.NumRotatableBonds(mol)}")
    print(f"   Anillos totales: {rdMolDescriptors.CalcNumRings(mol)}")
    print(f"   Anillos arom√°ticos: {Descriptors.NumAromaticRings(mol)}")
    print(f"   Fracci√≥n Csp¬≥: {Descriptors.FractionCSP3(mol):.3f}")
    print(f"   Complejidad: {Descriptors.BertzCT(mol):.2f}")
    
    # Propiedades fisicoqu√≠micas
    print("\n‚öóÔ∏è PROPIEDADES FISICOQU√çMICAS")
    print(f"   LogP (Crippen): {Crippen.MolLogP(mol):.3f}")
    print(f"   Refractividad molar: {Crippen.MolMR(mol):.3f}")
    print(f"   PSA topol√≥gica: {Descriptors.TPSA(mol):.2f} ≈≤")
    print(f"   √Årea superficie LabuteASA: {MolSurf.LabuteASA(mol):.2f} ≈≤")
    
    # Enlaces de hidr√≥geno
    print("\nüîó ENLACES DE HIDR√ìGENO")
    print(f"   Donadores de H: {Descriptors.NumHDonors(mol)}")
    print(f"   Aceptores de H: {Descriptors.NumHAcceptors(mol)}")
    
    # Regla de Lipinski
    print("\nüíä REGLA DE LIPINSKI (Biodisponibilidad oral)")
    mw = Descriptors.MolWt(mol)
    logp = Descriptors.MolLogP(mol)
    hbd = Descriptors.NumHDonors(mol)
    hba = Descriptors.NumHAcceptors(mol)
    
    cumple_mw = "‚úÖ" if mw <= 500 else "‚ùå"
    cumple_logp = "‚úÖ" if logp <= 5 else "‚ùå"
    cumple_hbd = "‚úÖ" if hbd <= 5 else "‚ùå"
    cumple_hba = "‚úÖ" if hba <= 10 else "‚ùå"
    
    print(f"   {cumple_mw} Peso molecular ‚â§ 500: {mw:.1f}")
    print(f"   {cumple_logp} LogP ‚â§ 5: {logp:.2f}")
    print(f"   {cumple_hbd} Donadores H ‚â§ 5: {hbd}")
    print(f"   {cumple_hba} Aceptores H ‚â§ 10: {hba}")
    
    violaciones = sum([mw > 500, logp > 5, hbd > 5, hba > 10])
    if violaciones == 0:
        print(f"\n   üéâ ¬°CUMPLE LA REGLA DE LIPINSKI!")
    else:
        print(f"\n   ‚ö†Ô∏è  {violaciones} violaci√≥n(es) de la regla de Lipinski")
    
    print(f"\n{'=' * 70}\n")
    
    return mol

# Analizar varios compuestos
compuestos = {
    "Aspirina": "CC(=O)Oc1ccccc1C(=O)O",
    "Penicilina V": "CC1(C)SC2C(NC(=O)COc3ccccc3)C(=O)N2C1C(=O)O",
    "Atorvastatina": "CC(C)c1c(C(=O)Nc2ccccc2)c(-c2ccccc2)c(-c2ccc(F)cc2)n1CCC(O)CC(O)CC(=O)O"
}

for nombre, smiles in compuestos.items():
    mol = propiedades_completas(smiles, nombre)
    if mol:
        display(mol)

---

## 8. Ejercicios Pr√°cticos <a id="8-ejercicios"></a>

### üìù Ejercicio 1: An√°lisis de biblioteca de compuestos

Analiza la siguiente biblioteca de compuestos naturales:

In [None]:
# Ejercicio 1: An√°lisis de compuestos naturales

compuestos_naturales = {
    "Mentol": "CC(C)C1CCC(C)CC1O",
    "Limoneno": "CC(=C)C1CCC(=C)CC1",
    "Timol": "Cc1ccc(C(C)C)c(O)c1",
    "Eugenol": "C=CCc1ccc(O)c(OC)c1",
    "Capsaicina": "COc1cc(CNC(=O)CCCC=CC(C)C)ccc1O"
}

# TU C√ìDIGO AQU√ç
# 1. Calcula descriptores para cada compuesto
# 2. Crea un DataFrame con los resultados
# 3. Identifica cu√°l cumple mejor la regla de Lipinski
# 4. Calcula el promedio de peso molecular
# 5. Visualiza las estructuras

### üìù Ejercicio 2: B√∫squeda de grupos funcionales

Identifica qu√© compuestos contienen grupos funcionales espec√≠ficos:

In [None]:
# Ejercicio 2: B√∫squeda de grupos funcionales

# Define patrones SMARTS para:
# - Alcoholes
# - √âteres
# - Dobles enlaces C=C
# - Anillos arom√°ticos

# TU C√ìDIGO AQU√ç
# 1. Define los patrones SMARTS
# 2. Busca coincidencias en cada compuesto
# 3. Crea una tabla que muestre qu√© grupos tiene cada compuesto
# 4. Visualiza los compuestos resaltando los grupos encontrados

### üìù Ejercicio 3: Generaci√≥n y optimizaci√≥n 3D

Genera conformaciones 3D para mol√©culas flexibles:

In [None]:
# Ejercicio 3: Conformaciones 3D

molecula_flexible = "CCCCCCCC"  # Octano

# TU C√ìDIGO AQU√ç
# 1. Genera 20 conformaciones diferentes
# 2. Optimiza cada una con MMFF
# 3. Calcula sus energ√≠as
# 4. Identifica las 3 conformaciones de menor energ√≠a
# 5. Grafica la distribuci√≥n de energ√≠as
# 6. Calcula la diferencia energ√©tica entre la m√°s estable y la menos estable

### üìù Ejercicio 4: Dise√±o de filtro molecular

Crea un filtro para seleccionar candidatos a f√°rmacos:

In [None]:
# Ejercicio 4: Filtro de selecci√≥n de f√°rmacos

biblioteca_grande = {
    "Compuesto A": "CC(C)Cc1ccc(cc1)C(C)C(=O)O",
    "Compuesto B": "CN1C=NC2=C1C(=O)N(C(=O)N2C)C",
    "Compuesto C": "CC(=O)Nc1ccc(cc1)O",
    "Compuesto D": "COc1ccc2nc(S(=O)Cc3ncc(C)c(OC)c3C)[nH]c2c1",
    "Compuesto E": "CC1(C)SC2C(NC(=O)Cc3ccccc3)C(=O)N2C1C(=O)O"
}

# TU C√ìDIGO AQU√ç
# Crea una funci√≥n que filtre compuestos bas√°ndose en:
# 1. Regla de Lipinski (todas las reglas)
# 2. PSA < 140 ≈≤
# 3. Enlaces rotables < 10
# 4. Peso molecular entre 200 y 500
# 
# Aplica el filtro y reporta qu√© compuestos pasan

---

## üìä Resumen y Conclusiones

### ‚úÖ Lo que hemos aprendido

En esta actividad has dominado:
- **RDKit**: Biblioteca principal para quimioinform√°tica en Python
- **Creaci√≥n molecular**: M√∫ltiples formatos de entrada (SMILES, InChI, archivos)
- **Descriptores**: C√°lculo de propiedades moleculares y fisicoqu√≠micas
- **Modificaci√≥n**: Transformaciones estructurales program√°ticas
- **OpenBabel**: Conversi√≥n universal entre formatos
- **Conformaciones 3D**: Generaci√≥n y optimizaci√≥n de geometr√≠as
- **Drug-likeness**: Evaluaci√≥n con regla de Lipinski

### üéØ Conceptos Clave

| Herramienta | Uso Principal | Ventajas |
|-------------|---------------|----------|
| **RDKit** | An√°lisis y quimioinform√°tica | R√°pida, completa, bien documentada |
| **OpenBabel** | Conversi√≥n de formatos | Soporta >100 formatos |

‚úÖ **Habilidades adquiridas**:
- Manipulaci√≥n program√°tica de estructuras moleculares
- C√°lculo autom√°tico de descriptores y propiedades
- Generaci√≥n de conformaciones tridimensionales
- Evaluaci√≥n de candidatos a f√°rmacos

‚úÖ **Aplicaciones pr√°cticas**:
- Filtrado de bibliotecas de compuestos
- C√°lculo de propiedades ADME
- Preparaci√≥n de estructuras para simulaciones
- An√°lisis de estructura-actividad

### üöÄ Pr√≥ximos Pasos
En la siguiente actividad exploraremos **Visualizaci√≥n 3D Interactiva** con Py3Dmol y NGLView para crear representaciones moleculares din√°micas y profesionales.

---

## üìö Referencias

1. **RDKit Documentation**: https://www.rdkit.org/docs/
2. **Getting Started with RDKit**: https://www.rdkit.org/docs/GettingStartedInPython.html
3. **OpenBabel**: http://openbabel.org/
4. **Lipinski's Rule**: Lipinski, C. A. et al. (1997). *Adv. Drug Deliv. Rev.* 23, 3-25.
5. **Molecular Descriptors**: Todeschini, R. & Consonni, V. (2009). *Molecular Descriptors for Chemoinformatics*.

---

<div align="center">

## üéâ ¬°Felicitaciones!

Has completado la **Actividad 2.3: RDKit y OpenBabel**

**Siguiente actividad**: Visualizaci√≥n 3D de Mol√©culas

[![Anterior](https://img.shields.io/badge/‚¨ÖÔ∏è_Actividad_2.2-Notaciones_Qu√≠micas-blue.svg)](02_notaciones_quimicas.ipynb)
[![Siguiente](https://img.shields.io/badge/Actividad_2.4_‚û°Ô∏è-Visualizaci√≥n_3D-green.svg)](04_visualizacion_3d.ipynb)

---

üìö **[Volver al M√≥dulo 2](README.md)** | üè† **[Inicio del Curso](../README.md)**

---

**Universidad de Caldas - Departamento de Qu√≠mica**  
*Qu√≠mica Computacional 173G7G*

</div>