# üì¶ M√≥dulo 1: Fundamentos Computacionales
## Actividad 1.8: Entornos Virtuales y Reproducibilidad Cient√≠fica

<div align="center">
  
**Universidad de Caldas - Departamento de Qu√≠mica**  
*Introducci√≥n a la Qu√≠mica Computacional (173G7G)*  
**Profesor:** Jos√© Mauricio Rodas Rodr√≠guez

[![Open in Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/maurorodas/Quimica_computacional_173G7G/blob/main/modulo_01_fundamentos/08_entornos_virtuales.ipynb)

</div>

---

## üéØ Objetivos de Aprendizaje

Al finalizar esta actividad, ser√°s capaz de:
- Comprender la importancia de los entornos virtuales en ciencia computacional
- Crear y gestionar entornos con Conda y venv
- Documentar dependencias para proyectos reproducibles
- Aplicar buenas pr√°cticas de reproducibilidad cient√≠fica
- Configurar entornos espec√≠ficos para proyectos de qu√≠mica computacional
- Compartir c√≥digo reproducible con la comunidad cient√≠fica

---

## üî¨ ¬øPor Qu√© Entornos Virtuales?

### El Problema de las Dependencias

> "¬°Pero en mi computadora s√≠ funciona!" 
> ‚Äî Todo cient√≠fico alguna vez

Imagina esta situaci√≥n:

```
T√∫ (2024): 
  - Python 3.11
  - NumPy 1.26
  - RDKit 2023.09
  ‚Üí Tu c√≥digo funciona perfectamente ‚úÖ

Tu colega (2024):
  - Python 3.9
  - NumPy 1.20
  - RDKit 2022.03
  ‚Üí Tu c√≥digo falla ‚ùå
  
Revisor del paper (2025):
  - Python 3.12
  - NumPy 2.0
  - RDKit 2024.03
  ‚Üí Resultados diferentes ‚ö†Ô∏è
```

### üìä Casos Reales de Problemas

| Problema | Ejemplo en Qu√≠mica Computacional | Impacto |
|----------|-----------------------------------|---------|
| **Versiones incompatibles** | NumPy 2.0 rompe c√≥digo con NumPy 1.x | Paper no reproducible |
| **Conflictos de dependencias** | RDKit necesita NumPy<2.0, pero TensorFlow necesita >2.0 | Instalaci√≥n imposible |
| **C√≥digo legacy** | Scripts de 2018 no funcionan en Python 3.11 | P√©rdida de metodolog√≠a |
| **Plataforma espec√≠fica** | C√≥digo desarrollado en Linux falla en Windows | Colaboraci√≥n limitada |

### üéØ Soluci√≥n: Entornos Virtuales

Un **entorno virtual** es un espacio aislado donde puedes:
- ‚úÖ Instalar versiones espec√≠ficas de paquetes
- ‚úÖ Evitar conflictos entre proyectos
- ‚úÖ Documentar exactamente qu√© necesitas
- ‚úÖ Compartir configuraci√≥n reproducible
- ‚úÖ Trabajar en m√∫ltiples proyectos simult√°neamente

### üìà Impacto en la Ciencia

Seg√∫n estudios recientes:
- üî¥ ~70% de papers computacionales NO son completamente reproducibles
- üü° ~50% por problemas de dependencias y entorno
- üü¢ Usar entornos virtuales reduce esto a <10%

> **Reproducibilidad = Ciencia de Calidad**

---


## üêç Parte 1: Conda - El Gestor Cient√≠fico

### ¬øQu√© es Conda?

**Conda** es un gestor de paquetes y entornos dise√±ado espec√≠ficamente para ciencia de datos y computaci√≥n cient√≠fica.

#### Conda vs pip

| Caracter√≠stica | Conda | pip |
|----------------|-------|-----|
| **Paquetes** | Python + No-Python (C, Fortran) | Solo Python |
| **Dependencias** | Resuelve conflictos autom√°ticamente | Puede tener conflictos |
| **Ciencia** | Optimizado para paquetes cient√≠ficos | General |
| **Binarios** | Pre-compilados | A veces compila localmente |
| **Qu√≠mica** | Canales especializados (conda-forge, rdkit) | PyPI |

**Para qu√≠mica computacional: Conda es preferido** ‚úÖ

### Instalaci√≥n de Conda

#### Opci√≥n 1: Miniconda (Recomendado - ~500 MB)

```bash
# Linux/Mac
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh

# Windows: Descargar instalador de
# https://docs.conda.io/en/latest/miniconda.html
```

#### Opci√≥n 2: Anaconda (Completo - ~3 GB)

```bash
# Incluye 250+ paquetes cient√≠ficos pre-instalados
# Descargar de: https://www.anaconda.com/download
```

**Recomendaci√≥n:** Miniconda + instalar solo lo que necesitas

### Verificar Instalaci√≥n


In [None]:
# Verificar conda (ejecutar en terminal, no en Python)
# conda --version
# conda list  # Ver paquetes instalados
# conda info  # Informaci√≥n del sistema

# En notebook, usar !
import sys
print(f"Python: {sys.version}")
print(f"Ejecutable: {sys.executable}")

# Verificar si estamos en un entorno conda
import os
conda_env = os.environ.get('CONDA_DEFAULT_ENV', 'base')
print(f"Entorno Conda: {conda_env}")

### Crear Entornos con Conda

#### Sintaxis B√°sica

```bash
conda create -n NOMBRE_ENTORNO python=VERSION
```

#### Ejemplo 1: Entorno para Mec√°nica Molecular


In [None]:
# Ejecutar en terminal:
# conda create -n mecanica_molecular python=3.11

# Instalar paquetes cient√≠ficos b√°sicos
# conda activate mecanica_molecular
# conda install numpy scipy matplotlib pandas

# Instalar paquetes de qu√≠mica desde conda-forge
# conda install -c conda-forge rdkit openbabel

# Verificar instalaci√≥n
# conda list

#### Ejemplo 2: Entorno para Din√°mica Molecular


In [None]:
# Terminal:
# conda create -n dinamica_molecular python=3.10

# conda activate dinamica_molecular
# conda install -c conda-forge mdanalysis mdtraj nglview

# Para visualizaci√≥n de trayectorias
# conda install -c conda-forge pymol-open-source

# Jupyter para an√°lisis
# conda install jupyter ipykernel
# python -m ipykernel install --user --name dinamica_molecular --display-name "Python (MD)"

#### Ejemplo 3: Entorno para Qu√≠mica Cu√°ntica


In [None]:
# Terminal:
# conda create -n quimica_cuantica python=3.11

# conda activate quimica_cuantica
# conda install -c conda-forge pyscf
# conda install -c conda-forge ase
# conda install -c conda-forge py3dmol

# Para machine learning en qu√≠mica
# conda install -c conda-forge scikit-learn
# conda install pytorch torchvision -c pytorch

### Gesti√≥n de Entornos

#### Comandos Esenciales

```bash
# Listar todos los entornos
conda env list
conda info --envs

# Activar un entorno
conda activate nombre_entorno

# Desactivar entorno actual
conda deactivate

# Ver paquetes en entorno activo
conda list

# Buscar un paquete
conda search rdkit

# Instalar paquete en entorno activo
conda install nombre_paquete

# Instalar versi√≥n espec√≠fica
conda install numpy=1.26.0

# Instalar desde canal espec√≠fico
conda install -c conda-forge rdkit

# Actualizar paquete
conda update nombre_paquete

# Actualizar todos los paquetes
conda update --all

# Eliminar paquete
conda remove nombre_paquete

# Eliminar entorno completo
conda env remove -n nombre_entorno
```

### Exportar e Importar Entornos

#### Opci√≥n 1: environment.yml (Recomendado)


In [None]:
# Exportar entorno completo
# conda env export > environment.yml

# El archivo environment.yml se ve as√≠:
"""
name: mecanica_molecular
channels:
  - conda-forge
  - defaults
dependencies:
  - python=3.11
  - numpy=1.26.0
  - scipy=1.11.3
  - matplotlib=3.8.0
  - pandas=2.1.1
  - rdkit=2023.09.1
  - openbabel=3.1.1
  - jupyter=1.0.0
  - pip
  - pip:
    - some-pypi-package==1.0.0
"""

# Recrear entorno desde archivo
# conda env create -f environment.yml

# Actualizar entorno existente
# conda env update -f environment.yml --prune

#### Opci√≥n 2: requirements.txt (Conda + pip)


In [None]:
# Exportar solo paquetes pip
# conda activate mi_entorno
# pip freeze > requirements.txt

# Ejemplo de requirements.txt:
"""
numpy==1.26.0
pandas==2.1.1
matplotlib==3.8.0
rdkit==2023.9.1
"""

# Instalar desde requirements.txt
# pip install -r requirements.txt

### Canales de Conda

Los **canales** son repositorios de paquetes.

#### Canales Importantes para Qu√≠mica

```bash
# conda-forge: El m√°s completo para ciencia
conda install -c conda-forge rdkit

# bioconda: Bioinform√°tica y qu√≠mica computacional
conda install -c bioconda openbabel

# Agregar canal permanentemente
conda config --add channels conda-forge
conda config --set channel_priority strict
```

#### Orden de Prioridad

```bash
# Ver configuraci√≥n de canales
conda config --show channels

# Configuraci√≥n recomendada para qu√≠mica:
# 1. conda-forge (primero)
# 2. defaults
# 3. bioconda
```

---


## üêç Parte 2: venv - Entornos Nativos de Python

### ¬øCu√°ndo Usar venv?

**Usa venv cuando:**
- ‚úÖ Solo necesitas paquetes Python puros
- ‚úÖ Quieres algo ligero y nativo
- ‚úÖ No necesitas paquetes compilados complejos
- ‚úÖ Trabajas en sistemas con espacio limitado

**Usa Conda cuando:**
- ‚úÖ Necesitas RDKit, OpenBabel, paquetes cient√≠ficos
- ‚úÖ Trabajas con qu√≠mica computacional
- ‚úÖ Necesitas Python + R + otros lenguajes

### Crear Entorno con venv

#### Linux/Mac


In [None]:
# Terminal:
# Crear entorno
# python3 -m venv mi_proyecto_quimica

# Activar entorno
# source mi_proyecto_quimica/bin/activate

# Verificar
# which python
# >>> /ruta/mi_proyecto_quimica/bin/python

# Instalar paquetes
# pip install numpy pandas matplotlib scipy

# Desactivar
# deactivate

#### Windows


In [None]:
# Terminal (PowerShell):
# Crear entorno
# python -m venv mi_proyecto_quimica

# Activar entorno
# .\mi_proyecto_quimica\Scripts\Activate.ps1

# Si da error de permisos:
# Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser

# En CMD (no PowerShell):
# .\mi_proyecto_quimica\Scripts\activate.bat

# Verificar
# where python

### Gestionar Dependencias con venv

#### requirements.txt Detallado


In [None]:
# Generar requirements.txt
# pip freeze > requirements.txt

# Ejemplo de requirements.txt bien documentado:
"""
# ============================================
# Proyecto: An√°lisis de Conformeros
# Autor: Jos√© Rodas
# Fecha: 2024-01-13
# Python: 3.11
# ============================================

# Computaci√≥n cient√≠fica
numpy==1.26.0
scipy==1.11.3
pandas==2.1.1

# Visualizaci√≥n
matplotlib==3.8.0
seaborn==0.13.0
plotly==5.17.0

# Qu√≠mica computacional (v√≠a pip)
# Nota: RDKit mejor instalar con conda
py3Dmol==2.0.4

# Jupyter
jupyter==1.0.0
ipykernel==6.26.0

# Testing (solo desarrollo)
pytest==7.4.3  # dev
pytest-cov==4.1.0  # dev

# Utilidades
python-dotenv==1.0.0
tqdm==4.66.1
"""

# Instalar todo
# pip install -r requirements.txt

# Instalar excluyendo dev
# grep -v "# dev" requirements.txt | pip install -r /dev/stdin

#### Estructura de Proyecto con venv

```
mi_proyecto_quimica/
‚îú‚îÄ‚îÄ .gitignore              # Ignorar venv/
‚îú‚îÄ‚îÄ README.md               # Documentaci√≥n
‚îú‚îÄ‚îÄ requirements.txt        # Dependencias
‚îú‚îÄ‚îÄ environment.yml         # Alternativa conda
‚îú‚îÄ‚îÄ setup.py                # Instalaci√≥n del proyecto
‚îú‚îÄ‚îÄ venv/                   # Entorno virtual (no versionar)
‚îú‚îÄ‚îÄ src/                    # C√≥digo fuente
‚îÇ   ‚îú‚îÄ‚îÄ __init__.py
‚îÇ   ‚îî‚îÄ‚îÄ analisis.py
‚îú‚îÄ‚îÄ data/                   # Datos
‚îÇ   ‚îú‚îÄ‚îÄ raw/
‚îÇ   ‚îî‚îÄ‚îÄ processed/
‚îú‚îÄ‚îÄ notebooks/              # Jupyter notebooks
‚îÇ   ‚îî‚îÄ‚îÄ 01_exploracion.ipynb
‚îú‚îÄ‚îÄ tests/                  # Tests
‚îÇ   ‚îî‚îÄ‚îÄ test_analisis.py
‚îî‚îÄ‚îÄ results/                # Resultados
    ‚îú‚îÄ‚îÄ figures/
    ‚îî‚îÄ‚îÄ tables/
```

---


## üî¨ Parte 3: Casos de Uso en Qu√≠mica Computacional

### Caso 1: Proyecto de Tesis Doctoral

**Escenario:** Tesis sobre an√°lisis conformacional de f√°rmacos

#### Paso 1: Crear Entorno


In [None]:
# Terminal:
# conda create -n tesis_conformeros python=3.11
# conda activate tesis_conformeros

# Instalar dependencias
# conda install -c conda-forge rdkit openbabel
# conda install numpy pandas matplotlib seaborn
# conda install jupyter ipykernel
# conda install -c conda-forge py3dmol

# Registrar kernel en Jupyter
# python -m ipykernel install --user --name tesis_conformeros --display-name "Python (Tesis)"

#### Paso 2: Documentar en README.md

```markdown
# An√°lisis Conformacional de Inhibidores de Proteasa

## Configuraci√≥n del Entorno

### Opci√≥n A: Conda (Recomendado)
```bash
conda env create -f environment.yml
conda activate tesis_conformeros
```

### Opci√≥n B: Manual
```bash
conda create -n tesis_conformeros python=3.11
conda activate tesis_conformeros
conda install -c conda-forge rdkit openbabel
pip install -r requirements.txt
```

## Versiones Verificadas
- Python: 3.11.5
- RDKit: 2023.09.1
- NumPy: 1.26.0
- Pandas: 2.1.1

## Reproducir An√°lisis
```bash
jupyter notebook notebooks/01_generacion_conformeros.ipynb
```
```

#### Paso 3: Crear environment.yml


In [None]:
# Exportar entorno
# conda env export > environment.yml

# Editar para hacerlo multiplataforma:
"""
name: tesis_conformeros
channels:
  - conda-forge
  - defaults
dependencies:
  - python=3.11
  - rdkit
  - openbabel
  - numpy>=1.26
  - pandas>=2.1
  - matplotlib>=3.8
  - seaborn>=0.13
  - jupyter
  - ipykernel
  - py3dmol
  - pip
  - pip:
    - tqdm>=4.66
"""

### Caso 2: Din√°mica Molecular con GROMACS

**Escenario:** An√°lisis de trayectorias de prote√≠nas


In [None]:
# environment.yml especializado
"""
name: md_analysis
channels:
  - conda-forge
  - bioconda
dependencies:
  - python=3.10
  - mdanalysis
  - mdtraj
  - nglview
  - matplotlib
  - seaborn
  - jupyter
  - jupyterlab
  # Opcional: GROMACS
  - gromacs=2023.1
"""

# Crear entorno
# conda env create -f environment.yml
# conda activate md_analysis

# Habilitar extensi√≥n de nglview para Jupyter
# jupyter nbextension enable --py --sys-prefix widgetsnbextension
# jupyter nbextension enable --py --sys-prefix nglview

### Caso 3: Machine Learning para Predicci√≥n de Propiedades

**Escenario:** QSAR con redes neuronales


In [None]:
# environment.yml para ML + Qu√≠mica
"""
name: ml_quimica
channels:
  - conda-forge
  - pytorch
dependencies:
  - python=3.11
  # Qu√≠mica
  - rdkit
  - mordred  # Descriptores moleculares
  # Machine Learning
  - scikit-learn
  - pytorch
  - torchvision
  - xgboost
  - lightgbm
  # Data Science
  - pandas
  - numpy
  - matplotlib
  - seaborn
  - plotly
  # Jupyter
  - jupyter
  - ipykernel
  # Utilidades
  - tqdm
  - pip
  - pip:
    - deepchem  # Deep learning para qu√≠mica
    - chemprop  # Predicci√≥n de propiedades moleculares
"""

### Caso 4: M√∫ltiples Proyectos Simult√°neos

**Escenario:** Trabajas en varios proyectos con requisitos diferentes

#### Organizaci√≥n Recomendada

```bash
~/Proyectos/
‚îú‚îÄ‚îÄ proyecto_farmaceutico/
‚îÇ   ‚îú‚îÄ‚îÄ environment.yml          # RDKit 2023.09
‚îÇ   ‚îî‚îÄ‚îÄ ... 
‚îÇ
‚îú‚îÄ‚îÄ proyecto_molecular_dynamics/
‚îÇ   ‚îú‚îÄ‚îÄ environment.yml          # MDAnalysis 2.6
‚îÇ   ‚îî‚îÄ‚îÄ ...
‚îÇ
‚îî‚îÄ‚îÄ proyecto_machine_learning/
    ‚îú‚îÄ‚îÄ environment.yml          # PyTorch 2.1
    ‚îî‚îÄ‚îÄ ...
```

#### Script de Activaci√≥n R√°pida


In [None]:
# activate_project.sh
"""
#!/bin/bash

# Script para activar entorno seg√∫n proyecto

case "$1" in
    "farm")
        echo "Activando proyecto farmac√©utico..."
        cd ~/Proyectos/proyecto_farmaceutico
        conda activate farma_rdkit
        ;;
    "md")
        echo "Activando din√°mica molecular..."
        cd ~/Proyectos/proyecto_molecular_dynamics
        conda activate md_analysis
        ;;
    "ml")
        echo "Activando machine learning..."
        cd ~/Proyectos/proyecto_machine_learning
        conda activate ml_quimica
        ;;
    *)
        echo "Uso: activate_project.sh [farm|md|ml]"
        ;;
esac
"""

# Uso:
# source activate_project.sh farm

---

## üìã Parte 4: Buenas Pr√°cticas de Reproducibilidad

### Checklist de Reproducibilidad

#### üì¶ Nivel 1: B√°sico (M√≠nimo Aceptable)

```markdown
‚úÖ requirements.txt con versiones espec√≠ficas
‚úÖ README con instrucciones de instalaci√≥n
‚úÖ Versi√≥n de Python especificada
‚úÖ .gitignore apropiado (no versionar venv/)
```

#### üì¶ Nivel 2: Intermedio (Recomendado)

```markdown
‚úÖ Todo del Nivel 1
‚úÖ environment.yml para conda
‚úÖ Versiones de SO y dependencias del sistema documentadas
‚úÖ Scripts de instalaci√≥n automatizados
‚úÖ Tests b√°sicos para verificar instalaci√≥n
‚úÖ Datos de ejemplo incluidos
```

#### üì¶ Nivel 3: Avanzado (Publicaci√≥n Cient√≠fica)

```markdown
‚úÖ Todo del Nivel 2
‚úÖ Dockerfile para contenedor reproducible
‚úÖ CI/CD con GitHub Actions
‚úÖ Binder/Google Colab badge para ejecuci√≥n directa
‚úÖ Zenodo DOI para versi√≥n espec√≠fica
‚úÖ Documentaci√≥n completa con readthedocs
‚úÖ Versiones de hardware (CPU/GPU) especificadas
```

### .gitignore para Proyectos de Qu√≠mica


In [None]:
# .gitignore completo
"""
# Entornos virtuales
venv/
env/
ENV/
.venv
.conda/
*.egg-info/

# Archivos de Python
__pycache__/
*.py[cod]
*$py.class
*.so
.Python

# Jupyter Notebook
.ipynb_checkpoints/
*.ipynb_checkpoints

# Archivos grandes de datos (opcional)
*.xyz
*.pdb
*.trr
*.xtc
*.dcd
*.nc
data/raw/*.sdf

# Resultados que se pueden regenerar
results/temp/
*.log
*.out

# Archivos de configuraci√≥n local
.env
config.local.yml

# IDE
.vscode/
.idea/
*.swp
*.swo

# Sistema operativo
.DS_Store
Thumbs.db

# Archivos temporales de programas
*.chk  # Gaussian checkpoints (pueden ser grandes)
*.fchk
*.wfn
slurm-*.out
```

### README.md Template para Proyectos Qu√≠micos


In [None]:
# README_template.md
"""
# [Nombre del Proyecto]

[![Python](https://img.shields.io/badge/Python-3.11-blue.svg)](https://python.org)
[![License](https://img.shields.io/badge/License-MIT-green.svg)](LICENSE)
[![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/usuario/repo/main)

## Descripci√≥n

Breve descripci√≥n del proyecto y objetivos cient√≠ficos.

## Requisitos del Sistema

- **Python:** 3.11 o superior
- **Sistema Operativo:** Linux/Mac/Windows
- **RAM:** M√≠nimo 8 GB
- **Espacio en disco:** ~2 GB

## Instalaci√≥n

### Opci√≥n 1: Conda (Recomendado)

```bash
# Clonar repositorio
git clone https://github.com/usuario/proyecto.git
cd proyecto

# Crear entorno
conda env create -f environment.yml
conda activate nombre_entorno

# Verificar instalaci√≥n
python -c "import rdkit; print(rdkit.__version__)"
```

### Opci√≥n 2: venv + pip

```bash
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate
pip install -r requirements.txt
```

## Uso R√°pido

```python
from src.analisis import procesar_molecula

# Ejemplo b√°sico
resultado = procesar_molecula("data/molecula.sdf")
print(resultado)
```

## Estructura del Proyecto

```
proyecto/
‚îú‚îÄ‚îÄ data/              # Datos de entrada
‚îú‚îÄ‚îÄ src/               # C√≥digo fuente
‚îú‚îÄ‚îÄ notebooks/         # Jupyter notebooks
‚îú‚îÄ‚îÄ tests/             # Tests
‚îî‚îÄ‚îÄ results/           # Resultados
```

## Reproducir Resultados

```bash
# Ejecutar pipeline completo
python src/pipeline.py

# O usar notebook
jupyter notebook notebooks/analisis_completo.ipynb
```

## Versiones Verificadas

| Paquete | Versi√≥n | Notas |
|---------|---------|-------|
| Python | 3.11.5 | |
| RDKit | 2023.09.1 | Necesario |
| NumPy | 1.26.0 | |
| Pandas | 2.1.1 | |

## Citar Este Trabajo

```bibtex
@article{autor2024,
  title={T√≠tulo del Paper},
  author={Autor, A. and Coautor, B.},
  journal={Journal Name},
  year={2024}
}
```

## Licencia

MIT License

## Contacto

- **Autor:** Nombre
- **Email:** email@universidad.edu
- **ORCID:** 0000-0000-0000-0000
"""

### Docker: Reproducibilidad Extrema (Opcional Avanzado)

Docker crea un contenedor con TODO el sistema operativo y dependencias.

#### Dockerfile Ejemplo


In [None]:
# Dockerfile
"""
FROM continuumio/miniconda3:latest

# Informaci√≥n del mantenedor
LABEL maintainer="tu_email@universidad.edu"
LABEL description="Entorno para qu√≠mica computacional"

# Actualizar sistema
RUN apt-get update && apt-get install -y \
    gcc \
    g++ \
    git \
    && rm -rf /var/lib/apt/lists/*

# Copiar archivos de configuraci√≥n
COPY environment.yml /tmp/environment.yml

# Crear entorno conda
RUN conda env create -f /tmp/environment.yml && \
    conda clean -afy

# Activar entorno por defecto
SHELL ["conda", "run", "-n", "quimica_comp", "/bin/bash", "-c"]

# Directorio de trabajo
WORKDIR /proyecto

# Puerto para Jupyter
EXPOSE 8888

# Comando por defecto
CMD ["conda", "run", "-n", "quimica_comp", "jupyter", "lab", \
     "--ip=0.0.0.0", "--port=8888", "--no-browser", "--allow-root"]
"""

# Construir imagen
# docker build -t quimica_comp:latest .

# Ejecutar contenedor
# docker run -p 8888:8888 -v $(pwd):/proyecto quimica_comp:latest

### Binder: Notebooks Ejecutables en la Nube

**Binder** permite que cualquiera ejecute tus notebooks sin instalar nada.

#### Configuraci√≥n

1. Crear repositorio p√∫blico en GitHub
2. Agregar `environment.yml` o `requirements.txt` en la ra√≠z
3. Ir a [mybinder.org](https://mybinder.org)
4. Pegar URL de tu repo
5. Copiar badge para README

#### Archivos necesarios para Binder

```
repo/
‚îú‚îÄ‚îÄ environment.yml      # O requirements.txt
‚îú‚îÄ‚îÄ postBuild           # (Opcional) comandos post-instalaci√≥n
‚îî‚îÄ‚îÄ notebooks/
    ‚îî‚îÄ‚îÄ analisis.ipynb
```

Ejemplo de `postBuild`:
```bash
#!/bin/bash
jupyter nbextension enable --py widgetsnbextension --sys-prefix
jupyter nbextension enable --py nglview --sys-prefix
```

---


## üõ†Ô∏è Parte 5: Troubleshooting y Tips

### Problemas Comunes con Conda

#### Problema 1: "Solving environment" tarda mucho

**Soluci√≥n:**
```bash
# Usar mamba (solver m√°s r√°pido)
conda install -c conda-forge mamba

# Usar mamba en lugar de conda
mamba install rdkit
mamba env create -f environment.yml
```

#### Problema 2: Conflictos de dependencias

**Soluci√≥n:**
```bash
# Crear entorno nuevo con dependencias especificadas
conda create -n nuevo_env python=3.11 rdkit=2023.09 numpy=1.26

# Si persiste, usar canales espec√≠ficos
conda create -n nuevo_env -c conda-forge python=3.11 rdkit numpy
```

#### Problema 3: Entorno no se activa

**Soluci√≥n:**
```bash
# Inicializar conda en shell
conda init bash  # o zsh, fish, etc.

# Reiniciar terminal

# Si sigue sin funcionar
source ~/miniconda3/etc/profile.d/conda.sh
conda activate mi_entorno
```

#### Problema 4: Paquete no encontrado

**Soluci√≥n:**
```bash
# Buscar en diferentes canales
conda search -c conda-forge nombre_paquete
conda search -c bioconda nombre_paquete

# Instalar con pip si no est√° en conda
conda activate mi_entorno
pip install nombre_paquete
```

### Problemas Comunes con venv

#### Problema 1: "no se puede activar en Windows"

**Soluci√≥n:**
```powershell
# PowerShell: cambiar pol√≠tica de ejecuci√≥n
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser

# O usar CMD en lugar de PowerShell
venv\Scripts\activate.bat
```

#### Problema 2: pip instala en sistema, no en venv

**Soluci√≥n:**
```bash
# Verificar que est√°s en venv
which pip  # Linux/Mac
where pip  # Windows

# Deber√≠a mostrar ruta dentro de venv/
# Si no, reactivar entorno
deactivate
source venv/bin/activate
```

#### Problema 3: Error al compilar paquetes

**Soluci√≥n:**
```bash
# Instalar herramientas de compilaci√≥n
# Ubuntu/Debian
sudo apt-get install build-essential python3-dev

# Mac
xcode-select --install

# Windows: instalar Visual Studio Build Tools
```

### Tips Pro

#### 1. Alias √∫tiles para .bashrc o .zshrc

```bash
# Agregar a ~/.bashrc
alias ca='conda activate'
alias cda='conda deactivate'
alias cenv='conda env list'
alias clist='conda list'

# Activaci√≥n r√°pida
alias actesis='conda activate tesis_conformeros'
alias acmd='conda activate md_analysis'

#### 2. Limpieza de Conda

```bash
# Liberar espacio
conda clean --all

# Ver tama√±o de paquetes descargados
du -sh ~/miniconda3/pkgs/

# Eliminar entornos no usados
conda env list
conda env remove -n entorno_viejo
```

#### 3. Acelerar Instalaciones

```bash
# Configurar para usar libmamba (solver r√°pido)
conda install -n base conda-libmamba-solver
conda config --set solver libmamba

# O instalar mamba
conda install -c conda-forge mamba
mamba install rdkit  # Mucho m√°s r√°pido
```

#### 4. Verificar Compatibilidad


In [None]:
# Script para verificar instalaci√≥n
import sys
import importlib

def verificar_entorno():
    """Verifica que todos los paquetes necesarios est√©n instalados."""
    
    paquetes_requeridos = {
        'numpy': '1.26.0',
        'pandas': '2.1.0',
        'matplotlib': '3.8.0',
        'rdkit': '2023.9.0',  # RDKit usa formato diferente
    }
    
    print(f"Python: {sys.version}")
    print(f"Ejecutable: {sys.executable}\n")
    print("=" * 60)
    print(f"{'Paquete':<20} {'Instalado':<15} {'Requerido':<15} {'Estado'}")
    print("=" * 60)
    
    for paquete, version_req in paquetes_requeridos.items():
        try:
            mod = importlib.import_module(paquete)
            version = getattr(mod, '__version__', 'unknown')
            
            # Comparaci√≥n simple de versi√≥n (mejora: usar packaging)
            if version >= version_req or version == 'unknown':
                estado = "‚úÖ"
            else:
                estado = "‚ö†Ô∏è"
                
            print(f"{paquete:<20} {version:<15} {version_req:<15} {estado}")
        except ImportError:
            print(f"{paquete:<20} {'NO INSTALADO':<15} {version_req:<15} ‚ùå")
    
    print("=" * 60)

# Ejecutar verificaci√≥n
verificar_entorno()

---

## ‚úçÔ∏è Ejercicios Pr√°cticos

### Ejercicio 1: Crear Entorno para Proyecto de Mec√°nica Molecular (B√°sico)

**Objetivo:** Configurar un entorno reproducible para an√°lisis conformacional

**Tareas:**
1. Crear entorno conda llamado `mecanica_molecular` con Python 3.11
2. Instalar: numpy, pandas, matplotlib, rdkit, openbabel
3. Crear archivo `environment.yml`
4. Crear archivo `requirements.txt` equivalente
5. Escribir un README.md con instrucciones de instalaci√≥n

**Verificaci√≥n:**
```python
# Ejecutar en el entorno
import rdkit
from rdkit import Chem
mol = Chem.MolFromSmiles('CCO')
print(f"Mol√©cula: {Chem.MolToMolBlock(mol)}")
```


In [None]:
# Tu soluci√≥n aqu√≠

### Ejercicio 2: Reproducir Entorno de un Paper (Intermedio)

**Escenario:** Encontraste un paper interesante en GitHub con este `environment.yml`:

```yaml
name: paper_conformers
channels:
  - conda-forge
dependencies:
  - python=3.10
  - rdkit=2022.09
  - numpy=1.23
  - pandas=1.5
  - matplotlib=3.6
```

**Tareas:**
1. Crear el entorno desde el archivo
2. Verificar que todas las versiones son correctas
3. Detectar si hay incompatibilidades con tu sistema
4. Actualizar a versiones modernas manteniendo compatibilidad
5. Documentar cambios necesarios


In [None]:
# Tu soluci√≥n aqu√≠

### Ejercicio 3: Proyecto Multi-Entorno (Avanzado)

**Escenario:** Tienes 3 proyectos simult√°neos:
- **Proyecto A:** Machine learning (PyTorch 2.0, scikit-learn)
- **Proyecto B:** Din√°mica molecular (MDAnalysis, MDTraj)
- **Proyecto C:** Qu√≠mica cu√°ntica (PySCF, ASE)

**Tareas:**
1. Crear 3 entornos separados con sus dependencias
2. Escribir script bash para cambiar entre proyectos
3. Crear archivo `.envrc` para direnv (auto-activaci√≥n)
4. Documentar en tabla comparativa qu√© paquetes usa cada uno
5. Identificar paquetes comunes que podr√≠an compartirse

**Bonus:** Crear entorno "base" con herramientas comunes (Jupyter, NumPy) y entornos espec√≠ficos que lo extiendan.


In [None]:
# Tu soluci√≥n aqu√≠

### Ejercicio 4: Publicaci√≥n Reproducible (Desaf√≠o)

**Objetivo:** Preparar un proyecto para publicaci√≥n cient√≠fica con reproducibilidad m√°xima

**Requisitos:**
1. Proyecto con al menos 3 notebooks de an√°lisis
2. `environment.yml` completo y testeado
3. `README.md` profesional con badges
4. `.gitignore` apropiado
5. Dockerfile funcional (opcional)
6. Configuraci√≥n para Binder
7. Script de verificaci√≥n de instalaci√≥n
8. Tests b√°sicos con pytest

**Entregable:** Repositorio de GitHub listo para compartir con revisores de paper

**Criterios de √©xito:**
- ‚úÖ Un colega puede clonar y ejecutar en <15 minutos
- ‚úÖ Todos los notebooks ejecutan sin errores
- ‚úÖ Badge de Binder funciona
- ‚úÖ Tests pasan correctamente


In [None]:
# Tu soluci√≥n aqu√≠

---

## üìö Recursos Adicionales

### Documentaci√≥n Oficial

#### Conda
- üìñ [Documentaci√≥n de Conda](https://docs.conda.io/)
- üìñ [Conda Cheat Sheet](https://docs.conda.io/projects/conda/en/latest/user-guide/cheatsheet.html)
- üìñ [Conda-Forge](https://conda-forge.org/)
- üìñ [Mamba Documentation](https://mamba.readthedocs.io/)

#### Python venv
- üìñ [venv - Python Docs](https://docs.python.org/3/library/venv.html)
- üìñ [pip Documentation](https://pip.pypa.io/)
- üìñ [virtualenv](https://virtualenv.pypa.io/)

### Herramientas de Reproducibilidad

#### Gesti√≥n de Entornos
- üîß [Poetry](https://python-poetry.org/) - Gesti√≥n moderna de dependencias
- üîß [Pipenv](https://pipenv.pypa.io/) - pip + venv simplificado
- üîß [direnv](https://direnv.net/) - Auto-activaci√≥n de entornos

#### Contenedores
- üê≥ [Docker](https://www.docker.com/)
- üê≥ [Singularity](https://sylabs.io/singularity/) - Para HPC
- üê≥ [Docker Hub - Scientific Images](https://hub.docker.com/u/continuumio)

#### Notebooks Reproducibles
- üìì [Binder](https://mybinder.org/)
- üìì [Google Colab](https://colab.research.google.com/)
- üìì [Jupyter Book](https://jupyterbook.org/)
- üìì [nbconvert](https://nbconvert.readthedocs.io/)

### Art√≠culos y Tutoriales

#### Reproducibilidad Cient√≠fica
- üìÑ [Ten Simple Rules for Reproducible Computational Research](https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003285)
- üìÑ [The Turing Way: Guide to Reproducible Research](https://the-turing-way.netlify.app/)
- üìÑ [Reproducibility in Computational Chemistry](https://pubs.acs.org/doi/10.1021/acs.jcim.0c00274)

#### Tutoriales
- üéì [Managing Environments - Conda](https://conda.io/projects/conda/en/latest/user-guide/tasks/manage-environments.html)
- üéì [Python Packaging User Guide](https://packaging.python.org/)
- üéì [Best Practices for Scientific Computing](https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.1001745)

### Qu√≠mica Computacional Espec√≠fica

#### Repositorios Ejemplo
- üß™ [MolSSI Best Practices](https://github.com/MolSSI/best-practices)
- üß™ [Computational Chemistry Templates](https://github.com/CCPBioSim/python_and_data)
- üß™ [RDKit Cookbook](https://github.com/rdkit/rdkit)

#### Paquetes √ötiles
- üî¨ [conda-forge/chemistry](https://github.com/conda-forge?q=chem&type=all)
- üî¨ [bioconda](https://bioconda.github.io/)
- üî¨ [PyPI - Chemistry](https://pypi.org/search/?q=chemistry)

### Videos y Cursos

- üé• [Conda Tutorial - YouTube](https://www.youtube.com/results?search_query=conda+tutorial)
- üé• [Python Virtual Environments](https://www.youtube.com/results?search_query=python+virtual+environments)
- üé• [Docker for Scientists](https://www.youtube.com/results?search_query=docker+for+scientists)

### Herramientas de Verificaci√≥n

- ‚úÖ [nbval](https://github.com/computationalmodelling/nbval) - Testing de notebooks
- ‚úÖ [pytest](https://pytest.org/) - Framework de testing
- ‚úÖ [pre-commit](https://pre-commit.com/) - Hooks de Git
- ‚úÖ [black](https://black.readthedocs.io/) - Formateo de c√≥digo

---

## üéì Resumen

En esta actividad has aprendido:

### ‚úÖ **Conceptos Fundamentales**
- Por qu√© los entornos virtuales son cr√≠ticos para ciencia reproducible
- Diferencias entre conda y venv
- Cu√°ndo usar cada herramienta

### ‚úÖ **Conda**
- Crear y gestionar entornos
- Instalar paquetes desde diferentes canales
- Exportar e importar configuraciones
- Resolver problemas comunes

### ‚úÖ **venv**
- Crear entornos ligeros
- Gestionar requirements.txt
- Integraci√≥n con pip

### ‚úÖ **Buenas Pr√°cticas**
- Documentar dependencias
- Estructurar proyectos reproducibles
- Crear README profesionales
- Compartir c√≥digo cient√≠fico

### ‚úÖ **Casos de Uso**
- Proyectos de tesis
- Din√°mica molecular
- Machine learning para qu√≠mica
- M√∫ltiples proyectos simult√°neos

### üéØ **Aplicaciones en Qu√≠mica Computacional**
- ‚öóÔ∏è Proyectos de mec√°nica molecular reproducibles
- üß¨ An√°lisis de trayectorias MD
- ü§ñ Predicci√≥n de propiedades con ML
- üìä Compartir c√≥digo con comunidad cient√≠fica
- üìÑ Publicaciones cient√≠ficas reproducibles

---

## üí° Pr√≥ximos Pasos

1. **Practica:** Crea entornos para tus proyectos actuales
2. **Documenta:** Agrega environment.yml a tus repositorios existentes
3. **Comparte:** Publica tu c√≥digo con instrucciones claras
4. **Mejora:** Implementa testing y CI/CD
5. **Aprende:** Explora Docker para reproducibilidad extrema

> "La reproducibilidad no es un extra, es parte integral del m√©todo cient√≠fico"

---


<div align="center">

## üéâ ¬°Felicitaciones!

Has completado la **Actividad 1.8: Entornos Virtuales y Reproducibilidad Cient√≠fica**

Ahora tienes las herramientas para crear proyectos de qu√≠mica computacional **reproducibles y profesionales**.

[![Anterior](https://img.shields.io/badge/‚¨ÖÔ∏è_Actividad_1.7-Visualizaci√≥n_de_Datos-blue.svg)](07_visualizacion_datos.ipynb)
[![M√≥dulo 2](https://img.shields.io/badge/M√≥dulo_2_‚û°Ô∏è-Representaci√≥n_Molecular-green.svg)](../modulo_02_representacion_molecular/)

---

üìö **[Volver al M√≥dulo 1](README.md)** | üè† **[Inicio del Curso](../README.md)**

---

**Universidad de Caldas - Departamento de Qu√≠mica**  
*Qu√≠mica Computacional 173G7G*

</div>