# Día 1: Entornos Virtuales en Python

## Objetivos de Aprendizaje

Al finalizar este notebook, serás capaz de:

1. Comprender qué son los entornos virtuales y por qué son esenciales
2. Identificar los problemas que resuelven los entornos virtuales
3. Crear y gestionar entornos virtuales con `venv`
4. Utilizar herramientas modernas como `uv` para gestión de dependencias
5. Aplicar mejores prácticas en la gestión de proyectos Python

## ¿Qué son los Entornos Virtuales?

Un **entorno virtual** es un directorio aislado que contiene:

- Una instalación específica de Python
- Un conjunto de paquetes instalados independientes del sistema
- Sus propios ejecutables y scripts

### El Problema que Resuelven

Considera este escenario real:

- **Proyecto A**: Requiere `numpy==1.21.0` y `pandas==1.3.0`
- **Proyecto B**: Requiere `numpy==1.24.0` y `pandas==2.0.0`

Sin entornos virtuales, ambos proyectos compartirían las mismas dependencias a nivel del sistema. Instalar una versión diferente de NumPy para el Proyecto B rompería el Proyecto A. Los entornos virtuales resuelven este problema creando espacios aislados donde cada proyecto puede tener sus propias versiones de dependencias.

In [None]:
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
from matplotlib.patches import FancyBboxPatch, FancyArrowPatch
import numpy as np

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 6))

# Left side: Without virtual environments (Problem)
ax1.set_xlim(0, 10)
ax1.set_ylim(0, 10)
ax1.axis('off')
ax1.set_title('Without Virtual Environments (Problem)', fontsize=14, fontweight='bold', pad=20)

# System Python
system_box = FancyBboxPatch((1, 7), 8, 2, boxstyle="round,pad=0.1", 
                            edgecolor='red', facecolor='#ffcccc', linewidth=2)
ax1.add_patch(system_box)
ax1.text(5, 8, 'System Python', ha='center', va='center', fontsize=11, fontweight='bold')
ax1.text(5, 7.5, 'numpy==1.24.0, pandas==2.0.0', ha='center', va='center', fontsize=9)

# Project A
proj_a = FancyBboxPatch((0.5, 3.5), 4, 2.5, boxstyle="round,pad=0.1", 
                        edgecolor='orange', facecolor='#ffe6cc', linewidth=2)
ax1.add_patch(proj_a)
ax1.text(2.5, 5.2, 'Project A', ha='center', va='center', fontsize=10, fontweight='bold')
ax1.text(2.5, 4.7, 'Needs:', ha='center', va='center', fontsize=8)
ax1.text(2.5, 4.3, 'numpy==1.21.0', ha='center', va='center', fontsize=8)
ax1.text(2.5, 3.9, 'pandas==1.3.0', ha='center', va='center', fontsize=8)

# Project B
proj_b = FancyBboxPatch((5.5, 3.5), 4, 2.5, boxstyle="round,pad=0.1", 
                        edgecolor='green', facecolor='#ccffcc', linewidth=2)
ax1.add_patch(proj_b)
ax1.text(7.5, 5.2, 'Project B', ha='center', va='center', fontsize=10, fontweight='bold')
ax1.text(7.5, 4.7, 'Needs:', ha='center', va='center', fontsize=8)
ax1.text(7.5, 4.3, 'numpy==1.24.0', ha='center', va='center', fontsize=8)
ax1.text(7.5, 3.9, 'pandas==2.0.0', ha='center', va='center', fontsize=8)

# Arrows showing conflict
arrow1 = FancyArrowPatch((2.5, 6), (2.5, 6.5), arrowstyle='->', mutation_scale=20, 
                        color='red', linewidth=2)
arrow2 = FancyArrowPatch((7.5, 6), (7.5, 6.5), arrowstyle='->', mutation_scale=20, 
                        color='red', linewidth=2)
ax1.add_patch(arrow1)
ax1.add_patch(arrow2)

# Conflict indicator
ax1.text(5, 1.5, 'CONFLICT!', ha='center', va='center', fontsize=12, 
        fontweight='bold', color='red', bbox=dict(boxstyle='round', facecolor='yellow', alpha=0.7))
ax1.text(5, 0.5, 'Both projects compete for the same packages', ha='center', va='center', fontsize=9)

# Right side: With virtual environments (Solution)
ax2.set_xlim(0, 10)
ax2.set_ylim(0, 10)
ax2.axis('off')
ax2.set_title('With Virtual Environments (Solution)', fontsize=14, fontweight='bold', pad=20)

# System Python
system_box2 = FancyBboxPatch((1, 8.5), 8, 1, boxstyle="round,pad=0.1", 
                             edgecolor='gray', facecolor='#e6e6e6', linewidth=2)
ax2.add_patch(system_box2)
ax2.text(5, 9, 'System Python (Untouched)', ha='center', va='center', fontsize=10, fontweight='bold')

# Venv A
venv_a = FancyBboxPatch((0.5, 4), 4, 3.5, boxstyle="round,pad=0.1", 
                        edgecolor='blue', facecolor='#cce5ff', linewidth=2.5)
ax2.add_patch(venv_a)
ax2.text(2.5, 7, 'venv_a/', ha='center', va='center', fontsize=10, fontweight='bold')
ax2.text(2.5, 6.4, 'Project A', ha='center', va='center', fontsize=9)
ax2.text(2.5, 5.9, 'numpy==1.21.0', ha='center', va='center', fontsize=8)
ax2.text(2.5, 5.4, 'pandas==1.3.0', ha='center', va='center', fontsize=8)
ax2.text(2.5, 4.5, 'Isolated', ha='center', va='center', fontsize=8, style='italic', color='blue')

# Venv B
venv_b = FancyBboxPatch((5.5, 4), 4, 3.5, boxstyle="round,pad=0.1", 
                        edgecolor='purple', facecolor='#e6ccff', linewidth=2.5)
ax2.add_patch(venv_b)
ax2.text(7.5, 7, 'venv_b/', ha='center', va='center', fontsize=10, fontweight='bold')
ax2.text(7.5, 6.4, 'Project B', ha='center', va='center', fontsize=9)
ax2.text(7.5, 5.9, 'numpy==1.24.0', ha='center', va='center', fontsize=8)
ax2.text(7.5, 5.4, 'pandas==2.0.0', ha='center', va='center', fontsize=8)
ax2.text(7.5, 4.5, 'Isolated', ha='center', va='center', fontsize=8, style='italic', color='purple')

# Arrows showing isolation
arrow3 = FancyArrowPatch((2.5, 7.5), (2.5, 8), arrowstyle='->', mutation_scale=15, 
                        color='blue', linewidth=1.5, linestyle='dashed')
arrow4 = FancyArrowPatch((7.5, 7.5), (7.5, 8), arrowstyle='->', mutation_scale=15, 
                        color='purple', linewidth=1.5, linestyle='dashed')
ax2.add_patch(arrow3)
ax2.add_patch(arrow4)

# Success indicator
ax2.text(5, 1.5, 'NO CONFLICT', ha='center', va='center', fontsize=12, 
        fontweight='bold', color='green', bbox=dict(boxstyle='round', facecolor='lightgreen', alpha=0.7))
ax2.text(5, 0.5, 'Each project has its own isolated environment', ha='center', va='center', fontsize=9)

plt.tight_layout()
plt.show()

print("This visualization shows why virtual environments are essential:")
print("- Left: Without venv, both projects compete for the same system packages")
print("- Right: With venv, each project has its own isolated environment")

### Key Insight

Los entornos virtuales son la base de la reproducibilidad en Python. Sin ellos, es imposible garantizar que tu código funcione en otra máquina o en el futuro.

## Verificando tu Instalación de Python

Antes de crear un entorno virtual, verifica tu instalación de Python:

In [1]:
import platform
import sys

print(f"Python version: {sys.version}")
print(f"Python executable: {sys.executable}")
print(f"Platform: {platform.platform()}")
print(f"Architecture: {platform.machine()}")

Python version: 3.12.10 (tags/v3.12.10:0cc8128, Apr  8 2025, 12:21:36) [MSC v.1943 64 bit (AMD64)]
Python executable: c:\Users\jsdecastro\repos\advanced-python-for-ai-engineering\venv\Scripts\python.exe
Platform: Windows-11-10.0.26200-SP0
Architecture: AMD64


## Opción 1: Usando `venv` (Estándar de Python)

`venv` es el módulo estándar de Python para crear entornos virtuales. Viene incluido con Python 3.3+.

### Crear un Entorno Virtual

**En Windows:**
```bash
python -m venv venv
```

**En Linux/Mac:**
```bash
python3 -m venv venv
```

Esto crea una carpeta `venv/` con:
- `Scripts/` (Windows) o `bin/` (Linux/Mac): Ejecutables
- `Lib/` o `lib/`: Paquetes instalados
- `pyvenv.cfg`: Configuración del entorno

### Hint

El nombre `venv` es una convención, pero puedes usar cualquier nombre. Sin embargo, es recomendable mantener la consistencia en tus proyectos.

### Activar el Entorno Virtual

**Windows (CMD):**
```bash
venv\\Scripts\\activate
```

**Windows (PowerShell):**
```bash
venv\\Scripts\\Activate.ps1
```

**Linux/Mac:**
```bash
source venv/bin/activate
```

Cuando está activado, verás `(venv)` al inicio de tu línea de comandos.

### Pregunta de Comprensión

¿Qué indica que un entorno virtual está activado en tu terminal?

### Instalar Paquetes

Una vez activado el entorno:

```bash
pip install numpy pandas matplotlib
```

O desde un archivo de requisitos:

```bash
pip install -r requirements.txt
```

### Key Insight

Cuando instalas paquetes en un entorno virtual activado, `pip` instala en ese entorno específico, no en el Python del sistema. Esto es lo que proporciona el aislamiento.

### Estructura de un Entorno Virtual

Cuando creas un entorno virtual, se genera una estructura de directorios específica. Veamos cómo se ve:

In [2]:
import sys


def visualize_venv_structure():
    """Visualize the typical structure of a virtual environment.

    :return: None
    :rtype: None
    """
    venv_structure = """
venv/
├── bin/                    (Linux/Mac) or Scripts/ (Windows)
│   ├── python              Python interpreter
│   ├── pip                 Package installer
│   ├── activate            Activation script
│   └── ...
├── lib/                    (Linux/Mac) or Lib/ (Windows)
│   └── python3.10/
│       └── site-packages/  Your installed packages go here
│           ├── numpy/
│           ├── pandas/
│           └── ...
├── include/                C headers for compiled packages
└── pyvenv.cfg              Configuration file
    """
    print(venv_structure)
    print("\nKey Points:")
    print("- bin/ (or Scripts/): Contains executables specific to this venv")
    print("- site-packages/: Where pip installs packages for this venv only")
    print("- pyvenv.cfg: Stores configuration like home = /usr/bin/python3")

visualize_venv_structure()


venv/
├── bin/                    (Linux/Mac) or Scripts/ (Windows)
│   ├── python              Python interpreter
│   ├── pip                 Package installer
│   ├── activate            Activation script
│   └── ...
├── lib/                    (Linux/Mac) or Lib/ (Windows)
│   └── python3.10/
│       └── site-packages/  Your installed packages go here
│           ├── numpy/
│           ├── pandas/
│           └── ...
├── include/                C headers for compiled packages
└── pyvenv.cfg              Configuration file
    

Key Points:
- bin/ (or Scripts/): Contains executables specific to this venv
- site-packages/: Where pip installs packages for this venv only
- pyvenv.cfg: Stores configuration like home = /usr/bin/python3


### Verificar Paquetes Instalados

In [None]:
# Check if we're in a virtual environment
import sys

in_venv = sys.prefix != sys.base_prefix
print(f"Running in virtual environment: {in_venv}")
print(f"Python prefix: {sys.prefix}")
print(f"Base prefix: {sys.base_prefix}")
print(f"\nThis means:")
print(f"- sys.prefix points to your venv location")
print(f"- sys.base_prefix points to your system Python")
print(f"- When they differ, you're in a virtual environment")

In [None]:
# List installed packages
import subprocess

result = subprocess.run(
    [sys.executable, "-m", "pip", "list"],
    capture_output=True,
    text=True
)
print(result.stdout)

### Desactivar el Entorno

Simplemente ejecuta:
```bash
deactivate
```

Después de esto, el prefijo `(venv)` desaparecerá de tu terminal.

## Opción 2: Usando `uv` (Moderno y Rápido)

`uv` es una herramienta moderna de gestión de paquetes Python escrita en Rust. Es **10-100x más rápida** que pip.

### Instalación de uv

**Windows (PowerShell):**
```bash
powershell -c \"irm https://astral.sh/uv/install.ps1 | iex\"
```

**Linux/Mac:**
```bash
curl -LsSf https://astral.sh/uv/install.sh | sh
```

O con pip:
```bash
pip install uv
```

### Hint

Aunque `uv` es más rápido, `venv` es el estándar de Python. Aprende ambos para ser versátil.

### Crear Proyecto con uv

```bash
# Initialize a new project
uv init my-project
cd my-project

# Create virtual environment and install dependencies
uv sync
```

### Ventajas de uv

1. **Velocidad**: Instalaciones hasta 100x más rápidas
2. **Gestión integrada**: Maneja Python, entornos virtuales y paquetes
3. **Lock files**: Garantiza reproducibilidad con `uv.lock`
4. **Compatible**: Funciona con `pyproject.toml` y `requirements.txt`

### Key Insight

El archivo `uv.lock` es crucial para reproducibilidad. Contiene las versiones exactas de todas las dependencias, incluyendo las transitorias.

## Gestión de Dependencias

### requirements.txt (Tradicional)

```txt
numpy>=1.24.0
pandas>=2.0.0
matplotlib>=3.7.0
scikit-learn==1.3.0
```

Generar desde tu entorno actual:
```bash
pip freeze > requirements.txt
```

### Pregunta de Comprensión

¿Cuál es la diferencia entre `>=1.24.0` y `==1.24.0` en un archivo de requisitos?

### pyproject.toml (Moderno)

```toml
[project]
name = "my-ai-project"
version = "0.1.0"
dependencies = [
    "numpy>=1.24.0",
    "pandas>=2.0.0",
    "scikit-learn>=1.3.0",
]

[project.optional-dependencies]
dev = [
    "pytest>=7.4.0",
    "ruff>=0.1.0",
]
```

Instalar con uv:
```bash
uv sync
uv sync --extra dev  # Include dev dependencies
```

### Key Insight

`pyproject.toml` es el estándar moderno de Python. Permite definir dependencias opcionales y metadatos del proyecto en un único archivo.

## Ejercicio Práctico

### Tarea 1: Crear tu Entorno Virtual

1. Abre una terminal en el directorio del curso
2. Crea un entorno virtual llamado `venv`
3. Actívalo
4. Instala las dependencias desde `requirements.txt`
5. Verifica que Jupyter esté instalado: `jupyter --version`

### Tarea 2: Explorar tu Entorno

Ejecuta las siguientes celdas para verificar tu configuración:

In [None]:
# Verify key packages are installed
import importlib
from typing import List

def check_package(package_name: str) -> bool:
    """
    Check if a package is installed.
    
    :param package_name: Name of the package to check
    :type package_name: str
    :return: True if package is installed, False otherwise
    :rtype: bool
    """
    try:
        importlib.import_module(package_name)
        return True
    except ImportError:
        return False

packages: List[str] = [
    "numpy",
    "pandas",
    "matplotlib",
    "sklearn",
    "torch",
]

print("Package Installation Status:")
print("-" * 40)
for package in packages:
    status = "Installed" if check_package(package) else "Not installed"
    print(f"{package:15} {status}")

In [None]:
# Display package versions
import numpy as np
import pandas as pd
import matplotlib

print("Package Versions:")
print("-" * 40)
print(f"NumPy:      {np.__version__}")
print(f"Pandas:     {pd.__version__}")
print(f"Matplotlib: {matplotlib.__version__}")

## Mejores Prácticas

### 1. Un Entorno por Proyecto
Cada proyecto debe tener su propio entorno virtual. Esto evita conflictos de dependencias y facilita la reproducibilidad.

### 2. Nombra tu Entorno Consistentemente
Usa nombres como `venv`, `.venv`, o `env` para facilitar la identificación. La consistencia es clave en equipos de trabajo.

### 3. Añade al .gitignore
```
venv/
.venv/
env/
*.pyc
__pycache__/
.kiro/
```

Nunca commits tu entorno virtual al repositorio. Es específico de cada máquina.

### 4. Documenta las Dependencias
Mantén actualizado tu `requirements.txt` o `pyproject.toml`. Esto es esencial para que otros puedan reproducir tu entorno.

### 5. Usa Versiones Específicas en Producción
```txt
# Development
numpy>=1.24.0

# Production
numpy==1.24.3
```

En desarrollo, puedes ser flexible. En producción, sé específico.

### Key Insight

La gestión de dependencias es una responsabilidad compartida. Documentarla correctamente es tan importante como escribir el código.

## Herramientas Adicionales

### virtualenvwrapper
Facilita la gestión de múltiples entornos virtuales con comandos simplificados.

### conda
Gestor de paquetes y entornos, especialmente útil para ciencia de datos. Maneja dependencias no-Python también.

### poetry
Herramienta moderna para gestión de dependencias y empaquetado. Proporciona un flujo de trabajo completo.

### pipenv
Combina pip y virtualenv en una sola herramienta. Menos popular que poetry pero aún relevante.

### Hint

Para este curso, nos enfocamos en `venv` y `uv` porque son los estándares modernos de Python. Aprenderlos te dará una base sólida.

## Resumen

En este notebook has aprendido:

- Qué son los entornos virtuales y por qué son esenciales
- Cómo crear y gestionar entornos con `venv`
- Cómo usar `uv` para gestión moderna de dependencias
- Mejores prácticas para gestión de proyectos Python
- Cómo verificar y documentar dependencias

### Próximos Pasos

Ahora que tienes tu entorno configurado, estás listo para:
- Explorar Python avanzado en los siguientes notebooks
- Trabajar con NumPy y Pandas
- Construir modelos de Machine Learning

Asegúrate de tener tu entorno virtual activado antes de continuar con el Día 2.

## Preguntas de Autoevaluación

Responde estas preguntas para verificar tu comprensión:

1. ¿Cuál es la diferencia principal entre `sys.prefix` y `sys.base_prefix`?
2. ¿Por qué es importante no commitear el directorio `venv/` a Git?
3. ¿Cuándo usarías `>=` vs `==` en un archivo de requisitos?
4. ¿Qué ventaja tiene `uv` sobre `pip`?
5. ¿Cómo verificarías que estás en un entorno virtual activado?

Discute tus respuestas con compañeros o instructores para profundizar tu comprensión.