# Día 3: Módulos, Importaciones y Estructura de Proyectos

## Descripción General

En Python, la organización del código es fundamental para crear proyectos mantenibles y escalables. Este notebook te enseña cómo estructurar proyectos Python profesionales, crear módulos reutilizables, gestionar importaciones correctamente y configurar tu proyecto con `pyproject.toml`.

Aprenderás cómo convertir tu código en un paquete instalable que pueda ser usado por otros desarrolladores o en diferentes entornos.

## Objetivos de Aprendizaje

Al finalizar este notebook, serás capaz de:

1. Comprender la diferencia entre módulos, paquetes y proyectos en Python
2. Organizar código en una estructura de proyecto profesional
3. Usar importaciones correctamente (absoluta, relativa, circular)
4. Configurar un proyecto con `pyproject.toml`
5. Instalar un proyecto en modo desarrollo con `pip install -e`
6. Crear paquetes reutilizables y distribuibles

## ¿Qué son los Módulos?

Un **módulo** es un archivo Python (`.py`) que contiene código reutilizable. Un **paquete** es un directorio que contiene módulos y un archivo `__init__.py`.

### El Problema que Resuelven

Considera este código en un único archivo `main.py`:

```python
# main.py - 500 líneas de código
def calculate_average(values):
    pass

def calculate_median(values):
    pass

def plot_data(data):
    pass

def save_to_csv(data, filename):
    pass

# ... más código ...
```

Este archivo es difícil de mantener, probar y reutilizar.

### Con Módulos (Solución)

```bash
my_project/
├── main.py
├── statistics.py      # Funciones de estadística
├── visualization.py   # Funciones de visualización
└── io_utils.py        # Funciones de entrada/salida
```

Cada módulo tiene una responsabilidad clara y es fácil de mantener.

### Aprendizaje Clave

La organización modular es la base de proyectos Python profesionales. Permite que múltiples desarrolladores trabajen en paralelo, facilita las pruebas unitarias y hace el código más reutilizable.

**Referencia oficial:** [PEP 420 - Implicit Namespace Packages](https://www.python.org/dev/peps/pep-0420/)

## Módulos y Paquetes

### Estructura Básica

Un **módulo** es simplemente un archivo `.py`:

```bash
my_module.py
```

Un **paquete** es un directorio con un archivo `__init__.py`:

```bash
my_package/
├── __init__.py
├── module1.py
└── module2.py
```

### El Archivo `__init__.py`

El archivo `__init__.py` marca un directorio como paquete Python. Puede estar vacío o contener código de inicialización:

```python
# my_package/__init__.py
"""
My package for data processing.

This package provides utilities for statistical analysis.
"""

__version__ = "1.0.0"
__author__ = "Your Name"

# Import commonly used functions for easier access
from .statistics import calculate_average, calculate_median
from .visualization import plot_data

__all__ = ["calculate_average", "calculate_median", "plot_data"]
```


**¿Cómo nos ayuda esto?**

Sin inicializar imports en el __init__:
```python
# ❌ Imports largos y verbosos
from data_processing.statistics import calculate_average
from data_processing.statistics import calculate_median
from data_processing.visualization import plot_data

# Usar funciones
avg = calculate_average([1, 2, 3, 4, 5])
median = calculate_median([1, 2, 3, 4, 5])
plot_data([1, 2, 3, 4, 5])
```

Inicializando imports en el __init__:
```python
# ✅ Imports cortos y limpios
import data_processing as dp

# Acceso directo desde el paquete
avg = dp.calculate_average([1, 2, 3, 4, 5])
median = dp.calculate_median([1, 2, 3, 4, 5])
dp.plot_data([1, 2, 3, 4, 5])

# O imports selectivos
from data_processing import calculate_average, plot_data

avg = calculate_average([1, 2, 3, 4, 5])
plot_data([1, 2, 3, 4, 5])

# O import todo lo público
from data_processing import *  # Importa solo lo que está en __all__
```

**¿Por qué necesitamos `__init__.py`?** Antes de Python 3.3, era obligatorio para que Python reconociera un directorio como paquete. Desde Python 3.3, los "namespace packages" no lo requieren, pero es una buena práctica incluirlo para claridad y control de inicialización.

### Aprendizaje Clave

El archivo `__init__.py` es tu punto de entrada al paquete. Úsalo para exponer la API pública de tu paquete y ocultar detalles de implementación internos.

**Referencia oficial:** [Packages - Python Documentation](https://docs.python.org/3/tutorial/modules.html#packages)

## Importaciones en Python

### Tipos de Importaciones

Existen varias formas de importar código en Python:

In [None]:
# 1. Importación absoluta (recomendada)
import statistics
from statistics import calculate_average
from statistics import calculate_average as avg

# 2. Importación relativa (dentro de paquetes)
from . import module1
from .module1 import function1
from .. import parent_module

# 3. Importación con alias
import numpy as np
from pandas import DataFrame as DF

### Importaciones Absolutas vs Relativas

**Importaciones Absolutas** (recomendadas):
```python
# En cualquier lugar del proyecto
from my_package.statistics import calculate_average
```

**Importaciones Relativas** (solo dentro de paquetes):
```python
# Dentro de my_package/visualization.py
from .statistics import calculate_average  # Mismo nivel
from ..utils import helper_function        # Nivel superior
```

### Pregunta de Comprensión

¿Cuándo deberías usar importaciones relativas en lugar de absolutas?

### Aprendizaje Clave

Las importaciones absolutas son más claras y evitan problemas de circularidad. Úsalas por defecto. Las importaciones relativas son útiles dentro de paquetes para evitar dependencias de nombres de paquetes.

**Referencia oficial:** [Relative Imports](https://docs.python.org/3/reference/import_system.html#package-relative-imports)

## Estructura Profesional de Proyectos

### Estructura Recomendada

```bash
my_project/
├── pyproject.toml              # Configuración del proyecto
├── README.md                   # Documentación
├── LICENSE                     # Licencia
├── .gitignore                  # Archivos a ignorar en Git
├── src/
│   └── my_package/
│       ├── __init__.py
│       ├── core.py
│       ├── utils.py
│       └── data/
│           ├── __init__.py
│           └── loader.py
├── tests/
│   ├── __init__.py
│   ├── test_core.py
│   └── test_utils.py
├── docs/
│   ├── index.md
│   └── api.md
└── examples/
    └── example_usage.py
```

### Explicación de Directorios

- **src/**: Código fuente del proyecto (estructura recomendada)
- **tests/**: Pruebas unitarias
- **docs/**: Documentación
- **examples/**: Ejemplos de uso
- **pyproject.toml**: Configuración central del proyecto

### Respuesta a la Pregunta Anterior

**¿Por qué usar `src/` en lugar de poner el código en la raíz?** Porque evita conflictos de importación durante el desarrollo y es la estructura recomendada por la comunidad Python. Facilita la instalación correcta del paquete.

### Aprendizaje Clave

La estructura de proyecto es importante desde el inicio. Una buena estructura facilita el crecimiento del proyecto, la colaboración en equipo y la distribución del código.

**Referencia oficial:** [Packaging Python Projects](https://packaging.python.org/tutorials/packaging-projects/)

## Configuración con `pyproject.toml`

El archivo `pyproject.toml` es el corazón de la configuración de tu proyecto Python. Define metadatos, dependencias y herramientas.

### Estructura Básica

```toml
[build-system]
requires = ["setuptools>=61.0", "wheel"]
build-backend = "setuptools.build_meta"

[project]
name = "my-project"
version = "0.1.0"
description = "A brief description"
authors = [{name = "Your Name", email = "your@email.com"}]
requires-python = ">=3.11"
dependencies = [
    "numpy>=1.24.0",
    "pandas>=2.0.0",
]

[project.optional-dependencies]
dev = [
    "pytest>=7.4.0",
    "mypy>=1.5.0",
    "ruff>=0.1.0",
]

[tool.setuptools]
package-dir = {"" = "src"}

[tool.setuptools.packages.find]
where = ["src"]

[tool.ruff]
line-length = 100
target-version = "py311"
```

### Secciones Principales

- **[build-system]**: Herramientas para construir el paquete
- **[project]**: Metadatos del proyecto
- **[project.optional-dependencies]**: Dependencias opcionales
- **[tool.*]**: Configuración de herramientas (ruff, mypy, pytest, etc.)

### Aprendizaje Clave

`pyproject.toml` es el estándar moderno de Python (PEP 517, PEP 518). Centraliza toda la configuración en un único archivo, reemplazando `setup.py`, `setup.cfg` y `requirements.txt`.

**Referencia oficial:** [PEP 517 - A build-system independent format](https://www.python.org/dev/peps/pep-0517/)

## Instalación en Modo Desarrollo

### El Problema

Cuando desarrollas un paquete, necesitas probar cambios sin reinstalar constantemente:

```bash
# Cambias código en src/my_package/core.py
# Necesitas reinstalar para ver los cambios
pip install .
```

Esto es tedioso y lento.

### La Solución: `pip install -e`

La opción `-e` (editable) instala el paquete en modo desarrollo:

```bash
pip install -e .
```

Esto crea un enlace simbólico a tu código fuente. Los cambios se reflejan inmediatamente sin reinstalar.

### Cómo Funciona

```
Instalación normal:
my_package/ → copia a → site-packages/my_package/

Instalación editable (-e):
my_package/ → enlace simbólico en → site-packages/my_package/
```

### Instalación con Dependencias de Desarrollo

```bash
# Instalar con dependencias de desarrollo
pip install -e ".[dev]"

# Instalar con múltiples grupos de dependencias
pip install -e ".[dev,docs]"
```

### Aprendizaje Clave

`pip install -e` es esencial para desarrollo. Permite iterar rápidamente sin reinstalar constantemente. Úsalo siempre cuando desarrolles paquetes Python.

**Referencia oficial:** [pip install - Editable Installs](https://pip.pypa.io/en/latest/topics/local-project-installs/#editable-installs)

## Ejemplo Práctico: Crear un Proyecto

Vamos a crear un proyecto de ejemplo paso a paso.

In [None]:
# Crear la estructura del proyecto
import os
from pathlib import Path

# Crear directorios
project_root = Path("example_project")
project_root.mkdir(exist_ok=True)

src_dir = project_root / "src" / "example_package"
src_dir.mkdir(parents=True, exist_ok=True)

tests_dir = project_root / "tests"
tests_dir.mkdir(exist_ok=True)

# Crear archivos
(src_dir / "__init__.py").touch()
(src_dir / "core.py").touch()
(tests_dir / "__init__.py").touch()

print("Estructura de proyecto creada:")
for root, dirs, files in os.walk(project_root):
    level = root.replace(str(project_root), "").count(os.sep)
    indent = " " * 2 * level
    print(f"{indent}{os.path.basename(root)}/")
    subindent = " " * 2 * (level + 1)
    for file in files:
        print(f"{subindent}{file}")

### Crear el Archivo `__init__.py`

El archivo `__init__.py` define la API pública del paquete:

In [None]:
# Contenido de src/example_package/__init__.py
init_content = '''"""
Example package for data processing.

This package provides utilities for statistical analysis and visualization.
"""

__version__ = "0.1.0"
__author__ = "Your Name"

from .core import calculate_average, calculate_median

__all__ = ["calculate_average", "calculate_median"]
'''

print("Contenido de __init__.py:")
print(init_content)

### Crear Módulos

Cada módulo tiene una responsabilidad clara:

In [None]:
# Contenido de src/example_package/core.py
core_content = '''"""
Core statistical functions.

This module provides basic statistical calculations.
"""

from typing import List


def calculate_average(values: List[float]) -> float:
    """
    Calculate the arithmetic mean of a list of numbers.
    
    :param values: List of numeric values
    :type values: List[float]
    :return: The arithmetic mean
    :rtype: float
    :raises ValueError: If the list is empty
    
    Example:
        >>> calculate_average([1, 2, 3, 4, 5])
        3.0
    """
    if not values:
        raise ValueError("Cannot calculate average of empty list")
    return sum(values) / len(values)


def calculate_median(values: List[float]) -> float:
    """
    Calculate the median of a list of numbers.
    
    :param values: List of numeric values
    :type values: List[float]
    :return: The median value
    :rtype: float
    :raises ValueError: If the list is empty
    
    Example:
        >>> calculate_median([1, 2, 3, 4, 5])
        3
    """
    if not values:
        raise ValueError("Cannot calculate median of empty list")
    
    sorted_values = sorted(values)
    n = len(sorted_values)
    
    if n % 2 == 1:
        return sorted_values[n // 2]
    else:
        mid1 = sorted_values[n // 2 - 1]
        mid2 = sorted_values[n // 2]
        return (mid1 + mid2) / 2
'''

print("Contenido de core.py:")
print(core_content)

## Ejercicios Prácticos

### Tarea 1: Crear un Módulo Simple

Crea un módulo `utils.py` con funciones de utilidad:

In [None]:
# TODO: Create a utils.py module with utility functions
# Functions to implement:
# - format_number(value: float, decimals: int) -> str
# - is_valid_email(email: str) -> bool
# - reverse_string(text: str) -> str

# Example implementation:
def format_number(value: float, decimals: int = 2) -> str:
    """
    Format a number to a specific number of decimal places.
    
    :param value: Number to format
    :type value: float
    :param decimals: Number of decimal places
    :type decimals: int
    :return: Formatted number as string
    :rtype: str
    """
    return f"{value:.{decimals}f}"


def is_valid_email(email: str) -> bool:
    """
    Check if an email address is valid (basic check).
    
    :param email: Email address to validate
    :type email: str
    :return: True if valid, False otherwise
    :rtype: bool
    """
    return "@" in email and "." in email.split("@")[1]


def reverse_string(text: str) -> str:
    """
    Reverse a string.
    
    :param text: String to reverse
    :type text: str
    :return: Reversed string
    :rtype: str
    """
    return text[::-1]


# Test the functions
print(format_number(3.14159, 2))
print(is_valid_email("user@example.com"))
print(reverse_string("hello"))

### Tarea 2: Crear un Paquete con `__init__.py`

Crea un paquete que exponga una API clara:

In [None]:
# TODO: Create a package structure
# Create:
# - my_package/__init__.py (expose public API)
# - my_package/math_utils.py (math functions)
# - my_package/string_utils.py (string functions)

# Example __init__.py content:
init_example = '''"""
My utility package.

Provides mathematical and string utilities.
"""

__version__ = "1.0.0"

from .math_utils import add, multiply
from .string_utils import uppercase, lowercase

__all__ = ["add", "multiply", "uppercase", "lowercase"]
'''

print("Example __init__.py:")
print(init_example)

### Tarea 3: Crear `pyproject.toml`

Configura un proyecto completo con `pyproject.toml`:

In [None]:
# TODO: Create a pyproject.toml file
# Include:
# - Project metadata
# - Dependencies
# - Development dependencies
# - Tool configurations

pyproject_example = '''[build-system]
requires = ["setuptools>=61.0", "wheel"]
build-backend = "setuptools.build_meta"

[project]
name = "my-data-project"
version = "0.1.0"
description = "A data processing project"
authors = [{name = "Your Name", email = "your@email.com"}]
requires-python = ">=3.11"
dependencies = [
    "numpy>=1.24.0",
    "pandas>=2.0.0",
]

[project.optional-dependencies]
dev = [
    "pytest>=7.4.0",
    "mypy>=1.5.0",
    "ruff>=0.1.0",
]
docs = [
    "sphinx>=5.0.0",
]

[tool.setuptools]
package-dir = {"" = "src"}

[tool.setuptools.packages.find]
where = ["src"]

[tool.ruff]
line-length = 100
target-version = "py311"

[tool.ruff.lint]
select = ["E", "F", "I", "N", "W"]
ignore = ["E501"]
'''

print("Example pyproject.toml:")
print(pyproject_example)

## Resumen

En este notebook has aprendido:

- La diferencia entre módulos, paquetes y proyectos
- Cómo estructurar un proyecto Python profesional
- Cómo usar importaciones correctamente (absoluta y relativa)
- Cómo configurar un proyecto con `pyproject.toml`
- Cómo instalar un proyecto en modo desarrollo con `pip install -e`
- Cómo crear paquetes reutilizables

Una buena estructura de proyecto es la base para código mantenible, escalable y colaborativo.

## Preguntas de Autoevaluación

### 1. ¿Cuál es la diferencia entre un módulo y un paquete?

**Respuesta:** Un módulo es un archivo `.py` individual. Un paquete es un directorio que contiene módulos y un archivo `__init__.py`. Los paquetes permiten organizar módulos relacionados en una jerarquía.

### 2. ¿Por qué es importante el archivo `__init__.py`?

**Respuesta:** El archivo `__init__.py` marca un directorio como paquete Python y permite controlar qué se expone como API pública. Aunque es opcional desde Python 3.3, es una buena práctica incluirlo para claridad y control de inicialización.

### 3. ¿Cuándo deberías usar importaciones relativas?

**Respuesta:** Usa importaciones relativas dentro de paquetes para evitar dependencias de nombres de paquetes. Usa importaciones absolutas en scripts y cuando importes desde otros paquetes. Las importaciones relativas son más frágiles y pueden causar problemas.

### 4. ¿Qué ventaja tiene `pip install -e` durante el desarrollo?

**Respuesta:** `pip install -e` crea un enlace simbólico a tu código fuente en lugar de copiar archivos. Esto permite que los cambios se reflejen inmediatamente sin reinstalar el paquete, acelerando significativamente el ciclo de desarrollo.

### 5. ¿Por qué usar `src/` en lugar de poner el código en la raíz del proyecto?

**Respuesta:** La estructura `src/` evita conflictos de importación durante el desarrollo y es la estructura recomendada por la comunidad Python. Facilita la instalación correcta del paquete y previene que se importe el código sin instalar el paquete.

Discute tus respuestas con compañeros o instructores para profundizar tu comprensión.

## Recursos y Referencias Oficiales

### Documentación Oficial

- **Modules**: [https://docs.python.org/3/tutorial/modules.html](https://docs.python.org/3/tutorial/modules.html)
  - Tutorial oficial sobre módulos y paquetes

- **The import system**: [https://docs.python.org/3/reference/import_system.html](https://docs.python.org/3/reference/import_system.html)
  - Referencia completa del sistema de importación

- **pip install**: [https://pip.pypa.io/en/latest/cli/pip_install/](https://pip.pypa.io/en/latest/cli/pip_install/)
  - Documentación de pip install con opciones como `-e`

### Estándares de Python (PEPs)

- **PEP 517 - A build-system independent format**: [https://www.python.org/dev/peps/pep-0517/](https://www.python.org/dev/peps/pep-0517/)
  - Define el formato de `pyproject.toml`

- **PEP 518 - Specifying build system requirements**: [https://www.python.org/dev/peps/pep-0518/](https://www.python.org/dev/peps/pep-0518/)
  - Especifica la sección `[build-system]`

- **PEP 420 - Implicit Namespace Packages**: [https://www.python.org/dev/peps/pep-0420/](https://www.python.org/dev/peps/pep-0420/)
  - Namespace packages sin `__init__.py`

### Guías y Tutoriales

- **Packaging Python Projects**: [https://packaging.python.org/tutorials/packaging-projects/](https://packaging.python.org/tutorials/packaging-projects/)
  - Guía completa sobre empaquetado

- **Real Python - Modules and Packages**: [https://realpython.com/python-modules-packages/](https://realpython.com/python-modules-packages/)
  - Tutorial práctico sobre módulos y paquetes

- **setuptools Documentation**: [https://setuptools.pypa.io/](https://setuptools.pypa.io/)
  - Documentación de setuptools para construcción de paquetes

### Mejores Prácticas

- **Python Project Structure**: [https://docs.python-guide.org/writing/structure/](https://docs.python-guide.org/writing/structure/)
  - Guía de estructura de proyectos Python

- **Cookiecutter**: [https://cookiecutter.readthedocs.io/](https://cookiecutter.readthedocs.io/)
  - Herramienta para crear plantillas de proyectos

### Notas Importantes

- Todos los enlaces están actualizados a partir de 2026
- La estructura `src/` es la recomendación moderna
- `pyproject.toml` es el estándar moderno, reemplazando `setup.py`
- Usa `pip install -e` siempre durante el desarrollo
- Mantén `__init__.py` incluso si está vacío para claridad