# Día 3: Comentarios y Documentación

## Descripción General

Los comentarios y la documentación son elementos fundamentales para crear código mantenible y comprensible. Aunque el código debe ser autoexplicativo en la medida de lo posible, los comentarios y docstrings bien escritos proporcionan contexto crucial sobre el *por qué* detrás de las decisiones de diseño, no solo el *qué* hace el código.

En este notebook aprenderás cuándo y cómo escribir comentarios efectivos, cómo crear docstrings profesionales siguiendo el formato Sphinx, y las mejores prácticas para documentar tu código Python de manera que sea útil tanto para ti como para otros desarrolladores.

## Objetivos de Aprendizaje

Al finalizar este notebook, serás capaz de:

1. Distinguir cuándo es apropiado escribir comentarios y cuándo el código debe hablar por sí mismo
2. Escribir docstrings en formato Sphinx con todos los elementos necesarios (:param, :type, :return, :rtype, :raises)
3. Aplicar las convenciones de PEP 257 para docstrings de módulos, clases y funciones
4. Identificar y evitar comentarios redundantes o que añaden ruido al código
5. Documentar decisiones de diseño complejas y casos especiales de manera efectiva

## 1. Cuándo Comentar: El Arte de la Moderación

### El Problema que Resuelve

Muchos desarrolladores caen en dos extremos: no comentar nada o comentar demasiado. Ambos enfoques son problemáticos:

- **Sin comentarios**: El código complejo se vuelve incomprensible, especialmente cuando se revisa meses después
- **Demasiados comentarios**: Los comentarios redundantes añaden ruido y pueden quedar desactualizados, causando confusión

El objetivo es encontrar el equilibrio: comentar el *por qué*, no el *qué*.

### Aprendizaje Clave

**Comenta el razonamiento, no la implementación.** El código debe ser autoexplicativo en cuanto a *qué* hace; los comentarios deben explicar *por qué* se tomaron ciertas decisiones.

**Referencia oficial:** [PEP 8 - Comments](https://peps.python.org/pep-0008/#comments)

In [None]:
# BAD: Comentarios que repiten lo que el código ya dice

# Increment counter by 1
counter = counter + 1

# Check if user is active
if user.is_active:
    # Send email to user
    send_email(user.email)

# Loop through all items
for item in items:
    # Process the item
    process(item)

In [None]:
# GOOD: Comentarios que explican el razonamiento

# Use exponential backoff to avoid overwhelming the API
# after multiple failed requests
wait_time = base_delay * (2 ** retry_count)

# Skip validation for admin users to allow emergency fixes
# See ticket #1234 for context
if not user.is_admin:
    validate_input(data)

# Process in batches of 100 to stay within memory limits
# Tested with datasets up to 1M records
for batch in chunk_list(items, size=100):
    process_batch(batch)

### Pregunta de Comprensión

¿Cuál de estos comentarios es más útil y por qué?

A) `# Calculate total price`

B) `# Add 10% tax because EU regulations require it for B2C transactions`

## 2. Tipos de Comentarios en Python

### Comentarios de Línea (Inline Comments)

Los comentarios inline deben usarse con moderación y separarse del código por al menos dos espacios.

In [None]:
# BAD: Inline comment too close and stating the obvious
x = x + 1# Increment x

# GOOD: Inline comment explaining non-obvious behavior
x = x + 1  # Compensate for border width in calculation

### Comentarios de Bloque (Block Comments)

Los comentarios de bloque se aplican al código que les sigue y deben estar al mismo nivel de indentación.

In [None]:
def process_data(data):
    # GOOD: Block comment explaining complex logic
    # We need to normalize the data before processing because:
    # 1. Different sources use different scales (0-1 vs 0-100)
    # 2. The ML model expects values in [0, 1] range
    # 3. Normalization improves convergence speed by 3x
    normalized_data = normalize(data)
    
    return train_model(normalized_data)

### Aprendizaje Clave

**Los comentarios inline deben ser excepcionales, no la norma.** Si necesitas muchos comentarios inline, probablemente tu código necesita refactorización para ser más claro.

**Referencia oficial:** [PEP 8 - Inline Comments](https://peps.python.org/pep-0008/#inline-comments)

## 3. Docstrings: Documentación Profesional

### El Problema que Resuelve

Los docstrings son diferentes de los comentarios: son parte de la API del código y pueden ser accedidos programáticamente mediante `__doc__`. Son esenciales para:

- Generar documentación automática con herramientas como Sphinx
- Proporcionar ayuda interactiva con `help()`
- Permitir que IDEs muestren información sobre funciones y clases

### Formato Sphinx (reStructuredText)

El formato Sphinx es el estándar de facto en Python para documentación profesional.

In [None]:
# BAD: Docstring sin estructura ni información de tipos

def calculate_discount(price, discount_percent):
    """Calculates discount."""
    return price * (1 - discount_percent / 100)

In [None]:
# GOOD: Docstring completo en formato Sphinx

def calculate_discount(price: float, discount_percent: float) -> float:
    """
    Calculate the final price after applying a percentage discount.
    
    This function applies a discount to a given price and returns
    the discounted amount. The discount is specified as a percentage
    (e.g., 20 for 20% off).
    
    :param price: The original price before discount
    :type price: float
    :param discount_percent: The discount percentage (0-100)
    :type discount_percent: float
    :return: The final price after applying the discount
    :rtype: float
    :raises ValueError: If discount_percent is not in range [0, 100]
    
    Example:
        >>> calculate_discount(100.0, 20.0)
        80.0
        >>> calculate_discount(50.0, 10.0)
        45.0
    """
    if not 0 <= discount_percent <= 100:
        raise ValueError("Discount percent must be between 0 and 100")
    
    return price * (1 - discount_percent / 100)

### Aprendizaje Clave

**Un docstring completo incluye: descripción breve, descripción detallada, parámetros con tipos, valor de retorno, excepciones y ejemplos.** Esto permite que herramientas automáticas generen documentación profesional.

**Referencia oficial:** [PEP 257 - Docstring Conventions](https://peps.python.org/pep-0257/)

## 4. Docstrings para Clases

Las clases requieren docstrings tanto a nivel de clase como en sus métodos.

In [None]:
# BAD: Clase sin documentación adecuada

class DataProcessor:
    def __init__(self, config):
        self.config = config
    
    def process(self, data):
        pass

In [None]:
# GOOD: Clase con documentación completa

class DataProcessor:
    """
    Process and transform data for machine learning pipelines.
    
    This class handles data preprocessing including normalization,
    feature extraction, and validation. It maintains state about
    the processing configuration and can be reused for multiple
    datasets with the same configuration.
    
    :param config: Configuration dictionary with processing parameters
    :type config: dict
    :ivar config: Stored configuration
    :vartype config: dict
    :ivar processed_count: Number of datasets processed
    :vartype processed_count: int
    
    Example:
        >>> config = {'normalize': True, 'scale': 'standard'}
        >>> processor = DataProcessor(config)
        >>> result = processor.process(data)
    """
    
    def __init__(self, config: dict) -> None:
        """
        Initialize the DataProcessor with configuration.
        
        :param config: Configuration parameters for processing
        :type config: dict
        :raises ValueError: If config is missing required keys
        """
        if 'normalize' not in config:
            raise ValueError("Config must include 'normalize' key")
        
        self.config = config
        self.processed_count = 0
    
    def process(self, data: list) -> list:
        """
        Process the input data according to configuration.
        
        :param data: Raw data to process
        :type data: list
        :return: Processed data
        :rtype: list
        :raises TypeError: If data is not a list
        """
        if not isinstance(data, list):
            raise TypeError("Data must be a list")
        
        self.processed_count += 1
        # Processing logic here
        return data

### Pregunta de Comprensión

¿Por qué es importante documentar tanto los atributos de instancia (`:ivar`) como los parámetros del constructor?

## 5. Docstrings para Módulos

Los módulos también deben tener docstrings que expliquen su propósito y contenido.

In [None]:
# BAD: Module without docstring
# (At the top of a .py file)

import numpy as np

def process_data(data):
    pass

In [None]:
# GOOD: Module with comprehensive docstring
# (At the top of a .py file)

"""
Data processing utilities for machine learning pipelines.

This module provides functions and classes for preprocessing data
before feeding it into ML models. It includes normalization,
feature extraction, and validation utilities.

Main components:
    - DataProcessor: Main class for data processing
    - normalize_data: Function for data normalization
    - validate_schema: Function for data validation

Example:
    >>> from data_processing import DataProcessor
    >>> processor = DataProcessor({'normalize': True})
    >>> result = processor.process(raw_data)

:author: Your Name
:date: 2025-02-03
:version: 1.0.0
"""

import numpy as np

def process_data(data):
    pass

### Aprendizaje Clave

**El docstring del módulo es lo primero que ven los usuarios al importar tu código.** Debe proporcionar una visión general clara del propósito del módulo y sus componentes principales.

**Referencia oficial:** [PEP 257 - Module Docstrings](https://peps.python.org/pep-0257/#multi-line-docstrings)

## 6. Comentarios TODO y FIXME

Los comentarios especiales como TODO y FIXME son útiles para marcar trabajo pendiente.

In [None]:
# GOOD: Using TODO and FIXME effectively

def process_payment(amount: float, currency: str) -> bool:
    """
    Process a payment transaction.
    
    :param amount: Payment amount
    :type amount: float
    :param currency: Currency code (e.g., 'USD', 'EUR')
    :type currency: str
    :return: True if payment successful
    :rtype: bool
    """
    # TODO: Add support for cryptocurrency payments (ticket #456)
    # TODO: Implement retry logic for failed transactions
    
    # FIXME: This doesn't handle negative amounts correctly (bug #789)
    if amount <= 0:
        return False
    
    # HACK: Temporary workaround for API rate limiting
    # Remove this once we upgrade to premium tier
    import time
    time.sleep(0.5)
    
    # Process payment logic
    return True

### Convenciones Comunes

- **TODO**: Funcionalidad que debe añadirse en el futuro
- **FIXME**: Código que funciona pero necesita corrección
- **HACK**: Solución temporal que debe reemplazarse
- **NOTE**: Información importante para futuros desarrolladores
- **XXX**: Advertencia sobre código problemático que necesita atención

## 7. Mejores Prácticas de Documentación

### 1. Mantén los Comentarios Actualizados

Un comentario desactualizado es peor que ningún comentario.

In [None]:
# BAD: Outdated comment that misleads

# Calculate average of 3 numbers
def calculate_statistics(numbers: list[float]) -> dict:
    """Calculate various statistics."""
    return {
        'mean': sum(numbers) / len(numbers),
        'median': sorted(numbers)[len(numbers) // 2],
        'std_dev': calculate_std_dev(numbers)
    }

In [None]:
# GOOD: Accurate and up-to-date documentation

def calculate_statistics(numbers: list[float]) -> dict:
    """
    Calculate statistical measures for a list of numbers.
    
    :param numbers: List of numeric values
    :type numbers: list[float]
    :return: Dictionary with mean, median, and standard deviation
    :rtype: dict
    :raises ValueError: If numbers list is empty
    """
    if not numbers:
        raise ValueError("Cannot calculate statistics for empty list")
    
    return {
        'mean': sum(numbers) / len(numbers),
        'median': sorted(numbers)[len(numbers) // 2],
        'std_dev': calculate_std_dev(numbers)
    }

### 2. Evita Comentarios Obvios

Si el código es claro, no necesita comentarios.

In [None]:
# BAD: Obvious comments that add no value

# Get the user
user = get_user(user_id)

# Check if user exists
if user is not None:
    # Get user name
    name = user.name
    # Print the name
    print(name)

In [None]:
# GOOD: No comments needed, code is self-explanatory

user = get_user(user_id)

if user is not None:
    print(user.name)

### 3. Documenta Decisiones No Obvias

Explica por qué elegiste un enfoque particular, especialmente si no es la solución más obvia.

In [None]:
# GOOD: Explaining non-obvious design decisions

def process_large_file(filepath: str) -> None:
    """
    Process a large file line by line.
    
    :param filepath: Path to the file to process
    :type filepath: str
    """
    # Use generator to avoid loading entire file into memory
    # Files can be 10GB+, which would cause OOM errors
    with open(filepath, 'r') as f:
        for line in f:
            process_line(line)
    
    # Don't use multiprocessing here despite the performance benefit
    # The file handle can't be pickled for inter-process communication
    # See: https://bugs.python.org/issue12345

### Aprendizaje Clave

**El mejor comentario es el que no necesitas escribir porque el código es claro.** Refactoriza primero, comenta solo cuando sea necesario.

**Referencia oficial:** [PEP 8 - Comments](https://peps.python.org/pep-0008/#comments)

## 8. Ejercicios Prácticos

Ahora es tu turno de practicar. Abre el archivo `exercises/05_comments_documentation.py` y completa los ejercicios.

### Tarea 1: Añadir Docstrings Completos

Completa los docstrings en formato Sphinx para las funciones proporcionadas.

### Tarea 2: Mejorar Comentarios

Identifica y mejora los comentarios problemáticos en el código.

### Tarea 3: Documentar una Clase

Añade documentación completa a una clase incluyendo docstrings de clase y métodos.

Ejecuta las pruebas con:
```bash
pytest exercises/tests/test_05_comments_documentation.py -v
```

## Resumen

En este notebook has aprendido:

1. **Cuándo comentar**: Comenta el *por qué*, no el *qué*. El código debe ser autoexplicativo.

2. **Formato Sphinx**: El estándar profesional para docstrings en Python, incluyendo `:param`, `:type`, `:return`, `:rtype`, y `:raises`.

3. **PEP 257**: Las convenciones oficiales para escribir docstrings en módulos, clases y funciones.

4. **Mejores prácticas**: Mantén los comentarios actualizados, evita comentarios obvios, y documenta decisiones no obvias.

5. **Comentarios especiales**: Usa TODO, FIXME, HACK, y NOTE para marcar trabajo pendiente y advertencias.

La documentación efectiva es una inversión en el futuro de tu código. Un código bien documentado es más fácil de mantener, extender y depurar, tanto para ti como para otros desarrolladores.

## Preguntas de Autoevaluación

### 1. ¿Cuál es la diferencia principal entre un comentario y un docstring?

**Respuesta:** Los comentarios son para desarrolladores que leen el código fuente y explican el *por qué* de las decisiones. Los docstrings son parte de la API del código, pueden accederse programáticamente con `__doc__`, y documentan el *qué* hace el código (su interfaz y comportamiento). Los docstrings se usan para generar documentación automática.

### 2. ¿Qué elementos debe incluir un docstring completo en formato Sphinx?

**Respuesta:** Un docstring completo debe incluir:
- Descripción breve (una línea)
- Descripción detallada (opcional, para lógica compleja)
- `:param` y `:type` para cada parámetro
- `:return` y `:rtype` para el valor de retorno
- `:raises` para excepciones que puede lanzar
- Ejemplos de uso (opcional pero recomendado)

### 3. ¿Cuándo es apropiado usar comentarios inline?

**Respuesta:** Los comentarios inline deben usarse con moderación, solo cuando:
- Explican comportamiento no obvio que no puede hacerse más claro con refactorización
- Documentan workarounds temporales o decisiones específicas
- Proporcionan contexto que no es evidente del código mismo
Deben separarse del código por al menos dos espacios y nunca deben repetir lo que el código ya dice claramente.

### 4. ¿Por qué es importante mantener los comentarios actualizados?

**Respuesta:** Un comentario desactualizado es peor que ningún comentario porque:
- Puede llevar a malentendidos sobre cómo funciona el código
- Causa confusión y pérdida de tiempo al depurar
- Reduce la confianza en toda la documentación del proyecto
- Puede llevar a bugs si los desarrolladores confían en información incorrecta
Los comentarios deben actualizarse siempre que cambie el código que describen.

### 5. ¿Qué significa "comentar el por qué, no el qué"?

**Respuesta:** Significa que los comentarios deben explicar el razonamiento detrás de las decisiones de código (por qué se eligió un enfoque particular, por qué existe una limitación, por qué se usa un valor específico), no simplemente describir lo que hace el código. El código mismo debe ser suficientemente claro para mostrar *qué* hace; los comentarios añaden el contexto del *por qué* que no puede expresarse en código.

### 6. ¿Cuál es el propósito de los comentarios TODO y FIXME?

**Respuesta:** 
- **TODO**: Marca funcionalidad que debe añadirse en el futuro, características planificadas o mejoras pendientes
- **FIXME**: Indica código que funciona pero tiene problemas conocidos que necesitan corrección
Ambos ayudan a rastrear trabajo pendiente directamente en el código y pueden ser detectados por herramientas de análisis. Es buena práctica incluir referencias a tickets o issues para contexto adicional.

### 7. ¿Por qué es importante documentar los atributos de instancia con `:ivar` en las clases?

**Respuesta:** Documentar los atributos de instancia con `:ivar` es importante porque:
- Permite que herramientas de documentación automática (como Sphinx) generen documentación completa de la clase
- Ayuda a los IDEs a proporcionar autocompletado y sugerencias
- Documenta el estado interno de la clase para futuros desarrolladores
- Especifica los tipos esperados de los atributos, mejorando la comprensión y el type checking
Es especialmente importante para atributos que no se pasan como parámetros del constructor.

## Recursos y Referencias Oficiales

### Documentación Oficial

- **[PEP 8 - Style Guide for Python Code](https://peps.python.org/pep-0008/)**: La guía oficial de estilo de Python, incluyendo convenciones para comentarios
  - Sección específica sobre comentarios y cuándo usarlos
  - Convenciones para comentarios inline y de bloque

- **[PEP 257 - Docstring Conventions](https://peps.python.org/pep-0257/)**: El estándar oficial para escribir docstrings en Python
  - Convenciones para docstrings de una línea y multilínea
  - Guías para documentar módulos, clases, funciones y métodos

### Herramientas de Documentación

- **[Sphinx Documentation](https://www.sphinx-doc.org/)**: La herramienta estándar para generar documentación de proyectos Python
  - Soporte para formato reStructuredText
  - Generación automática de documentación desde docstrings

- **[Sphinx reStructuredText Primer](https://www.sphinx-doc.org/en/master/usage/restructuredtext/basics.html)**: Guía de sintaxis para docstrings en formato Sphinx
  - Sintaxis de campos (`:param`, `:type`, `:return`, etc.)
  - Ejemplos de documentación completa

### Mejores Prácticas

- **[Google Python Style Guide - Comments](https://google.github.io/styleguide/pyguide.html#38-comments-and-docstrings)**: Guía de estilo de Google para comentarios y docstrings
  - Cuándo comentar y cuándo no
  - Ejemplos de buenas y malas prácticas

- **[Real Python - Documenting Python Code](https://realpython.com/documenting-python-code/)**: Tutorial completo sobre documentación en Python
  - Comparación de diferentes formatos de docstrings
  - Herramientas para validar y generar documentación

### Herramientas de Validación

- **[pydocstyle](https://www.pydocstyle.org/)**: Herramienta para verificar que los docstrings cumplan con PEP 257
  - Detecta docstrings faltantes o mal formateados
  - Integrable en pipelines de CI/CD

- **[interrogate](https://interrogate.readthedocs.io/)**: Verifica la cobertura de docstrings en tu código
  - Reporta qué porcentaje del código está documentado
  - Configurable para diferentes niveles de strictness

### Notas Importantes

- Todos los enlaces están actualizados a partir de febrero de 2025
- Se recomienda revisar PEP 8 y PEP 257 regularmente ya que son los estándares oficiales
- Sphinx es el estándar de facto para documentación profesional en Python
- Las herramientas de validación pueden integrarse en tu flujo de trabajo para mantener la calidad de la documentación