
# Programación Modular: Funciones, Módulos y Paquetes

**Curso:** Fundamentos de Programación y Analítica de Datos con Python  
**Duración estimada del bloque:** 2 horas

## Objetivos específicos
- Diseñar y utilizar funciones puras con parámetros y retorno, aplicando tipado opcional y documentación mínima.
- Diferenciar el alcance de variables (LEGB) y aplicar correctamente `global` y `nonlocal` cuando corresponda.
- Crear y reutilizar módulos con `import`, alias, `from ... import ...` y el patrón `if __name__ == "__main__":`.
- Estructurar paquetes con `__init__.py`, importaciones absolutas/relativas y organización básica por responsabilidades.

## Prerrequisitos
- Fundamentos de Python: tipos básicos, operaciones aritméticas y control de flujo.
- Conocimientos mínimos de entorno: uso de editor (VSCode), ejecución de scripts y notebooks.



## Tema 1: Funciones

### Definición
Una función es una unidad modular de código que encapsula una operación específica y puede recibir **parámetros** y retornar **resultados**. En Python se declara típicamente con `def` y puede incluir **anotaciones de tipo** y **docstrings**.

### Importancia en programación y analítica de datos
- Favorecen la **reutilización** y la **composición** de soluciones.
- Permiten separar **cálculo** de **E/S**, facilitando pruebas unitarias y mantenimiento.
- En analítica, ayudan a crear **pipelines** de transformación y validación de datos.
- Disminuyen la duplicación y mejoran la **legibilidad** y la **trazabilidad**.

### Buenas prácticas profesionales y errores comunes
- Preferir **funciones puras** (sin efectos secundarios) para facilitar pruebas y razonamiento.
- Escribir **docstrings** concisos que describan propósito, parámetros y retorno.
- Evitar **parámetros con valores mutables** por defecto (usar `None` y asignar dentro).
- Usar **anotaciones de tipo** y nombres descriptivos.
- Error común: mezclar **lógica** con **E/S** dentro de la misma función.


In [None]:

# TODO: Ejemplo: funciones con parámetros, retorno, tipos y docstring


In [None]:

# TODO: Parámetros por defecto y el problema de los mutables



## Tema 2: Ámbito de variables y modelo LEGB

### Definición
El **ámbito** determina dónde una variable es visible y modificable. Python resuelve nombres siguiendo el modelo **LEGB**: Local, Enclosing, Global, Built-in.

### Importancia en programación y analítica de datos
- Controlar efectos secundarios y **estado** evita errores difíciles de rastrear.
- Comprender **closures** y **`nonlocal`** habilita patrones funcionales y decoradores simples.
- Manejar **`global`** con cautela; preferir parámetros/retornos o inyección de dependencias.

### Buenas prácticas y errores comunes
- Evitar modificar variables globales desde funciones; preferir retornos.
- Usar **`nonlocal`** solo cuando se justifique en closures.
- Error común: suponer que la asignación dentro de una función modifica el nombre externo.


In [None]:

# TODO: Demostración LEGB, global y nonlocal



## Tema 3: Módulos

### Definición
Un **módulo** es un archivo `.py` que agrupa funciones, clases y constantes relacionadas. Se importa con `import` o `from ... import ...`.

### Importancia en programación y analítica de datos
- Permite organizar el código por **responsabilidades** (p. ej., `io.py`, `limpieza.py`).
- Facilita **pruebas unitarias**, reutilización y colaboración entre equipos.
- Mejora la **descubrilidad** y el **versionamiento** de componentes.

### Buenas prácticas y errores comunes
- Nombrar módulos con minúsculas y guiones bajos (`snake_case`).
- Evitar importaciones circulares; extraer dependencias comunes.
- Usar `if __name__ == "__main__":` para ejecutar pruebas locales o CLIs.


In [None]:


# TODO: Simulación de módulo dentro del notebook usando types.ModuleType (solo a modo demostrativo)



## Tema 4: Paquetes

### Definición
Un **paquete** es un directorio que contiene múltiples módulos relacionados. Tradicionalmente incluye un archivo `__init__.py` que puede exponer una API pública.

### Importancia en programación y analítica de datos
- Escala la organización modular a **dominios** o **subdominios** (p. ej., `mi_app/ingesta`, `mi_app/transform`).
- Facilita la **separación de capas** y el diseño de **pipelines**.
- Habilita importaciones absolutas y relativas para dependencias internas.

### Buenas prácticas y errores comunes
- Definir una **API pública** mínima en `__init__.py`.
- Usar **importaciones absolutas** para claridad en proyectos medianos/grandes.
- Evitar barajar responsabilidades; mantener alta **cohesión** y bajo **acoplamiento**.


In [None]:

# TODO: Simulación pedagógica de un paquete en memoria
# Nota: En proyectos reales se crean carpetas y archivos .py.



# Ejercicios integradores

A continuación se presentan ejercicios que integran funciones, ámbito, módulos y paquetes. Cada ejercicio incluye contexto técnico, datos/entradas, requerimientos, criterios de aceptación y pistas. Se proporciona una celda de solución después de cada enunciado.



## Ejercicio 1: Normalizador de calificaciones

**Contexto técnico:** Eres responsable de un pequeño módulo de utilidades académicas. Necesitas una función que normalice calificaciones de 0–100 a 0–5 para reportes consolidados. Se usará dentro de un pipeline de análisis.

**Datos/entradas:** Lista de enteros o flotantes en el rango 0–100, por ejemplo: `[55, 70, 92, 100, 0]`.

**Requerimientos:**
- Implementar una función pura `normalizar(calificacion: float) -> float` que proyecte 0–100 a 0–5 con dos decimales.
- Implementar `normalizar_lista(valores: Iterable[float]) -> list[float]` usando composición.
- Manejar entradas fuera de rango con `ValueError`.

**Criterios de aceptación:**
- `normalizar(100) == 5.0`, `normalizar(0) == 0.0`.
- Para `[55, 70, 92]` retornar `[2.75, 3.5, 4.6]`.
- Lanza `ValueError` si algún valor < 0 o > 100.

**Pistas:** Usa una función auxiliar de validación. Evita redondeos prematuros salvo en el resultado final.


In [None]:

# TODO: Ejercicio 1



## Ejercicio 2: Módulo de estadísticas descriptivas

**Contexto técnico:** En un análisis exploratorio, necesitas centralizar cálculos de tendencia central en un **módulo** para reutilizarlo entre notebooks y scripts.

**Datos/entradas:** Secuencias numéricas como `[2, 4, 4, 4, 5, 5, 7, 9]`.

**Requerimientos:**
- Crear un módulo llamado `estadisticas` con funciones `media`, `mediana` y `moda`.
- Manejar secuencias vacías con `ValueError`.
- Proveer un punto de ejecución local con `if __name__ == "__main__":` para pruebas.

**Criterios de aceptación:**
- `media([2,2]) == 2.0`, `mediana([1,3,2]) == 2`, `moda([1,1,2]) == 1`.
- Importar el módulo y utilizar sus funciones desde el notebook.

**Pistas:** Puedes simular el módulo con `types.ModuleType` en este entorno. Implementa `moda` contando frecuencias.


In [None]:

# TODO: Ejercicio 2



## Ejercicio 3: Paquete de utilidades para limpieza de texto

**Contexto técnico:** Estás construyendo un **paquete** interno `textutils` para preprocesamiento de texto en un pipeline de analítica (normalización y tokens). Debe ser reutilizable y con API clara.

**Datos/entradas:** Cadenas como `"  Hola,   Mundo!!  "` y `"analítica de Datos en PYTHON"`.

**Requerimientos:**
- Crear un paquete `textutils` con módulos `normalize` y `tokenize`.
- `normalize.clean(s: str) -> str`: recorta espacios, baja a minúsculas y elimina signos de puntuación simples `, . ! ? ; :`.
- `tokenize.words(s: str) -> list[str]`: divide por espacios y filtra tokens vacíos.
- Exponer en `textutils/__init__.py` una API mínima con `clean` y `words`.

**Criterios de aceptación:**
- `clean("  Hola,   Mundo!!  ") == "hola mundo"`
- `words("hola   mundo  python") == ["hola", "mundo", "python"]`
- Importación: `from textutils import clean, words` funciona.

**Pistas:** Simula el paquete en memoria con `types.ModuleType` y registra en `sys.modules`.


In [None]:

# TODO: Ejercicio 3
