
# Programación Modular: Funciones, Módulos y Paquetes

**Curso:** Fundamentos de Programación y Analítica de Datos con Python  
**Duración estimada del bloque:** 2 horas

## Objetivos específicos
- Diseñar y utilizar funciones puras con parámetros y retorno, aplicando tipado opcional y documentación mínima.
- Diferenciar el alcance de variables (LEGB) y aplicar correctamente `global` y `nonlocal` cuando corresponda.
- Crear y reutilizar módulos con `import`, alias, `from ... import ...` y el patrón `if __name__ == "__main__":`.
- Estructurar paquetes con `__init__.py`, importaciones absolutas/relativas y organización básica por responsabilidades.

## Prerrequisitos
- Fundamentos de Python: tipos básicos, operaciones aritméticas y control de flujo.
- Conocimientos mínimos de entorno: uso de editor (VSCode), ejecución de scripts y notebooks.



## Tema 1: Funciones

### Definición
Una función es una unidad modular de código que encapsula una operación específica y puede recibir **parámetros** y retornar **resultados**. En Python se declara típicamente con `def` y puede incluir **anotaciones de tipo** y **docstrings**.

### Importancia en programación y analítica de datos
- Favorecen la **reutilización** y la **composición** de soluciones.
- Permiten separar **cálculo** de **E/S**, facilitando pruebas unitarias y mantenimiento.
- En analítica, ayudan a crear **pipelines** de transformación y validación de datos.
- Disminuyen la duplicación y mejoran la **legibilidad** y la **trazabilidad**.

### Buenas prácticas profesionales y errores comunes
- Preferir **funciones puras** (sin efectos secundarios) para facilitar pruebas y razonamiento.
- Escribir **docstrings** concisos que describan propósito, parámetros y retorno.
- Evitar **parámetros con valores mutables** por defecto (usar `None` y asignar dentro).
- Usar **anotaciones de tipo** y nombres descriptivos.
- Error común: mezclar **lógica** con **E/S** dentro de la misma función.


In [8]:

# TODO: Ejemplo: funciones con parámetros, retorno, tipos y docstring
from __future__ import annotations
from typing import Optional, Iterable, Callable

def media(numeros: Iterable[float]) -> float:
  """Calcula la media aritmética de una lista de números.

  :param numeros: Una lista o iterable de números (int o float).
  :return: La media aritmética de los números.
  :raises ValueError: Si la lista está vacía.
  """
  lista = list(numeros)
  if not lista:
    raise ValueError("La lista no puede estar vacía.")

  print(f"La suma de las posiciones es {sum(lista)}")
  print(f"La cantidad de elementos es {len(lista)}")
  return sum(lista)/len(lista)

def aplicar(f: Callable[[float], float], valores: Iterable[float]) -> list[float]:
  """Aplica una función a cada elemento de un iterable y devuelve una lista con los resultados."""
  return [f(v) for v in valores]

# Uso de la función: media
datos = [1, 2, 3, 4, 5]
resultado = media(datos)
print(f"La media de {datos} es {resultado}")

resultado = aplicar(lambda x: x*1.1, datos)
print(f"Aplicando un aumento del 10% a {datos} obtenemos {resultado}")


La suma de las posiciones es 15
La cantidad de elementos es 5
La media de [1, 2, 3, 4, 5] es 3.0
Aplicando un aumento del 10% a [1, 2, 3, 4, 5] obtenemos [1.1, 2.2, 3.3000000000000003, 4.4, 5.5]


In [14]:

# TODO: Parámetros por defecto y el problema de los mutables
from typing import List

def agregar_item(item: str, acumulador: Optional[List[str]] = None) -> List[str]:
  """Acumula elementos en una lista nueva por invocación"""
  if acumulador is None:
    acumulador = []
  acumulador.append(item)
  return acumulador

print(agregar_item("manzana"))
print(agregar_item("banano"))

['manzana']
['banano']



## Tema 2: Ámbito de variables y modelo LEGB

### Definición
El **ámbito** determina dónde una variable es visible y modificable. Python resuelve nombres siguiendo el modelo **LEGB**: Local, Enclosing, Global, Built-in.

### Importancia en programación y analítica de datos
- Controlar efectos secundarios y **estado** evita errores difíciles de rastrear.
- Comprender **closures** y **`nonlocal`** habilita patrones funcionales y decoradores simples.
- Manejar **`global`** con cautela; preferir parámetros/retornos o inyección de dependencias.

### Buenas prácticas y errores comunes
- Evitar modificar variables globales desde funciones; preferir retornos.
- Usar **`nonlocal`** solo cuando se justifique en closures.
- Error común: suponer que la asignación dentro de una función modifica el nombre externo.


In [None]:

# TODO: Demostración LEGB, global y nonlocal
x = 10 # Variable global

def ejemplo_scope():
  x = 20 # Local
  def inner():
    nonlocal x
    x += 5 # Modifica la variable local de la función contenedora
    return x
  nueva_x = inner()
  return x, nueva_x

print("Global x:", x)
print("Inner x:", ejemplo_scope())
print("Global x después:", x)

# Uso de 'Global' - Utilizar sólo en casos excepcionales
contador = 0 # Variable global

def incrementar():
  global contador
  contador += 1
  return contador

print("Contador:", contador, incrementar(), incrementar())

Global x: 10
Inner x: (25, 25)
Global x después: 10
Contador: 0 1 2



## Tema 3: Módulos

### Definición
Un **módulo** es un archivo `.py` que agrupa funciones, clases y constantes relacionadas. Se importa con `import` o `from ... import ...`.

### Importancia en programación y analítica de datos
- Permite organizar el código por **responsabilidades** (p. ej., `io.py`, `limpieza.py`).
- Facilita **pruebas unitarias**, reutilización y colaboración entre equipos.
- Mejora la **descubrilidad** y el **versionamiento** de componentes.

### Buenas prácticas y errores comunes
- Nombrar módulos con minúsculas y guiones bajos (`snake_case`).
- Evitar importaciones circulares; extraer dependencias comunes.
- Usar `if __name__ == "__main__":` para ejecutar pruebas locales o CLIs.


In [26]:

# TODO: Simulación de módulo dentro del notebook usando types.ModuleType (solo a modo demostrativo)
import types, sys

codigo_modulo = '''
"""operaciones.py: Utilidades aritméticas básicas."""
from __future__ import annotations

PI = 3.14159

def area_circulo(radio: float) -> float:
  """Calcula el área de un círculo dado su radio."""
  return PI * radio**2

def es_par(n: int) -> bool:
  """Determina si un número es par."""
  return n % 2 == 0

if __name__ == "__main__":
  # Pruebas locales
  print("Area del Circulo de radio 5: ", area_circulo(5))
  print("Es 4 par?: ", es_par(4))
'''

modulo_operaciones = types.ModuleType("operaciones")
exec(codigo_modulo, modulo_operaciones.__dict__)
sys.modules["operaciones"] = modulo_operaciones
# Registrar para permitir import operaciones

import operaciones
print("PI:", operaciones.PI)
print("Área círculo radio 3:", operaciones.area_circulo(3))



PI: 3.14159
Área círculo radio 3: 28.27431



## Tema 4: Paquetes

### Definición
Un **paquete** es un directorio que contiene múltiples módulos relacionados. Tradicionalmente incluye un archivo `__init__.py` que puede exponer una API pública.

### Importancia en programación y analítica de datos
- Escala la organización modular a **dominios** o **subdominios** (p. ej., `mi_app/ingesta`, `mi_app/transform`).
- Facilita la **separación de capas** y el diseño de **pipelines**.
- Habilita importaciones absolutas y relativas para dependencias internas.

### Buenas prácticas y errores comunes
- Definir una **API pública** mínima en `__init__.py`.
- Usar **importaciones absolutas** para claridad en proyectos medianos/grandes.
- Evitar barajar responsabilidades; mantener alta **cohesión** y bajo **acoplamiento**.


In [None]:

# TODO: Simulación de un paquete en memoria
# Nota: En proyectos reales se crean carpetas y archivos .py.

import types, sys

# Creación de Sub-Modules
mod_math = types.ModuleType("mi_paquete.math")
mod_math.__dict__.update({
  "sumar": lambda a, b: a + b,
  "restar": lambda a, b: a - b,
  "cuadrado": lambda x: x**2
})

mod_string = types.ModuleType("mi_paquete.string")
def saludar(nombre: str) -> str:
  return f"Hola, {nombre}!"
mod_string.__dict__.update({
  "saludar": saludar
})

# Cración de Pseudo-Paquete
pkg = types.ModuleType("mi_paquete")
pkg.__path__ = []  # Marca como paquete - import machinery
pkg.__all__ = ["math", "string"] # type: ignore

# Registrar los sys.modules
sys.modules["mi_paquete"] = pkg
sys.modules["mi_paquete.math"] = mod_math
sys.modules["mi_paquete.string"] = mod_string

# Uso con importaciones
from mi_paquete import math, string
print("Suma 5 + 3:", math.sumar(5, 3))
print("Saludo:", string.saludar("Juan"))


Suma 5 + 3: 8
Saludo: Hola, Juan!



# Ejercicios integradores

A continuación se presentan ejercicios que integran funciones, ámbito, módulos y paquetes. Cada ejercicio incluye contexto técnico, datos/entradas, requerimientos, criterios de aceptación y pistas. Se proporciona una celda de solución después de cada enunciado.



## Ejercicio 1: Normalizador de calificaciones

**Contexto técnico:** Eres responsable de un pequeño módulo de utilidades académicas. Necesitas una función que normalice calificaciones de 0–100 a 0–5 para reportes consolidados. Se usará dentro de un pipeline de análisis.

**Datos/entradas:** Lista de enteros o flotantes en el rango 0–100, por ejemplo: `[55, 70, 92, 100, 0]`.

**Requerimientos:**
- Implementar una función pura `normalizar(calificacion: float) -> float` que proyecte 0–100 a 0–5 con dos decimales.
- Implementar `normalizar_lista(valores: Iterable[float]) -> list[float]` usando composición.
- Manejar entradas fuera de rango con `ValueError`.

**Criterios de aceptación:**
- `normalizar(100) == 5.0`, `normalizar(0) == 0.0`.
- Para `[55, 70, 92]` retornar `[2.75, 3.5, 4.6]`.
- Lanza `ValueError` si algún valor < 0 o > 100.

**Pistas:** Usa una función auxiliar de validación. Evita redondeos prematuros salvo en el resultado final.


In [39]:

# TODO: Ejercicio 1
from typing import Iterable

def _validar_rango(calificacion: float) -> None:
  if not (0 <= calificacion <= 100):
    raise ValueError(f"La calificacion es {calificacion} y debe estar entre 0 y 100.")

def normalizar(calificacion: float) -> float:
  """Normaliza una calificación de 0-100 a 0-5."""
  _validar_rango(calificacion)
  return (calificacion / 100.0)*5.0

def redondear(calificacion: float) -> float:
  """Redondea una calificación a la décima más cercana."""
  return round(calificacion, 2)

def normalizar_lista(calificaciones: Iterable[float]) -> list[float]:
  """Normaliza y redondea una lista de calificaciones."""
  return [redondear(normalizar(calificacion)) for calificacion in calificaciones]

# Pruebas
print("Normalización y redondeo de 100:", redondear(normalizar(100)))
print("Normalización y redondeo de 0:", redondear(normalizar(0)))
print("Normalización y redondeo de 80:", redondear(normalizar(80)))

try:
  normalizar(200)
except ValueError as e:
  print("Error esperado:", e)


Normalización y redondeo de 100: 5.0
Normalización y redondeo de 0: 0.0
Normalización y redondeo de 80: 4.0
Error esperado: La calificacion es 200 y debe estar entre 0 y 100.


## Ejercicio 1.2
Escribir una función que calcule el total de una factura tras aplicarle el IVA. La función debe recibir la cantidad sin IVA y el porcentaje de IVA a aplicar, y devolver el total de la factura. Si se invoca la función sin pasarle el porcentaje de IVA, deberá aplicar un 21%.

In [43]:

# TODO: Ejercicio 1.2

def _validar_iva(iva: float) -> None:
  if iva < 0:
    raise ValueError(f"El IVA no puede ser negativo, el valor introducido fue: {iva}")

def calculo_precio_final(precio: float, iva:float = 21) -> float:
  """Calcula el precio final tras aplicar el IVA."""
  _validar_iva(iva)
  return precio*(1 + iva/100)

try:
  print(calculo_precio_final(100, -5))   # Error esperado
  print(calculo_precio_final(100))       # Con IVA por defecto (21%)
  print(calculo_precio_final(100, 10))   # Con IVA del 10%
except ValueError as e:
  print("Error esperado:", e)

Error esperado: El IVA no puede ser negativo, el valor introducido fue: -5



## Ejercicio 2: Módulo de estadísticas descriptivas

**Contexto técnico:** En un análisis exploratorio, necesitas centralizar cálculos de tendencia central en un **módulo** para reutilizarlo entre notebooks y scripts.

**Datos/entradas:** Secuencias numéricas como `[2, 4, 4, 4, 5, 5, 7, 9]`.

**Requerimientos:**
- Crear un módulo llamado `estadisticas` con funciones `media`, `mediana` y `moda`.
- Manejar secuencias vacías con `ValueError`.
- Proveer un punto de ejecución local con `if __name__ == "__main__":` para pruebas.

**Criterios de aceptación:**
- `media([2,2]) == 2.0`, `mediana([1,3,2]) == 2`, `moda([1,1,2]) == 1`.
- Importar el módulo y utilizar sus funciones desde el notebook.

**Pistas:** Puedes simular el módulo con `types.ModuleType` en este entorno. Implementa `moda` contando frecuencias.


In [None]:

# TODO: Ejercicio 2



## Ejercicio 3: Paquete de utilidades para limpieza de texto

**Contexto técnico:** Estás construyendo un **paquete** interno `textutils` para preprocesamiento de texto en un pipeline de analítica (normalización y tokens). Debe ser reutilizable y con API clara.

**Datos/entradas:** Cadenas como `"  Hola,   Mundo!!  "` y `"analítica de Datos en PYTHON"`.

**Requerimientos:**
- Crear un paquete `textutils` con módulos `normalize` y `tokenize`.
- `normalize.clean(s: str) -> str`: recorta espacios, baja a minúsculas y elimina signos de puntuación simples `, . ! ? ; :`.
- `tokenize.words(s: str) -> list[str]`: divide por espacios y filtra tokens vacíos.
- Exponer en `textutils/__init__.py` una API mínima con `clean` y `words`.

**Criterios de aceptación:**
- `clean("  Hola,   Mundo!!  ") == "hola mundo"`
- `words("hola   mundo  python") == ["hola", "mundo", "python"]`
- Importación: `from textutils import clean, words` funciona.

**Pistas:** Simula el paquete en memoria con `types.ModuleType` y registra en `sys.modules`.


In [None]:

# TODO: Ejercicio 3
