# Revisión de estructuras esenciales y programación modular

Este notebook educativo está orientado a estudiantes de introducción a la programación con aplicación en ciencia de datos. Alternaremos teoría y práctica con ejemplos del mundo real (ventas, calificaciones, reseñas, temperaturas) y ejercicios guiados con soluciones comentadas.

Al finalizar, podrás:
- Usar condicionales para tomar decisiones en tu código.
- Trabajar con bucles `for` y `while` de forma segura.
- Manipular listas y diccionarios, estructuras clave en ciencia de datos.
- Definir funciones reutilizables y documentadas.
- Organizar tu código en módulos para proyectos más grandes.

Mini desafío inicial: ejecuta la siguiente celda para comprobar tu entorno de Python.


In [1]:
# Comprobación rápida del entorno
import sys
print(f"Versión de Python: {sys.version.split()[0]}")
print("Todo listo para empezar 🚀")

Versión de Python: 3.12.7
Todo listo para empezar 🚀


## 1. Introducción

En este notebook aprenderás los bloques fundamentales de la programación aplicados a ciencia de datos:
- Condicionales (`if`, `elif`, `else`) para tomar decisiones.
- Bucles (`for`, `while`) para repetir acciones y recorrer colecciones.
- Listas y diccionarios para almacenar y estructurar datos.
- Funciones para reutilizar y documentar código.
- Programación modular para organizar proyectos en varios archivos reutilizables.

¿Por qué estos temas son la base de cualquier análisis de datos?
- Todo pipeline de datos toma decisiones (filtrar, imputar, validar) y repite tareas (limpiar, transformar, resumir).
- Los datos se modelan naturalmente con listas (colecciones) y diccionarios (estructuras tipo JSON).
- La modularidad permite mantener proyectos limpios, testeables y colaborativos.

Mini desafío: piensa en un análisis que te interese (ventas, notas, temperatura). ¿Qué decisiones y repeticiones crees que necesitarás?


## 2. Condicionales (if, elif, else)

Objetivo: aprender a tomar decisiones con operadores relacionales (`>`, `<`, `>=`, `<=`, `==`, `!=`) y lógicos (`and`, `or`, `not`).

Conceptos clave:
- Flujo condicional: `if` se evalúa primero; si es falso, se prueba `elif`; si ninguno se cumple, se ejecuta `else`.
- Anidación: un `if` dentro de otro para evaluar casos jerárquicos.
- Precedencia lógica: `not` > `and` > `or` (usa paréntesis para claridad).
- Truthy/Falsy: valores considerados verdaderos/falsos (0, `""`, `[]`, `None` son Falsy).
- Comparación encadenada: expresiones como `a < b < c`.

A continuación, ejemplos prácticos y una analogía con aprobación por nota.


In [2]:
# Ejemplos prácticos de condicionales

# Ejemplo 1: if/elif/else para decidir Aprobado/Reprobado
nota = 3.6
umbral = 3.0
if nota >= umbral:
    resultado = "Aprobado"
else:
    resultado = "Reprobado"
print(f"Ejemplo 1 — Nota: {nota} => {resultado}")

# Ejemplo 2: combinación de condiciones con and/or (beca por nota y asistencia)
nota = 4.2
asistencia = 0.85  # 85%
umbral_beca_nota = 4.0
umbral_beca_asistencia = 0.8

if (nota >= umbral_beca_nota) and (asistencia >= umbral_beca_asistencia):
    print("Ejemplo 2 — Beca: Sí (cumple nota y asistencia)")
elif (nota >= 4.5) or (asistencia >= 0.95):
    print("Ejemplo 2 — Beca parcial: cumple por nota muy alta o asistencia destacada")
else:
    print("Ejemplo 2 — Beca: No")

# Ejemplo 3: condiciones anidadas para clasificar
nota = 4.7
if nota >= 4.5:
    categoria = "Excelente"
elif nota >= 3.0:
    categoria = "Aprobado"
else:
    categoria = "Reprobado"
print(f"Ejemplo 3 — Nota: {nota} => {categoria}")

# Ejemplo real (promedio)
calificaciones = [3.2, 4.1, 2.9, 4.7]
promedio = round(sum(calificaciones) / len(calificaciones), 2)
print("Promedio:", promedio)
if promedio >= 3.0:
    print("Aprueba por promedio")
else:
    print("Reprueba por promedio")

# Nota: también puedes usar comparación encadenada
# a = 5
# if 0 < a < 10:
#     print("a está entre 0 y 10")


Ejemplo 1 — Nota: 3.6 => Aprobado
Ejemplo 2 — Beca: Sí (cumple nota y asistencia)
Ejemplo 3 — Nota: 4.7 => Excelente
Promedio: 3.73
Aprueba por promedio


In [None]:
# Ejercicio guiado: clasificar calificaciones
# Dada una lista, clasificar cada nota en "Alta" (>=4.0), "Media" (>=3.0 y <4.0), "Baja" (<3.0)
# Solución comentada incluida

calificaciones = [2.5, 3.1, 4.8, 3.9, 1.7, 4.2]
clasificaciones = []  # guardaremos tuplas (nota, categoria)

for nota in calificaciones:
    if nota >= 4.0:
        categoria = "Alta"
    elif nota >= 3.0:  # aquí ya sabemos que nota < 4.0
        categoria = "Media"
    else:
        categoria = "Baja"
    clasificaciones.append((round(nota, 1), categoria))  # normalizamos al imprimir

print("Clasificaciones:")
for nota, cat in clasificaciones:
    print(f"- {nota}: {cat}")

# Alternativa: contar por categorías con un diccionario
conteo = {"Alta": 0, "Media": 0, "Baja": 0}
for _, cat in clasificaciones:
    conteo[cat] += 1
print("\nConteo por categoría:", conteo)

# Mini desafío: agrega la categoría "Sobresaliente" (>= 4.7) y cuenta cuántas hay.
# Pista: inserta una condición antes de "Alta" y actualiza el diccionario de conteo.


## 3. Bucles (for y while)

Objetivo: repetir acciones y recorrer estructuras; controlar el flujo con `break`, `continue` y `else`.

Conceptos clave:
- `for`: recorre elementos de una secuencia (lista, cadena, rango, etc.).
- `while`: repite mientras una condición sea verdadera.
- `range(n)`: genera 0..n-1; `enumerate(iterable)`: entrega (índice, valor).
- `break`: sale del bucle; `continue`: salta a la siguiente iteración.
- `for ... else`: el `else` se ejecuta si NO hubo `break` dentro del bucle.


In [None]:
# Ejemplos prácticos de bucles

# Ejemplo 1: recorrer precios e imprimir los > umbral
precios = [120, 80, 200, 150, 60]
umbral = 100
print("Precios mayores a", umbral)
for p in precios:
    if p > umbral:
        print("-", p)

# Ejemplo 2: continue para saltar valores faltantes y break al encontrar un tope
valores = [10, None, 15, 50, None, 200, 30]
tope = 150
print("\nProcesamiento con continue y break:")
for v in valores:
    if v is None:
        continue  # saltamos valores faltantes
    if v > tope:
        print(f"Encontrado valor > tope ({v}), deteniendo...")
        break
    print("ok:", v)

# Ejemplo 3: for ... else
objetivo = 500
print("\nBuscando un valor mayor a", objetivo)
for v in valores:
    if v is not None and v > objetivo:
        print("Encontrado:", v)
        break
else:
    print("No se encontraron valores por encima del objetivo")


In [None]:
# Ejercicios guiados con bucles

# 1) Contar cuántos elementos superan el promedio
valores = [10, 20, 15, 30, 25, 5]
promedio = sum(valores) / len(valores)
contador = 0
indices_superiores = []
for i, v in enumerate(valores):
    if v > promedio:
        contador += 1
        indices_superiores.append(i)
print(f"Promedio: {promedio:.2f} | Elementos > promedio: {contador} (índices: {indices_superiores})")
print(f"Porcentaje: {contador/len(valores)*100:.1f}%\n")

# 2) Solicitar una nota válida entre 0 y 5 con while
# Versión interactiva (comenta si no quieres ingresar datos manualmente):
# while True:
#     try:
#         nota = float(input("Ingresa una nota (0 a 5): "))
#         if 0 <= nota <= 5:
#             print("Nota válida:", nota)
#             break
#         else:
#             print("Fuera de rango. Intenta de nuevo.")
#     except ValueError:
#         print("Entrada inválida. Ingresa un número.")

# Versión NO interactiva (simulación para este notebook):
entradas = ["6", "-1", "hola", "4.5"]
nota = None
for e in entradas:
    try:
        n = float(e)
        if 0 <= n <= 5:
            nota = n
            print("Simulación: recibido válido ->", nota)
            break
        else:
            print("Simulación: fuera de rango ->", n)
    except ValueError:
        print("Simulación: entrada inválida ->", e)

# Mini desafío: usar enumerate para guardar los índices de valores que superan
# 1.5 desviaciones estándar por encima del promedio (puedes calcular media y desviación
# en dos pasadas por la lista).


## 4. Listas en Python

Objetivo: comprender cómo almacenar y transformar colecciones; operaciones típicas y comprensión de listas.

Conceptos clave:
- Crear y acceder: índices, slices (`lista[a:b:c]`).
- Modificar: asignación por índice/slice.
- Métodos: `append`, `extend`, `insert`, `remove`, `pop`.
- Ordenar: `sort` (in-place) vs `sorted` (copia); `reverse=True` para descendente.
- Comprensión de listas: transformar (map) y filtrar (filter) de forma concisa.


In [None]:
# Ejemplos prácticos con listas

# Ejemplo 1: estadísticas básicas de temperaturas
temperaturas = [21.0, 19.5, 23.3, 18.2, 20.1]
prom = round(sum(temperaturas)/len(temperaturas), 2)
mx = max(temperaturas)
mn = min(temperaturas)
print(f"Promedio: {prom} | Máxima: {mx} | Mínima: {mn}")

# Ejemplo 2: comprensión de listas (transformar y filtrar)
# a) Celsius -> Fahrenheit
fahrenheit = [round((t*9/5)+32, 1) for t in temperaturas]
print("Fahrenheit:", fahrenheit)
# b) Filtrar mayores a 20°C
mayores_20 = [t for t in temperaturas if t > 20]
print("> 20°C:", mayores_20)

# Ejemplo 3: ordenar y top-3
asc = sorted(temperaturas)
desc = sorted(temperaturas, reverse=True)
print("Asc:", asc)
print("Desc:", desc)
print("Top-3 más altas:", desc[:3])


In [None]:
# Ejercicio guiado: ventas y filtros
ventas = [100, 230, 80, 150, 260, 120]

# Con bucle
umbral = 150
filtradas = []
for v in ventas:
    if v > umbral:
        filtradas.append(v)
print("Filtradas (bucle):", filtradas)
print("Suma filtradas:", sum(filtradas), "| Cantidad:", len(filtradas))

# Con comprensión de listas
filtradas2 = [v for v in ventas if v > umbral]
print("Filtradas (comprensión):", filtradas2)
print("Suma:", sum(filtradas2), "| Cantidad:", len(filtradas2))

# Mini desafío: aplanar listas = [[1,2],[3,4,5],[6]] y obtener valores únicos preservando orden.
# Pista: recorre sublistas y usa un conjunto de vistos para evitar duplicados.


## 5. Diccionarios en Python

Objetivo: representar datos estructurados (tipo JSON) con pares clave-valor.

Conceptos clave:
- Crear y acceder: `d[clave]` y `d.get(clave, por_defecto)`.
- Modificar: asignar `d[clave] = valor`; eliminar con `del d[clave]` o `d.pop(clave, None)`.
- Recorrer: `keys()`, `values()`, `items()`; operador `in` sobre claves.
- Estructuras anidadas: diccionarios dentro de listas y viceversa.


In [None]:
# Ejemplos prácticos con diccionarios

# Ejemplo 1: estudiante y promedio
estudiante = {"nombre": "Ana", "calificaciones": [4.0, 3.5, 4.2, 2.8]}
prom = round(sum(estudiante["calificaciones"]) / len(estudiante["calificaciones"]), 2)
estudiante["promedio"] = prom
estudiante["aprobado"] = prom >= 3.0
print("Estudiante:", estudiante)

# Ejemplo 2: recorrer items() para reporte
for clave, valor in estudiante.items():
    print(f"{clave:>10}: {valor}")


In [None]:
# Ejercicio guiado: frecuencia de palabras
comentarios = [
    "Bueno y rápido",
    "Bueno y barato",
    "Rápido pero no tan bueno",
]

# Normalizar: minúsculas y quitar puntuación simple
import string
traductor = str.maketrans("", "", string.punctuation)

palabras = []
for c in comentarios:
    texto = c.lower().translate(traductor)
    palabras.extend(texto.split())

# Contar frecuencias manualmente
frecuencias = {}
for p in palabras:
    frecuencias[p] = frecuencias.get(p, 0) + 1

print("Frecuencias:", frecuencias)

# Extensión: top-3 más frecuentes
mas_frecuentes = sorted(frecuencias.items(), key=lambda kv: kv[1], reverse=True)[:3]
print("Top-3:", mas_frecuentes)

# Alternativa de validación con collections.Counter
from collections import Counter
print("Counter:", Counter(palabras).most_common(3))

# Mini desafío: convertir una lista de diccionarios de usuarios
# en un índice por id, manejando ids repetidos (último gana o acumular en lista).


## 6. Funciones en Python

Objetivo: reutilizar código; definir interfaces claras con docstrings y retornos.

Conceptos clave:
- Definición con `def` y parámetros (posicionales, por nombre, con defecto).
- Retorno múltiple: devolver tuplas `(a, b, c)`.
- Docstrings (triple comilla) y anotaciones de tipo para claridad y herramientas.
- Variables locales vs globales; preferir argumentos a depender de globales.
- Buenas prácticas: funciones cortas, nombres claros, validar entradas.


In [None]:
# Ejemplos prácticos con funciones
from typing import Iterable, Tuple

def resumen(numeros: Iterable[float]) -> tuple[float, float, float]:
    """Calcula (promedio, máximo, mínimo) de una secuencia de números.

    Args:
        numeros: Iterable de números (no vacío).
    Returns:
        Tupla (promedio, maximo, minimo).
    Raises:
        ValueError: si la secuencia está vacía.
    """
    datos = list(numeros)
    if not datos:
        raise ValueError("La lista no puede estar vacía")
    prom = sum(datos) / len(datos)
    return round(prom, 2), max(datos), min(datos)

# Pruebas rápidas
p, mx, mn = resumen([1, 2, 3, 4])
assert (p, mx, mn) == (2.5, 4, 1)
print("resumen OK:", (p, mx, mn))

# Validación de entradas
try:
    resumen([])
except ValueError as e:
    print("Validación capturada:", e)


In [None]:
# Ejercicio guiado: estadísticas de calificaciones
from typing import List, Tuple

def estadisticas(calificaciones: List[float]) -> Tuple[float, int, float]:
    """Devuelve (promedio, número de aprobados >= 3.0, nota más alta).

    Args:
        calificaciones: lista de notas (0 a 5).
    Returns:
        Tupla (promedio, aprobados, maximo).
    Raises:
        ValueError: si la lista está vacía o contiene valores fuera de [0, 5].
    """
    if not calificaciones:
        raise ValueError("La lista no puede estar vacía")
    if any((n < 0 or n > 5) for n in calificaciones):
        raise ValueError("Todas las notas deben estar en [0, 5]")
    promedio = sum(calificaciones) / len(calificaciones)
    aprobados = sum(1 for n in calificaciones if n >= 3.0)
    maximo = max(calificaciones)
    return round(promedio, 2), aprobados, maximo

# Ejemplos de uso
print(estadisticas([3.0, 4.5, 2.8, 5.0, 3.9]))
print(estadisticas([2.0, 2.5]))

# Mini desafío: escribir aplicar(func, datos) que aplique una función a cada elemento
# y devuelva la lista transformada; probar con lambda y con funciones definidas.


## 7. Introducción a la programación modular

Objetivo: dividir programas en módulos reutilizables (`archivo.py`) y mantener el código ordenado.

Conceptos clave:
- Módulo: un archivo `.py` que puedes importar con `import` o `from ... import ...`.
- Namespaces: evitar colisiones de nombres; usar alias si hace falta.
- Estructura de carpetas: agrupa módulos por tema.
- Punto de entrada: `if __name__ == "__main__":` para ejecutar solo al correr como script.
- Uso en VS Code: ver módulos en el Explorador y ejecutar en la Terminal integrada.


In [3]:
# Ejemplo práctico: crear analisis.py y principal.py
from pathlib import Path
from textwrap import dedent
import sys, subprocess

root = Path.cwd()

# Crear analisis.py
analisis_code = dedent('''
    """Funciones de análisis de productos.

    Un producto es un diccionario con claves: {"nombre", "precio", "cantidad"}.
    """
    from typing import List, Dict, Optional

    Producto = Dict[str, float]

    def total_vendido(productos: List[Producto]) -> float:
        """Devuelve el total vendido = sum(precio * cantidad)."""
        total = 0.0
        for p in productos:
            precio = p.get("precio")
            cantidad = p.get("cantidad")
            if precio is None or cantidad is None:
                raise ValueError("Producto sin precio o cantidad")
            total += float(precio) * float(cantidad)
        return round(total, 2)

    def promedio_precios(productos: List[Producto]) -> float:
        """Devuelve el precio promedio de los productos (independiente de la cantidad)."""
        precios = [float(p["precio"]) for p in productos if "precio" in p]
        if not precios:
            raise ValueError("Lista de productos sin precios")
        return round(sum(precios) / len(precios), 2)

    def filtrar_por_precio(productos: List[Producto], minimo: float, maximo: Optional[float] = None) -> List[Producto]:
        """Filtra productos por rango de precio [minimo, maximo]. Si maximo es None, solo aplica el mínimo."""
        res = []
        for p in productos:
            precio = float(p.get("precio", 0))
            if precio >= minimo and (maximo is None or precio <= maximo):
                res.append(p)
        return res

    def reporte(productos: List[Producto]) -> Dict[str, float]:
        """Devuelve un reporte con totales y promedios."""
        return {
            "total_vendido": total_vendido(productos),
            "promedio_precios": promedio_precios(productos),
            "num_items": len(productos),
        }
''')

(root / "analisis.py").write_text(analisis_code, encoding="utf-8")

# Crear principal.py
principal_code = dedent('''
    from analisis import total_vendido, promedio_precios, filtrar_por_precio, reporte

    def main():
        productos = [
            {"nombre": "A", "precio": 10.0, "cantidad": 3},
            {"nombre": "B", "precio": 25.0, "cantidad": 2},
            {"nombre": "C", "precio": 15.0, "cantidad": 5},
        ]
        print("Total vendido:", total_vendido(productos))
        print("Promedio de precios:", promedio_precios(productos))
        print("Filtrados >= 15:", filtrar_por_precio(productos, minimo=15.0))
        print("Reporte:", reporte(productos))

    if __name__ == "__main__":
        main()
''')

(root / "principal.py").write_text(principal_code, encoding="utf-8")

print("Archivos creados en:", root)

# Ejecutar principal.py con el mismo intérprete del kernel
res = subprocess.run([sys.executable, "principal.py"], capture_output=True, text=True)
print("\nSalida de principal.py:\n", res.stdout)
if res.stderr:
    print("Stderr:\n", res.stderr)

# Ejercicio modular (para practicar en archivos):
# - Extiende analisis.py con manejo de errores más detallado.
# - Agrega io_utils.py para cargar/guardar productos en CSV (módulo csv).
# - Ajusta principal.py para usar io_utils y mostrar un reporte alineado.


Archivos creados en: c:\Users\juand\GitHub\Máster en IA & Data Science\Clase 2

Salida de principal.py:
 Total vendido: 155.0
Promedio de precios: 16.67
Filtrados >= 15: [{'nombre': 'B', 'precio': 25.0, 'cantidad': 2}, {'nombre': 'C', 'precio': 15.0, 'cantidad': 5}]
Reporte: {'total_vendido': 155.0, 'promedio_precios': 16.67, 'num_items': 3}



## 8. Cierre y reflexión

Resumen de lo aprendido:
- Tomar decisiones con condicionales y controlar el flujo con bucles.
- Manipular listas y diccionarios, estructuras fundamentales en ciencia de datos.
- Definir funciones con docstrings y validaciones para reutilizar código.
- Organizar un proyecto en módulos para hacerlo escalable y mantenible.

Código lineal vs modular:
- Lineal: útil para scripts cortos, pero difícil de mantener y probar.
- Modular: facilita el reuso, las pruebas unitarias y el trabajo en equipo.

Preguntas de reflexión:
- ¿Qué ventajas encontraste al usar funciones y módulos?
- ¿Por qué condicionales y bucles son la base del procesamiento de datos?
- ¿Cómo aplicarías estos conceptos en un mini proyecto (por ejemplo, analizar ventas o reseñas)?

Mini desafío final: crea un módulo `metricas.py` con funciones `precision`, `recall` y `f1` para listas de etiquetas verdaderas y predichas, y pruébalas con datos simples.
