# Revisi√≥n de estructuras esenciales y programaci√≥n modular

Este notebook educativo est√° orientado a estudiantes de introducci√≥n a la programaci√≥n con aplicaci√≥n en ciencia de datos. Alternaremos teor√≠a y pr√°ctica con ejemplos del mundo real (ventas, calificaciones, rese√±as, temperaturas) y ejercicios guiados con soluciones comentadas.

Al finalizar, podr√°s:
- Usar condicionales para tomar decisiones en tu c√≥digo.
- Trabajar con bucles `for` y `while` de forma segura.
- Manipular listas y diccionarios, estructuras clave en ciencia de datos.
- Definir funciones reutilizables y documentadas.
- Organizar tu c√≥digo en m√≥dulos para proyectos m√°s grandes.

Mini desaf√≠o inicial: ejecuta la siguiente celda para comprobar tu entorno de Python.


In [1]:
# Comprobaci√≥n r√°pida del entorno
import sys
print(f"Versi√≥n de Python: {sys.version.split()[0]}")
print("Todo listo para empezar üöÄ")

Versi√≥n de Python: 3.12.7
Todo listo para empezar üöÄ


## 1. Introducci√≥n

En este notebook aprender√°s los bloques fundamentales de la programaci√≥n aplicados a ciencia de datos:
- Condicionales (`if`, `elif`, `else`) para tomar decisiones.
- Bucles (`for`, `while`) para repetir acciones y recorrer colecciones.
- Listas y diccionarios para almacenar y estructurar datos.
- Funciones para reutilizar y documentar c√≥digo.
- Programaci√≥n modular para organizar proyectos en varios archivos reutilizables.

¬øPor qu√© estos temas son la base de cualquier an√°lisis de datos?
- Todo pipeline de datos toma decisiones (filtrar, imputar, validar) y repite tareas (limpiar, transformar, resumir).
- Los datos se modelan naturalmente con listas (colecciones) y diccionarios (estructuras tipo JSON).
- La modularidad permite mantener proyectos limpios, testeables y colaborativos.

Mini desaf√≠o: piensa en un an√°lisis que te interese (ventas, notas, temperatura). ¬øQu√© decisiones y repeticiones crees que necesitar√°s?


## 2. Condicionales (if, elif, else)

Objetivo: aprender a tomar decisiones con operadores relacionales (`>`, `<`, `>=`, `<=`, `==`, `!=`) y l√≥gicos (`and`, `or`, `not`).

Conceptos clave:
- Flujo condicional: `if` se eval√∫a primero; si es falso, se prueba `elif`; si ninguno se cumple, se ejecuta `else`.
- Anidaci√≥n: un `if` dentro de otro para evaluar casos jer√°rquicos.
- Precedencia l√≥gica: `not` > `and` > `or` (usa par√©ntesis para claridad).
- Truthy/Falsy: valores considerados verdaderos/falsos (0, `""`, `[]`, `None` son Falsy).
- Comparaci√≥n encadenada: expresiones como `a < b < c`.

A continuaci√≥n, ejemplos pr√°cticos y una analog√≠a con aprobaci√≥n por nota.


In [2]:
# Ejemplos pr√°cticos de condicionales

# Ejemplo 1: if/elif/else para decidir Aprobado/Reprobado
nota = 3.6
umbral = 3.0
if nota >= umbral:
    resultado = "Aprobado"
else:
    resultado = "Reprobado"
print(f"Ejemplo 1 ‚Äî Nota: {nota} => {resultado}")

# Ejemplo 2: combinaci√≥n de condiciones con and/or (beca por nota y asistencia)
nota = 4.2
asistencia = 0.85  # 85%
umbral_beca_nota = 4.0
umbral_beca_asistencia = 0.8

if (nota >= umbral_beca_nota) and (asistencia >= umbral_beca_asistencia):
    print("Ejemplo 2 ‚Äî Beca: S√≠ (cumple nota y asistencia)")
elif (nota >= 4.5) or (asistencia >= 0.95):
    print("Ejemplo 2 ‚Äî Beca parcial: cumple por nota muy alta o asistencia destacada")
else:
    print("Ejemplo 2 ‚Äî Beca: No")

# Ejemplo 3: condiciones anidadas para clasificar
nota = 4.7
if nota >= 4.5:
    categoria = "Excelente"
elif nota >= 3.0:
    categoria = "Aprobado"
else:
    categoria = "Reprobado"
print(f"Ejemplo 3 ‚Äî Nota: {nota} => {categoria}")

# Ejemplo real (promedio)
calificaciones = [3.2, 4.1, 2.9, 4.7]
promedio = round(sum(calificaciones) / len(calificaciones), 2)
print("Promedio:", promedio)
if promedio >= 3.0:
    print("Aprueba por promedio")
else:
    print("Reprueba por promedio")

# Nota: tambi√©n puedes usar comparaci√≥n encadenada
# a = 5
# if 0 < a < 10:
#     print("a est√° entre 0 y 10")


Ejemplo 1 ‚Äî Nota: 3.6 => Aprobado
Ejemplo 2 ‚Äî Beca: S√≠ (cumple nota y asistencia)
Ejemplo 3 ‚Äî Nota: 4.7 => Excelente
Promedio: 3.73
Aprueba por promedio


In [None]:
# Ejercicio guiado: clasificar calificaciones
# Dada una lista, clasificar cada nota en "Alta" (>=4.0), "Media" (>=3.0 y <4.0), "Baja" (<3.0)
# Soluci√≥n comentada incluida

calificaciones = [2.5, 3.1, 4.8, 3.9, 1.7, 4.2]
clasificaciones = []  # guardaremos tuplas (nota, categoria)

for nota in calificaciones:
    if nota >= 4.0:
        categoria = "Alta"
    elif nota >= 3.0:  # aqu√≠ ya sabemos que nota < 4.0
        categoria = "Media"
    else:
        categoria = "Baja"
    clasificaciones.append((round(nota, 1), categoria))  # normalizamos al imprimir

print("Clasificaciones:")
for nota, cat in clasificaciones:
    print(f"- {nota}: {cat}")

# Alternativa: contar por categor√≠as con un diccionario
conteo = {"Alta": 0, "Media": 0, "Baja": 0}
for _, cat in clasificaciones:
    conteo[cat] += 1
print("\nConteo por categor√≠a:", conteo)

# Mini desaf√≠o: agrega la categor√≠a "Sobresaliente" (>= 4.7) y cuenta cu√°ntas hay.
# Pista: inserta una condici√≥n antes de "Alta" y actualiza el diccionario de conteo.


## 3. Bucles (for y while)

Objetivo: repetir acciones y recorrer estructuras; controlar el flujo con `break`, `continue` y `else`.

Conceptos clave:
- `for`: recorre elementos de una secuencia (lista, cadena, rango, etc.).
- `while`: repite mientras una condici√≥n sea verdadera.
- `range(n)`: genera 0..n-1; `enumerate(iterable)`: entrega (√≠ndice, valor).
- `break`: sale del bucle; `continue`: salta a la siguiente iteraci√≥n.
- `for ... else`: el `else` se ejecuta si NO hubo `break` dentro del bucle.


In [None]:
# Ejemplos pr√°cticos de bucles

# Ejemplo 1: recorrer precios e imprimir los > umbral
precios = [120, 80, 200, 150, 60]
umbral = 100
print("Precios mayores a", umbral)
for p in precios:
    if p > umbral:
        print("-", p)

# Ejemplo 2: continue para saltar valores faltantes y break al encontrar un tope
valores = [10, None, 15, 50, None, 200, 30]
tope = 150
print("\nProcesamiento con continue y break:")
for v in valores:
    if v is None:
        continue  # saltamos valores faltantes
    if v > tope:
        print(f"Encontrado valor > tope ({v}), deteniendo...")
        break
    print("ok:", v)

# Ejemplo 3: for ... else
objetivo = 500
print("\nBuscando un valor mayor a", objetivo)
for v in valores:
    if v is not None and v > objetivo:
        print("Encontrado:", v)
        break
else:
    print("No se encontraron valores por encima del objetivo")


In [None]:
# Ejercicios guiados con bucles

# 1) Contar cu√°ntos elementos superan el promedio
valores = [10, 20, 15, 30, 25, 5]
promedio = sum(valores) / len(valores)
contador = 0
indices_superiores = []
for i, v in enumerate(valores):
    if v > promedio:
        contador += 1
        indices_superiores.append(i)
print(f"Promedio: {promedio:.2f} | Elementos > promedio: {contador} (√≠ndices: {indices_superiores})")
print(f"Porcentaje: {contador/len(valores)*100:.1f}%\n")

# 2) Solicitar una nota v√°lida entre 0 y 5 con while
# Versi√≥n interactiva (comenta si no quieres ingresar datos manualmente):
# while True:
#     try:
#         nota = float(input("Ingresa una nota (0 a 5): "))
#         if 0 <= nota <= 5:
#             print("Nota v√°lida:", nota)
#             break
#         else:
#             print("Fuera de rango. Intenta de nuevo.")
#     except ValueError:
#         print("Entrada inv√°lida. Ingresa un n√∫mero.")

# Versi√≥n NO interactiva (simulaci√≥n para este notebook):
entradas = ["6", "-1", "hola", "4.5"]
nota = None
for e in entradas:
    try:
        n = float(e)
        if 0 <= n <= 5:
            nota = n
            print("Simulaci√≥n: recibido v√°lido ->", nota)
            break
        else:
            print("Simulaci√≥n: fuera de rango ->", n)
    except ValueError:
        print("Simulaci√≥n: entrada inv√°lida ->", e)

# Mini desaf√≠o: usar enumerate para guardar los √≠ndices de valores que superan
# 1.5 desviaciones est√°ndar por encima del promedio (puedes calcular media y desviaci√≥n
# en dos pasadas por la lista).


## 4. Listas en Python

Objetivo: comprender c√≥mo almacenar y transformar colecciones; operaciones t√≠picas y comprensi√≥n de listas.

Conceptos clave:
- Crear y acceder: √≠ndices, slices (`lista[a:b:c]`).
- Modificar: asignaci√≥n por √≠ndice/slice.
- M√©todos: `append`, `extend`, `insert`, `remove`, `pop`.
- Ordenar: `sort` (in-place) vs `sorted` (copia); `reverse=True` para descendente.
- Comprensi√≥n de listas: transformar (map) y filtrar (filter) de forma concisa.


In [None]:
# Ejemplos pr√°cticos con listas

# Ejemplo 1: estad√≠sticas b√°sicas de temperaturas
temperaturas = [21.0, 19.5, 23.3, 18.2, 20.1]
prom = round(sum(temperaturas)/len(temperaturas), 2)
mx = max(temperaturas)
mn = min(temperaturas)
print(f"Promedio: {prom} | M√°xima: {mx} | M√≠nima: {mn}")

# Ejemplo 2: comprensi√≥n de listas (transformar y filtrar)
# a) Celsius -> Fahrenheit
fahrenheit = [round((t*9/5)+32, 1) for t in temperaturas]
print("Fahrenheit:", fahrenheit)
# b) Filtrar mayores a 20¬∞C
mayores_20 = [t for t in temperaturas if t > 20]
print("> 20¬∞C:", mayores_20)

# Ejemplo 3: ordenar y top-3
asc = sorted(temperaturas)
desc = sorted(temperaturas, reverse=True)
print("Asc:", asc)
print("Desc:", desc)
print("Top-3 m√°s altas:", desc[:3])


In [None]:
# Ejercicio guiado: ventas y filtros
ventas = [100, 230, 80, 150, 260, 120]

# Con bucle
umbral = 150
filtradas = []
for v in ventas:
    if v > umbral:
        filtradas.append(v)
print("Filtradas (bucle):", filtradas)
print("Suma filtradas:", sum(filtradas), "| Cantidad:", len(filtradas))

# Con comprensi√≥n de listas
filtradas2 = [v for v in ventas if v > umbral]
print("Filtradas (comprensi√≥n):", filtradas2)
print("Suma:", sum(filtradas2), "| Cantidad:", len(filtradas2))

# Mini desaf√≠o: aplanar listas = [[1,2],[3,4,5],[6]] y obtener valores √∫nicos preservando orden.
# Pista: recorre sublistas y usa un conjunto de vistos para evitar duplicados.


## 5. Diccionarios en Python

Objetivo: representar datos estructurados (tipo JSON) con pares clave-valor.

Conceptos clave:
- Crear y acceder: `d[clave]` y `d.get(clave, por_defecto)`.
- Modificar: asignar `d[clave] = valor`; eliminar con `del d[clave]` o `d.pop(clave, None)`.
- Recorrer: `keys()`, `values()`, `items()`; operador `in` sobre claves.
- Estructuras anidadas: diccionarios dentro de listas y viceversa.


In [None]:
# Ejemplos pr√°cticos con diccionarios

# Ejemplo 1: estudiante y promedio
estudiante = {"nombre": "Ana", "calificaciones": [4.0, 3.5, 4.2, 2.8]}
prom = round(sum(estudiante["calificaciones"]) / len(estudiante["calificaciones"]), 2)
estudiante["promedio"] = prom
estudiante["aprobado"] = prom >= 3.0
print("Estudiante:", estudiante)

# Ejemplo 2: recorrer items() para reporte
for clave, valor in estudiante.items():
    print(f"{clave:>10}: {valor}")


In [None]:
# Ejercicio guiado: frecuencia de palabras
comentarios = [
    "Bueno y r√°pido",
    "Bueno y barato",
    "R√°pido pero no tan bueno",
]

# Normalizar: min√∫sculas y quitar puntuaci√≥n simple
import string
traductor = str.maketrans("", "", string.punctuation)

palabras = []
for c in comentarios:
    texto = c.lower().translate(traductor)
    palabras.extend(texto.split())

# Contar frecuencias manualmente
frecuencias = {}
for p in palabras:
    frecuencias[p] = frecuencias.get(p, 0) + 1

print("Frecuencias:", frecuencias)

# Extensi√≥n: top-3 m√°s frecuentes
mas_frecuentes = sorted(frecuencias.items(), key=lambda kv: kv[1], reverse=True)[:3]
print("Top-3:", mas_frecuentes)

# Alternativa de validaci√≥n con collections.Counter
from collections import Counter
print("Counter:", Counter(palabras).most_common(3))

# Mini desaf√≠o: convertir una lista de diccionarios de usuarios
# en un √≠ndice por id, manejando ids repetidos (√∫ltimo gana o acumular en lista).


## 6. Funciones en Python

Objetivo: reutilizar c√≥digo; definir interfaces claras con docstrings y retornos.

Conceptos clave:
- Definici√≥n con `def` y par√°metros (posicionales, por nombre, con defecto).
- Retorno m√∫ltiple: devolver tuplas `(a, b, c)`.
- Docstrings (triple comilla) y anotaciones de tipo para claridad y herramientas.
- Variables locales vs globales; preferir argumentos a depender de globales.
- Buenas pr√°cticas: funciones cortas, nombres claros, validar entradas.


In [None]:
# Ejemplos pr√°cticos con funciones
from typing import Iterable, Tuple

def resumen(numeros: Iterable[float]) -> tuple[float, float, float]:
    """Calcula (promedio, m√°ximo, m√≠nimo) de una secuencia de n√∫meros.

    Args:
        numeros: Iterable de n√∫meros (no vac√≠o).
    Returns:
        Tupla (promedio, maximo, minimo).
    Raises:
        ValueError: si la secuencia est√° vac√≠a.
    """
    datos = list(numeros)
    if not datos:
        raise ValueError("La lista no puede estar vac√≠a")
    prom = sum(datos) / len(datos)
    return round(prom, 2), max(datos), min(datos)

# Pruebas r√°pidas
p, mx, mn = resumen([1, 2, 3, 4])
assert (p, mx, mn) == (2.5, 4, 1)
print("resumen OK:", (p, mx, mn))

# Validaci√≥n de entradas
try:
    resumen([])
except ValueError as e:
    print("Validaci√≥n capturada:", e)


In [None]:
# Ejercicio guiado: estad√≠sticas de calificaciones
from typing import List, Tuple

def estadisticas(calificaciones: List[float]) -> Tuple[float, int, float]:
    """Devuelve (promedio, n√∫mero de aprobados >= 3.0, nota m√°s alta).

    Args:
        calificaciones: lista de notas (0 a 5).
    Returns:
        Tupla (promedio, aprobados, maximo).
    Raises:
        ValueError: si la lista est√° vac√≠a o contiene valores fuera de [0, 5].
    """
    if not calificaciones:
        raise ValueError("La lista no puede estar vac√≠a")
    if any((n < 0 or n > 5) for n in calificaciones):
        raise ValueError("Todas las notas deben estar en [0, 5]")
    promedio = sum(calificaciones) / len(calificaciones)
    aprobados = sum(1 for n in calificaciones if n >= 3.0)
    maximo = max(calificaciones)
    return round(promedio, 2), aprobados, maximo

# Ejemplos de uso
print(estadisticas([3.0, 4.5, 2.8, 5.0, 3.9]))
print(estadisticas([2.0, 2.5]))

# Mini desaf√≠o: escribir aplicar(func, datos) que aplique una funci√≥n a cada elemento
# y devuelva la lista transformada; probar con lambda y con funciones definidas.


## 7. Introducci√≥n a la programaci√≥n modular

Objetivo: dividir programas en m√≥dulos reutilizables (`archivo.py`) y mantener el c√≥digo ordenado.

Conceptos clave:
- M√≥dulo: un archivo `.py` que puedes importar con `import` o `from ... import ...`.
- Namespaces: evitar colisiones de nombres; usar alias si hace falta.
- Estructura de carpetas: agrupa m√≥dulos por tema.
- Punto de entrada: `if __name__ == "__main__":` para ejecutar solo al correr como script.
- Uso en VS Code: ver m√≥dulos en el Explorador y ejecutar en la Terminal integrada.


In [3]:
# Ejemplo pr√°ctico: crear analisis.py y principal.py
from pathlib import Path
from textwrap import dedent
import sys, subprocess

root = Path.cwd()

# Crear analisis.py
analisis_code = dedent('''
    """Funciones de an√°lisis de productos.

    Un producto es un diccionario con claves: {"nombre", "precio", "cantidad"}.
    """
    from typing import List, Dict, Optional

    Producto = Dict[str, float]

    def total_vendido(productos: List[Producto]) -> float:
        """Devuelve el total vendido = sum(precio * cantidad)."""
        total = 0.0
        for p in productos:
            precio = p.get("precio")
            cantidad = p.get("cantidad")
            if precio is None or cantidad is None:
                raise ValueError("Producto sin precio o cantidad")
            total += float(precio) * float(cantidad)
        return round(total, 2)

    def promedio_precios(productos: List[Producto]) -> float:
        """Devuelve el precio promedio de los productos (independiente de la cantidad)."""
        precios = [float(p["precio"]) for p in productos if "precio" in p]
        if not precios:
            raise ValueError("Lista de productos sin precios")
        return round(sum(precios) / len(precios), 2)

    def filtrar_por_precio(productos: List[Producto], minimo: float, maximo: Optional[float] = None) -> List[Producto]:
        """Filtra productos por rango de precio [minimo, maximo]. Si maximo es None, solo aplica el m√≠nimo."""
        res = []
        for p in productos:
            precio = float(p.get("precio", 0))
            if precio >= minimo and (maximo is None or precio <= maximo):
                res.append(p)
        return res

    def reporte(productos: List[Producto]) -> Dict[str, float]:
        """Devuelve un reporte con totales y promedios."""
        return {
            "total_vendido": total_vendido(productos),
            "promedio_precios": promedio_precios(productos),
            "num_items": len(productos),
        }
''')

(root / "analisis.py").write_text(analisis_code, encoding="utf-8")

# Crear principal.py
principal_code = dedent('''
    from analisis import total_vendido, promedio_precios, filtrar_por_precio, reporte

    def main():
        productos = [
            {"nombre": "A", "precio": 10.0, "cantidad": 3},
            {"nombre": "B", "precio": 25.0, "cantidad": 2},
            {"nombre": "C", "precio": 15.0, "cantidad": 5},
        ]
        print("Total vendido:", total_vendido(productos))
        print("Promedio de precios:", promedio_precios(productos))
        print("Filtrados >= 15:", filtrar_por_precio(productos, minimo=15.0))
        print("Reporte:", reporte(productos))

    if __name__ == "__main__":
        main()
''')

(root / "principal.py").write_text(principal_code, encoding="utf-8")

print("Archivos creados en:", root)

# Ejecutar principal.py con el mismo int√©rprete del kernel
res = subprocess.run([sys.executable, "principal.py"], capture_output=True, text=True)
print("\nSalida de principal.py:\n", res.stdout)
if res.stderr:
    print("Stderr:\n", res.stderr)

# Ejercicio modular (para practicar en archivos):
# - Extiende analisis.py con manejo de errores m√°s detallado.
# - Agrega io_utils.py para cargar/guardar productos en CSV (m√≥dulo csv).
# - Ajusta principal.py para usar io_utils y mostrar un reporte alineado.


Archivos creados en: c:\Users\juand\GitHub\M√°ster en IA & Data Science\Clase 2

Salida de principal.py:
 Total vendido: 155.0
Promedio de precios: 16.67
Filtrados >= 15: [{'nombre': 'B', 'precio': 25.0, 'cantidad': 2}, {'nombre': 'C', 'precio': 15.0, 'cantidad': 5}]
Reporte: {'total_vendido': 155.0, 'promedio_precios': 16.67, 'num_items': 3}



## 8. Cierre y reflexi√≥n

Resumen de lo aprendido:
- Tomar decisiones con condicionales y controlar el flujo con bucles.
- Manipular listas y diccionarios, estructuras fundamentales en ciencia de datos.
- Definir funciones con docstrings y validaciones para reutilizar c√≥digo.
- Organizar un proyecto en m√≥dulos para hacerlo escalable y mantenible.

C√≥digo lineal vs modular:
- Lineal: √∫til para scripts cortos, pero dif√≠cil de mantener y probar.
- Modular: facilita el reuso, las pruebas unitarias y el trabajo en equipo.

Preguntas de reflexi√≥n:
- ¬øQu√© ventajas encontraste al usar funciones y m√≥dulos?
- ¬øPor qu√© condicionales y bucles son la base del procesamiento de datos?
- ¬øC√≥mo aplicar√≠as estos conceptos en un mini proyecto (por ejemplo, analizar ventas o rese√±as)?

Mini desaf√≠o final: crea un m√≥dulo `metricas.py` con funciones `precision`, `recall` y `f1` para listas de etiquetas verdaderas y predichas, y pru√©balas con datos simples.
