# Unidad 5: Estructuras de Datos Avanzadas y Módulos de Terceros

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/caracena/apunte-programacion-python/blob/main/unidad5_estructuras_datos.ipynb)


**Semanas 11, 12 y 13**

---

Hasta ahora hemos trabajado con variables que almacenan un solo valor. En esta unidad aprenderemos a manejar **colecciones de datos**: listas, diccionarios, tuplas y sets. Estas estructuras son fundamentales para resolver problemas del mundo real donde trabajamos con múltiples registros, configuraciones y conjuntos de información.

:::{tip}
Elegir la estructura de datos correcta para cada problema es una habilidad clave. Cada estructura tiene sus fortalezas y casos de uso óptimos.
:::


## 5.1 Listas

Una **lista** es una colección ordenada y mutable de elementos. Es la estructura de datos más usada en Python.

```python
mi_lista = [elemento1, elemento2, elemento3]
```

### Características
- **Ordenada**: los elementos mantienen su posición
- **Mutable**: se puede modificar después de crearla
- **Indexada**: acceso por posición (índice empieza en 0)
- **Heterogénea**: puede contener distintos tipos de datos

| Operación | Sintaxis | Ejemplo |
|-----------|---------|--------|
| Acceder por índice | `lista[i]` | `productos[0]` |
| Último elemento | `lista[-1]` | `precios[-1]` |
| Slice (rebanada) | `lista[i:j]` | `ventas[2:5]` |
| Longitud | `len(lista)` | `len(clientes)` |
| Agregar al final | `lista.append(x)` | `carrito.append(item)` |
| Insertar en posición | `lista.insert(i, x)` | `lista.insert(0, nuevo)` |
| Eliminar por valor | `lista.remove(x)` | `lista.remove("error")` |
| Eliminar por índice | `lista.pop(i)` | `lista.pop(-1)` |
| Ordenar | `lista.sort()` | `precios.sort()` |
| Buscar | `x in lista` | `"Laptop" in inventario` |


In [None]:
# Crear y manipular listas
ventas_diarias = [145000, 230000, 89000, 310000, 275000]

print(f"Lista original: {ventas_diarias}")
print(f"Primera venta:  ${ventas_diarias[0]:,}")
print(f"Última venta:   ${ventas_diarias[-1]:,}")
print(f"Ventas 2-4:     {ventas_diarias[1:4]}")
print(f"Cantidad días:  {len(ventas_diarias)}")

# Modificar
ventas_diarias.append(420000)       # Agregar sábado
ventas_diarias.insert(0, 0)         # El lunes fue feriado
print(f"\nCon feriado y sábado: {ventas_diarias}")

# Estadísticas básicas
print(f"\nTotal: ${sum(ventas_diarias):,}")
print(f"Mayor: ${max(ventas_diarias):,}")
print(f"Menor: ${min(ventas_diarias):,}")

Lista original: [145000, 230000, 89000, 310000, 275000]
Primera venta:  $145,000
Última venta:   $275,000
Ventas 2-4:     [230000, 89000, 310000]
Cantidad días:  5

Con feriado y sábado: [0, 145000, 230000, 89000, 310000, 275000, 420000]

Total: $1,469,000
Mayor: $420,000
Menor: $0


In [None]:
# List comprehension: crear listas de forma concisa
precios_netos = [10000, 25000, 8500, 45000, 12000]

# Forma tradicional
precios_iva = []
for p in precios_netos:
    precios_iva.append(p * 1.19)

# List comprehension (más pythónico)
precios_iva_comp = [p * 1.19 for p in precios_netos]

# Con condición — solo precios mayores a $10.000
precios_altos = [p for p in precios_netos if p > 10000]

print(f"Precios netos: {precios_netos}")
print(f"Con IVA:       {[f'{p:,.0f}' for p in precios_iva_comp]}")
print(f"Precios altos: {precios_altos}")

Precios netos: [10000, 25000, 8500, 45000, 12000]
Con IVA:       ['11,900', '29,750', '10,115', '53,550', '14,280']
Precios altos: [25000, 45000, 12000]


## 5.2 Diccionarios

Un **diccionario** almacena pares **clave-valor**. Es ideal para representar registros con propiedades nombradas.

```python
mi_dict = {"clave1": valor1, "clave2": valor2}
```

### Características
- **No ordenado** (en versiones < 3.7) / **Ordenado por inserción** (Python 3.7+)
- **Mutable**: se pueden agregar, modificar y eliminar pares
- **Claves únicas**: no puede haber dos claves iguales
- **Acceso por clave**, no por índice numérico


In [None]:
# Crear y usar diccionarios
empleado = {
    "nombre": "Ana García",
    "rut": "12.345.678-9",
    "cargo": "Analista de Datos",
    "sueldo": 1200000,
    "activo": True,
    "habilidades": ["Python", "Excel", "SQL"]
}

# Acceder a valores
print(f"Nombre: {empleado['nombre']}")
print(f"Cargo:  {empleado['cargo']}")
print(f"Sueldo: ${empleado['sueldo']:,}")

# Acceso seguro con .get() (no lanza error si la clave no existe)
print(f"Área:   {empleado.get('area', 'No asignada')}")

# Agregar y modificar
empleado["area"] = "Tecnología"
empleado["sueldo"] = 1350000   # Aumento

print(f"\nNuevo sueldo: ${empleado['sueldo']:,}")
print(f"Área:         {empleado['area']}")

# Iterar
print("\nHabilidades:")
for habilidad in empleado["habilidades"]:
    print(f"  - {habilidad}")

Nombre: Ana García
Cargo:  Analista de Datos
Sueldo: $1,200,000
Área:   No asignada

Nuevo sueldo: $1,350,000
Área:         Tecnología

Habilidades:
  - Python
  - Excel
  - SQL


In [None]:
# Diccionario de diccionarios — Base de datos de clientes
clientes = {
    "C001": {"nombre": "Tech Solutions",    "rubro": "TI",       "credito": 5000000},
    "C002": {"nombre": "Retail Express",    "rubro": "Retail",   "credito": 2000000},
    "C003": {"nombre": "Café Central",      "rubro": "Alimentos","credito": 500000},
    "C004": {"nombre": "Constructora UAI",  "rubro": "Inmob.",   "credito": 8000000},
}

# Reporte de clientes
print(f"{'Código':<8} {'Nombre':<20} {'Rubro':<12} {'Crédito':>12}")
print("-" * 56)

total_credito = 0
for codigo, datos in clientes.items():
    print(f"{codigo:<8} {datos['nombre']:<20} {datos['rubro']:<12} ${datos['credito']:>10,}")
    total_credito += datos['credito']

print("-" * 56)
print(f"{'Total crédito otorgado:':<42} ${total_credito:>10,}")
print(f"Número de clientes: {len(clientes)}")

Código   Nombre               Rubro        Crédito
--------------------------------------------------------
C001     Tech Solutions        TI           $  5,000,000
C002     Retail Express        Retail       $  2,000,000
C003     Café Central          Alimentos    $    500,000
C004     Constructora UAI      Inmob.       $  8,000,000
--------------------------------------------------------
Total crédito otorgado:                    $ 15,500,000
Número de clientes: 4


## 5.3 Tuplas

Una **tupla** es como una lista, pero **inmutable**: una vez creada no se puede modificar.

```python
mi_tupla = (elemento1, elemento2, elemento3)
```

### ¿Cuándo usar tuplas?
- Datos que no deben cambiar (coordenadas, fechas, configuración)
- Retorno de múltiples valores desde funciones
- Claves de diccionarios (las listas no pueden ser claves)
- Ligeramente más eficientes en memoria que las listas


In [None]:
# Tuplas — uso práctico

# Coordenadas inmutables de sucursales
sucursales = {
    "Santiago Centro": (-33.4489, -70.6693),
    "Las Condes":      (-33.4097, -70.5672),
    "Providencia":     (-33.4323, -70.6109),
}

for nombre, (lat, lon) in sucursales.items():
    print(f"{nombre:<20} Lat: {lat}, Lon: {lon}")

# Desempaquetar tupla
rgb_azul = (0, 120, 215)
rojo, verde, azul = rgb_azul
print(f"\nColor azul UAI: R={rojo}, G={verde}, B={azul}")

# Intentar modificar una tupla genera error
try:
    rgb_azul[0] = 100
except TypeError as e:
    print(f"\nError al modificar tupla: {e}")

Santiago Centro      Lat: -33.4489, Lon: -70.6693
Las Condes           Lat: -33.4097, Lon: -70.5672
Providencia          Lat: -33.4323, Lon: -70.6109

Color azul UAI: R=0, G=120, B=215

Error al modificar tupla: 'tuple' object does not support item assignment


## 5.4 Sets (Conjuntos)

Un **set** es una colección **desordenada** de elementos **únicos**. Es ideal para eliminar duplicados y realizar operaciones de conjuntos.

```python
mi_set = {elemento1, elemento2, elemento3}
```

| Operación | Método / Operador |
|-----------|------------------|
| Unión | `A \| B` o `A.union(B)` |
| Intersección | `A & B` o `A.intersection(B)` |
| Diferencia | `A - B` o `A.difference(B)` |
| Diferencia simétrica | `A ^ B` |


In [None]:
# Sets — eliminar duplicados
registros_ventas = ["P001", "P003", "P001", "P002", "P003", "P004", "P002", "P001"]
productos_vendidos = set(registros_ventas)
print(f"Registros totales:  {len(registros_ventas)}")
print(f"Productos únicos:   {len(productos_vendidos)}")
print(f"IDs únicos: {sorted(productos_vendidos)}")

# Operaciones de conjuntos — análisis de clientes
clientes_enero = {"C001", "C002", "C003", "C005", "C007"}
clientes_febrero = {"C001", "C003", "C004", "C006", "C007"}

compraron_ambos_meses = clientes_enero & clientes_febrero   # Intersección
compraron_alguno      = clientes_enero | clientes_febrero   # Unión
solo_enero            = clientes_enero - clientes_febrero   # Diferencia
solo_febrero          = clientes_febrero - clientes_enero

print(f"\nClientes fieles (ambos meses): {sorted(compraron_ambos_meses)}")
print(f"Total clientes únicos:         {len(compraron_alguno)}")
print(f"Solo compraron en enero:       {sorted(solo_enero)}")
print(f"Clientes nuevos en febrero:    {sorted(solo_febrero)}")

Registros totales:  8
Productos únicos:   4
IDs únicos: ['P001', 'P002', 'P003', 'P004']

Clientes fieles (ambos meses): ['C001', 'C003', 'C007']
Total clientes únicos:         7
Solo compraron en enero:       ['C002', 'C005']
Clientes nuevos en febrero:    ['C004', 'C006']


## 5.5 Listas Multidimensionales

Una **lista multidimensional** (o matriz) es una lista que contiene otras listas. Es útil para representar tablas, matrices y datos tabulares.


In [None]:
# Matriz de ventas: filas=productos, columnas=trimestres
productos = ["Laptop", "Mouse", "Teclado", "Monitor"]
trimestres = ["T1", "T2", "T3", "T4"]

ventas_matriz = [
    [45, 52, 61, 78],   # Laptop
    [320, 415, 390, 502], # Mouse
    [180, 195, 210, 265], # Teclado
    [28, 35, 42, 55],   # Monitor
]

# Imprimir tabla
print(f"{'Producto':<12}", end="")
for t in trimestres:
    print(f"{t:>8}", end="")
print(f"{'Total':>10}")
print("-" * 52)

totales_trimestre = [0, 0, 0, 0]

for i, producto in enumerate(productos):
    fila = ventas_matriz[i]
    total_prod = sum(fila)
    print(f"{producto:<12}", end="")
    for j, cant in enumerate(fila):
        print(f"{cant:>8}", end="")
        totales_trimestre[j] += cant
    print(f"{total_prod:>10}")

print("-" * 52)
print(f"{'TOTAL':<12}", end="")
for t in totales_trimestre:
    print(f"{t:>8}", end="")
print(f"{sum(totales_trimestre):>10}")

Producto          T1      T2      T3      T4     Total
----------------------------------------------------
Laptop            45      52      61      78       236
Mouse            320     415     390     502      1627
Teclado          180     195     210     265       850
Monitor           28      35      42      55       160
----------------------------------------------------
TOTAL            573     697     703     900      2873


## 5.6 Módulos Estándar de Python

Python viene con una **biblioteca estándar** enorme. Los módulos se importan con `import`.


In [None]:
import math
import random
import time

# --- math ---
print("=== Módulo math ===")
print(f"PI:             {math.pi:.6f}")
print(f"sqrt(144):      {math.sqrt(144):.0f}")
print(f"ceil(3.2):      {math.ceil(3.2)}")
print(f"floor(3.9):     {math.floor(3.9)}")
print(f"log10(1000):    {math.log10(1000):.0f}")

# Aplicación: calcular cuota de crédito
capital = 5000000
tasa_mensual = 0.012  # 1.2% mensual
n_cuotas = 24
cuota = capital * (tasa_mensual * (1 + tasa_mensual)**n_cuotas) / ((1 + tasa_mensual)**n_cuotas - 1)
print(f"\nCuota crédito ${capital:,} a 24 meses: ${cuota:,.0f}")

=== Módulo math ===
PI:             3.141593
sqrt(144):      12
ceil(3.2):      4
floor(3.9):     3
log10(1000):    3

Cuota crédito $5,000,000 a 24 meses: $238,424


In [None]:
# --- random --- simulación de datos de negocio
print("=== Módulo random ===")
random.seed(42)  # Para reproducibilidad

# Generar ventas diarias aleatorias
ventas_simuladas = [random.randint(100000, 500000) for _ in range(7)]
dias = ["Lun", "Mar", "Mié", "Jue", "Vie", "Sáb", "Dom"]

print("Ventas simuladas de la semana:")
for dia, venta in zip(dias, ventas_simuladas):
    barra = "█" * (venta // 50000)
    print(f"  {dia}: ${venta:>7,} {barra}")

# Escoger ganador de sorteo
clientes = ["Ana García", "Pedro Rojas", "María López", "Juan Pérez", "Sofía Martínez"]
ganador = random.choice(clientes)
print(f"\nGanador del sorteo: {ganador}")

# Muestra aleatoria de clientes para encuesta
muestra = random.sample(clientes, 3)
print(f"Muestra para encuesta: {muestra}")

=== Módulo random ===
Ventas simuladas de la semana:
  Lun: $251,175 █████
  Mar: $402,373 ████████
  Mié: $219,932 ████
  Jue: $185,434 ███
  Vie: $394,026 ███████
  Sáb: $329,451 ██████
  Dom: $473,148 █████████

Ganador del sorteo: Pedro Rojas
Muestra para encuesta: ['Ana García', 'Sofía Martínez', 'María López']


## 5.7 Lectura y Escritura de Archivos CSV

En el mundo empresarial, los datos suelen venir en archivos CSV o Excel. Python facilita su lectura y escritura.


In [None]:
import csv
import os

# --- Escritura de CSV ---
datos_empleados = [
    ["ID",    "Nombre",          "Cargo",              "Sueldo"],
    ["E001",  "Ana García",      "Analista",           "1200000"],
    ["E002",  "Pedro Rojas",     "Desarrollador",      "1500000"],
    ["E003",  "María López",     "Gerente de Ventas",  "2500000"],
    ["E004",  "Juan Pérez",      "Contador",           "900000"],
    ["E005",  "Sofía Martínez",  "Diseñadora UX",      "1100000"],
]

archivo_csv = "/tmp/empleados.csv"

with open(archivo_csv, "w", newline="", encoding="utf-8") as f:
    writer = csv.writer(f)
    writer.writerows(datos_empleados)

print(f"Archivo CSV creado: {archivo_csv}")
print(f"Tamaño: {os.path.getsize(archivo_csv)} bytes")

Archivo CSV creado: /tmp/empleados.csv
Tamaño: 215 bytes


In [None]:
# --- Lectura de CSV ---
print("Leyendo archivo CSV:")
print("-" * 65)

sueldos = []

with open("/tmp/empleados.csv", "r", encoding="utf-8") as f:
    reader = csv.DictReader(f)
    for fila in reader:
        sueldo = int(fila["Sueldo"])
        sueldos.append(sueldo)
        print(f"  {fila['ID']} | {fila['Nombre']:<20} | {fila['Cargo']:<20} | ${sueldo:>10,}")

print("-" * 65)
print(f"  Promedio salarial: ${sum(sueldos)/len(sueldos):>10,.0f}")
print(f"  Sueldo máximo:     ${max(sueldos):>10,}")
print(f"  Sueldo mínimo:     ${min(sueldos):>10,}")

Leyendo archivo CSV:
-----------------------------------------------------------------
  E001 | Ana García            | Analista              | $ 1,200,000
  E002 | Pedro Rojas           | Desarrollador         | $ 1,500,000
  E003 | María López           | Gerente de Ventas     | $ 2,500,000
  E004 | Juan Pérez            | Contador              | $   900,000
  E005 | Sofía Martínez        | Diseñadora UX         | $ 1,100,000
-----------------------------------------------------------------
  Promedio salarial: $ 1,440,000
  Sueldo máximo:     $ 2,500,000
  Sueldo mínimo:     $   900,000


## 5.8 Resumen de Estructuras de Datos

| Estructura | Ordenada | Mutable | Duplicados | Acceso | Uso típico |
|-----------|----------|---------|-----------|--------|------------|
| **Lista** `[]` | Sí | Sí | Sí | Por índice | Colecciones ordenadas |
| **Diccionario** `{}` | Sí* | Sí | Claves no | Por clave | Registros con campos |
| **Tupla** `()` | Sí | No | Sí | Por índice | Datos inmutables |
| **Set** `{}` | No | Sí | No | No indexado | Elementos únicos |

### Guía de elección rápida

- ¿Colección ordenada que puede cambiar? → **Lista**
- ¿Datos con nombres de campo (como una fila de base de datos)? → **Diccionario**
- ¿Datos que no deben cambiar? → **Tupla**
- ¿Eliminar duplicados u operar con conjuntos? → **Set**

:::{note}
En la próxima y última unidad integraremos todo lo aprendido para construir programas completos que resuelvan problemas empresariales reales.
:::
