
# Colecciones en Python — Qué son, tipos, funciones habituales y ejemplos reales (IFCD104)

Este cuaderno explica **solo**:
- Qué son las **colecciones**.
- Sus **tipos principales**: `list`, `tuple`, `set`/`frozenset`, `dict`.
- Las **funciones y métodos habituales** para cada una.
- **Ejemplos de uso reales** y prácticos.

> Nota: No incluye teoría ajena a colecciones ni ejercicios guiados; es una guía de referencia práctica.



## 1) ¿Qué es una colección?
Una **colección** es un tipo de dato que **agrupa** varios valores bajo una sola variable. Python ofrece varias, con propiedades distintas:

| Tipo | Mutabilidad | Orden | Duplicados | Acceso | Sintaxis literal | Uso típico |
|---|---|---|---|---|---|---|
| `list` | ✅ mutable | ✅ orden inserción | ✅ | índice (`L[i]`) | `[1,2,3]` | Secuencias editables, colas/pilas |
| `tuple` | ❌ inmutable | ✅ orden inserción | ✅ | índice (`t[i]`) | `(1,2,3)` | Registros inmutables, retorno múltiple, claves compuestas |
| `set` | ✅ mutable | ⚠️ sin orden | ❌ | — (pertenencia) | `{1,2,3}` | Unicidad, operaciones de conjuntos, deduplicar |
| `frozenset` | ❌ inmutable | ⚠️ sin orden | ❌ | — | `frozenset({...})` | Elemento de `set`, clave de `dict` (hashable) |
| `dict` | ✅ mutable | ✅ orden inserción | ❌ (claves únicas) | por clave (`d['k']`) | `{"k": "v"}` | Mapeos clave→valor (tipo JSON), índices |



## 2) Listas (`list`)
**Qué son**: Secuencias **mutables y ordenadas** que aceptan duplicados y tipos mixtos.

**Funciones/métodos habituales**
- Crear/convertir: `list(iterable)`  
- Tamaño y pertenencia: `len(L)`, `x in L`  
- Acceso/slices: `L[i]`, `L[a:b:c]`  
- Añadir: `append(x)`, `extend(iter)`, `insert(i,x)`  
- Quitar: `remove(x)`, `pop([i])`, `clear()`  
- Buscar/contar: `index(x[,i[,j]])`, `count(x)`  
- Ordenar/invertir: `sort(key=None, reverse=False)`, `reverse()`; y las variantes que devuelven nueva lista: `sorted(iterable)`, `list(reversed(iterable))`  
- Copias: `L.copy()`, `L[:]` (superficial)  
- Otras: concatenación `+`, repetición `*`, asignación por *slice*, `del`



**Ejemplos reales**
- **Cola de tareas** simple (añadir y procesar):

In [1]:

tareas = []
# Llegan tareas
tareas.append("importar_datos.csv")
tareas.extend(["limpiar_nulos", "generar_informe"])
# Procesar (FIFO simple)
siguiente = tareas.pop(0)
print(f"Procesando: {siguiente}")
print("Pendientes:", tareas)

Procesando: importar_datos.csv
Pendientes: ['limpiar_nulos', 'generar_informe']


- **Ordenar registros por un campo** (p. ej., fecha o prioridad):

In [None]:
# Versión solo con listas: [id, prio]
tickets = [
    [3, 2],
    [1, 1],
    [2, 3],
]

# Ordenar por prioridad (menor primero)
ordenados = sorted(tickets, key=lambda t: t[1])
print(ordenados)  # [[1, 1], [3, 2], [2, 3]]



- **Filtrar y transformar** (comprensiones):

In [None]:

precios = [10, 0, 25, 8, 0, 15]
con_descuento = [p*0.9 for p in precios if p > 0]  # ignora 0 y aplica -10%
print(con_descuento)


## 3) Tuplas (`tuple`)
**Qué son**: Secuencias **inmutables y ordenadas**; eficaces para representar **registros** (datos que no cambian).

**Funciones/métodos habituales**
- Crear/convertir: `tuple(iterable)`  
- Tamaño y pertenencia: `len(t)`, `x in t`  
- Acceso/slices: `t[i]`, `t[a:b:c]`  
- Métodos: `count(x)`, `index(x[,i[,j]])`  
- *Packing/Unpacking*: `p = (x, y)`, `x, y = p` (incluye *star-unpacking*)  
- Operadores: concatenar `+`, repetir `*`



**Ejemplos reales**
- **Coordenadas** y cálculo sin mutaciones:

In [3]:

import math
p = (3, 4)       # (x,y)
x, y = p
dist = math.hypot(x, y)
print(f"dist={dist:.2f}")

dist=5.00



- **Retorno múltiple** y **swap** de variables:

In [None]:

def min_max(nums):
    return min(nums), max(nums)   # retorna una tupla

mn, mx = min_max([3,1,7,2])
a, b = 10, 20
a, b = b, a   # swap con tuplas
print(f"mn={mn}, mx={mx}, swap-> a={a}, b={b}")


- **Claves compuestas** (tuplas hashables) en diccionarios:

In [None]:

habitantes = {("ES","MAD"): 3.2, ("ES","BCN"): 1.6}
print(habitantes[("ES","MAD")], "millones")


## 4) Conjuntos (`set`) y conjuntos inmutables (`frozenset`)
**Qué son**: Colecciones **sin orden y sin duplicados**. `set` es **mutable**; `frozenset` es **inmutable** y por tanto **hashable**.

**Funciones/métodos habituales de `set`**
- Crear/convertir: `set(iterable)`  
- Añadir/quitar: `add(x)`, `update(iter)`, `remove(x)`, `discard(x)`, `pop()`, `clear()`  
- Operaciones de conjuntos: `union` (`|`), `intersection` (`&`), `difference` (`-`), `symmetric_difference` (`^`)  
- Relaciones: `issubset` (`<=`), `issuperset` (`>=`), `isdisjoint()`  
- Copia: `copy()`  
**`frozenset(iterable)`**: igual que `set` pero **inmutable** (apto como clave o elemento de otro set).



**Ejemplos reales**
- **Deduplicar** rápidamente (ojo: pierde orden):

In [None]:

emails = ["a@x.com","b@x.com","a@x.com","c@x.com"]
unicos = set(emails)  # {'a@x.com','b@x.com','c@x.com'} (orden no garantizado)
print(unicos)


- **Mantener orden** mientras deduplicas (mezclando lista + set de vistos):

In [None]:

visto = set()
dedup_orden = []
for e in emails:
    if e not in visto:
        dedup_orden.append(e)
        visto.add(e)
print(dedup_orden)


- **Intersección de permisos/roles** entre usuarios:

In [None]:

roles_alice = {"lectura","edicion","exportar"}
roles_bob   = {"lectura","comentarios"}
comunes = roles_alice & roles_bob
solo_alice = roles_alice - roles_bob
print("comunes:", comunes, "| solo_alice:", solo_alice)


- **`frozenset` como clave de diccionario** (por ser hashable):

In [None]:

permisos_combo = {
    frozenset({"lectura","edicion"}): "Plan PRO",
    frozenset({"lectura"}): "Plan BASIC"
}
print(permisos_combo[frozenset({'lectura'})])


## 5) Diccionarios (`dict`)
**Qué son**: Mapeos **clave→valor**. Claves **hashables** y únicas; mantienen **orden de inserción**.

**Funciones/métodos habituales**
- Crear/convertir: `dict()`, literales `{clave: valor}`  
- Acceso/inserción/actualización: `d[k]`, `d[k]=v`, `update(...)`  
- Lectura segura: `get(k[, default])`, `setdefault(k[, default])`  
- Vistas: `keys()`, `values()`, `items()`  
- Quitar: `pop(k[, default])`, `popitem()`, `clear()`  
- Constructores: `dict.fromkeys(iter[, v])`  
- Copia: `copy()` (superficial)



**Ejemplos reales**
- **Conteo de frecuencias** (palabras):

In [None]:

texto = "hola hola adios hola que tal adios"
frecuencias = {}
for palabra in texto.split():
    frecuencias[palabra] = frecuencias.get(palabra, 0) + 1
print(frecuencias)


- **Índice por id** (acceso O(1) a registros):

In [None]:

usuarios = [
    {"id": 100, "nombre": "Ana"},
    {"id": 200, "nombre": "Luis"},
]
por_id = {u["id"]: u for u in usuarios}
print(por_id[200])


- **Agrupar por clave** (p. ej., dominio de email):

In [None]:

emails = ["ana@x.com","luis@y.com","eva@x.com"]
grupos = {}
for e in emails:
    dominio = e.split("@")[1]
    grupos.setdefault(dominio, []).append(e)
print(grupos)


## 6) ¿Cuál elijo? — Reglas rápidas
- Quieres **orden** y **editar** → `list`  
- Quieres **orden** y **no editar** (registro fijo) → `tuple`  
- Quieres **unicidad** / **pertenencia rápida** → `set` (o `frozenset` si necesitas inmutabilidad/clave)  
- Quieres datos **etiquetados por clave** → `dict`



## 7) Pitfalls (trampas) y buenas prácticas
- **Mutabilidad compartida**: `B = A` no copia; es un **alias**. Usa `copy()` para copiar (superficial) o `copy.deepcopy()` si hay anidados mutables.
- **`set` sin orden**: no dependas del orden; si necesitas deduplicar **y** mantener orden, usa un patrón con `visto` (como antes).
- **Multiplicar listas anidadas**: `mat = [[0,0]] * 3` duplica referencias; usa `[fila.copy() for _ in range(3)]`.
- **Claves de `dict`**: deben ser **hashables** (por ejemplo, tuplas de hashables, `frozenset`, `str`, `int`, etc.).
