# Bloque 1 — Estructuras de Datos en Python
**Curso:** Fundamentos de Programación y Analítica de Datos con Python  
**Duración estimada del bloque:** 2 horas

## Objetivos específicos
- Identificar y describir las características formales de listas, tuplas, diccionarios y conjuntos.
- Manipular estructuras de datos nativas mediante operaciones básicas (inserción, eliminación, actualización, consulta).
- Seleccionar la estructura de datos adecuada según el caso de uso (orden, mutabilidad, unicidad, acceso por clave).
- Implementar ejemplos funcionales y pedagógicos que demuestren comprensión de los conceptos.
- Reconocer errores comunes y aplicar buenas prácticas de uso en código Python.

## Prerrequisitos
- Conocimientos básicos de sintaxis de Python (variables, tipos primitivos, operaciones aritméticas y lógicas, `print`).
- Entorno configurado con Python ≥ 3.11, preferiblemente 3.12.x, y Jupyter/VSCode.


## Tema 1 — Listas (`list`)

### Definición
Una **lista** es una secuencia **ordenada** y **mutable** de elementos. Permite contener valores heterogéneos y soporta operaciones de inserción, eliminación, actualización y recorrido por índice.

### Importancia en programación y analítica de datos
- Estructura base para colecciones secuenciales, ideal para **acumular resultados**, **recorrer registros** y **aplicar transformaciones**.
- Frecuente en ETL/ELT: lectura de filas, preprocesamiento y carga hacia estructuras tabulares (antes de Pandas).
- Sirve como puente hacia estructuras de mayor nivel (p. ej., convertir listas de diccionarios a `DataFrame`).

### Buenas prácticas y errores comunes
- **Buenas prácticas:**
  - Usar **comprensiones de listas** para transformaciones claras y concisas.
  - Preferir **métodos específicos** (`append`, `extend`, `insert`, `remove`) para operaciones controladas.
  - Documentar el **invariante** (qué tipo de elementos esperamos).
- **Errores comunes:**
  - Modificar una lista mientras se itera sobre ella (puede omitir elementos). En su lugar, crear una nueva lista filtrada.
  - Usar `+` repetidamente en bucles grandes (coste acumulado). Considerar `extend` o comprensiones.


In [None]:

# TODO: Ejemplo de Listas

## Tema 2 — Tuplas (`tuple`)

### Definición
Una **tupla** es una secuencia **ordenada** e **inmutable**. Tras su creación, sus elementos no pueden modificarse. Es adecuada para representar **registros** o **coordenadas** con estructura fija.

### Importancia en programación y analítica de datos
- Útiles para **empaquetar/desempaquetar** valores y para **claves** en estructuras como **diccionarios**.
- Su inmutabilidad puede servir como **contrato**: indica que un conjunto de valores no cambiará.

### Buenas prácticas y errores comunes
- **Buenas prácticas:** usar tuplas para datos **posicionales** y de **longitud fija**; nombrar las variables al desempaquetar para claridad.
- **Errores comunes:** forzar la tupla donde se requiere mutabilidad; en ese caso, una lista es más apropiada.


In [None]:

# TODO: Ejemplo de Tuplas

## Tema 3 — Diccionarios (`dict`)

### Definición
Un **diccionario** es una colección de **pares clave–valor**, no ordenada en versiones antiguas y de **inserción ordenada** desde Python 3.7+. Las claves deben ser **hashables** (inmutables o con un `__hash__` estable).

### Importancia en programación y analítica de datos
- Base para estructuras estilo **JSON** y para **configuración**.
- Facilita accesos directos por clave y modelado de **registros** o **entidades**.

### Buenas prácticas y errores comunes
- **Buenas prácticas:** usar `get` con valores por defecto; `dict`/`update` para fusiones controladas; **comprensiones** para transformar.
- **Errores comunes:** asumir la existencia de una clave sin validarla; usar claves mutables (p. ej., listas).


In [None]:

# TODO: Ejemplo de Diccionarios

## Tema 4 — Conjuntos (`set` y `frozenset`)

### Definición
Un **conjunto** es una colección **no ordenada** de elementos **únicos**. `set` es mutable y `frozenset` es inmutable (hashable).

### Importancia en programación y analítica de datos
- Eliminación de **duplicados**, operaciones de **teoría de conjuntos** (unión, intersección, diferencia).
- Chequeos de pertenencia eficientes y deduplicación previa a análisis o uniones tabulares.

### Buenas prácticas y errores comunes
- **Buenas prácticas:** convertir listas a `set` para eliminar duplicados; usar operaciones de conjuntos para filtros rápidos.
- **Errores comunes:** asumir orden o indexación; si se necesita orden estable, considerar `list(dict.fromkeys(seq))` para deduplicar preservando orden.


In [None]:

# TODO: Ejemplo de Conjuntos

# Ejercicios Integradores

A continuación, se presentan ejercicios que integran **listas, tuplas, diccionarios y conjuntos**. Cada ejercicio incluye contexto, datos/entradas, requerimientos, criterios de aceptación y pistas.


## Ejercicio 1 — Catálogo de productos único

**Contexto técnico:** Eres parte de un equipo de analítica que necesita consolidar un catálogo de productos sin duplicados para preparar un análisis de ventas. Debes deduplicar códigos y preparar una estructura limpia para exportación.

**Datos/entradas:**  
- Lista de códigos con repetidos: `["A1", "B2", "A1", "C3", "B2", "D4"]`  
- Lista paralela de precios: `[100, 80, 100, 120, 80, 150]` (alineada por índice)

**Requerimientos:**  
1. Deduplicar los códigos preservando el primer precio visto.  
2. Construir una lista de diccionarios con claves `codigo` y `precio`.  
3. Calcular el conjunto de códigos únicos y su cardinalidad.

**Criterios de aceptación:**  
- La lista final no contiene repeticiones y mantiene el primer precio observado para cada código.  
- El conteo de únicos coincide con el tamaño del conjunto.  

**Pistas:**  
- Considera `dict.fromkeys` para preservar orden sin duplicados o un bucle que acumule vistos.  
- Puedes usar `zip` para iterar en paralelo.


In [None]:

# TODO: Solución propuesta Ejercicio 1

## Ejercicio 2 — Geolocalización con tuplas

**Contexto técnico:** Te asignan normalizar ubicaciones capturadas por un sensor que devuelve pares `(lat, lon)`. Debes validar y transformar datos para un módulo de mapas.

**Datos/entradas:**  
- Lista de tuplas: `[(4.65, -74.05), (999, 20.0), (48.85, 2.35)]`

**Requerimientos:**  
1. Filtrar tuplas inválidas: latitud debe estar en [-90, 90], longitud en [-180, 180].  
2. Construir un diccionario con claves `"validas"` y `"invalidas"` mapeando a listas de tuplas.  
3. Obtener, a partir de las válidas, una lista de latitudes y otra de longitudes.

**Criterios de aceptación:**  
- Solo se consideran válidas las tuplas dentro de los rangos indicados.  
- Las listas de latitudes/longitudes conservan el orden de aparición.

**Pistas:**  
- Usa **desempaquetado** de tuplas y condiciones lógicas.  
- Considera comprensiones de listas para las proyecciones de lat/lon.


In [None]:

# TODO: Solución propuesta Ejercicio 2

## Ejercicio 3 — Panel mínimo de estudiantes

**Contexto técnico:** Como analista académico, necesitas construir una estructura para un panel simple que consolide información de estudiantes y métricas derivadas para un reporte rápido.

**Datos/entradas:**  
- Lista de nombres: `["Ana", "Luis", "Marta", "Ana"]`  
- Lista de edades: `[21, 23, 22, 21]`

**Requerimientos:**  
1. Crear una lista de **diccionarios** con claves `nombre` y `edad`, preservando el orden.  
2. Construir un **conjunto** de nombres únicos para dimensionar el universo.  
3. Calcular la **edad promedio** y la **edad máxima**.

**Criterios de aceptación:**  
- La estructura por filas está alineada por índice correctamente.  
- Los nombres únicos se calculan con `set` y corresponden con lo esperado.  
- Las métricas se calculan con precisión (usar `round` si es necesario).

**Pistas:**  
- Usa `zip` y `dict` para normalizar filas.  
- Considera `sum`/`len` para el promedio y `max` para el valor máximo.


In [None]:

# TODO: Solución propuesta Ejercicio 3

## Ejercicio 4 — Normalización de etiquetas para un pipeline

**Contexto técnico:** En un pipeline de clasificación de texto, recibes etiquetas ruidosas con repetidos y mayúsculas/minúsculas mezcladas. Necesitas normalizarlas para construir un vocabulario base.

**Datos/entradas:**  
- Lista de etiquetas: `["Spam", "spam", "Ham", "SPAM", "ham", "Spam"]`

**Requerimientos:**  
1. Normalizar a minúsculas y deduplicar preservando el orden de primera aparición.  
2. Construir un **diccionario** con:
   - `"vocabulario"` → lista de etiquetas normalizadas únicas.
   - `"indice"` → diccionario que mapea etiqueta → índice (posición en vocabulario).
3. Validar pertenencia con un **conjunto** auxiliar para O(1) promedio.

**Criterios de aceptación:**  
- `vocabulario` queda como `["spam", "ham"]`.  
- `indice` debe ser `{"spam": 0, "ham": 1}`.

**Pistas:**  
- Considera `str.lower`, `dict.fromkeys` y comprensiones.  
- El conjunto puede ayudar a verificar si ya has visto una etiqueta.


In [None]:

# TODO: Solución propuesta Ejercicio 4