# Módulo 2: Estructuras de Datos en Python

**Duración estimada:** 45 minutos

## Objetivos
- Dominar listas, tuplas, diccionarios y sets
- Entender las diferencias entre estructuras mutables e inmutables
- Aprender list comprehensions (muy importantes para ML)
- Trabajar con funciones y lambdas

## 2.1 Listas (Lists)

**Equivalente en Java:** `ArrayList<Object>`

Las listas son:
- Ordenadas (mantienen el orden de inserción)
- Mutables (se pueden modificar)
- Permiten duplicados
- Pueden contener tipos mixtos

In [None]:
# Creación de listas
lista_vacia = []
numeros = [1, 2, 3, 4, 5]
mixta = [1, "texto", 3.14, True, None]  # ¡Tipos mixtos!

print(f"Lista de números: {numeros}")
print(f"Lista mixta: {mixta}")
print(f"Longitud: {len(numeros)}")

### Indexación y Slicing

In [None]:
frutas = ["manzana", "banana", "cereza", "dátil", "elderberry"]

print(f"Primera fruta: {frutas[0]}")
print(f"Última fruta: {frutas[-1]}")        # Índice negativo
print(f"Penúltima: {frutas[-2]}")

# Slicing: lista[inicio:fin:paso]
print(f"\nPrimeras 3: {frutas[0:3]}")        # [0, 1, 2]
print(f"Desde índice 2: {frutas[2:]}")       # Desde 2 hasta el final
print(f"Hasta índice 3: {frutas[:3]}")       # Desde inicio hasta 3 (no incluido)
print(f"Cada 2 elementos: {frutas[::2]}")    # Con paso de 2
print(f"Lista invertida: {frutas[::-1]}")    # Paso negativo invierte

### Métodos de Listas

In [None]:
numeros = [1, 2, 3]

# Agregar elementos
numeros.append(4)          # Agrega al final
print(f"Después de append: {numeros}")

numeros.insert(0, 0)       # Inserta en posición específica
print(f"Después de insert: {numeros}")

numeros.extend([5, 6, 7])  # Agrega múltiples elementos
print(f"Después de extend: {numeros}")

# Eliminar elementos
numeros.remove(0)          # Elimina primera ocurrencia del valor
print(f"Después de remove: {numeros}")

ultimo = numeros.pop()     # Elimina y retorna el último elemento
print(f"Pop retornó: {ultimo}, lista: {numeros}")

elemento = numeros.pop(2)  # Pop en índice específico
print(f"Pop en índice 2: {elemento}, lista: {numeros}")

In [None]:
# Otros métodos útiles
numeros = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3]

print(f"Lista original: {numeros}")
print(f"Cuenta de 5s: {numeros.count(5)}")
print(f"Índice del 4: {numeros.index(4)}")

# Ordenar
numeros.sort()             # Ordena in-place (modifica la lista)
print(f"Lista ordenada: {numeros}")

numeros.reverse()          # Invierte in-place
print(f"Lista invertida: {numeros}")

# sorted() retorna una nueva lista ordenada (no modifica el original)
original = [3, 1, 4, 1, 5]
ordenada = sorted(original)
print(f"\nOriginal: {original}")
print(f"Ordenada (copia): {ordenada}")

### EJERCICIO 1: Manipulación de Listas

Dada la lista `temperaturas`, realiza las siguientes operaciones:
1. Calcula la temperatura promedio
2. Encuentra la temperatura máxima y mínima (usa `max()` y `min()`)
3. Cuenta cuántas temperaturas están por encima del promedio
4. Crea una nueva lista con solo las temperaturas mayores a 25°C

In [None]:
temperaturas = [22, 25, 19, 30, 28, 21, 26, 24, 29, 23]

# TU CÓDIGO AQUÍ
promedio = 
maxima = 
minima = 

# Contar temperaturas sobre el promedio
sobre_promedio = 

# Temperaturas mayores a 25
calurosas = 

print(f"Promedio: {promedio}°C")
print(f"Máxima: {maxima}°C, Mínima: {minima}°C")
print(f"Sobre el promedio: {sobre_promedio}")
print(f"Días calurosos (>25°C): {calurosas}")

## 2.2 Tuplas (Tuples)

**Diferencia clave:** Las tuplas son **inmutables** (como `final` en Java pero para toda la estructura)

- Ordenadas
- Inmutables (no se pueden modificar)
- Permiten duplicados
- Más rápidas que las listas

In [None]:
# Creación de tuplas
punto = (10, 20)                    # Coordenadas 2D
persona = ("Ana", 28, "Madrid")     # Tupla con tipos mixtos
singleton = (42,)                   # Tupla de un elemento (nota la coma)

print(f"Punto: {punto}")
print(f"Coordenada x: {punto[0]}, y: {punto[1]}")

# Desempaquetado de tuplas (tuple unpacking)
nombre, edad, ciudad = persona
print(f"\n{nombre} tiene {edad} años y vive en {ciudad}")

In [None]:
# Las tuplas son inmutables
tupla = (1, 2, 3)
# tupla[0] = 10  # Esto daría error: TypeError

# Pero puedes crear una nueva tupla
nueva_tupla = tupla + (4, 5)
print(f"Nueva tupla: {nueva_tupla}")

# Útil para retornar múltiples valores de funciones
def obtener_stats(lista):
    return min(lista), max(lista), sum(lista) / len(lista)

minimo, maximo, promedio = obtener_stats([1, 2, 3, 4, 5])
print(f"Min: {minimo}, Max: {maximo}, Prom: {promedio}")

## 2.3 Diccionarios (Dictionaries)

**Equivalente en Java:** `HashMap<K, V>`

- Pares clave-valor
- Mutables
- Claves únicas
- Búsqueda O(1) en promedio

In [None]:
# Creación de diccionarios
estudiante = {
    "nombre": "Carlos",
    "edad": 22,
    "carrera": "Informática",
    "notas": [8.5, 9.0, 7.5]
}

print(f"Estudiante: {estudiante}")
print(f"Nombre: {estudiante['nombre']}")
print(f"Edad: {estudiante['edad']}")

# Método get() - seguro (no da error si la clave no existe)
print(f"\nEmail: {estudiante.get('email', 'No disponible')}")

In [None]:
# Operaciones con diccionarios
dict_example = {"a": 1, "b": 2}

# Agregar/modificar
dict_example["c"] = 3        # Agregar nuevo par
dict_example["a"] = 10       # Modificar existente
print(f"Después de modificar: {dict_example}")

# Eliminar
del dict_example["b"]        # Eliminar clave
valor = dict_example.pop("c")  # Eliminar y retornar valor
print(f"Valor eliminado: {valor}")
print(f"Diccionario final: {dict_example}")

In [None]:
# Iterar sobre diccionarios
notas = {"Alice": 90, "Bob": 85, "Carol": 92, "David": 88}

print("Solo claves:")
for nombre in notas.keys():
    print(nombre, end=" ")

print("\n\nSolo valores:")
for nota in notas.values():
    print(nota, end=" ")

print("\n\nClaves y valores:")
for nombre, nota in notas.items():
    print(f"{nombre}: {nota}")

### EJERCICIO 2: Análisis de Texto con Diccionarios

Escribe un programa que:
1. Tome un texto (string)
2. Cuente la frecuencia de cada palabra
3. Muestre las 3 palabras más frecuentes

Pistas:
- Usa `.lower()` para normalizar
- Usa `.split()` para separar palabras
- Usa un diccionario para contar
- Usa `sorted()` con `key=lambda x: x[1]` para ordenar por valor

In [None]:
texto = """Python es un lenguaje de programación. Python es fácil de aprender.
Python es muy popular. Python se usa en ciencia de datos."""

# TU CÓDIGO AQUÍ
# 1. Convertir a minúsculas y separar en palabras
palabras = 

# 2. Contar frecuencias
frecuencias = {}

# 3. Encontrar las 3 más frecuentes


## 2.4 Sets (Conjuntos)

**Equivalente en Java:** `HashSet<T>`

- No ordenados
- Mutables
- Solo elementos únicos
- Operaciones de conjunto muy rápidas

In [None]:
# Creación de sets
numeros = {1, 2, 3, 4, 5}
duplicados = {1, 2, 2, 3, 3, 3}  # Automáticamente elimina duplicados
print(f"Set con duplicados: {duplicados}")  # {1, 2, 3}

# Convertir lista a set (elimina duplicados)
lista = [1, 2, 2, 3, 3, 3, 4, 5]
set_unico = set(lista)
print(f"Lista: {lista}")
print(f"Set (únicos): {set_unico}")

In [None]:
# Operaciones de conjuntos
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

print(f"A: {a}")
print(f"B: {b}")
print(f"\nUnión (A | B): {a | b}")
print(f"Intersección (A & B): {a & b}")
print(f"Diferencia (A - B): {a - b}")
print(f"Diferencia simétrica (A ^ B): {a ^ b}")

# Métodos
a.add(6)                   # Agregar elemento
print(f"\nDespués de add(6): {a}")

a.remove(1)                # Eliminar (da error si no existe)
a.discard(100)             # Eliminar (no da error si no existe)
print(f"Después de remove y discard: {a}")

## 2.5 Comprehensions (Muy importantes para ML)

Las comprehensions son una forma concisa y pythónica de crear colecciones.

### List Comprehensions

In [None]:
# Forma tradicional (como en Java)
cuadrados = []
for i in range(10):
    cuadrados.append(i ** 2)
print(f"Tradicional: {cuadrados}")

# List comprehension (pythónico)
cuadrados = [i ** 2 for i in range(10)]
print(f"Comprehension: {cuadrados}")

In [None]:
# Comprehension con condición
pares = [x for x in range(20) if x % 2 == 0]
print(f"Números pares: {pares}")

# Múltiples condiciones
divisibles = [x for x in range(30) if x % 2 == 0 if x % 3 == 0]
print(f"Divisibles por 2 y 3: {divisibles}")

# Comprehension con if-else (expresión ternaria)
clasificacion = ["Par" if x % 2 == 0 else "Impar" for x in range(10)]
print(f"Clasificación: {clasificacion}")

In [None]:
# Comprehensions anidadas (útil para matrices)
matriz = [[i * j for j in range(1, 4)] for i in range(1, 4)]
print("Tabla de multiplicar 3x3:")
for fila in matriz:
    print(fila)

### Dictionary y Set Comprehensions

In [None]:
# Dictionary comprehension
cuadrados_dict = {x: x**2 for x in range(6)}
print(f"Diccionario de cuadrados: {cuadrados_dict}")

# Set comprehension
cuadrados_set = {x**2 for x in range(-5, 6)}
print(f"Set de cuadrados: {cuadrados_set}")

# Filtrar diccionario
notas = {"Alice": 90, "Bob": 85, "Carol": 92, "David": 78}
aprobados = {k: v for k, v in notas.items() if v >= 80}
print(f"Aprobados (>=80): {aprobados}")

### EJERCICIO 3: Comprehensions Avanzadas

Usa comprehensions para:
1. Crear una lista con el cuadrado de los números impares del 1 al 20
2. Crear un diccionario que mapee cada número del 1 al 10 a su factorial
3. Dada una lista de strings, crear una nueva lista con las longitudes de cada string
4. Crear una matriz identidad 4x4 (unos en la diagonal, ceros en el resto)

In [None]:
import math

# 1. Cuadrados de impares
cuadrados_impares = 

# 2. Diccionario de factoriales
factoriales = 

# 3. Longitudes de strings
palabras = ["Python", "es", "genial", "para", "ciencia", "de", "datos"]
longitudes = 

# 4. Matriz identidad 4x4
identidad = 

print(f"Cuadrados impares: {cuadrados_impares}")
print(f"Factoriales: {factoriales}")
print(f"Longitudes: {longitudes}")
print("\nMatriz identidad:")
for fila in identidad:
    print(fila)

## 2.6 Funciones

### Funciones Básicas

In [None]:
# Función simple
def saludar(nombre):
    return f"Hola, {nombre}!"

# Función con parámetros por defecto
def potencia(base, exponente=2):
    return base ** exponente

# Función con múltiples retornos
def dividir(a, b):
    cociente = a // b
    resto = a % b
    return cociente, resto  # Retorna una tupla

print(saludar("Python"))
print(f"2^3 = {potencia(2, 3)}")
print(f"2^2 = {potencia(2)}")

q, r = dividir(17, 5)
print(f"17 ÷ 5 = {q} con resto {r}")

### Argumentos *args y **kwargs

In [None]:
# *args: número variable de argumentos posicionales
def sumar_todos(*args):
    return sum(args)

print(f"Suma: {sumar_todos(1, 2, 3, 4, 5)}")

# **kwargs: número variable de argumentos con nombre
def crear_perfil(**kwargs):
    for clave, valor in kwargs.items():
        print(f"{clave}: {valor}")

print("\nPerfil:")
crear_perfil(nombre="Ana", edad=25, ciudad="Madrid", profesion="Ingeniera")

### Funciones Lambda (Anónimas)

Similar a las expresiones lambda en Java 8+

In [None]:
# Función normal
def cuadrado(x):
    return x ** 2

# Lambda equivalente
cuadrado_lambda = lambda x: x ** 2

print(f"Función normal: {cuadrado(5)}")
print(f"Lambda: {cuadrado_lambda(5)}")

# Lambdas con múltiples argumentos
suma = lambda a, b: a + b
print(f"Suma lambda: {suma(3, 4)}")

### EJERCICIO 4: Funciones y Procesamiento de Datos

Crea las siguientes funciones:

1. `normalizar_lista(lista)`: Normaliza una lista de números al rango [0, 1]
   - Fórmula: (x - min) / (max - min)

2. `filtrar_outliers(lista, umbral=2)`: Elimina valores que estén a más de `umbral` desviaciones estándar de la media


Estas funciones son típicas en preprocessing de ML!

In [None]:
import statistics

def normalizar_lista(lista):
    # TU CÓDIGO AQUÍ
    pass

def filtrar_outliers(lista, umbral=2):
    # TU CÓDIGO AQUÍ
    # Pista: usa statistics.mean() y statistics.stdev()
    pass


# Prueba tus funciones
datos = [10, 20, 15, 100, 18, 22, 19]  # 100 es un outlier

print(f"Datos originales: {datos}")
print(f"Normalizados: {normalizar_lista(datos)}")
print(f"Sin outliers: {filtrar_outliers(datos)}")


## Resumen del Módulo 2

**Has aprendido:**
- Listas: mutables, ordenadas, indexables
- Tuplas: inmutables, para datos fijos
- Diccionarios: pares clave-valor, muy rápidos
- Sets: únicos, operaciones de conjuntos
- Slicing: `lista[inicio:fin:paso]`
- Comprehensions: forma pythónica y eficiente
- Funciones: def, lambda, *args, **kwargs

**Para ML y AIMA:**
- Las comprehensions son fundamentales para procesamiento de datos
- Los diccionarios se usan mucho para configuraciones y resultados
- Las funciones lambda son útiles con pandas y numpy

**Siguiente paso:** Programación Orientada a Objetos en Python