# Ayudantia 02 : Estructuras de Datos

## Ayudantes

* Julio Huerta
* Felipe Vidal
* Diego Toledo
* Alejandro Held
* Clemente Campos

## ¿ Que son las EDDs ?

Las **estructuras de datos** son formas de organizar y almacenar información en la memoria de una computadora para que sea fácil de acceder y manejar. Cada tipo de estructura tiene sus propias ventajas dependiendo de cómo se necesite acceder o modificar los datos. Podemos clasificarlas en dos grandes categorias:

1. **Secuenciales:** Corresponden a estructuras basadas en un ordenamiento secuencial de sus elementos, tipicamente se almacenan uno después del otro, en un orden específico segun como son ingresados. Permiten un acceso rápido y directo a cada elemento mediante su índice. Algunas estructuras de ejemplo en python son: `tuple`, `list` y `str`

2. **No Secuenciales:** Son aquellas estructuras donde los elementos no se almacenan en posiciones contiguas en la memoria, por lo cual sus elementos no estan en un orden fijo. A diferencia de las estructuras secuenciales, estas no permiten un recorrido en orden de la estructura. A pesar de esto, son muy eficiente en la búsqueda de datos. En python tenemos ejemplos como: `dict` y `set`



### Tuplas
Es una secuencia ordenanda de elementos **inmutable**, es decir, no pueden modificarse una vez creadas. Es útil para almacenar datos que no deben modificarse a lo largo del programa. Puede contener datos de distinto tipos.

In [7]:
# Creacion de Tuplas
a = (0, "1", 2.0)

b = 0, "1"

# tupla de un elemento
c = (0,)

print(a)
print(b)
print(c)

(0, '1', 2.0)
(0, '1')
(0,)


 Al ser inmutables, el programa arrojara un error al intentar modificarlas

In [8]:
a = tuple()
a.append(0)

AttributeError: 'tuple' object has no attribute 'append'


Al ser secuenciales como las listas y los strings, permiten trabajar con indice y notación slicing.


In [11]:
tupla = (0, 1, 2, 3, 4, 5, 6, 7, 8, 9)
print(f"tupla: {tupla}")

# Acceso por indice
a = tupla[9]
print(f"tupla[9] = {a}")

# elemento entre indices
a = tupla[0:5]
print(f"tupla[0:5] = {a}")

# elementos entre indices con saltos (2 en este caso)
a = tupla[0:8:2]
print(f"tupla[0:8:2] = {a}")

# elementos desde cierto indice hacia adelante o atras
a = tupla[5:]
b = tupla[:5]
print(f"tupla[5:] = {a}")
print(f"tupla[:5] = {b}")

# inversion de la tupla
a = tupla[::-1]
print(f"tupla[::-1] = {a}")

# ultimo elemento
a = tupla[-1]
print(f"tupla[:-1] = {a}")

tupla: (0, 1, 2, 3, 4, 5, 6, 7, 8, 9)
tupla[9] = 9
tupla[0:5] = (0, 1, 2, 3, 4)
tupla[0:8:2] = (0, 2, 4, 6)
tupla[5:] = (5, 6, 7, 8, 9)
tupla[:5] = (0, 1, 2, 3, 4)
tupla[::-1] = (9, 8, 7, 6, 5, 4, 3, 2, 1, 0)
tupla[:-1] = 9


### Stacks
Es una estructura de datos que sigue el principio **Lifo** (Last In, First Out), donde el último elemento agregado es el primero en ser retirado. Es util para manejar situaciones donde el orden de las operaciones es importante, como el historial de los navegadores web o en la reversión de acciones (`ctrl + z`). En Python podemos representar Stacks mediante listas.

In [17]:
# Crear Stack
stack = []
print(f"stack: {stack}")

# Push: agregar un elemento al stack
stack.append(0)
stack.append(1)
stack.append(2)
print(f"stack: {stack}")

# Pop: sacar y retornar el ultimo elemento del stack
ultimo = stack.pop()
print(f"Pop: {ultimo}")
print(f"stack: {stack}")

# Peek: retorna el ultimo elemento del stack sin extraerlo
peek = stack[-1]
print(f"Peek: {peek}")
print(f"stack: {stack}")


stack: []
stack: [0, 1, 2]
Pop: 2
stack: [0, 1]
Peek: 1
stack: [0, 1]


### Colas
Es una estructura de datos que sigue el principio **FIFO** (First In, First Out), donde el primer elemento agregado es el primero en ser retirado. Es similar a una fila en la vida real, donde el primero en llegar es el primero en ser atendido, son por lo tanto muy utilizadas en sistemas de atención al cliente. La implementación en Python viene dado por la clase `deque` del módulo `collections`.

In [21]:
# Creacion de una cola
from collections import deque

cola = deque()
print(f"cola: {cola}")


# Enqueue: Agrega elementos al final de la cola
cola.append(1)
cola.append(2)
cola.append(3)
print(f"cola: {cola}")

# Dequeue: Extraer y retornar el primer elemento de la cola
primero = cola.popleft()
print(f"elemento extraido: {primero}")
print(f"cola: {cola}")

cola: deque([])
cola: deque([1, 2, 3])
elemento extraido: 1
cola: deque([2, 3])


### Sets
Un `set` en Python es una colección desordenada de elementos únicos. Al ser una colección desordenada, no admite acceso por indice o notación slicing. Los sets son útiles cuando necesitas asegurarte de que no haya duplicados en una colección de datos, ademas son particularmente eficientes al realizar operaciones matemáticas de conjuntos como puede ser intersecciones, uniones o chequear si un elemento esta en el conjunto.

In [58]:
# Crear un set vacio
conjunto = set()

print(conjunto)

# Agregar elementos
conjunto.add("Julio")
conjunto.add("Felipe")
conjunto.add("Diego")
conjunto.add("Alejandro")
conjunto.add("Clemente")

print(conjunto)

set()
{'Clemente', 'Felipe', 'Diego', 'Julio', 'Alejandro'}


In [60]:
# En el set no existen elementos duplicados
conjunto = {"Julio", "Clemente", "Julio", "Julio", "Diego", 'Julio', 'Alejandro', "Julio", "Felipe"}

print(conjunto)

{'Clemente', 'Felipe', 'Diego', 'Julio', 'Alejandro'}


In [66]:
# Operaciones matematicas extremadamente eficientes
catedra = {'Clemente', 'Felipe', 'Diego', 'Julio', 'Alejandro'}
coordinadores = {'Catalina', 'Pia', 'Patricio', 'Amanda', 'Julio'}

# Pertenencia al conjunto
condicion1 = "Clemente" in catedra
print(f"Clemente esta en catedra?: {condicion1}")
condicion2 = "Clemente" in coordinadores
print(f"Clemente es coordinador?: {condicion2}")

# Union de conjuntos
ayudantes = catedra | coordinadores
print(f"ayudantes: {ayudantes}")

# Interseccion de conjuntos
interseccion = catedra & coordinadores
print(f"Algun coordinador es ayudante de catedra? {interseccion}")

# Diferencia de conjuntos
diferencia = catedra - coordinadores
print(f"Ayudantes de catedra que no son coordinadores: {diferencia}")

Clemente esta en catedra?: True
Clemente es coordinador?: False
ayudantes: {'Amanda', 'Clemente', 'Felipe', 'Catalina', 'Diego', 'Julio', 'Patricio', 'Pia', 'Alejandro'}
Algun coordinador es ayudante de catedra? {'Julio'}
Ayudantes de catedra que no son coordinadores: {'Diego', 'Clemente', 'Felipe', 'Alejandro'}


### Diccionarios
Es una estructura de datos que almacena pares **llave-valor**, donde cada llave es única y se asocia a un valor específico. En lugar de acceder a los elementos por un índice numérico, como en listas o tuplas, se accede a los valores utilizando las claves, lo que permite búesquedas rápidas y eficientes. Por lo tanto los diccionarios son especialmente utiles para almacenar datos donde cada elemento tiene una llave única (como el sistema de rut o numero de alumno) o al contar la recurrencia de palabras en un texto. En python son implementados por medios de la clase `dict`.

In [27]:
# Creacion de un diccionario vacio
plan_comun = dict()
plan_comun = {}

print(f"Plan Comun: {plan_comun}")


# Agregar elementos al diccionario
plan_comun["MAT1610"] = "Calculo1"
plan_comun["MAT1203"] = "Algebra Lineal"
plan_comun["ICS1113"] = "Optimizacion"
plan_comun["QIM100I"] = "Quimica General"
print(f"Plan Comun: {plan_comun}")


# Creacion de un diccionario con datos
cursos_dcc = {"IIC2233" : "Programacion Avanzada",
          "IIC1253" : "Matematicas Discretas",
          "IIC2143" : "Ingenieria de Software",
          "IIC2613" : "Inteligencia Artificial"}

print(f"Cursos DCC: {cursos_dcc}")

Plan Comun: {}
Plan Comun: {'MAT1610': 'Calculo1', 'MAT1203': 'Algebra Lineal', 'ICS1113': 'Optimizacion', 'QIM100I': 'Quimica General'}
Cursos DCC: {'IIC2233': 'Programacion Avanzada', 'IIC1253': 'Matematicas Discretas', 'IIC2143': 'Ingenieria de Software', 'IIC2613': 'Inteligencia Artificial'}


#### Elementos permitidos en el diccionario

* **Valores:** A diferencia de otros lenguajes, en Python los valores del diccionario pueden ser de todo tipo, tanto de objetos build-in, como en objetos creados por el programador.
  
* **LLaves:** Python solo permite ciertos datos como posibles llaves en el diccionario. En particular se busque que las llaves sean:

    1. *Unicas*: ya que al tener llaves con el mismo valor, puede llevar a errores como que dos valores diferentes sean asociadas a la misma llave
    2. *Hasheables*: Es un concepto deficil de definir (para más información ver los contenidos :D), pero lo que más nos importara, es que sean  no mutables. Esto significa que objetos como `int`, `str` y `tuple` puden usarse como llaves, mientras que `list` no puede ser usado.

In [26]:
# Diccionario con diferentes valores
diccionario = {"lista" : (0, 1, 2, 3),
               "Sigla" : "IIC2233",
               "Diccionario" : {}}

print(diccionario)

{'lista': (0, 1, 2, 3), 'Sigla': 'IIC2233', 'Diccionario': {}}


In [31]:
# Diccionario con diferentes llaves
diccionario = {1 : "Primero",
               "2" : "Segundo",
               (3,) : "Tercero"}

print(diccionario)
print(diccionario[(3,)])

{1: 'Primero', '2': 'Segundo', (3,): 'Tercero'}
Tercero


#### Metodos del diccionario
Algunos métodos útiles del diccionario son:

In [32]:
# Obtener las llaves de un diccionario
llaves = cursos_dcc.keys()
print(llaves)

# Obtener los valores de un diccionario
valores = cursos_dcc.values()
print(valores)

# Obtener los item (llave, valor) del diccionario
items = cursos_dcc.items()
print(items)

dict_keys(['IIC2233', 'IIC1253', 'IIC2143', 'IIC2613'])
dict_values(['Programacion Avanzada', 'Matematicas Discretas', 'Ingenieria de Software', 'Inteligencia Artificial'])
dict_items([('IIC2233', 'Programacion Avanzada'), ('IIC1253', 'Matematicas Discretas'), ('IIC2143', 'Ingenieria de Software'), ('IIC2613', 'Inteligencia Artificial')])


#### Iteración en un diccionario
Si iteramos sobre un diccionario en un ciclo `for` la iteración se realizara sobre las llaves del diccionario.

In [33]:
for llave in cursos_dcc:
    print(f"llave: {llave}")
    print(f"valor asociado: {cursos_dcc[llave]}")

llave: IIC2233
valor asociado: Programacion Avanzada
llave: IIC1253
valor asociado: Matematicas Discretas
llave: IIC2143
valor asociado: Ingenieria de Software
llave: IIC2613
valor asociado: Inteligencia Artificial


### Named Tuples
Son una extensión de las tuplas regulares, que permiten nombrar cada uno de los elementos de la tupla, dándoles una etiqueta que facilita el acceso y la comprensión del codigo. En lugar de acceder a los elementos por su posición, se accede por un nombre (como en los objetos), lo que hace que el codigo sea más legigle y claro.

In [38]:
# Creacion de una named tuple
from collections import namedtuple

# Creamos el molde, parecido a definir una clase
Curso = namedtuple("Curso_type", ["sigla", "nombre", "profesor", "cupos"])

# instanciacion de la named tuple, similar a crear un objeto de la clase
avanzada = Curso("IIC2233", "Programación Avanzada", "Cristian Ruz", 100)
print(f"NamedTuple:  {avanzada}")

# Ahora podemos acceder a sus atributos de la forma en que lo hacemos en objetos
print(f"Sigla:  {avanzada.sigla}")
print(f"Nombre:  {avanzada.nombre}")
print(f"Profesor:  {avanzada.profesor}")

NamedTuple:  Curso_type(sigla='IIC2233', nombre='Programación Avanzada', profesor='Cristian Ruz', cupos=100)
Sigla:  IIC2233
Nombre:  Programación Avanzada
Profesor:  Cristian Ruz


Al igual que las tuplas, las named tuple son inmutables. Es decir, que si queremos modificarlas, obtendremos un error.

In [39]:
avanzada.profesor = "Julio Huerta"

AttributeError: can't set attribute

### Argumentos
Son los valores que se pasan a una función cuando se ejecuta, estos argumentos son utilizados por la función o método para realizar tareas especificas, podemos clasificarlos en dos tipos

* **Argumentos posicionales** (`args`): son aquellos que se pasan a una función en un orden específico. El valor de cada argumento se asigna a un parámetro basado en su posición.

In [1]:
# funcion con argumentos posicionales
def sumador(a, b, c):
    return a + b**2 + c**3

resultado = sumador(1, 2, 3)
print(resultado)

32


* **Argumentos por palabra clave** (`kwars`): Son aquellos que se pasan a una función utilizando el nombre del parámetro. Esto permite especificar los valores sin tener que seguir el orden de los parámetros 

In [2]:
# funcion con argumentos por palabra clave
resultado = sumador(c=3, b=2, a=1)
print(resultado)

32


Es posible utilizar conjuntamente `args` y `kwargs`, pero se debe hacer en un orden especial. Este es: primero van todos los argumentos posicionales y luego aquellos por palabra clave, de otra forma, dara un error.

In [45]:
resultado = sumador(1, c=3, b=2)
print(resultado)

32


In [46]:
resultado = sumador(C=3, 1, 2)

SyntaxError: positional argument follows keyword argument (1867695460.py, line 1)

### Desempaquetamiento de EDDs

Es posible hacer un llamado a funciones que reciben multiples argumentos con los datos contenidos en una estructura, pero debemos tener cierto cuidado al hacerlo. Por ejemplo la función `randint` del modulo `random`, recibe dos argumentos donde `a` es el número menor y `b` el número mayor, la función retorna un `int` aleatorio entre este rango numerico.

In [3]:
from random import randint, seed
seed(2233) # para replicar resultados aleatorios

numero = randint(0,100)
print(numero)

64


In [4]:
rango = (0, 100)
numero = randint(rango)
print(numero)

TypeError: Random.randint() missing 1 required positional argument: 'b'

#### ¿ Que nos paso ?
Lo que sucede, es que python detecta la tupla como un solo argumento, por lo tanto nos indica que le falta un segundo argumento `b`. Podemos solucionar esto por medio de los operadores `*`y `**`, los cuales nos permitiran desempacar el contenido de la estructura.

* `*args`: Permite declarar una cantidad arbitraría de argumentos **posicionales**. Para esto debemos pasarle los argumentos *en el orden que los espera la funcion*
* `**kwargs`: Permite declarar una cantidad arbitraría de argumentos **por palabra clave**. Para esto debemos usar *el nombre de los parametros de la funcion*

In [53]:
# Argumentos posicionales
rango = (0, 100)
numero = randint(*rango)
print(numero)

12


In [54]:
# Error debido a que randint espera que a < b
rango = (100, 0)
numero = randint(*rango)
print(numero)

ValueError: empty range for randrange() (100, 1, -99)

In [55]:
# Argumentos por palabra clave
valores = { "a": 0, "b": 100}
numero = randint(**valores)
print(numero)

26


In [56]:
# Nombres que no espera la funcion
valores = { "a": 0, "c": 100}
numero = randint(**valores)
print(numero)

TypeError: Random.randint() got an unexpected keyword argument 'c'