<a href="https://colab.research.google.com/github/RodolfoFigueroa/madi2022-1/blob/main/3_Conociendo_Estructuras_de_Datos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

En esta sesión veremos algunas de las estructuras de datos más usadas, en algunos casos veremos cómo se implentan, y también veremos ejemplos concretos en donde usemos al menos una de ellas.

Nos vamos a centrar en cuatro estructuras de datos principalmente: pilas, colas y diccionarios.

**Pilas.** Se dice que funcionan bajo el principio LIFO: last-in, first-out. Lo que esto quiere decir es que cada que sacamos un elemento de nuestra pila, se nos devolverá el último elemento que fue introducido. Hay múltiples formas de implementar una pila en Python,  veremos dos de ellas:

*Usando listas.* Las listas en Python tienen las operaciones que caracterizan a una pila: 

*   $Append$. Nos permite insertar un nuevo elemento a la lista.
*   $Pop$. Nos devuelve el valor del último elemento que fue insertado en la pila, y lo elimina de ésta.



In [None]:
Pila = []

Pila.append('Hola')
Pila.append(10)

print(Pila)

print(Pila.pop())
Pila.append('Dos')
Pila.append(100)
Pila.append(5)

print(Pila)

print(Pila.pop())
print(Pila.pop())

print(Pila)

['Hola', 10]
10
['Hola', 'Dos', 100, 5]
5
100
['Hola', 'Dos']


Una gran desventaja de implementar una pila de esta forma, es que las forma en la que están implementadas las listas de Python hacen que la complejidad de append y pop sea $O(n)$ en cuanto a tiempo.

Otra forma de implementar una pila en Python es usando la estructura $deque$, la cual, a diferencia de una lista, nos permite hacer las operaciones deseadas en tiempo constante.

In [None]:
from collections import deque

Pila2 = deque()

Pila2.append('Hola')
Pila2.append(10)

print(Pila2)

print(Pila2.pop())
Pila2.append('Dos')
Pila2.append(100)
Pila2.append(5)

print(Pila2)

print(Pila2.pop())
print(Pila2.pop())

print(Pila2)

deque(['Hola', 10])
10
deque(['Hola', 'Dos', 100, 5])
5
100
deque(['Hola', 'Dos'])


Veamos un ejemplo en el que es muy útil esta estructura. Consideremos el siguiente problema:

Dado un histograma (gráfica de barras) donde cada barra tiene una altura entera no negativa, encuentra el rectángulo (formado por barras consecutivas) con mayor área posible. 

Un primer algoritmo para resolver este problema podría ser encontrar para cada altura posible, el rectángulo más largo con dicha altura. Esto en principio puede costarnos tiempo cuadrático en resolver.

¿Qué pasa si para cada barra del histograma calculamos el rectángulo más largo tal que esta barra es la más corta que aparece? Esto en efecto nos permite encontrar el rectángulo de mayor área, y nos basta con encontrar para cada barra, las primeras barras a su izquierda y a su derecha que son más chicas que ella.

Entonces hemos transformado nuestro problema al siguiente:
Dada una lista de enteros, determinar para cada entero de la lista, cuál es el primero número a su derecha que es menor que él.

Para esto es para lo que utilizaremos una pila, siguiendo los siguientes pasos:

*   Creamos una pila $P$, y comenzamos a recorrer los elementos de nuestra lista de izquierda a derecha.
*   En cada paso de este recorrido, tenemos dos posibilidades:
  *   Si $P$ está vacía, le agregarmos el elemento que está visitando.
  *   Si $P$ no está vacía, comprobamos si el último elemento de la pila es mayor que el elemento que estamos visitando, de ser así, sacamos a dicho elemento de la pila y le asignamos la posición del elemento en el que estamos, y repetimos este proceso hasta que $P$ quede vacía o que el último elemento de $P$ sea menor o igual que el actual. Finalmente, insertamos el elemento actual a la pila $P$.
* Si ya recorrimos todos los elementos de la lista, y $P$ no está vacía, a todos los elementos de $P$ les asignamos una posición más allá del final de la lista.


Este algoritmo nos permite identificar cuál es el primer elemento a su derecha que es menor que él. Pero nosotros queremos encontrar esto tanto para la izquierda como para la derecha. ¿Qué hacer? Repetimos el algoritmo, pero ahora iteramos nuestra lista de derecha a izquierda.

Finalmente, para cada barra en el histograma, calculamos el área del rectángulo que la tiene como la barra más chica, y actualizamos un máximo sobre las áreas calculadas.



In [None]:
Hist = [6, 2, 5, 4, 5, 1, 6]

left = [-1]*len(Hist) # Guarda la posición del menor elemento a la izquierda
right = [len(Hist)] * len(Hist) # Guarda la posición del menor elemento a la derecha
stack = deque()

def find_right():
  for i in range(0, len(Hist)):
    while(stack and stack[-1][0] > Hist[i]):
      right[stack[-1][1]] = i
      stack.pop()
    stack.append((Hist[i], i))
  stack.clear() #Borramos todos los elementos restantes
  return

def find_left():
  for i in range(len(Hist) - 1, -1, -1):
    while(stack and stack[-1][0] > Hist[i]):
      left[stack[-1][1]] = i
      stack.pop()
    stack.append((Hist[i], i))
  return

find_left()
find_right()

max_area = 0

for i in range(0, len(Hist)):
  b = right[i] - left[i] - 1
  A = b*Hist[i]
  if(A > max_area):
    max_area = A


print(max_area)

12


Queda como ejercicio determinar las complejidades en tiempo y espacio del algoritmo presentado. 

**Colas.** Se dice que funcionan bajo el principio FIFO: first-in, first-out. Lo que esto quiere decir es que cada que sacamos un elemento de nuestra cola, se nos devolverá el primer elemento que fue introducido (funciona como la fila para comprar las tortillas). En el algoritmo de BFS ya vimos cómo se usa una estructura como esta, usando la estructura $deque$:


In [None]:
Cola = deque()

Cola.append('Hola')
Cola.append(10)

print(Cola)

print(Cola.popleft())
Cola.append('Dos')
Cola.append(100)
Cola.append(5)

print(Cola)

print(Cola.popleft())
print(Cola.popleft())

print(Cola)

deque(['Hola', 10])
Hola
deque([10, 'Dos', 100, 5])
10
Dos
deque([100, 5])


**Diccionarios** Un diccionario es un conjunto de objetos que constan de una llave (key) y un objeto asignado a dicha llave. Veamos cómo definir un diccionario en Python y consultar sus elementos:

In [None]:
dic = {'key1' : 2, 'key2' : 'hola', 3 : 'salida', 4 : 123}

print(dic)
print(dic[3])
dic['key1'] = 4
print(dic['key1'])
# print(dic[2]) si usamos una llave que no existe se obtiene un error

# Podemos checar si determinada llave existe o no en el diccionario
if(2 in dic):
  print('El valor de la llave es :', dic[2])
else : 
  dic[2] = 'Llave agregada'
  print('Se agregó la llave')

# También podemos remover una llave en específico
dic.pop(3)

print(dic)

{'key1': 2, 'key2': 'hola', 3: 'salida', 4: 123}
salida
4
Se agregó la llave
{'key1': 4, 'key2': 'hola', 4: 123, 2: 'Llave agregada'}


Veamos ahora un ejemplo de un algoritmo en donde el uso de esta estructura nos facilita las cosas.

Consideremos el siguiente problema: tenemos una lista de números $L$ y un número $s$, se quiere determinar si existen dos elementos de $L$ tales que su suma sea $s$, en caso de existir, imprime las posiciones de dichos elementos en $L$.

Una primer idea para atacar este problema sería iterar sobre todas las parejas posibles y verificar si su suma es $s$. Sin embargo, un diccionario nos permite reducir la complejidad del algoritmo de 'fuerza bruta'. Vamos a iterar sobre los elementos de $L$, y en cada momento, si estamos en el elemento $a$, verificamos si la llave $s-a$ existe en el diccionario, de ser así, hemos encontrado una pareja que cumple lo deseado. En caso contrario, agredamos la llave $a$ con valor la posición de $a$ al diccionario. 

In [None]:
L = [1, 5, 2, 7, 8, 12, 18, 32, 21, 42, 10]

dic = {}

def suma_parejas(s):
  for i in range (0, len(L)):
    if(s - L[i] in dic):
      print("Los valores en posición :", dic[s - L[i]] + 1, " y ", i + 1, "suman ", s)
      return True
    else:
      dic[L[i]] = i
  return False

if(not suma_parejas(28)):
  print("No existen parejas que sumen ", s)

Los valores en posición : 4  y  9 suman  28


Para conocer más operaciones que se pueden hacer en las estructuras de datos más comunes, así como las complejidades de estas, pueden consultar la páigna https://wiki.python.org/moin/TimeComplexity

**Ejercicios**


1.   Determina y argumenta las complejidades en tiempo y espacio del algoritmo para el área máxima de un rectángulo en un histograma. 
2.   Podemos pensar de cierta forma, que los algoritmos de BFS y DFS son 'duales', mientras que las estructuras de pila y cola también son 'duales'. Nuestra implementación de BFS fue usando una cola, implementa el algoritmo de DFS usando una pila.
3. Dada una lista de números $L$ (puede que no esté ordenada) y un número $d$, se quiere determinar si existen dos elementos de $L$ tales que su diferencia sea $d$, en caso de existir, imprime las posiciones de dichos elementos en $L$. Verifica tu algoritmo con la lista $L = [1, 5, 9, 14, 18, 24, 27, 32, 35]$, para $d = 1, 4, 14, 19, 20$.


*Ejercicio 1.* Aquí va la respuesta argumentada del primer ejercicio.

*Ejercicio 2.* Nota que en lugar de llamar a la función DFS de manera recursiva, se puede implementar usando por ejemplo un ciclo $while$ al igual que se hizo con el BFS.

In [None]:
# (Aquí va tu código de DFS usando una pila)

*Ejercicio 3.* Describe a continuación los pasos de tu algoritmo.

In [None]:
# (Aquí va el código del algoritmo que describiste)