<a href="https://colab.research.google.com/github/RodolfoFigueroa/madi2022-1/blob/main/5_Mas_estructuras_de_datos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

En esta sesión nos enfocaremos en estudiar dos estructuras de datos que también son muy utilizadas: colas de prioridad y strings.



**Colas de prioridad.** Una cola de prioridad es un tipo especial de cola, que nos permite ir insertando elementos, asignándoles determinada prioridad, de modo que cada que consultemos el elemento en la 'cima' de la cola de prioridad, obtenemos el elemento de menor (o mayor) prioridad. Veamos dos ejemplos de cómo implementar una cola de prioridad en Python. El primero es importando una función que trabaja sobre una lista, y el segundo es definiendo nuestra cola de prioridad como una nueva estructura.

In [None]:
import heapq

PQ = []

# Vamos insertando elementos, donde la primer entrada corresponde a la prioridad asignada al elemento de la segunda entrada
heapq.heappush(PQ, (1, 'menor prioridad')) 
heapq.heappush(PQ, (2, 2))
heapq.heappush(PQ, (5, 'Hola'))
heapq.heappush(PQ, (3, 'Probando'))
heapq.heappush(PQ, (4, 4))

print(PQ)

while(PQ):
  print(heapq.heappop(PQ)[1])

[(1, 'menor prioridad'), (2, 2), (5, 'Hola'), (3, 'Probando'), (4, 4)]
menor prioridad
2
Probando
4
Hola


In [None]:
from queue import PriorityQueue 

PQ2 = PriorityQueue()

PQ2.put(1)
PQ2.put(2)
PQ2.put(5)
PQ2.put(3)
PQ2.put(4)

print(PQ2)

while(not PQ2.empty()):
  print(PQ2.get())


PQ3 = PriorityQueue()

PQ3.put((1, 'Primero'))
PQ3.put((2, 'Hola'))
PQ3.put((5, 'Sol'))
PQ3.put((3, 'Adiós'))
PQ3.put((4, 'Prueba'))

print(PQ3)

while(not PQ3.empty()):
  print(PQ3.get())

<queue.PriorityQueue object at 0x7f3ac8612ef0>
1
2
3
4
5
<queue.PriorityQueue object at 0x7f3ac8612f98>
(1, 'Primero')
(2, 'Hola')
(3, 'Adiós')
(4, 'Prueba')
(5, 'Sol')


Para ver un ejemplo de cómo utilizar colas de prioridad, veamos el siguiente problema : http://codeforces.com/contest/377/problem/B

Notemos que si es posible arreglar los bugs en un tiempo $t$, entonces también se puede en cualquier tiempo mayor que $t$, entonces, podemos hacer búsqueda binaria sobre el tiempo. Notemos que si el estudiante con mayor habilidad puede resolver el bug más complicado, entonces existe algún tiempo en el que se pueden resolver todos los bugs (olvidando por el momento el costo de contratar al alumno). Además, podemos omitir a todos los alumnos cuyo precio esté por encima del presupuesto establecido.

Entonces, una primer condición para que se puedan reparar todos los bugs es que el estudiante con mayor habilidad y con un costo menor al mayor establecido pueda arreglar el bug más complicado. Procedemos haciendo búsqueda binaria sobre el tiempo, pues sabemos que debe estar entre $0$ y la cantidad de bugs. Una vez descartado este caso haremos lo siguiente:

*   Ordenamos la lista de estudiantes, de mayor a menor habilidad.
*   Ordenamos la lista de bugs, de mayor a menor dificultad.
*   Creamos una cola de prioridades, inicialmente vacía.
*   Iteramos sobre la lista de bugs, y en cada paso agregamos a la cola a aquellos alumnos que pueden resolver el bug en cuestión, y su prioridad asignada será justamente el costo del alumno. Obtenemos de la cola al alumno más barato, y le asignamos el bug en el que estamos, así como los siguientes $t-1$, pues estamos verificando el tiempo $t$. 
*   Si en algún momento la cola de prioridad está vacía es porque el tiempo $t$ no es suficiente y necesitamos más días.
*   Si en algún momento excedimos el presupuesto, necesitamos más días, para poder utilizar más veces el trabajo de un mismo alumno.

Veamos la implementación de este algoritmo




In [None]:
# 3 4 9
# 1 3 1 2
# 2 1 3
# 4 3 6


# 3 4 10
# 2 3 1 2
# 2 1 3
# 4 3 6


# 3 4 9
# 2 3 1 2
# 2 1 3
# 4 3 6


# 3 4 5
# 1 3 1 2
# 2 1 3
# 5 3 6



n = 3
m = 4
s = 9
A = [2,3,1,2]
B = [2,1,3]
C = [4,3,6]
Bugs = [0]*len(A)
St = []

for i in range(0, len(B)): # Guardamos la información de los estudiantes que no superan el costo, en ternas
  if(C[i] <= s):
    St.append((B[i], C[i], i))

for i in range(0, len(A)): # Guardamos las posiciones iniciales de los Bugs en una nueva lista para ordenarlos
  Bugs[i] = (A[i], i)

St.sort(reverse = True) # Ordena a los estudiantes según su habilidad
Bugs.sort(reverse=True) # Ordena los bugs según su dificultad



def check_time(t): # Función que nos permite checar si es posible arreglar todos los bugs en un tiempo t sin pasarse del presupuesto
  PQS = PriorityQueue()
  idxBg = 0
  idxSt = 0
  sum = 0
  while(idxBg < len(A)): # Iteramos sobre los Bugs
    while(idxSt < len(B) and St[idxSt][0] >= Bugs[idxBg][0]): # Checa si el alumno puede o no resolver el bug
      PQS.put((St[idxSt][1], St[idxSt][2])) # Metemos al alumno, su posición, con prioridad el costo de contratarlo
      idxSt = idxSt + 1
    if(PQS.empty()):
      return False
    else:
      To_Use = PQS.get()
      sum += To_Use[0] # Sumamos el costo del alumno que queremos usar
      if(sum > s):
        return False
      else:
        idxBg += t # "Asignamos" a los siguientes t Bugs un mismo estudiante
  return True

def ans(t): # Función que nos permite saber qué estudiante resuelve qué bug, una vez encontrado el tiempo
  PQS = PriorityQueue()
  idxBg = 0
  idxSt = 0
  Ans = [-1]*len(A)
  while(idxBg < len(A)): 
    while(idxSt < len(B) and St[idxSt][0] >= Bugs[idxBg][0]): 
      PQS.put((St[idxSt][1], St[idxSt][2])) 
      idxSt = idxSt + 1
    To_Use = PQS.get()
    for i in range(0, min(t, len(A)-idxBg)): # Bugs[idxBg + i][1] nos dice qué bug estamos considerando
      Ans[Bugs[idxBg + i][1]] = To_Use[1] + 1 # +1 Para cambiar de 0-indexed a 1-indexed
    idxBg += t
  return Ans

l = 0
r = m # El extremo derecho de nuestra búsqueda binaria es el total de bugs

if(St[0][0] < Bugs[0][0]): # Checamos si el más hábil puede solucionar el bug más difícil
  print('NO')
else:
  Shortest = r
  while(l < r):
    mid = (l+r)//2
    if check_time(mid):
      r = mid
      Shortest = mid
    else:
      l = mid + 1
  print('YES\n', ans(Shortest))
  
    

YES
 [3, 3, 2, 3]


En este algoritmo el uso de una cola de prioridad fue de gran ayuda, pues justo lo que queríamos era determinar al estudiante con menor precio en determinado momento.

**Strings.** Veamos algunos algoritmos que involucran el uso de estas estructuras de datos, con la finalidad de aprender cómo manipularlas al implementar algún algoritmo.

Consideremos el siguiente ejemplo. Dada una oración, queremos determinar cuál (o cuales) es la letra que aparece más veces, sin diferenciar entre mayúsculas y minúsculas, además determina en cuántas palabras aparece dicha letra. 

Notemos en principio que la letra que aparece más veces no es necesariamente la letra que aparece en más palabras, entonces primero debemos hacer un conteo 'global', y posteriormente contar sobre las palabras.

Para esto, utilizaremos que una string se puede operar como una lista de caracteres, para poder visitar caracter por caracter.

In [None]:
Stc = "Estassssssssssssss es una frase con la que vamos a hacer algunas pruebas, Pablo clavaba un clavito para la casa de Pedro en San Juan"

# La función lower() nos permite pasar todos los caracteres de nuestra string a minúsculas
Stc2 = Stc.lower()
print(Stc2)

# Podemos aprovechar el código ASCII para asignarle un número a cada caracter y así poder guardar las cuentas en una lista
# Usando que un caracter que representa una letra minúscula tiene un valor entre 97 y 122
Cnt = [0]*28
Maxi = 0
Letras = ''

for i in range (0, len(Stc2)):
  if(ord(Stc2[i]) > 96 and ord(Stc2[i]) < 123):
    idx = ord(Stc2[i]) - 97
    Cnt[idx] += 1
    if(Maxi < Cnt[idx]):
      Maxi = Cnt[idx]
      Letras = Stc2[i]
    elif(Maxi == Cnt[idx]):
      Letras += ' ' + Stc2[i]

Letters = Letras.split()

# Split nos permite separar lo que hay entre los espacios de una string
print("Las letras que más aparecen son: ", Letters, "y aparecen", Maxi, "veces.")

Palabras = Stc2.split()

for i in range(0, len(Letters)):
  Tot = 0
  for p in Palabras:
    if(p.count(Letters[i]) > 0): # count cuenta las ocurrencias de determinado caracter en la string
      Tot += 1
  print("La letra", Letters[i], "aparece en", Tot, "palabras.")

estassssssssssssss es una frase con la que vamos a hacer algunas pruebas, pablo clavaba un clavito para la casa de pedro en san juan
Las letras que más aparecen son:  ['s', 'a'] y aparecen 22 veces.
La letra s aparece en 8 palabras.
La letra a aparece en 17 palabras.


Como el ejemplo ilustra, hay una gran cantidad de funciones que nos permiten trabajar de una manera cómoda con strings.

**Ejercicios.** 

1.   Dada una lista de artículos con sus precios y descuentos que se les harán, determina utilizando la estructura de priority queue el artículo de mayor precio y el artículo de menor precio. Verifica que tu código arroje resultado correcto para las listas: `[("Pluma", 8, 30), ("Balón", 350, 15), ("Naranja", 25, 15), ("Playera", 400, 25), ("Vaso", 20, 5), ("Teclado", 800, 40), ("Libro", 300, 10)], [('A', 35, 10), ('B' 123, 60), ('C', 400, 18), ('D', 325, 7), ('E', 50, 50), ('F', 100, 75), ('G', 40, 10), ('H', 120, 15)]`, donde la terna '(A, B, C)` indica que el artículo A cuesta B y tiene un descuento de C%.
2.   Dada una palabra, determina si es palíndroma o no (sin importar mayúsculas o minúsculas), suponiendo que no tiene tildes ni símbolos especiales. Da un algoritmo que lo determine en tiempo menor que $O(n^2)$. ¿Qué complejidad en tiempo tiene tu algoritmo? 



*Ejercicio 1.* Escribe a continuación el código para este ejercicio.

*Ejercicio 2.* Escribe a continuación el código de tu algoritmo.

(Aquí va el análisis de la complejidad de tu algoritmo)