# Solución Ayudantia 01: Estructura de datos (Built-ins)

Ayudantia por Alonso Gómez, Barbara Irarrazaval, Vicente Vega


## Advertencia

Si no has leído el cuaderno `AY01_Enunciado`, lo que viene a continuación no tendrá mucho sentido, por lo que te recomendamos leer ese archivo y volver a este luego :D

## Ejercicio 1
En este caso, la estructura elegida es ***SETS***, ya que estos nos permiten eliminar elementos repetidos y hacer unión e intersección de conjuntos.
En primer lugar, cargamos ambos archivos y buscamos cada lista. Para eliminar los usuarios repetidos, convertimos estas listas en sets.



In [None]:
# Primero tenemos que cargar los archivos correspondientes, para tener la información
with open("comentarios_giveaway.txt", "r") as archivo_comentarios:
    # Creamos una lista con cada usuario que comentó la publicación
    lista_concursantes_repetidos = []
    for persona in archivo_comentarios.readlines():
        lista_concursantes_repetidos.append(persona.strip("\n"))
    # Para eliminar duplicados, convertimos la lista a un set
    concursantes_que_comentaron = set(lista_concursantes_repetidos)

with open("seguidores.txt", "r") as archivo_seguidores:
    # Creamos una lista con cada usuario que sigue la cuenta
    lista_seguidores_repetidos = []
    for persona in archivo_seguidores.readlines():
        lista_seguidores_repetidos.append(persona.strip("\n"))
    # Para eliminar duplicados, convertimos la lista a un set
    seguidores_no_repetidos = set(lista_seguidores_repetidos)

# Puedes verificarlo descomentando las siguientes lineas:
# print("Esta era la lista de usuarios que comentaron: \n", lista_concursantes_repetidos)
# print("Este era el set de usuarios que comentaron: \n", concursantes_que_comentaron)
# print("Esta era la lista de usuarios que seguian la cuenta: \n", lista_seguidores_repetidos)
# print("Esta era el set de usuarios que seguian la cuenta: \n", seguidores_no_repetidos)

Luego, para poder ver quien cumple con ambos requisitos (seguir a la página Y comentar la publicación), hacemos la intersección de los conjuntos con el comando `intersection`.

In [None]:
# Para ver quienes cumplen con ambos requisitos, simplemente buscamos la interseccion de las listas
concursantes_que_cumplen_requisitos = concursantes_que_comentaron.intersection(seguidores_no_repetidos)
print("Los concursantes que cumplen los requisitos son: ", concursantes_que_cumplen_requisitos)

Finalmente, tenemos que buscar el ganador al azar. Podemos aprovechar que los sets no son ordenados para elegir un ganador, convirtiendo el set en lista y eligiendo un elemento.

In [None]:
# Finalmente, para ver el ganador del concurso, 
# podemos hacer random o convertir el set en lista y elegir un elemento al azar
lista_concursantes_finales = list(concursantes_que_cumplen_requisitos)
ganador = lista_concursantes_finales[0]
print(f"¡¡El ganador es {ganador}!!")

## Ejercicio 2

La estructura elegida fue ***NAMED TUPLE***, ya que esta es la forma más eficiente de guardar un elemento con sus atributos correspondientes. Primero, acceder a estos es intuitivo y no requiere saber un orden arbitrario que no es parte del mismo codigo. Es muy probable que en "*Intro*" para guardar elementos lo hubieran hecho a traves de una lista de una forma similar a: `[nombre, lanzamiento, genero, rating]`. Para acceder al lanzamiento de la pelicula hubieran colocado `lista[1]` o al `N` correspondiente del atributo. Esto se hace a traves de un orden arbitrario que requiere memoria. 

En este caso no es terrible ya que son pocos atributos y además simple. ¿Pero qué hubiera ocurrido si nos hubieramos enfrentado a una elemento con 182 atributos? O, ¿si uno de los atributos fuera una estructura de datos?. En estos casos mantener la memoria suele costar e incluso uno se encuentra con cosas del estilo como 
`lista_generica[0][3][4][5][1][3]`. Hasta el mismo creador del codigo se desorienta al ver estas cosas.

In [None]:
from collections import namedtuple

Peliculas = namedtuple("Peliculas", ["nombre", "lanzamiento", "genero", "rating"])

with open("peliculas.txt", encoding="utf-8") as archivo:
    # Solucion implementado args
    for line in archivo:
        info = line.strip().split(",")
        i = (Peliculas(*info))
        print(i.nombre, i.lanzamiento, i.genero, i.rating)
    
    # Solucion colocando dato por dato:
    for line in archivo:
        info = line.strip().split(";")
        i = (Peliculas(*info))
        print(i.nombre, i.lanzamiento, i.genero, i.rating)

## Ejercicio 3
Los **diccionarios** deben ser una de las mejores herramientas para guardar un conjunto de elementos. Estos nos permiten preguntar por el elemento que deseamos de forma directa y específica, sin tener que recurrir a un metodo de enumeración. De hecho, por esto mismo se llaman diccionarios. Una ventaja de los diccionarios es que nos permite eliminar elementos repetidos instantaneamente, gracias a su funcionamiento basado en llaves.

In [None]:
from collections import namedtuple

Peliculas = namedtuple("Peliculas", ["nombre", "lanzamiento", "genero", "rating"])
base_de_datos = {}

with open("peliculas.txt", encoding="utf-8") as archivo:
    for line in archivo:
        info = line.strip().split(",")
        pelicula = (Peliculas(*info))
        base_de_datos[pelicula.nombre] = (pelicula.lanzamiento, pelicula.genero, pelicula.rating)
    

print(base_de_datos.items())

## Ejercicio 4

Para este ejercicio, la estructura de datos que se debía usar era **LISTA**. Esto porque se pedia una estructura mutable (`append`) y ordenada (`sort`).

In [None]:
# Primero creamos la variable cervezas para asignarle la lista de cervezas.
cervezas = []
# Abrimos el archivo
with open("cervezas.txt") as file:
    # Almacenamos como string la lista que nos entregan
    cervezas = file.readlines()[0]
    # Le quitamos los espacios y, dado que los elementos estan separados por un "-"
    # separamos el string por este caracter dejandolo como una lista 
    cervezas = cervezas.strip().split("-")

Para ordenar de forma alfabética usamos el método `sort`

In [None]:
cervezas.sort()
print(cervezas)

Para añadir dos usamos `append` y volvemos a ordenar

In [None]:
cervezas.append("Baltikreisi")
cervezas.append("Kuntsmen")
cervezas.sort()
print(cervezas)

## Ejercicio 5
Para este ejercicio, la estructura de datos buscada era **COLA**. Esto porque se necesitaba algo similar a una lista, pero sacando al primer elemento sin generar problemas con la indexación.

In [None]:
# Importamos deque desde collections
from collections import deque
# Abrimos el archivo de manera similar a como lo hicimos en el ejercicio de lista
# solo que ahora lo guardamos como un deque.
fila = None
with open("participantes.txt") as file:
    fila = file.readlines()[0]
    fila = fila.strip().split(",")
    fila = deque(fila)

Primero usamos la operación `length` para ver cuantas personas hay.

In [None]:
print(len(fila))

Para ver quién está primero utilizamos la operacion `peek`.

In [None]:
print(fila[0])

Para sacar a la primera persona de la lista usamos la operacion `popleft`.

In [None]:
primero = fila.popleft()
print(primero)
print(fila)

Con `append` agregamos dos personas a la fila.

In [None]:
fila.append("Antonio")
fila.append("Fernando")
print(fila)

Volvemos a ver el largo.

In [None]:
print(len(fila))

## Ejercicio 6
Este problema se puede solucionar con un diccionario, ya que nos permite almacenar el producto y su respectivo *stock* de una manera limpia, ordenada y accesible. Ahora, tenemos la opción de utilizar un diccionario normal o un `defaultdict`. ¿Qué nos conviene en este caso? Veremos ambos casos.

In [None]:
from collections import defaultdict

# Primero cargamos los datos y hacemos una lista con cada uno de los artículos
with open("inventario_rapido.txt", "r") as archivo_inventario:
    elementos_en_bodega = []
    for articulo in archivo_inventario.readlines():
        elementos_en_bodega.append(articulo.strip("\n"))

# Con diccionarios:
diccionario_bodega = dict()
for articulo in elementos_en_bodega:
    if articulo not in diccionario_bodega:
        diccionario_bodega[articulo] = 1
    else:
        diccionario_bodega[articulo] += 1

# Con defaultdicts:
defaultdict_bodega = defaultdict(int)
for articulo in elementos_en_bodega:
    defaultdict_bodega[articulo] += 1

# Probamos llamando un artículo que sabemos que hay
print("El valor con diccionario es:", diccionario_bodega["oreos"])
print("El valor con defaultdict es:", defaultdict_bodega["oreos"])

Podemos ver que el código con `defaultdict` nos permite ahorrarnos lineas, al ser más conciso.
Ahora, si el cliente quiere buscar el *stock* disponible de un artículo, puede hacerlo de manera rápida. Pero, ¿qué ocurre si el usuario busca un elemento que no esta disponible?

In [None]:
print("El valor con defaultdict es:", defaultdict_bodega["arroz"])
print("El valor con diccionario es:", diccionario_bodega["arroz"])

Vemos que con `defaultdict` el valor entregado es 0, pero con diccionarios normales el código colapsa. Esto es porque `defaultdict` asigna el valor de 0 a todas las llaves inicialmente (le da un "*default value*"), mientras que un diccionario no le asigna ningún valor a una llave que no ha sido creada. 
*Default dicts* funciona de esta manera con otros tipos de estructuras:
* `defaultdict(list)`: empieza con una lista vacia
* `defaultdict(set)`: empieza con un set vacio 
* `defaultdict(int)`: empieza con 0, etc.