# Ayudantía 5 🤓

### Serialización, manejo de bytes y excepciones

## Ayudantes  👾

- [Clemente Campos](https://github.com/mskdancers)
- [Patricio Hinostroza](https://github.com/Dvckhv)
- [Julio Huerta](https://github.com/julius)
- [Carlos Olguin](https://github.com/CarlangaUC)
- [Catalina Miranda](https://github.com/catalinamirandah)
- [Felipe Vidal](https://github.com/fvidalf)

## 📖 Contenidos 📖

#### En este ayudantía usaremos:
- Serialización
- Manejo de bytes
- Excepciones

## Serialización

Es el procedimiento de transformar cualquier objeto en una secuencia o serie de bytes. Esto nos permite almacenar el estado de un objeto de forma persistente, por ejemplo en un archivo o una base de datos que podamos consultar más tarde. También nos permite enviar el objeto a otros computadores y programas.

### Pickle 🥒 y JSON 👻

#### Métodos:
- `dumps`: serializa un objeto, es decir, lo guarda.
- `loads`: deserializa un objeto serializado, es decir, carga un objeto a su estado original.
- `dump`: guarda un archivo con el objeto serializado.
- `load`: deserializa un objeto almacenado en un archivo (lo "trae de vuelta").

Veamos un ejemplo utilizando pickle:

In [1]:
import pickle
lista = ["asado", "terremoto", 18, True]
print(f"Soy una {type(lista)} y contengo {lista}\n")


lista_serializada = pickle.dumps(lista)
print(f"Soy una {type(lista_serializada)} y contengo {lista_serializada}\n")

lista_deserializada = pickle.loads(lista_serializada)
print(f"Soy una {type(lista_deserializada)} y contengo {lista_deserializada}\n")

Soy una <class 'list'> y contengo ['asado', 'terremoto', 18, True]

Soy una <class 'bytes'> y contengo b'\x80\x04\x95\x1c\x00\x00\x00\x00\x00\x00\x00]\x94(\x8c\x05asado\x94\x8c\tterremoto\x94K\x12\x88e.'

Soy una <class 'list'> y contengo ['asado', 'terremoto', 18, True]



Veamos un ejemplo utilizando json:

In [2]:
import json

class Fonda:
    def __init__(self, nombre, n_curados, nombres_detenidos):
        self.nombre = nombre
        self.n_curados = n_curados
        self.nombres_detenidos = nombres_detenidos

            
fonda = Fonda("Parque O'higgins", 100000, ["Felipe", "Catalina"])

json_string = json.dumps(fonda.__dict__)
print("datos en formato JSON:", type(json_string), json_string)
json_deserializado = json.loads(json_string)
print("datos en formato Python:", type(json_deserializado), json_deserializado)

datos en formato JSON: <class 'str'> {"nombre": "Parque O'higgins", "n_curados": 100000, "nombres_detenidos": ["Felipe", "Catalina"]}
datos en formato Python: <class 'dict'> {'nombre': "Parque O'higgins", 'n_curados': 100000, 'nombres_detenidos': ['Felipe', 'Catalina']}


### Pickle v/s JSON

<img width=500 src="img/diferencias.png">

## Manejo de bytes 🤖

### Bits y Bytes

Un byte es la estructura básica para guardar datos en computación. A su vez, un byte está compuesto por 8 bits, y cada bit es un número que puede ser 1 o 0. Usamos esta estructura (byte) para medir el tamaño de los archivos.

<img width=600 src="img/bit_bytes.png">

### Codificación UTF-8

Podríamos decir que el Byte 0 corresponde a la letra "a", el Byte 1 corresponde a "b", el Byte 2 corresponde a "c", etc, hasta cubrir todos los caracteres que queremos representar. Esa asociación se conoce como codificación o encoding. 

Una codificación muy común es la codificación UTF-8, la cual nace como una ampliación de la codificación ASCII dada la necesidad de agregar caracteres que no se encontraban presentes en un teclado tradicional estadounidense.

La codificación ASCII asocia números (Bytes) con caracteres de la siguiente manera:

<img width=400 src="img/ascii.jpg">

### Objeto Byte

Un objeto de tipo bytes es una secuencia inmutable, tal como los strings. Para declarar que un objeto es un byte simplemente se pone al comienzo del objeto una "b". Por ejemplo:

In [3]:
nombre = b"\x47\x75\x61\x74\xc3\xb3\x6e\x20\x4c\x6f\x79\x61\x6c\x61"

print(nombre)
print(type(nombre))
print(nombre.decode())

b'Guat\xc3\xb3n Loyala'
<class 'bytes'>
Guatón Loyala


*Nota: el binario b"\xc3\xb3" corresponde a la letra "ó" en UTF-8*

### Codificar y decodificar

En python existen las funciones `encode` para convertir los caracteres a su versión en bytes y `decode` para decodificar estos. 

In [4]:
nombre = "Guatón Loyola"
nombre_codificado = nombre.encode()
nombre_decodificado = nombre_codificado.decode()

print(nombre_codificado)
print(nombre_decodificado)

b'Guat\xc3\xb3n Loyola'
Guatón Loyola


### bytes() y bytearray()

Podemos usar otros métodos para definir la estructura de los bytes: bytes() y bytearray(), y el método que usemos va a depender de la funcionalidad que necesitemos.

- ¿Quieres usar una estructura inmutable, similar a un string? Usa bytes()
- ¿Quieres usar una estructura mutable, similar a una lista? Usa bytearray()

#### Ejemplo 💃

Queremos que nuestro programa convierta en bytes la letra de la famosa canción "Yo tomo vino y cerveza".

In [5]:
letra = "Yo tomo vino y cerveza para olvidarme de ella"

# Utilizamos bytes() para pasar nuestra letra a bytes
# Esta función recibe 2 argumentos, el string a convertir y el encoding
# Utilizamos encoding "utf-8", ya que, es el que más nos conviene
byte_letra = bytes(letra, 'utf-8')
print(byte_letra)

b'Yo tomo vino y cerveza para olvidarme de ella'


Pero a nuestra letra le falta algo importante 🤔, olvidamos que entre medio se debe gritar "PISCO Y RON" en la canción.

In [6]:
# Trabajamos con bytearray() para que nuestra estructura sea mutable
arr_letra = bytearray(byte_letra)
letra_faltante = " PISCO Y RON ".encode()

arr_letra[22:23] = letra_faltante
print(arr_letra)

bytearray(b'Yo tomo vino y cerveza PISCO Y RON para olvidarme de ella')


*Nota: si hubiesemos usado `arr_letra[22]` nuestro código no funcionaría.*

### Endianess

- big-endian: En este formato, el byte más significativo se almacena en primer lugar y los demás bytes le siguen en orden de significado descendente.

- little-endian: Aquí sucede al revés, en este formato el byte menos significativo se almacena en primer lugar y los demás bytes le siguen en orden de significado ascendente.

<img width=500 src="img/endianess.jpg">

### from_bytes()

La función `from_bytes()` nos permite convertir la información en bytes a un número entero. Esta función recibe dos parámetros, los bytes a convertir y el orden en el que vienen.

In [7]:
print(int.from_bytes(b'\x01\x11', byteorder='big')) # 0111 = 273

273


In [8]:
print(int.from_bytes(b'\x01\x11', byteorder='little')) # 0111 = 4353

4353


### to_bytes()

La función `to_bytes()` nos permite convertir un número en bytes. Al igual que `from_bytes()`, esta función recibe dos parámetros, pero son el primero es diferente. Ahora necesitamos la cantidad de bytes que usaremos para escribir el número convertido y el orden a usar.

In [9]:
numero_a_convertir = 2233
numero_a_convertir.to_bytes(4, byteorder="big")

b'\x00\x00\x08\xb9'

In [10]:
numero_a_convertir = 2233
numero_a_convertir.to_bytes(4, byteorder="little")

b'\xb9\x08\x00\x00'

## Excepciones 🤔

Son situaciones anómalas o inesperadas que pueden ocurrir en un proceso de cómputo. Estos eventos surgen cuando ocurren condiciones que alteran el flujo normal o esperado de un programa, o alguna acción no pudo ser ejecutada tal como se esperaba. A las excepciones uno les suele llamar comúnmente como "errores".

### Levantando excepciones

Se puede generar una excepción en el momento que queramos creando una nueva instancia de la excepción, y utilizando la sentencia raise. La forma de hacerlo es la siguiente:

In [None]:
raise NombreExcepcion('Mensaje de error')

A continuación se muestra un ejemplo:

In [11]:
def suma(x, y):
    
    # Si el input no es del tipo esperado
    check = isinstance(x, int) and isinstance(y, int)
    if not check:
        raise TypeError('Ambos argumentos deben ser tipo int')

    return x + y

print(suma("Hola", 3))

TypeError: Ambos argumentos deben ser tipo int

### Manejo de excepciones

Cada vez que se levanta una excepción, es posible atraparla mediante el uso de las sentencias `try` y `except`.

Funcionamiento: si se levanta una excepción dentro del scope de `try`, entonces la excepción es capturada, y debe seguir una o más instrucciones `except`. Si no ocurre ningún problema, el programa sigue su flujo.

In [12]:
try:
    x = 0
    print(f"El número elegido es {x}")
    print(f"Resultado operación: {1/x}")

except (ZeroDivisionError) as error:
    print(f"Error: {error} -> no se puede dividir por cero")

print("El programa continúa después del try/except")

El número elegido es 0
Error: division by zero -> no se puede dividir por cero
El programa continúa después del try/except


También existen las sentencias complementarias `else` y `finally`:

- `else`: instrucciones se ejecutarán siempre y cuando no se haya lanzado ninguna excepción.
- `finally`: instrucciones se realizan siempre, independientemente de si ocurrió una excepción o no.

In [13]:
try:
    x = 1
    print(f"El número elegido es {x}")
    print(f"Resultado operación: {1/x}")

except (ZeroDivisionError) as error:
    print(f"Error: {error}, no se puede dividir por cero")

else:
    # Si no hay errores, se ejecuta este bloque
    # Si se colocara un return después de la operación y esta es correcta, 
    # entonces nunca se ejecutará este punto.
    print("¡Todo OK! La división se hizo correctamente")

finally:
    # Este bloque siempre se ejecuta
    print("Recuerde SIEMPRE usar excepciones para manejar los errores de su programa")

print("El programa continúa después del try/except")

El número elegido es 1
Resultado operación: 1.0
¡Todo OK! La división se hizo correctamente
Recuerde SIEMPRE usar excepciones para manejar los errores de su programa
El programa continúa después del try/except


## Música DCCiochera!

El 18 llegó con todo, y ¡estamos organizando nuestra propia fonda! Queremos celebrar en grande, por lo que nos contactamos con todo tipo de artistas de la región para que vengan a actuar en nuestro evento. El único problema, es que el formulario que les dimos para anotarse en el concierto llegó con información poco confiable, por lo que no sabemos cuanta gente debe estar en el escenario para cada acto, ni por cuanto tiempo. ¡Ni siquiera en que orden deben salir 😨!

Por fortuna, existe un archivo JSON que contiene la información de cada acto, el cual además  contiene una llave, que en sí trae de forma encriptada una confirmación de los datos relacionados al número de miembros y al largo del acto. La primera parte de tu trabajo será seguir los pasos para extraer correctamente la información, y avisar de posibles errores.

Por otro lado, para determinar el orden en que saldrán los actos, deberás rankear los actos de acuerdo a su nivel de interés, el cual depende del largo del acto, y del interés por el género. Para eso, contarás con un segundo archivo JSON. Pero OJO, en ese archivo NO están todos los géneros! Por lo que deberemos manejar esos casos de forma distinta.

### La encriptación

La llave es un string de 6 caracteres, los cuales deberás convertir en un bytearray para poder trabajar con ellos. Desde el segundo byte, la llave debe ser separada en dos partes, desde el segundo al tercer byte, y desde el cuarto al sexto byte. Estas subsecuencias, deberán ser interpretadas como números enteros, pero siguiendo el criterio de *endianness* indicado por el primer byte. Si el primer byte representa un número par, será en *big-endian*. Si es impar, en *little-endian*.

Luego, en base a esos números deberás verificar si los datos son correctos o no (el criterio en específico se detalla más adelante). Si la información no calza, por precaución, el acto no será invitado al concierto 😔.

## Instrucciones

### Primera parte: Lectura de JSON

Lo primero que deberás hacer es leer correctamente los archivos JSON que se ubican en la carpeta `data`. `actos.json` corresponderá a una lista de diccionarios, cada uno con la información de un acto, mientras que `generos.json` es un único diccionario con la relación entre género y su factor de interés.

### Segunda parte: Clase Acto

Aquí deberás completar los siguiente métodos:

`serializar_llave()`: Deberás transformar el atributo `self.llave`, recibido originalmente como un string, a un *bytearray* para su manipulación más adelante con encoding "UTF-8".

`deserializar_llave()`: Deberás transformar una llave en formato bytearray de vuelta a un *str* en formato "UTF-8".

`determinar_big_o_little()`: Este método determinará la lectura del resto de los bytes de la llave, utilizando el primer byte de esta.
- Si el byte corresponde a un número par, se retornará `True`, indicando que los bytes se leerán en formato *big-endian*.
- En caso contrario, se retornará `False`, indicando que los bytes se leerán en formato *little-endian*.

`verificar_datos()`: Este método realiza la verificación de los valores de `self.miembros` y `self.largo_acto`. Para esto, se deben seguir los siguientes pasos:

- Primero, se debe serializar la llave usando el método `serializar_llave`
- Se debe dividir la secuencia de bytes restantes (luego de extraído el primer byte) en las dos partes correspondientes.
- Cada una de estas partes debe ser interpretada como un *int*, siguiendo el formato de *endianness* correcto.
- Para validar `self.miembros`, su valor debe corresponder a la división módulo 10 del valor absoluto de la resta entre los enteros obtenidos.
- Para validar `self.largo_acto`, su valor debe corresponder a la división módulo 100 del valor absoluto de la suma entre los enteros obtenidos.

En caso de que alguno de los valores no sea correcto, se deberá **levantar una excepción de tipo ValueError**, especificando como mensaje de error la(s) causas del error. En caso de que todo esté en orden, no es necesario retornar nada.

Finalmente, antes de terminar el método, deberás deseralizar la llave (convertirla nuevamente en un *str*) con el método correspondiente.

`calcular_interes(interes_por_genero)`: Este método deberá calcular el interés por el acto en función de la duración de su show, y un factor de interés determinado por su género, el cual estará disponible mediante el diccionario recibido `interes_por_genero`, en el cual las llaves corresponden a un género en *str*, y los valores son de tipo *float*. Se deberá intentar asignar al atributo `self.interes` la multiplicación entre ambas cantidades, a excepción del caso en el que no se encuentre el género como llave del diccionario, en cuyo caso, se deberá **manejar la excepción de forma acorde** y asignar el valor como 0.

### Tercera parte: Clase Concierto

Aquí deberás completar los siguientes métodos:

`validar_actos()`: Este método debe recorrer todos los actos almacenados en `self.actos`, donde para cada uno debe ejecutar su método `verificar_datos`. 
- En caso de que se levante una excepción del tipo `ValueError`, se deberá manejar el error, imprimiendo un mensaje avisando de su eliminación del concierto, seguido de los motivos adjuntos en el mensaje de error. Finalmente, se deberá eliminar el acto del festival con el método correspondiente.

- En caso que no ocurrá una excepción, se deberá imprimir un mensaje avisando que el acto fue validado correctamente.


`planificar_conciertos()`: Este método debe rankear los actos de acuerdo a su nivel de interés, para producir un itinerario. 

- Para cada acto del concierto, se deberá calcular su interés con el método `calcular_interes`. Luego, se ordenerá la lista de acuerdo al atributo `acto.interes`. 

- Se deberá generar un archivo serializado en JSON que contenga cada uno de los actos. *Hint: Recordar el método `__dict__` de un objeto, y que un JSON puede serializarse como una lista de dicts*.

- Finalmente, se deberá imprimir en orden cada uno de los actos, junto a su género, y duración de presentación.

### Cuarta parte: Flujo de Programa

Debes instanciar un `Concierto`, y por cada elemento de la lista proveniente de `actos.json`, instanciar un `Acto` y agregarlo a la instancia de Concierto con el método correspondiente.

Finalmente, deberás ejecutar los métodos `validar_actos` y `planificar_concierto` de tu instancia de `concierto`. 