# Ayudant√≠a 5 ü§ì

### Serializaci√≥n, manejo de bytes y excepciones

## Ayudantes  üëæ

- [Clemente Campos](https://github.com/mskdancers)
- [Patricio Hinostroza](https://github.com/Dvckhv)
- [Julio Huerta](https://github.com/julius)
- [Carlos Olguin](https://github.com/CarlangaUC)
- [Catalina Miranda](https://github.com/catalinamirandah)
- [Felipe Vidal](https://github.com/fvidalf)

## üìñ Contenidos üìñ

#### En este ayudant√≠a usaremos:
- Serializaci√≥n
- Manejo de bytes
- Excepciones

## Serializaci√≥n

Es el procedimiento de transformar cualquier objeto en una secuencia o serie de bytes. Esto nos permite almacenar el estado de un objeto de forma persistente, por ejemplo en un archivo o una base de datos que podamos consultar m√°s tarde. Tambi√©n nos permite enviar el objeto a otros computadores y programas.

### Pickle ü•í y JSON üëª

#### M√©todos:
- `dumps`: serializa un objeto, es decir, lo guarda.
- `loads`: deserializa un objeto serializado, es decir, carga un objeto a su estado original.
- `dump`: guarda un archivo con el objeto serializado.
- `load`: deserializa un objeto almacenado en un archivo (lo "trae de vuelta").

Veamos un ejemplo utilizando pickle:

In [1]:
import pickle
lista = ["asado", "terremoto", 18, True]
print(f"Soy una {type(lista)} y contengo {lista}\n")


lista_serializada = pickle.dumps(lista)
print(f"Soy una {type(lista_serializada)} y contengo {lista_serializada}\n")

lista_deserializada = pickle.loads(lista_serializada)
print(f"Soy una {type(lista_deserializada)} y contengo {lista_deserializada}\n")

Soy una <class 'list'> y contengo ['asado', 'terremoto', 18, True]

Soy una <class 'bytes'> y contengo b'\x80\x04\x95\x1c\x00\x00\x00\x00\x00\x00\x00]\x94(\x8c\x05asado\x94\x8c\tterremoto\x94K\x12\x88e.'

Soy una <class 'list'> y contengo ['asado', 'terremoto', 18, True]



Veamos un ejemplo utilizando json:

In [2]:
import json

class Fonda:
    def __init__(self, nombre, n_curados, nombres_detenidos):
        self.nombre = nombre
        self.n_curados = n_curados
        self.nombres_detenidos = nombres_detenidos

            
fonda = Fonda("Parque O'higgins", 100000, ["Felipe", "Catalina"])

json_string = json.dumps(fonda.__dict__)
print("datos en formato JSON:", type(json_string), json_string)
json_deserializado = json.loads(json_string)
print("datos en formato Python:", type(json_deserializado), json_deserializado)

datos en formato JSON: <class 'str'> {"nombre": "Parque O'higgins", "n_curados": 100000, "nombres_detenidos": ["Felipe", "Catalina"]}
datos en formato Python: <class 'dict'> {'nombre': "Parque O'higgins", 'n_curados': 100000, 'nombres_detenidos': ['Felipe', 'Catalina']}


### Pickle v/s JSON

<img width=500 src="img/diferencias.png">

## Manejo de bytes ü§ñ

### Bits y Bytes

Un byte es la estructura b√°sica para guardar datos en computaci√≥n. A su vez, un byte est√° compuesto por 8 bits, y cada bit es un n√∫mero que puede ser 1 o 0. Usamos esta estructura (byte) para medir el tama√±o de los archivos.

<img width=600 src="img/bit_bytes.png">

### Codificaci√≥n UTF-8

Podr√≠amos decir que el Byte 0 corresponde a la letra "a", el Byte 1 corresponde a "b", el Byte 2 corresponde a "c", etc, hasta cubrir todos los caracteres que queremos representar. Esa asociaci√≥n se conoce como codificaci√≥n o encoding. 

Una codificaci√≥n muy com√∫n es la codificaci√≥n UTF-8, la cual nace como una ampliaci√≥n de la codificaci√≥n ASCII dada la necesidad de agregar caracteres que no se encontraban presentes en un teclado tradicional estadounidense.

La codificaci√≥n ASCII asocia n√∫meros (Bytes) con caracteres de la siguiente manera:

<img width=400 src="img/ascii.jpg">

### Objeto Byte

Un objeto de tipo bytes es una secuencia inmutable, tal como los strings. Para declarar que un objeto es un byte simplemente se pone al comienzo del objeto una "b". Por ejemplo:

In [3]:
nombre = b"\x47\x75\x61\x74\xc3\xb3\x6e\x20\x4c\x6f\x79\x61\x6c\x61"

print(nombre)
print(type(nombre))
print(nombre.decode())

b'Guat\xc3\xb3n Loyala'
<class 'bytes'>
Guat√≥n Loyala


*Nota: el binario b"\xc3\xb3" corresponde a la letra "√≥" en UTF-8*

### Codificar y decodificar

En python existen las funciones `encode` para convertir los caracteres a su versi√≥n en bytes y `decode` para decodificar estos. 

In [4]:
nombre = "Guat√≥n Loyola"
nombre_codificado = nombre.encode()
nombre_decodificado = nombre_codificado.decode()

print(nombre_codificado)
print(nombre_decodificado)

b'Guat\xc3\xb3n Loyola'
Guat√≥n Loyola


### bytes() y bytearray()

Podemos usar otros m√©todos para definir la estructura de los bytes: bytes() y bytearray(), y el m√©todo que usemos va a depender de la funcionalidad que necesitemos.

- ¬øQuieres usar una estructura inmutable, similar a un string? Usa bytes()
- ¬øQuieres usar una estructura mutable, similar a una lista? Usa bytearray()

#### Ejemplo üíÉ

Queremos que nuestro programa convierta en bytes la letra de la famosa canci√≥n "Yo tomo vino y cerveza".

In [5]:
letra = "Yo tomo vino y cerveza para olvidarme de ella"

# Utilizamos bytes() para pasar nuestra letra a bytes
# Esta funci√≥n recibe 2 argumentos, el string a convertir y el encoding
# Utilizamos encoding "utf-8", ya que, es el que m√°s nos conviene
byte_letra = bytes(letra, 'utf-8')
print(byte_letra)

b'Yo tomo vino y cerveza para olvidarme de ella'


Pero a nuestra letra le falta algo importante ü§î, olvidamos que entre medio se debe gritar "PISCO Y RON" en la canci√≥n.

In [6]:
# Trabajamos con bytearray() para que nuestra estructura sea mutable
arr_letra = bytearray(byte_letra)
letra_faltante = " PISCO Y RON ".encode()

arr_letra[22:23] = letra_faltante
print(arr_letra)

bytearray(b'Yo tomo vino y cerveza PISCO Y RON para olvidarme de ella')


*Nota: si hubiesemos usado `arr_letra[22]` nuestro c√≥digo no funcionar√≠a.*

### Endianess

- big-endian: En este formato, el byte m√°s significativo se almacena en primer lugar y los dem√°s bytes le siguen en orden de significado descendente.

- little-endian: Aqu√≠ sucede al rev√©s, en este formato el byte menos significativo se almacena en primer lugar y los dem√°s bytes le siguen en orden de significado ascendente.

<img width=500 src="img/endianess.jpg">

### from_bytes()

La funci√≥n `from_bytes()` nos permite convertir la informaci√≥n en bytes a un n√∫mero entero. Esta funci√≥n recibe dos par√°metros, los bytes a convertir y el orden en el que vienen.

In [7]:
print(int.from_bytes(b'\x01\x11', byteorder='big')) # 0111 = 273

273


In [8]:
print(int.from_bytes(b'\x01\x11', byteorder='little')) # 0111 = 4353

4353


### to_bytes()

La funci√≥n `to_bytes()` nos permite convertir un n√∫mero en bytes. Al igual que `from_bytes()`, esta funci√≥n recibe dos par√°metros, pero son el primero es diferente. Ahora necesitamos la cantidad de bytes que usaremos para escribir el n√∫mero convertido y el orden a usar.

In [9]:
numero_a_convertir = 2233
numero_a_convertir.to_bytes(4, byteorder="big")

b'\x00\x00\x08\xb9'

In [10]:
numero_a_convertir = 2233
numero_a_convertir.to_bytes(4, byteorder="little")

b'\xb9\x08\x00\x00'

## Excepciones ü§î

Son situaciones an√≥malas o inesperadas que pueden ocurrir en un proceso de c√≥mputo. Estos eventos surgen cuando ocurren condiciones que alteran el flujo normal o esperado de un programa, o alguna acci√≥n no pudo ser ejecutada tal como se esperaba. A las excepciones uno les suele llamar com√∫nmente como "errores".

### Levantando excepciones

Se puede generar una excepci√≥n en el momento que queramos creando una nueva instancia de la excepci√≥n, y utilizando la sentencia raise. La forma de hacerlo es la siguiente:

In [None]:
raise NombreExcepcion('Mensaje de error')

A continuaci√≥n se muestra un ejemplo:

In [11]:
def suma(x, y):
    
    # Si el input no es del tipo esperado
    check = isinstance(x, int) and isinstance(y, int)
    if not check:
        raise TypeError('Ambos argumentos deben ser tipo int')

    return x + y

print(suma("Hola", 3))

TypeError: Ambos argumentos deben ser tipo int

### Manejo de excepciones

Cada vez que se levanta una excepci√≥n, es posible atraparla mediante el uso de las sentencias `try` y `except`.

Funcionamiento: si se levanta una excepci√≥n dentro del scope de `try`, entonces la excepci√≥n es capturada, y debe seguir una o m√°s instrucciones `except`. Si no ocurre ning√∫n problema, el programa sigue su flujo.

In [12]:
try:
    x = 0
    print(f"El n√∫mero elegido es {x}")
    print(f"Resultado operaci√≥n: {1/x}")

except (ZeroDivisionError) as error:
    print(f"Error: {error} -> no se puede dividir por cero")

print("El programa contin√∫a despu√©s del try/except")

El n√∫mero elegido es 0
Error: division by zero -> no se puede dividir por cero
El programa contin√∫a despu√©s del try/except


Tambi√©n existen las sentencias complementarias `else` y `finally`:

- `else`: instrucciones se ejecutar√°n siempre y cuando no se haya lanzado ninguna excepci√≥n.
- `finally`: instrucciones se realizan siempre, independientemente de si ocurri√≥ una excepci√≥n o no.

In [13]:
try:
    x = 1
    print(f"El n√∫mero elegido es {x}")
    print(f"Resultado operaci√≥n: {1/x}")

except (ZeroDivisionError) as error:
    print(f"Error: {error}, no se puede dividir por cero")

else:
    # Si no hay errores, se ejecuta este bloque
    # Si se colocara un return despu√©s de la operaci√≥n y esta es correcta, 
    # entonces nunca se ejecutar√° este punto.
    print("¬°Todo OK! La divisi√≥n se hizo correctamente")

finally:
    # Este bloque siempre se ejecuta
    print("Recuerde SIEMPRE usar excepciones para manejar los errores de su programa")

print("El programa contin√∫a despu√©s del try/except")

El n√∫mero elegido es 1
Resultado operaci√≥n: 1.0
¬°Todo OK! La divisi√≥n se hizo correctamente
Recuerde SIEMPRE usar excepciones para manejar los errores de su programa
El programa contin√∫a despu√©s del try/except


## M√∫sica DCCiochera!

El 18 lleg√≥ con todo, y ¬°estamos organizando nuestra propia fonda! Queremos celebrar en grande, por lo que nos contactamos con todo tipo de artistas de la regi√≥n para que vengan a actuar en nuestro evento. El √∫nico problema, es que el formulario que les dimos para anotarse en el concierto lleg√≥ con informaci√≥n poco confiable, por lo que no sabemos cuanta gente debe estar en el escenario para cada acto, ni por cuanto tiempo. ¬°Ni siquiera en que orden deben salir üò®!

Por fortuna, existe un archivo JSON que contiene la informaci√≥n de cada acto, el cual adem√°s  contiene una llave, que en s√≠ trae de forma encriptada una confirmaci√≥n de los datos relacionados al n√∫mero de miembros y al largo del acto. La primera parte de tu trabajo ser√° seguir los pasos para extraer correctamente la informaci√≥n, y avisar de posibles errores.

Por otro lado, para determinar el orden en que saldr√°n los actos, deber√°s rankear los actos de acuerdo a su nivel de inter√©s, el cual depende del largo del acto, y del inter√©s por el g√©nero. Para eso, contar√°s con un segundo archivo JSON. Pero OJO, en ese archivo NO est√°n todos los g√©neros! Por lo que deberemos manejar esos casos de forma distinta.

### La encriptaci√≥n

La llave es un string de 6 caracteres, los cuales deber√°s convertir en un bytearray para poder trabajar con ellos. Desde el segundo byte, la llave debe ser separada en dos partes, desde el segundo al tercer byte, y desde el cuarto al sexto byte. Estas subsecuencias, deber√°n ser interpretadas como n√∫meros enteros, pero siguiendo el criterio de *endianness* indicado por el primer byte. Si el primer byte representa un n√∫mero par, ser√° en *big-endian*. Si es impar, en *little-endian*.

Luego, en base a esos n√∫meros deber√°s verificar si los datos son correctos o no (el criterio en espec√≠fico se detalla m√°s adelante). Si la informaci√≥n no calza, por precauci√≥n, el acto no ser√° invitado al concierto üòî.

## Instrucciones

### Primera parte: Lectura de JSON

Lo primero que deber√°s hacer es leer correctamente los archivos JSON que se ubican en la carpeta `data`. `actos.json` corresponder√° a una lista de diccionarios, cada uno con la informaci√≥n de un acto, mientras que `generos.json` es un √∫nico diccionario con la relaci√≥n entre g√©nero y su factor de inter√©s.

### Segunda parte: Clase Acto

Aqu√≠ deber√°s completar los siguiente m√©todos:

`serializar_llave()`: Deber√°s transformar el atributo `self.llave`, recibido originalmente como un string, a un *bytearray* para su manipulaci√≥n m√°s adelante con encoding "UTF-8".

`deserializar_llave()`: Deber√°s transformar una llave en formato bytearray de vuelta a un *str* en formato "UTF-8".

`determinar_big_o_little()`: Este m√©todo determinar√° la lectura del resto de los bytes de la llave, utilizando el primer byte de esta.
- Si el byte corresponde a un n√∫mero par, se retornar√° `True`, indicando que los bytes se leer√°n en formato *big-endian*.
- En caso contrario, se retornar√° `False`, indicando que los bytes se leer√°n en formato *little-endian*.

`verificar_datos()`: Este m√©todo realiza la verificaci√≥n de los valores de `self.miembros` y `self.largo_acto`. Para esto, se deben seguir los siguientes pasos:

- Primero, se debe serializar la llave usando el m√©todo `serializar_llave`
- Se debe dividir la secuencia de bytes restantes (luego de extra√≠do el primer byte) en las dos partes correspondientes.
- Cada una de estas partes debe ser interpretada como un *int*, siguiendo el formato de *endianness* correcto.
- Para validar `self.miembros`, su valor debe corresponder a la divisi√≥n m√≥dulo 10 del valor absoluto de la resta entre los enteros obtenidos.
- Para validar `self.largo_acto`, su valor debe corresponder a la divisi√≥n m√≥dulo 100 del valor absoluto de la suma entre los enteros obtenidos.

En caso de que alguno de los valores no sea correcto, se deber√° **levantar una excepci√≥n de tipo ValueError**, especificando como mensaje de error la(s) causas del error. En caso de que todo est√© en orden, no es necesario retornar nada.

Finalmente, antes de terminar el m√©todo, deber√°s deseralizar la llave (convertirla nuevamente en un *str*) con el m√©todo correspondiente.

`calcular_interes(interes_por_genero)`: Este m√©todo deber√° calcular el inter√©s por el acto en funci√≥n de la duraci√≥n de su show, y un factor de inter√©s determinado por su g√©nero, el cual estar√° disponible mediante el diccionario recibido `interes_por_genero`, en el cual las llaves corresponden a un g√©nero en *str*, y los valores son de tipo *float*. Se deber√° intentar asignar al atributo `self.interes` la multiplicaci√≥n entre ambas cantidades, a excepci√≥n del caso en el que no se encuentre el g√©nero como llave del diccionario, en cuyo caso, se deber√° **manejar la excepci√≥n de forma acorde** y asignar el valor como 0.

### Tercera parte: Clase Concierto

Aqu√≠ deber√°s completar los siguientes m√©todos:

`validar_actos()`: Este m√©todo debe recorrer todos los actos almacenados en `self.actos`, donde para cada uno debe ejecutar su m√©todo `verificar_datos`. 
- En caso de que se levante una excepci√≥n del tipo `ValueError`, se deber√° manejar el error, imprimiendo un mensaje avisando de su eliminaci√≥n del concierto, seguido de los motivos adjuntos en el mensaje de error. Finalmente, se deber√° eliminar el acto del festival con el m√©todo correspondiente.

- En caso que no ocurr√° una excepci√≥n, se deber√° imprimir un mensaje avisando que el acto fue validado correctamente.


`planificar_conciertos()`: Este m√©todo debe rankear los actos de acuerdo a su nivel de inter√©s, para producir un itinerario. 

- Para cada acto del concierto, se deber√° calcular su inter√©s con el m√©todo `calcular_interes`. Luego, se ordener√° la lista de acuerdo al atributo `acto.interes`. 

- Se deber√° generar un archivo serializado en JSON que contenga cada uno de los actos. *Hint: Recordar el m√©todo `__dict__` de un objeto, y que un JSON puede serializarse como una lista de dicts*.

- Finalmente, se deber√° imprimir en orden cada uno de los actos, junto a su g√©nero, y duraci√≥n de presentaci√≥n.

### Cuarta parte: Flujo de Programa

Debes instanciar un `Concierto`, y por cada elemento de la lista proveniente de `actos.json`, instanciar un `Acto` y agregarlo a la instancia de Concierto con el m√©todo correspondiente.

Finalmente, deber√°s ejecutar los m√©todos `validar_actos` y `planificar_concierto` de tu instancia de `concierto`. 