## Ayudantía 09:  I/O y Serialización

#### Autores: @Alonsinho1 & @csantiagopaz


Puedes evaluar esta ayudantía [aquí](https://forms.gle/qh2WLMmGoAhEWLma8)


En esta ayudantía tiene como proposito que interioricen los conpectos de I/O y Serialización. Para esto haremos un breve repaso y unos cuantos ejercicios que les permitirán visualizar la materia.

### ¿Qué son los bits y los bytes?:

Un __byte__ es la estructura basica para guardar datos computacionalmente. Este esta compuesto de 8 __bits__. Cada bit es un numero que puede tener como valor 1 o 0.

Tal como medimos la naturaleza mediante unidades de medida (gramos, litros, Newton, etc.), el byte lo utilizamos para medir el tamaño de los archivos de un computador.

__Para mayor información de como el computador interpreta esta info, pueden tomar el curso IIC2343 Arquitectura de Computadores__

### ¿Qué significa serializar?:

Serializar es transformar un objeto en una secuencia o serie de bytes. Esto permite tener la información en un estado de forma persistente, lo que sirve para enviar el objeto a otros computadores y programas.

### Formatos de seralización

#### JSON

Este formato es limitado, pues solamente permite serializar __algunos__ objetos específicos como strings y diccionarios. Sin embargo, es legible por humanos.

#### Pickle

Pickle es un formato específico de Python para serializar. Una de las ventajas es que este puede serializar __cualquier__ objeto de python, sin embargo no puede ser leído por otros lenguajes de programación o por humanos.

Como este no puede ser leido por humanos, es posible incluír código malicioso en un programa que utiliza pickle, por lo que __NO__ deberías ejecutar código que incluya pickle si es que no confías en su origen.

### Resumen de JSON Vs Pickle

![Resmuen](imgs/Capture.png)

### Bytes en IIC2233

En este curso se les pedira que puedan leer, editar y guardar estos tipos de datos, al igual como lo han hecho con los strings, diccionarios, etc...

#### Open()

La función open() les permitira leer cualquier archivo sin que estos necesariamente sean de texto. Cual es la ventaja de usar open() directamente?

In [None]:
with open('datos.bin', 'rb') as byte_file:
    datos = byte_file.read()
    print(datos)
    print(type(datos))
    mis_bytes = bytearray(datos)
    print(type(mis_bytes))
    
with open('datos2.bin', 'wb') as byte_file:
    byte_file.write(datos)
    
with open('datos2.bin', 'rb') as byte_file:
    print(byte_file.read())
    mis_bytes = bytearray(byte_file.read())

#### bytes() v/s bytearray()

En Python existen dos metodos para definir la estrucutra de byte. Estos son, _bytes()_ y _bytearray()_

Estos métodos permitirán contener bytes o transformar otros tipos de datos a un objeto de tipo bytes.

La diferencia entre bytes y bytearrays es la misma que entre _tuples_ y _lists_:

- _bytes_ y _tuples_ son __inmutables__. Mientras que,

- _bytearrays_ y _lists_ son __mutables__.

In [None]:
datos = bytes([1, 12, 255]) #transformo una lista de ints (0 <= x <= 255)
print(datos)

inversos = bytearray()
for i in range(len(datos)-1, -1, -1):
    inversos.append(datos[i])

print(inversos)

for i in inversos:
    print(i)

#### Conversión de bytes a números enteros


In [None]:
print(int.from_bytes(b'\x01\x01', byteorder='big')) # Utilizaremos el estandar big endian [leer un número de izquierda a derecha]


#### Obtener los bits de un byte

In [None]:
un_byte = b'\x7a'

#pasamos de bytes a int
int_byte = int.from_bytes(un_byte, 'big')
print('1.', int_byte)

#transformamos a un string binario
bin_byte = bin(int_byte)
print('2.', bin_byte)

#eliminamos el 0b del formato bin
bin_byte = bin_byte[2:]
print('3.', bin_byte)

#rellenamos con 0 a la izquierda, para ajustar el tamaño a 8 bits.
bits_byte = bin_byte.zfill(8)
print('4.', bits_byte)

### Ejercicios Propuestos:

¡Han contaminado el recetario de las pizzas del Tini Tamburini! Es por esta razón que han venido a pedirte ayuda mediante este ejercicio propuesto.

Deberás deserializar el archivo **pizzeria.json** que contiene una lista de objetos de clase `Pizza`. Estos objetos tienen el atributo `ingredientes`, el cual ha sido contaminado con elementos que no son comestibles. Para identificarlos, el Tini le entrega un archivo llamado **comestibles.json**, el cual será de ayuda para filtrar los ingredientes mediante el uso un `object_hook`. Finalmente, imprime todas las pizzas utilizando *f-strings*.

In [None]:
import json

class Pizza:
    def __init__(self, nombre, ingredientes, *args, **kwargs):
        self.nombre = nombre
        self.ingredientes = ingredientes
    def __repr__(self):
        return self.nombre
    
def filtrar_comestibles(diccionario):
    
    return Pizza(**diccionario)

# Carga las pizzas del archivo pizzeria.json
# y finalmente imprime la lista de pizzas usando f-strings



## Recruit Anonymous

# Parte 1
Después de ver a Anonymous en twitter, tu como programin decidiste que postular a Anonymous, pero no es un desafio facil.

Al intentar descargar los archivos necesarios para postular, viste que estos estaban escondidos y encriptados, pero tu como experto en Manejo de Bytes y Serealización decidiste investigar más. Luego de arduo trabajo, te diste cuenta que había una forma de desincriptar el archivo, para esto, primero hay que buscar el archivo "contenido.alma", consiguindo encontrar el archivo hay que leer el archivo completo en forma de bytes, despues se obtienen pedazos de a 5 bytes del archivo y se elimina el máximo de ese chunk de bytes. Finalmente deberas eliminar el último byte obtenido (es decir, removerlo del bytearray, el archivo se llama "contenido.alma").


Para poder guardar los contenidos, se deberá escribir los bytes resultantes en un archivo nuevo llamado "desencriptado.alma"

In [None]:
import os
import pickle
# import json

def buscar_contenido():
    for raiz, directorios, archivos in os.walk('Multiverso'):

        if archivos:
            if archivos[0] == "contenido.alma":
                new_str = os.sep.join([raiz, archivos[0]])
                new_str = new_str.replace("\\", "/")
                return new_str


def obtener_contenido(path_alma):
    with open(path_alma, "rb") as file:
        todos_los_bytes = file.read()
        chunk = bytearray()
        for i in range(0, len(todos_los_bytes), 5):
            segmento = todos_los_bytes[i:i + min(5, abs(i - len(todos_los_bytes)))]
            grande = max(segmento)
            bytes_segmento = bytearray(segmento)
            bytes_segmento.remove(grande)
            chunk.extend(bytes_segmento)
        a = chunk.pop()
        with open("desencriptado.alma", "wb") as file2:
            file2.write(chunk)

# Parte 2

Ahora que tienes la función de desencriptación, deberás cargar la información del archivo generado en la funcion anterior mediante algum metodo de deserealización. Sin embargo, intuyes que la información entregda tiene datos extras y por eso has definido en un tupla los parametros que desearas tener del archivo. Es por esto que te propones definir el metodo de deserialización de los datos.

El primer desafio que te encuentras es definir que formato de deserialización deberas usar. El segundo desafio es implementar la deserialización. Finalmente, deberas completar la función deserializar_contenido que retornará una instancia de la clase recruit.

In [None]:
import os
import pickle
# import json


class ContenidoDelInfinito:
    def init(self, nombre, semana, contenido):
        self.nombre = nombre
        self.semana = semana
        self.contenido = contenido
        self.sacrificio = "Sacrifique ..."

    def setstate(self, state):
        """COMPLETAR SOLO SI ES CORRESPONDIENTE"""
        params = ("nombre", "semana", "contenido")
        state.update({"sacrificio": self.sacrificio})
        listas = []
        for key in state.keys():
            if key not in params:
                listas.append(state[key])
        for coisa in listas:
            del coisa
        self.dict = state

    def str(self):
        return "nombre: {} - semana: {} - contenido: {} - sacrificio: {}".format(
            self.nombre,
            self.semana,
            self.contenido,
            self.sacrificio)


def contenido_hook(contenido):
    """COMPLETAR SOLO SI ES CORRESPONDIENTE"""
    params = ("nombre", "semana", "contenido")
    pass


def deserializar_contenido(path_serializado):
    with open(path_serializado, "rb") as file:
        pck = pickle.load(file)
        # return ContenidoDelInfinito(nombre, )

        return pck

Aca puede testear tu codigo

In [None]:
if __name__ == "__main__":
    busqueda = False
    desencriptar = False
    deserializar = False
    try:
        print("Buscando path ...")
        path = buscar_contenido()
        if path:
            print("El camino al contenido del alma es: ", path)
            busqueda = True
        else:
            print("La busqueda del contenido del alma ha fracasado")
    except Exception as err:
        print(err, "hola")
        print("La busqueda del contenido del alma ha fracasado")
    if busqueda:
        try:
            print("Desencriptando el contenido")
            obtener_contenido(path)
            if os.path.exists("desencriptado.alma"):
                print("El sacrificio ha sido aceptado")
                desencriptar = True
            else:
                print("Tu sacrificio no es el correcto")
        except Exception as err:
            print(err, " sacrificio")
    if desencriptar:
        try:
            print("Deserializando el contenido")
            contenido = deserializar_contenido("desencriptado.alma")

            if contenido:
                deserializar = True
                print("Has logrado obtener el contenido")
            else:
                print("No has deserializado bien", "else")
        except Exception as err:
            print(err, " deserializado")
            print("No has deserializado bien")
    if deserializar:
        print(contenido)
        print(
            "nombre: I/O + sacrificio: Tu sacrificio")
        print("Si ves esto, y las dos líneas anteriores estan bien, te hago entrega del Contenido del Anonymous")