# **Ayudantía 7: I/O, Serialización, Networking**

### Autores
* Camila González ([@camilagonzalezp](https://github.com/camilagonzalezp))
* Simón Jaramillo ([@try-except](https://github.com/try-except))
* Caua Terra

# I/0

## ¿Cómo "piensan" los computadores?

* Seguramente has escuchado que los computadores solo piensan en "unos y ceros", estos "unos y ceros" se llaman *bits*
* Un *bit* es la unidad básica de la computación y un grupo de ocho *bits* seguidos se llama *byte*
* Absolutamente todo dentro del computador está expresado en *bits*; los programas, los archivos, etc.

## Ejemplo: Hello World

Por ejemplo, un código de `python` que imprima `"hello world"` para un humano se ve así:

In [1]:
print("hello world")

hello world


Y para el computador se ve así:

```
01110000 01110010 01101001 01101110 01110100 00101000
00100010 01101000 01100101 01101100 01101100 01101111
00100000 01110111 01101111 01110010 01101100 01100100
00100010 00101001 00001010
```

Cada grupo de 8 dígitos representa un número entero, el cual a su vez representa un carácter del código.

Como son muchos unos y ceros, es común usar una representación más cómoda de los bytes, como por ejemplo en forma *hexadecimal*:

```
7072 696e 7428 2268 656c 6c6f 2077 6f72
6c64 2229 0a
```

## ¿Cómo "leen" los computadores?

* Los humanos podemos leer de izquierda a derecha, de derecha a izquierda, de arriba hacia abajo, etc.
* Al momento de diseñar un computador, hay que decidir en qué orden va a leer los *bytes*
* En 1980 aparecen los términos *Big-endian* y *Little-endian* para designar dos ordenes distintos ([referencia](https://www.rfc-editor.org/ien/ien137.txt))
* Al mover *bytes* de un lado a otro, es muy importante saber en qué *endianess* fueron escritos

In [6]:
mi_int = 8
bytes_int = mi_int.to_bytes(4, 'big') # codificado en Little Endian

print(bytes_int)
print(mi_int.to_bytes(4, 'little'))

int_decodificado = int.from_bytes(bytes_int, 'little')
int_mal_decodificado = int.from_bytes(bytes_int, 'big')

print(int_decodificado)
print(int_mal_decodificado)

b'\x00\x00\x00\x08'
b'\x08\x00\x00\x00'
134217728
8


0000001 => 1
(0)*2^7 + (0)*2^6 ... + (1)*2^0 => 1

(0)*2^0 + (0)*2^6 + ... + (1)*2^7 => 2^7

## I/O en `python`

* En `python` hay muchas formas para crear un objeto de clase `bytes`
* Una letra `b` antes de un `string` indica que es un string de bytes

In [5]:
mis_bytes = bytes.fromhex("7072 696e 7428 2268 656c 6c6f 2077 6f72 6c64 2229 0a")
mismos_bytes = b"\x70\x72\x69\x6e\x74\x28\x22\x68\x65\x6c\x6c\x6f\x20\x77\x6f\x72\x6c\x64\x22\x29\x0a"
print('mis_bytes =', mis_bytes)
print('mismos_bytes =', mismos_bytes.decode("ascii"))

mis_bytes = b'print("hello world")\n'
mismos_bytes = print("hello world")



Lo más probable es que acá salgan dudas sobre `decode`

## Bytearrays

* Los objetos de tipo `bytes`, al igual que los `strings` son *inmutables*
* Los `bytearrays` son una colección (arreglo) de `bytes` que sí es *mutable*

In [6]:
mi_bytearray = bytearray(b"\x70\x72\x69\x6e\x74\x28\x22\x68\x65\x6c\x6c\x6f\x20\x77\x6f\x72\x6c\x64\x22\x29\x0a")
print(mi_bytearray[7:18])
mi_bytearray[7:18] = b"hola mundo"
print(mi_bytearray)

bytearray(b'hello world')
bytearray(b'print("hola mundo")\n')


Quizás acá van a preguntar qué significa mutable

## Chunks
* Muchas veces tendremos que manejar grandes cantidades de `bytes` al mismo tiempo, lo que puede ser muy lento
* Podemos seleccionar solo una porción de los `bytes` cada vez para no llenar la memoria

### I/O de archivos

* Como vimos en el ejemplo anterior, los archivos son una colección de *bytes*
* Para leer un archivo sin decodificarlo, usamos el modo `rb` de la función `open`

```python
>>> with open('hello_world.py', 'rb') as archivo:
...     print(archivo.read())

b'print("hello world")\n'
```

* Para escribir un archivo a partir de bytes, usamos el modo `wb` (write bytes)

```python
>>> mis_bytes = bytes.fromhex("7072 696e 7428 2268 656c 6c6f 2077 6f72 6c64 2229 0a")
>>> with open('hello_world.py', 'wb') as archivo:
...     archivo.write(mis_bytes)
```

# Serialización

### Primero, ¿Qué es serialización?

### Serializar es guarda la información de forma persistente, puede ser como bytes(Pickle es un ejemplo) o como un formato de texto estandarizado (JSON es un ejemplo).

### Ya y para que sirve? 

### Nada, se acabo la Ayudantia Chau

### Ya y para que sirve? 

### ~~Nada, se acabo la Ayudantia Chau~~
### Cada programador puede programar en un lenguaje distinto, un idioma distinto, etc. 
### Imagina como seria la comunicación entre distintos programadores si toda la información fuera armazenada de forma arbritaria, seria horrible, por eso serializamos, para tener una padronización de nuestra información que queremos guardar.


# Pickle vs JSON

![Resumen](imgs/resumen.png)

### Metodos Útiles

* `dumps(obj)`: Serializa un objeto, es decir, lo guarda.
* `loads(bytes)`: Deserializa un objeto serializado, es decir, lo carga a su estado original.

* `dump(obj, file)`: Serializa el objeto y lo guarda en un archivo.
* `load(file)`: Deserializa un objeto almacenado en un archivo.

In [3]:
import pickle
import json

diccionario = {
    'mi_variable_1': 8,
    2: 'Hello',
    'tres': True,
    4.0: ['1', '2', '3']
}

serializacion_pickle = pickle.dumps(diccionario)
serializacion_json = json.dumps(diccionario)
print(f"Tipo serialización picke: {type(serializacion_pickle)}")
print(f"Serialización picke: {serializacion_pickle}")
print(f"Tipo serialización JSON: {type(serializacion_json)}")
print(f"Serialización JSON: {serializacion_json}")

print("")

deserializacion_pickle = pickle.loads(serializacion_pickle)
deserializacion_json = json.loads(serializacion_json)
print(f"Tipo deserialización picke: {type(deserializacion_pickle)}")
print(f"Deserialización picke: {deserializacion_pickle}")
print(f"Tipo deserialización JSON: {type(deserializacion_json)}")
print(f"Deserialización JSON: {deserializacion_json}")

Tipo serialización picke: <class 'bytes'>
Serialización picke: b'\x80\x04\x95B\x00\x00\x00\x00\x00\x00\x00}\x94(\x8c\rmi_variable_1\x94K\x08K\x02\x8c\x05Hello\x94\x8c\x04tres\x94\x88G@\x10\x00\x00\x00\x00\x00\x00]\x94(\x8c\x011\x94\x8c\x012\x94\x8c\x013\x94eu.'
Tipo serialización JSON: <class 'str'>
Serialización JSON: {"mi_variable_1": 8, "2": "Hello", "tres": true, "4.0": ["1", "2", "3"]}

Tipo deserialización picke: <class 'dict'>
Deserialización picke: {'mi_variable_1': 8, 2: 'Hello', 'tres': True, 4.0: ['1', '2', '3']}
Tipo deserialización JSON: <class 'dict'>
Deserialización JSON: {'mi_variable_1': 8, '2': 'Hello', 'tres': True, '4.0': ['1', '2', '3']}


### Personalización

### Set state(definir estado)
Acá vamos decidir como cargar la información, si vamos cambiar algun elemento, o desencriptar por ejemplo.

#### Pickle
```python
Basta definir el método __setstate__ en la clase que será responsable de la información.
```


#### Jsonsito
```
Em Json hacemos uso del Object_hook, al hacer json.loads() ou json.load() se debe pasar como parametro la función que queremos que sea responsable por esa deserialización personalizada
```

### Get State
De forma análoga, acá vamos a obtener la información para guardarla

#### Pickle
```python
Basta definir el método __getstate__ en la clase para que se encargue de generar la información a guardar.
```

#### Json
```python
Nuevamente Json es un poquito distinto, pero de forma análoga, vamos definir un método para poder personalizar esa serialización, en ese caso el método default, pero tambien hay que heredar de json.JSONEncoder en la clase que queremos que sea responsable por esa serialización.
```

# Ejemplo
### Criptografar con pickle

In [24]:
import pickle
import json
from functools import reduce

class SecretEncoder(json.JSONEncoder):
    def default(self, obj):
        nueva_lista = [[o.attrs] for o in obj.lista]
        return {
            "secreto": obj.secreto,
            "lista": nueva_lista
        }

class SecretDecoder(json.JSONDecoder):
    def default(self, obj_json):
        nuevo = Secret(obj_json["secreto"])
        nuevo.lista = [] 
        return nuevo

class Secret():
    def __init__(self, secreto):
        self.secreto = secreto
        self.lista = []
        
    def __getstate__(self):
        #Acá se suele retorna el __dict__ de la clase, más que solo un atributo, recuerden que eso es un Ejemplo
        
        print('Me están guardando')
        print(f'mi secreto no Criptografado: {self.secreto}')
        nuevo_secreto = self.secreto[::-1]
        print(f'mi secreto criptografado: {nuevo_secreto}')
        return nuevo_secreto
    
    def __setstate__(self, nuevo_secreto):
        
        print(nuevo_secreto)
        print('Me están cargando')
        print(f'mi secreto criptografado: {nuevo_secreto}')
        secreto_no_secreto = nuevo_secreto[::-1]
        print(f'mi secreto no criptografado: {secreto_no_secreto}')
        self.secreto = secreto_no_secreto
              
obj = Secret('hola soy un string')
#nuevo_obj = pickle.dumps(obj)
#print(nuevo_obj)

#obj2 = pickle.loads(nuevo_secreto)
#print(obj2)

serializado = json.dumps(obj, cls=SecretEncoder)
print(serializado)
print(json.loads(serializado, object_hook=SecretDecoder))

{"secreto": "hola soy un string", "lista": []}


TypeError: __init__() takes 1 positional argument but 2 were given