# Lo que hemos visto hasta ahora
Primero vimos los tipos de datos:
* Flotante: `float` como `3.14`
* Entero: `int` como `2021`
* Booleano: `bool` que son `True` y `False`
* Un tipo que representa la nada: `NoneType` con el único valor `None`

También vimos unos datos que se podían iterar. Los cuales se dividían en dos grupos:
* Inmutables:
  * cadenas: `str` como 'Hola Mundo' o como "Hola otra vez"
  * tuplas: `tuple` como `2021,  3.14,  'Hola Mundo'`
* Mutables:
  * listas: `list` como `[2021,  3.14,  'Hola otra vez']`
  * conjuntos: `set` como `{2021,  3.14,  'Hola otra vez'}`
  * diccionarios: `dict` como `{2021:'Año de este curso',  3.14:'Perimetro sobre el radio',  'Hola Mundo':'Primera cadena usada al aprender un lenguaje de programación'}`
  * arreglos de la librería `numpy` sobre los cuales se pueden hacer operaciones aritméticas y matriciales.  




# Conjuntos.
A diferencia de las listas y las tuplas, en un **conjunto** (`set`):
* los elementos no se repiten, 
* pueden cambiar su puesto, 
* se definen con llaves,
* los elementos pueden ser números, `str`, `tuple` pero no `list` (específicamente son objetos inmutables que tienen implementado el método `__hash__`)

In [76]:
B = {1,0,1,0}
B

{0, 1}

In [77]:
D = {1,3,2,6,3,9,5,7,0,4,8}
D

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}

La **pertenencia a un conjunto** se comprueba con `in`

In [78]:
2 in B

False

In [79]:
2 in D

True

En Python también se puede definir un **conjunto por comprensión**, es decir usando parámetros.

In [80]:
{x**2 for x in range(-5,10)}

{0, 1, 4, 9, 16, 25, 36, 49, 64, 81}

El **conjunto vacío** <u>no</u> se define con los corchetes sino con 

In [81]:
set()

set()

In [82]:
{[1,2,3],4}

TypeError: unhashable type: 'list'

# Diccionario
Un **diccionario** (`dict`) se parece a un conjunto, pero a cada elemento del diccionario se le asocia un valor (elemento : valor).

In [83]:
libro_1={
    'nombre':'La pandemia del 2020', 
    'año_de_publicacion':2310, 
    'genero':'Historia'
}

libro_1

{'nombre': 'La pandemia del 2020',
 'año_de_publicacion': 2310,
 'genero': 'Historia'}

Dado un elemento es posible recuperar su valor

In [84]:
libro_1['nombre']

'La pandemia del 2020'

De manera similar es posible adicionar, cambiar o eliminar un elemento:valor

In [85]:
libro_1['autor']='Covid Covidez'
libro_1

{'nombre': 'La pandemia del 2020',
 'año_de_publicacion': 2310,
 'genero': 'Historia',
 'autor': 'Covid Covidez'}

In [86]:
libro_1['año_de_publicacion']=3333
libro_1

{'nombre': 'La pandemia del 2020',
 'año_de_publicacion': 3333,
 'genero': 'Historia',
 'autor': 'Covid Covidez'}

In [87]:
del libro_1['genero']
libro_1

{'nombre': 'La pandemia del 2020',
 'año_de_publicacion': 3333,
 'autor': 'Covid Covidez'}

In [88]:
libro_2=dict(
    nombre='La rutina diaria a finales del siglo XX', 
    genero='Humor', 
    año_de_publicacion=2222)
libro_2

{'nombre': 'La rutina diaria a finales del siglo XX',
 'genero': 'Humor',
 'año_de_publicacion': 2222}

También es posible crear diccionarios por comprensión

In [89]:
import random
clave={x:random.random() for x in range(5)}
clave

{0: 0.7618351319926817,
 1: 0.5766231545127123,
 2: 0.7935493841726842,
 3: 0.3160884411860153,
 4: 0.1955792954747282}

# `with` 
La sentencia `with` se utiliza con objetos que tienen definido los métodos `__enter__` y `__exit__` como se muestra en el siguiente ejemplo.

In [90]:
class Ejemplo:
    def __enter__(self):
        print('Ya entré')
        return 'Hola Mundo'
    def __exit__(self, tipo_err, error, err_info):
        print('Ya salí:',tipo_err, error, err_info)

        
print('Antes del bloque')        
with Ejemplo() as x:
    print('Esto recibí:', x)
print('Después del bloque')

Antes del bloque
Ya entré
Esto recibí: Hola Mundo
Ya salí: None None None
Después del bloque


In [91]:
print('Antes del bloque')        
with Ejemplo() as x:
    print('Vamos a dividir por cero')
    print(1/0)
    print('Ya dividí por cero')
print('Después del bloque')

Antes del bloque
Ya entré
Vamos a dividir por cero
Ya salí: <class 'ZeroDivisionError'> division by zero <traceback object at 0x000001FA2AF48EC8>


ZeroDivisionError: division by zero

# Leer y escribir archivos de texto
La función incorporada
* `open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)` 
permite leer y/o escribir un archivo. Por ejemplo.

In [92]:
with open("test.txt", mode='w', encoding='utf-8') as archivo:
    print('Archivo:',archivo)
    archivo.write('Esto queda escrito en el archivo')

Archivo: <_io.TextIOWrapper name='test.txt' mode='w' encoding='utf-8'>


In [93]:
with open("test.txt", mode='r', encoding='utf-8') as archivo:
    texto = archivo.read()
print(texto)

Esto queda escrito en el archivo


 Los parámetros de `open` son:
* `file` es el nombre del archivo, 
* `mode` está dado por 
  * 'r': abierto para lectura (por defecto)
  * 'w': abierto para escritura
  * 'x': abierto para creación en exclusiva, falla si el fichero ya existe
  * ’a’: abierto para escritura, añadiendo al final del fichero si este existe
  * 'b': modo binario
  * ’t’: modo texto (por defecto)
  * ’+’: abierto para actualizar (lectura y escritura)
* `encoding` corresponde a la codificación, recomiendo usar `utf-8`
* Los otros parámetros recomiendo no cambiarlos.  

Como el objeto que retorna `open` implementa las funciones `__enter__` y `__exit__` puede ser usado con `with`, lo cual simplifica la codificación y el manejo de errores.

Además de ser iterable, puede proveer los siguientes atributos y métodos:
* `close()`: Cierra el stream. Cuando se usa `with` no hay que llamarlo porque `__exit__` lo llama.
* `closed` : Es `True` si está cerrado el stream.
* `fileno()`: Retorna el descriptor de archivo subyacente (un número de tipo entero).
* `flush()`: Vacía los buffers de grabación del stream si corresponde. 
* `isatty()`: Retorna `True` si el stream es interactiva (ej., si está conectado a un terminal o dispositivo tty).
* `readable()`: Retorna `True` si el stream puede ser leída. Si es `False`, el método read() lanzará un OSError.
* `readline(size=-1)`: Lee y retorna una línea del stream. Si size (tamaño) es especificado, se capturará un máximo de ése mismo tamaño especificado en bytes.
* `readlines(hint=-1)`: Lee y retorna una lista de líneas del stream. hint puede ser especificado para controlar el número de líneas que se lee: no se leerán más líneas si el tamaño total (en bytes / caracteres) de todas las líneas excede hint.
* `seek(offset, whence=SEEK_SET)`: Cambiar la posición del stream al dado byte offset. offset se interpreta en relación con la posición indicada por whence. El valor dado para whence es SEEK_SET. Valores para whence son:
* `seekable()`: Retorna `True` si el stream apoya acceso aleatorio. Si retorna `False`, seek(), tell() y truncate() lanzarán OSError.
* `tell()`:Retorna la posición actual del stream.
* `truncate(size=None)`: Cambia el tamaño del stream al size dado en bytes (o la posición actual si no se especifica size). 
* `writable()` Retorna True si el stream apoya grabación. Si retorna False, write() y truncate() lanzarán OSError.
* `writelines(lines)`: Escribir una lista de líneas al stream. No se agrega separadores de líneas, así que es usual que las líneas tengan separador al final.
* `__del__()`: Llama `close()`.
* `read(size=-1)`:Lee hasta el size de los bytes del objeto y los retorna. 
* `write(b)`: Escribe  b al stream subyacente y retorna la cantidad de bytes grabadas.

# Leer y escribir arreglos de numpy

Numpy tiene sus propias librerías para escribir y leer sus arreglos.

`numpy.save(file, arr, allow_pickle=True, fix_imports=True)`

In [94]:
import numpy as np
A=np.arange(50).reshape(5,10)
A

array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
       [40, 41, 42, 43, 44, 45, 46, 47, 48, 49]])

In [95]:
np.save('arreglo_A.npy', A)

In [96]:
A_leido=np.load('arreglo_A.npy')
A_leido

array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
       [40, 41, 42, 43, 44, 45, 46, 47, 48, 49]])

Sin embargo, en la literatura puede encontrar muchas otras opciones.

# Pandas
Ver '10 minutes to pandas'

# Bases de datos
Una universidad tiene muchas tablas. Por ejemplo:
* cursos dados cada semestre
* profesores
* programas
* materias
* espacios físicos
* egresados
* seminarios y congresos

Además, algunas de las tablas están relacionadas con otras y se pueden hacer consultas que involucren las diferentes tablas. Por ejemplo, el listado de los correos electrónicos de los profesores que van a usar un determinado salón durante un determinado seminario.

Para administrar estas tablas se utilizan **Sistemas de administración de bases de datos** (**RDBMS**). Estos sistemas son gestionados mediante sentencias **SQL**. Pandas permite conectarse a algunos RDBMS y ejecutar consulta incluso con sentencias SQL.

Recientemente, con la explosión de información digital, resulta muy costoso o prácticamente imposible realizar una estructura detallada sobre algunos conjuntos de datos; lo cual motivó la creación de nuevas formas de consultar las bases de datos no estructuradas. Estas formas se conocen como **NoSQL**. Una de estas formas está basada en los diccionarios es decir parejas de llave-valor y se pueden almacenar en el formato **JSON** (JavaScript Object Notation).

# Leer y escribir archivos  JSON
En JSON se puede almacenar los siguientes tipos de datos:
* `float`
* `str`
* `list`
* `dict`
* `bool` 
* `NoneType`
 
Los datos booleanos van en minúscula y el tipo nulo es `null`.

<!-- Resulta que con un diccionario prácticamente se puede modelar un objeto de Python, en donde las llaves son los atributos (o las funciones) y su valor es el contenido o dirección de memoria. -->


In [4]:
libreria=[
    {
        'nombre':'La novela más larga',
        'género':'novela',
        'autor' :'Elif'
    },
    {
        'nombre':'Filosofía del electrón',
        'género':[
            {
                'ciencias':{
                    'física':'partículas'
                }
            },
            'Filosofía'
        ],
        'autor' : [
            {
                'Instituto de altas energías':[
                    'Gonzalo Rodríguez',
                    'Rodrigo González'
                ],
                'Centro Filosófico del Sur': 'Dolores de Rodríguez'
            }
        ]
    }
]

libreria

[{'nombre': 'La novela más larga', 'género': 'novela', 'autor': 'Elif'},
 {'nombre': 'Filosofía del electrón',
  'género': [{'ciencias': {'física': 'partículas'}}, 'Filosofía'],
  'autor': [{'Instituto de altas energías': ['Gonzalo Rodríguez',
     'Rodrigo González'],
    'Centro Filosófico del Sur': 'Dolores de Rodríguez'}]}]

In [5]:
import json

with open('libreria.json', 'w') as archivo:
    json.dump(libreria,archivo)

In [6]:
with open('libreria.json', 'r') as archivo:
    libreria_leida=json.load(archivo)
libreria_leida

[{'nombre': 'La novela más larga', 'género': 'novela', 'autor': 'Elif'},
 {'nombre': 'Filosofía del electrón',
  'género': [{'ciencias': {'física': 'partículas'}}, 'Filosofía'],
  'autor': [{'Instituto de altas energías': ['Gonzalo Rodríguez',
     'Rodrigo González'],
    'Centro Filosófico del Sur': 'Dolores de Rodríguez'}]}]