# Entrada y salida

## Índice de contenidos
* [1. Entrada y salida estándar](#sec_1)
 * [1.1. Funciones input y print](#sec_1_1)
 * [1.2. Formateo de cadenas](#sec_1_2)
* [2. Lectura y escritura de ficheros](#sec_2)
 * [2.1. Apertura y cierre de ficheros](#sec_2_1)
 * [2.2. Lectura y escritura de texto libre](#sec_2_2)
 * [2.3. Lectura y escritura de CSV](#sec_2_3)
 * [2.4. Serialización y deserialización mediante JSON](#sec_2_4)

# 1. Entrada y salida estándar <a name="sec_1"/>

## 1.1. Funciones input y print <a name="sec_1_1"/>

Por regla general, cuando ejecutamos un programa en Python llamamos **entrada estándar** al teclado de nuestro ordenador, y **salida estándar** a la pantalla. Como ya hemos visto en anteriores notebooks, podemos leer datos desde el teclado mediante la función **input**, y escribir en la pantalla mediante la función **print**:

In [None]:
print("==== Cálculo de una potencia =====")
base = int(input("Introduzca un número entero (base):")) # La función predefinida input permite leer texto desde el teclado
exponente = int(input("Introduzca un número entero (exponente):"))

print("El resultado de", base, "elevado a", exponente, "es", base**exponente, '.')

La función **input** recibe opcionalmente un mensaje, que es mostrado al usuario para a continuación esperar que introduzca un texto. La ejecución del programa "se espera" en este punto, hasta que el usuario introduce el texto y pulsa la tecla *enter*. Entonces, **la función *input* devuelve el texto introducido por el usuario** (excluyendo la pulsación de la tecla *enter*, que no aparece en la cadena devuelta). Si en nuestro programa estábamos esperando un dato numérico, en lugar de una cadena, será necesario convertir la cadena al tipo deseado mediante alguna de las funciones de construcción de tipos que ya conocemos (por ejemplo, *int* para obtener un número entero o *float* para obtener un número real).

Por su parte, la función **print** recibe una o varias expresiones por parámetros, y **muestra el resultado** de dichas expresiones en **pantalla**. Si el resultado de alguna de las expresiones es una cadena de texto, la muestra tal cual. Si el resultado de alguna de las expresiones es de cualquier otro tipo, la función *print* se encarga de convertir el resultado a cadena mediante el uso de la función *str*. Si recibe varias expresiones, por defecto *print* las muestra una tras otra, separadas por un espacio en blanco. Al finalizar de mostrar las expresiones, la ejecución de *print* finaliza imprimiendo un salto de línea; por consiguiente, la siguiente llamada a *print* escribirá en la siguiente línea de la pantalla. Ambas cosas, el carácter usado para separar las distintas expresiones y el carácter usado como finalizador, pueden cambiarse utilizando los parámetros opcionales adecuados:

In [None]:
import random
numeros = [random.randint(1, 100) for _ in range(10)]
print("Se han generado los siguientes números aleatorios: ")
for i, numero in enumerate(numeros):
    print(i, numero, sep=': ') # Se usa la cadena ': ' para separar las expresiones recibidas por print

In [None]:
texto = "Muestrame con guiones"
for caracter in texto:
    print('-' + caracter, end='') # Se indica a print que no concatene ninguna cadena al final del mensaje a mostrar

Aunque el uso de los parámetro opcionales *sep* y *end* nos da algunas opciones para obtener la salida que deseamos en pantalla, a veces se nos puede quedar corto. Por ejemplo, si queremos mostrar un mensaje formado por distintos trozos de texto y datos a extraer de variables o expresiones, puede que no siempre queramos usar el mismo separador entre cada dos expresiones. Un ejemplo sencillo lo tenemos en la siguiente sentencia que ya hemos escrito antes:

In [None]:
print("El resultado de", base, "elevado a", exponente, "es", base**exponente, '.')

En este caso, nos interesa usar el espacio para separar los distintos trozos del mensaje a mostrar, salvo para el punto final, que debería aparecer a continuación del resultado de la expresión ``base**exponente``. Además, la forma en que las cadenas de texto y las expresiones se van intercalando en los parámetros del *print* complica un poco la legibilidad de la sentencia. Es por todo esto por lo que es apropiado usar el **formateo de cadenas** en estos casos.

## 1.2. Formateo de cadenas <a name="sec_1_2"/>

El método **format** de las cadenas devuelve una versión *formateada* de la cadena. Entre otras cosas, nos permite intercalar en una cadena los resultados de diversas expresiones, eligiendo el orden o el formato en que se representan dichos resultados. Esta flexibilidad hace de *format* una función perfecta para ser utilizada junto a *print* para mostrar mensajes más o menos complejos, con mucho más control sobre la salida obtenida del que tendríamos usando únicamente *print*. 

El uso más básico de *format* consiste en intercalar en la cadena parejas de llaves, de manera que el método devolverá una cadena en la que se sustituirán las llaves por los resultados de evaluar las expresiones que reciba como parámetros, en el mismo orden:

In [None]:
a = int(input('Introduce un número:'))
b = int(input('Introduce un número:'))

print('El resultado de {} elevado a {} es {}.'.format(a, b, a**b))

Podemos hacer mención explícita entre las llaves a la expresión concreta que queremos intercalar. Para ello utilizamos números comenzando en cero (como si los parámetros recibidos por format fueran una lista):

In [None]:
print('El resultado de {0} multiplicado por {1} es {2}'.format(a, b, a*b))

Esto nos permite intercalar los datos en cualquier orden, o usarlos varias veces dentro de la cadena:

In [None]:
print('El resultado de {0} entre {1} es {2}, y el de {1} entre {0} es {3}'.format(a, b, a/b, b/a))

Podemos formatear los valores numéricos, por ejemplo indicando que queremos redondear a 2 decimales. La f del siguiente ejemplo indica que el número a mostrar es un real:

In [None]:
print('El resultado de {0} entre {1} es {2:.2f}, y el de {1} entre {0} es {3}'.format(a, b, a/b, b/a))

También es posible conseguir que un dato ocupe un mínimo de caracteres, rellenando  los huecos con espacios si es necesario. Esto es especialmente útil cuando se desea mostrar información en forma de tabla, consiguiendo que las columnas queden alineadas. La d en el siguiente ejemplo indica que los números a mostrar son enteros:

In [None]:
print("Mostrando los cuadrados y los cubos de los números del 1 al 5:")
for i in range(1,6):
    print('{0} {1:2d} {2:3d}'.format(i, i*i, i*i*i))

Si lo preferimos, podemos rellenar los huecos con ceros en lugar de espacios, como se muestra en este ejemplo:

In [None]:
print("Mostrando los cuadrados y los cubos de los números del 1 al 5:")
for i in range(1,6):
    print('{0:03d} {1:03d} {2:03d}'.format(i, i*i, i*i*i))
    

En ocasiones, nombrar a las distintas expresiones que pasamos al método format puede mejorar la legibilidad. Para ello, usaremos parámetros con nombre en la llamada a format, y podremos referirnos a dichos nombres en las distintas llaves que utilicemos en la cadena a formatear:

In [None]:
print('Si x es igual a {x} e y es igual a {y}, entonces la inecuación x < (y * 2) es {inecuacion}'.
             format(x=a, y=b, inecuacion= a<(b*2)))

# 2. Lectura y escritura de ficheros <a name="sec_2"/>

Muchas veces no es suficiente con la introducción de datos desde el teclado por parte del usuario. Como hemos visto en los ejercicios realizados a lo largo del curso, es muy habitual leer datos desde un fichero o archivo (que llamamos de entrada). Igualmente, es posible escribir datos en un fichero (que llamamos de salida).

Tanto la lectura como la escritura de datos en un fichero se puede realizar de diversas formas:

* Mediante cadenas de texto libres, en lo que llamamos **ficheros de texto**.
* Mediante cadenas de texto de un formato predefinido, como es el caso de los ficheros **csv**.
* Mediante algún formato estándar de intercambio de datos (por ejemplo, **json**), lo que nos permite guardar y recuperar más tarde fácilmente el contenido de las variables de nuestros programas. A este tipo de escrituras y lecturas las llamamos *serialización* y *deserialización*, respectivamente.
* Mediante datos binarios, en lo que llamamos *ficheros binarios*. De esta forma, el programador tiene el control absoluto de los datos que se escriben o se leen de un fichero. Esto no lo veremos en esta asignatura.


## 2.1. Apertura y cierre de ficheros <a name="sec_2_1"/>

Lo primero que hay que hacer para poder trabajar con un fichero es abrirlo. Al abrir un fichero, establecemos la manera en que vamos a trabajar con él: si lo haremos en modo texto o modo binario, o si vamos a leer o escribir de él, entre otras cosas. 

La apertura de un fichero se realiza mediante la función **open**:

In [None]:
f = open('fichero.txt')

Si la apertura del fichero se lleva a cabo sin problemas, la función nos devuelve un **descriptor del fichero**. Usaremos esta variable más adelante para leer o escribir en el fichero.

Por defecto, el fichero se abre en modo texto para lectura. Podemos cambiar el modo en que se abre el fichero mediante el parámetro opcional **mode**, en el que pasaremos una cadena formada por alguno(s) de los caracteres siguientes:
* 'r': abre el fichero en modo lectura.
* 'w': abre el fichero en modo escritura. Si el archivo existía, lo sobrescribe (es decir, primero es borrado).
* 'a': abre el fichero en modo escritura. Si el archivo existía, las escrituras se añadirán al final del fichero.
* 't': abre el fichero en modo texto. Es el modo por defecto, así que normalmente no lo indicaremos y se entenderá que lo abrimos en modo texto. Es el modo que usaremos siempre en nuestra asignatura.
* 'b': abre el fichero en modo binario.

Veamos como ejemplo cómo abrir un fichero de texto para escribir en él, sobrescribiéndolo si ya existía:

In [None]:
f2 = open('fichero_escritura.txt', mode='w')

Cuando abrimos un fichero de texto es importante que tengamos en cuenta la **codificación de caracteres** utilizada por el fichero. Existen diversos estándares, aunque el más utilizado hoy en día en el contexto de Internet es el **utf-8**. Será éste el que usaremos preferiblemente. Por defecto, la función *open* decide la codificación de caracteres en función de la configuración de nuestro sistema operativo. Para especificar explícitamente que se utilice *utf-8* lo haremos mediantes el parámetro opcional **encoding**:

In [None]:
f3 = open('fichero.txt', encoding='utf-8')

Cuando terminemos de trabajar con el fichero (por ejemplo, al acabar de leer su contenido), es importante **cerrarlo**. De esta forma liberamos el recurso para que puedan trabajar con él otros procesos de nuestra máquina, y también nos aseguramos de que las escrituras que hayamos realizado se llevan a cabo de manera efectiva en disco (ya que las escrituras suelen utilizar un buffer en memoria para mejorar la eficiencia). Para cerrar un fichero usamos el método **close** sobre el descriptor del fichero que queremos cerrar:

In [None]:
f.close()
f2.close()
f3.close()

Una forma de no olvidarnos de cerrar el fichero (algo muy habitual) es usar la sentencia **with**:

In [None]:
with open('fichero.txt', encoding='utf-8') as f:
    print('Trabajamos con el fichero...')    

Una vez ejecutadas las instrucciones contenidas en el bloque *with*, el fichero es cerrado automáticamente. Esta variante tiene la ventaja además de que si se produce cualquier error mientras trabajamos con el fichero, que produzca la parada de la ejecución de nuestro programa, el fichero también es cerrado. Esto no ocurre si abrimos el fichero sin usar *with*.

## 2.2. Lectura y escritura de texto libre <a name="sec_2_2"/>

Una vez abierto un fichero en modo texto, podemos leer todo el contenido y guardarlo en una variable de tipo cadena mediante el método **read**:

In [None]:
with open('fichero.txt', encoding='utf-8') as f:
    contenido = f.read()
    print(contenido)  # Mostramos el contenido del fichero

Aunque se puede hacer de esta forma, es más habitual leer los ficheros de texto línea a línea. De esta forma podemos procesar archivos muy grandes sin usar demasiada memoria. Para ello, podemos usar el descriptor del fichero dentro de un bucle *for*, como si se tratara de una secuencia de cadenas, de manera que en cada paso del bucle obtendremos la siguiente línea del fichero:

In [None]:
with open('fichero.txt', encoding='utf-8') as f:
    for linea in f:
        print(linea)

Observarás que en el ejemplo anterior se está visualizando cada línea separada con una línea vacía. Esto es así porque la línea leida del fichero incluye al final un salto de línea, y a su vez la función *print* incluye un salto de línea tras la cadena a mostrar. Si queremos mostrar el contenido del fichero con el mismo formato que en el ejemplo anterior, podríamos hacer esto:

In [None]:
with open('fichero.txt', encoding='utf-8') as f:
    for linea in f:
        print(linea, end='')

Para escribir texto en un fichero, usaremos el método **write** sobre el descriptor del fichero:

In [None]:
with open('fichero_escritura.txt', mode='w', encoding='utf-8') as f:
    f.write('Este texto se almacenará en el fichero.')

Comprobemos si se ha realizado la escritura correctamente:

In [None]:
with open('fichero_escritura.txt', encoding='utf-8') as f:
    contenido = f.read()
    print(contenido)

## 2.3. Lectura y escritura de CSV <a name="sec_2_3"/>

Un tipo de fichero de texto que usamos en muchos ejercicios es el llamado formato **CSV** (por *Comma-Separated Values*). Estos ficheros se utilizan para almacenar datos de tipo tabular, al estilo de una hoja de cálculo. En este notebook se incluye un fichero con este formato, extraído del ejercicio "Servicio de alquiler de bicicletas públicas de Sevilla (Sevici)". Veamos un trozo de su contenido:

In [None]:
with open('estaciones.csv', encoding='utf-8') as f:
    # Leemos las líneas del fichero junto con un número que indica la línea por la que vamos
    for num_linea, linea in enumerate(f):  
        print(linea, end='')
        if num_linea == 10:   # Al llegar a las 10 líneas, paramos
            break

Como puedes observar, los datos vienen expresados por columnas. Cada columna o atributo representa un dato concreto, y cada línea representa una tupla o registro de valores para cada uno de los atributos. 

Para poder trabajar con estos datos, lo normal es que necesitemos acceder a cada atributo de cada registro por separado. Si leemos el fichero línea a línea, podríamos acceder a cada atributo si rompemos la cadena en cada uno de los trozos separados por una coma. Esto puede conseguirse así:

In [None]:
with open('estaciones.csv', encoding='utf-8') as f:
    for num_linea, linea in enumerate(f):  
        trozos = linea.split(',')
        print(trozos)
        if num_linea == 10:   # Al llegar a las 10 líneas, paramos
            break

Como puedes observar, al usar el método *split* obtenemos una lista con los distintos atributos de cada línea. Podríamos acceder ahora al atributo que quisiéramos usando los corchetes sobre dicha lista.

Sin embargo, esta no es la mejor manera de trabajar con un CSV, ya que se nos pueden colar espacios en blanco en sitios que no esperamos, caracteres de salto de línea... Existen en Python dos mecanismos que nos permiten leer CSV de una forma más sencilla y robusta:
* Mediante la función **csv.reader**, que nos permite recorrer cada registro del fichero en formato lista.
* Mediante el objeto **csv.DictReader**, que nos permite recorrer cada registro del fichero en formato diccionario.

Empecemos viendo un ejemplo de uso de **csv.reader**:

In [None]:
import csv # Hay que importar el paquete csv

with open('estaciones.csv', encoding='utf-8') as f:
    lector = csv.reader(f)
    for registro in lector:
        print(registro)
        # Para este ejemplo, nos basta con ver el primer registro
        break;

En el CSV que estamos procesando, la primera línea contiene los nombres de los atributos. No es por tanto un registro como tal (no contiene valores), por lo que lo habitual es saltárnoslo. Esto se puede conseguir de la siguiente forma:

In [None]:
with open('estaciones.csv', encoding='utf-8') as f:
    lector = csv.reader(f)
    next(lector) # Nos saltamos la cabecera del CSV
    for registro in lector:
        print(registro)
        # Para este ejemplo, nos basta con ver el primer registro
        break;

Normalmente, nos interesa almacenar los registros en alguna estructura de datos, para utilizarlos más adelante en nuestro programa. Podemos utilizar por ejemplo una lista para almacenar cada registro. Además, es conveniente que convirtamos cada atributo al tipo de datos de Python que mejor se adapte al tipo de dato que representa el atributo. En nuestro ejemplo, el primer atributo es una cadena de texto, los tres siguientes son números enteros, y los dos últimos números reales.

Podríamos obtener una lista de tuplas, cada tupla representando un registro del fichero, de esta manera:

In [None]:
with open('estaciones.csv', encoding='utf-8') as f:
    lector = csv.reader(f)
    next(lector) # Nos saltamos la cabecera del CSV
    registros = []
    for registro in lector:
        name = registro[0]
        slots = int(registro[1])
        empty_slots = int(registro[2])
        free_bikes = int(registro[3])
        latitude = float(registro[4])
        longitude = float(registro[5])
        tupla = (name, slots, empty_slots, free_bikes, latitude, longitude)
        registros.append(tupla)

# Mostremos los 10 primeros registros
print(registros[:10])

Si tenemos muchos atributos, es preferible utilizar **csv.DictReader** para leer el CSV. La diferencia con *csv.reader* es que cada registro devuelto está representado mediante un diccionario, en el que las claves son los nombres de los atributos (obtenidos a partir de la cabecera del CSV) y los valores asociados son los valores de los atributos correspondientes. Al hacer uso de los nombres de los atributos para acceder a los atributos se mejora la legibilidad del código:

In [None]:
with open('estaciones.csv', encoding='utf-8') as f:
    lector = csv.DictReader(f)
    registros = []
    for registro in lector:
        name = registro['name']
        slots = int(registro['slots'])
        empty_slots = int(registro['empty_slots'])
        free_bikes = int(registro['free_bikes'])
        latitude = float(registro['latitude'])
        longitude = float(registro['longitude'])
        tupla = (name, slots, empty_slots, free_bikes, latitude, longitude)
        registros.append(tupla)

# Mostremos los 10 primeros registros
print(registros[:10])

Si el CSV que utilizamos no tiene una primera línea de cabecera con los nombres de los atributos, podemos pasarle dichos nombres a *csv.DictReader* mediante el parámetro opcional **fieldnames**. Debemos pasar en dicho parámetro una lista de cadenas con los nombres que queremos asignarle a los atributos, en el mismo orden en que aparezcan en el CSV.

## 2.4. Serialización y deserialización mediante JSON <a name="sec_2_4"/>

Llamamos **serialización** al proceso de convertir los datos almacenados en una o varias variables de nuestro programa a una representación en formato textual o binario, de manera que posteriormente esta representación pueda ser utilizada para volver a cargar dichos datos en nuestro programa, proceso que se conoce como **deserialización**. 

La serialización/deserialización nos permite guardar el contenido de una variable tal cual en un fichero, de manera que en una ejecución posterior de nuestro programa (o de otro programa) esos datos puedan ser cargados fácilmente en otra variable, y se pueda seguir trabajando con ellos. Otra posibilidad es utilizar la representación obtenida para enviarla a través de Internet, de manera que permitamos que dos programas situados en máquinas distintas se envíen estos datos uno al otro; conseguimos así que ambos programas puedan colaborar como si se ejecutaran en una misma máquina y compartieran dicha variable. Esta es la base de los **servicios web**, aplicaciones que ofrecen funcionalidades que pueden ser utilizadas por programas a través del protocolo **http**. Por poner algunos ejemplos, es posible consultar información sobre artistas o canciones haciendo consultas a los servicios web ofrecidos por *Spotify*. La información requerida es serializada por los servidores de *Spotify*, y enviada por Internet como respuesta a la petición de un cliente. El programa del cliente deserializará dicha información y podrá utilizarla para llevar a cabo la funcionalidad que se desee.

Un formato estándar de intercambio de datos ampliamente utilizado y muy bien integrado en Python es **json**. De hecho, la representación de los datos en *json* es muy parecida a la propia sintaxis de Python. Puedes comprobarlo en el siguiente ejemplo, en el que serializamos la variable glosario:

In [None]:
import json

glosario = {'programación estructurada': [14,15,18,24,85,86], 'funciones': [2,3,4,8,9,10,11,14,15,18]}
glosario_json = json.dumps(glosario)
print(glosario_json)

Aunque la variable que se está serializando en este ejemplo es simple, con el mismo código podemos serializar cualquier variable, sea cual sea la complejidad de los datos que almacena. 

Para deserializar la representación *json* obtenida, lo haremos así:

In [None]:
glosario = json.loads(glosario_json)
print(glosario)

Si combinamos los ejemplos anteriores con la escritura y lectura de ficheros de texto, podemos guardar en un fichero el contenido de la variable, y en una ejecución posterior leer el fichero y cargar dichos datos de nuevo en una variable:

In [None]:
glosario = {'programación estructurada': [14,15,18,24,85,86], 'funciones': [2,3,4,8,9,10,11,14,15,18]}
glosario_json = json.dumps(glosario)
print('Almacenando la variable glosario en el fichero glosario.txt')
with open('glosario.txt','w') as f:
    f.write(glosario_json)

In [None]:
print('Cargando los datos del fichero glosario.txt en la variable glosario')
with open('glosario.txt') as f:
    glosario_json = f.read()
    glosario = json.loads(glosario_json)
    print('Datos cargados:', glosario)

La deserialización de *json* nos permite hacer multitud de consultas a diversos servicios web, y trabajar con los datos obtenidos directamente en nuestro programa Python. Por ejemplo, el siguiente ejemplo muestra cómo obtener la información sobre las estaciones de bicicletas de alquiler de Sevici (servicio público de alquiler de bicicletas de Sevilla), a través del servicio web ofrecido por https://citybik.es/:

In [None]:
import urllib.request

# urllib.request.urlopen es parecido a la función open, pero en lugar de leer
# desde un fichero estamos leyendo una dirección http
with urllib.request.urlopen("https://api.citybik.es/v2/networks/sevici") as f:
    sevici_json = f.read()
    estaciones = json.loads(sevici_json)
    print(estaciones)

El objeto que hemos cargado en la variable estaciones tiene una estructura compleja, por lo que es conveniente consultar la [documentación del servicio](https://api.citybik.es/v2/) si queremos utilizar dichos datos en nuestro programa. Observe el abundante uso de diccionarios y listas. Por ejemplo, es posible acceder a las direcciones de todas las estaciones mediante este código:

In [None]:
with urllib.request.urlopen("https://api.citybik.es/v2/networks/sevici") as f:
    sevici_json = f.read()
    estaciones = json.loads(sevici_json)
    for estacion in estaciones['network']['stations']:
        print(estacion['extra']['address'])

**NOTA:** Si obtienes un error al ejecutar las dos celdas de código anteriores, prueba a cambiar la llamada a la función json.loads, de esta forma:
```python
json.loads(sevici_json.decode('utf-8'))
```

### ¡Prueba tú!
El servicio web ofrecido por https://swapi.co/ proporciona información sobre las películas de la saga Star Wars. Consulta la [documentación del servicio](https://swapi.co/documentation) y escribe un código similar al de Sevici que muestre los nombres de todos los personajes que aparecen en el episodio VII.

NOTA: Para poder acceder a los recursos de la API, es necesario hacer la consulta de la url de manera algo distinta a lo mostrado anteriormente, incorporando el campo [User-Agent](https://es.wikipedia.org/wiki/Agente_de_usuario) en la llamada. Se proporciona a continuación el código necesario para hacer esto.

In [None]:
from urllib.request import urlopen, Request

# Consultar la información del episodio 7 de Star Wars
with urllib.request.urlopen(Request("https://swapi.co/api/films/7", headers={'User-Agent': 'python'})) as f:
    # TODO
            