# Entrada y salida de datos

En la mayoría de los programas es necesario poder cargar unos datos de entrada y almacenar los resultados de salida. En esta sección vamos a ver cómo utilizar los mecanismos básicos de manejo de ficheros en Python para realizar estas tareas.

Python nos permite trabajar con un fichero a través de un objeto `File`. Un objeto `File` representa una conexión a un fichero determinado, y nos permite leer su contenido o escribir en él.

Veamos un ejemplo sencillo.

In [None]:
# Ajusta la ubicación del directorio `U09_aux`
# incluido en el material de la unidad
# que descargaste del campus !!
DIR_U09_AUX = os.path.join(".", "U09_aux")

nombre_fichero = os.path.join(DIR_U09_AUX, "lorem_ipsum.txt")

# Abrimos un fichero de texto con la función open()
f = open(nombre_fichero, "r")

# Tenemos un objeto file en la variable f
# Leemos una línea del fichero usando readline()
linea_1 = f.readline()
print(linea_1)

# Cuando hemos terminado, debemos cerrar el fichero
f.close()


Lorem ipsum dolor sit amet,

c:\Users\alber\OneDrive\Documentos\GitHub\BigDataConPython\Master BD Python\Material


Para empezar, tenemos que abrir el fichero. Para ello utilizamos la función `open()`. El primer argumento de esta función es el nombre del fichero que queremos abrir. Si el fichero está en un directorio diferente de donde se ejecuta la sesión de Python, tendremos que indicar la ruta completa de directorios. El segundo argumento indica _en qué modo_ queremos abrir el fichero, esto es, si queremos abrirlo solo para lectura (pero no podremos escribir en él), o para lectura y escritura, si queremos vaciar su contenido antes de empezar a escribir, o queremos añadir contenido al final...

A continuación indicamos los códigos que se utilizan para los distintos _modos_ aceptados

| Modo | Descripción |
|:-----|:------------|
| `r`  | Abrir solo para lectura, desde el inicio del fichero |
| `r+` | Abrir para lectura y escritura, desde el inicio del fichero |
| `w`  | Abrir solo para escritura. Si el fichero no existe, lo crea primero. Si ya existe, sobreescribe el contenido |
| `w+` | Abrir para escritura y lectura. Si el fichero no existe, lo crea primero. Si ya existe, sobreescribe el contenido |
| `a`  | Abrir para añadir al final del fichero. Si el fichero no existe, lo crea primero. |
| `a+` | Abrir para añadir al final del fichero y para lectura. Si el fichero no existe, lo crea primero. |

Estos modos sirver para trabajar con ficheros cuyo contenido esté codificado como texto. Si queremos trabajar con datos binarios (por ejemplo, una imagen), añadimos el modificador `b` a la primera letra del modo (p.ej. `"rb"`, `"rb+"` o `"wb+"`).

La función `open()` nos devuelve un objeto `file` que usaremos para acceder y manipular su contenido.

Para leer el contenido, disponemos de varias funciones

| Función                 | Descripción                            |
|:------------------------|:---------------------------------------|
| `f.read(n)`             | Lee `n` caracteres o bytes del fichero |
| `f.readline()`          | Lee una nueva línea del fichero        |
| `f.readlines()`         | Lee todas las líneas del fichero       |

Veamos un ejemplo de cómo leer el contenido completo de un fichero de texto.

In [None]:
# Abrimos un fichero de texto con la función open()
f = open(nombre_fichero, "r")

# Leemos todas las lineas del fichero
lineas = f.readlines()
print(lineas)

# Cuando hemos terminado, debemos cerrar el fichero
f.close()



SyntaxError: EOL while scanning string literal (625112469.py, line 12)

La función `f.readlines()` lee todas las líneas y las devuelve en una lista. En realidad, si lo que necesitamos es iterar y procesar secuencialmente cada una de las líneas, cargar todo el contenido del fichero de golpe en memoria no suele ser la mejor opción, sobre todo si el fichero es grande. Una forma más eficiente y rápida es la siguiente.

In [None]:
# Abrimos un fichero de texto con la función open()
f = open(nombre_fichero, "r")

# Iteramos sobre las lineas del fichero
for linea in f:
    print(linea)

# Cerramos el fichero
f.close()

Lorem ipsum dolor sit amet,

consectetur adipiscing elit,

sed eiusmod tempor incidunt

ut labore et dolore magna aliqua.



Para escribir datos en un fichero podemos usar las siguientes funciones

| Función                 | Descripción                                                |
|:------------------------|:-----------------------------------------------------------|
| `f.write(datos)`        | Escribe el contenido de `datos` en el fichero              |
| `f.writelines(lineas)`  | Escribe el contenido de la lista de `lineas` en el fichero |

Cuando utilicemos estas funciones tenemos que saber que no añaden los caracteres delimitadores de líneas al final de cada una de forma automática. Si el propio contenido no incluye los caracteres de fin de línea, tendremos que añadirlos nosotros antes (si es que estamos escribiendo ficheros de texto, claro).


In [None]:
# Abrimos el fichero con los datos de entrada
f_in = open(nombre_fichero, "r")
# y un fichero en el que guardar los resultados
f_out = open("resultado.txt", "w")

# Iteramos cada línea del fichero de entrada
for linea in f_in:
    # Dividimos cada línea en palabras
    palabras = linea.split()
    # Contamos cuantas palabras hay
    n_palabras = len(palabras)
    # Escribimos el número de palabras en el fichero de salida
    f_out.write(str(palabras) )
    f_out.write( str(n_palabras))
    # Añadimos el carácter de fin de línea
    f_out.write("\n")

# Cuando hemos terminado, debemos cerrar los fichero
f_in.close()
f_out.close()

Cuando ejecutes este fragmento de código, busca y abre el fichero `resultado.txt` y comprueba su contenido. Fíjate también en cómo escribimos en el fichero el número de palabras que hemos contado en cada línea. No escribimos directamente la variable `n_palabras`. Convertimos el valor a cadena de texto utilizando `str()`. La razón es que si abrimos un fichero para escritura en modo texto (`"w"`), debemos pasar cadenas de texto a la función `f.write()`. De lo contrario, se producirá un error.

Como habrás visto, cada nueva operación de lectura y escritura que ejecutamos comienza a partir de la última posición accedida del fichero. Esto es el comportamiento que necesitaremos habitualmente. En algunos casos, puede que queramos volver al inicio del fichero, o saber en qué posición del fichero nos encontramos. Para eso tenemos las funciones `f.seek()` y `f.tell()`.

| Función                       | Descripción                                                |
|:------------------------------|:-----------------------------------------------------------|
| `f.seek(posicion [, origen])` | Desplazarse a una `posicion` dentro del fichero, relativa al `origen` |
| `f.tell()`                    | Devolver la posición actual dentro del fichero |

En la función `f.seek()` el argumento `origen` es opcional y puede tomar los siguientes valores

| Origen en `f.seek()` | Descripción                                      |
|:---------------------|:-------------------------------------------------|
| 0                    | Desplazarse desde el inicio del fichero          |
| 1                    | Desplazarse desde la posición actual del fichero |
| 2                    | Desplazarse desde el final del fichero           |

En los dos últimos casos, el argumento `posicion` de `f.seek()` puede tomar valores negativos. Así le indicamos que queremos desplazarnos hacia atrás desde la posición actual (`origen = 1`) o desde el final del fichero (`origen = 2`). Veamos un ejemplo sencillo.

In [None]:
# Abrimos un fichero de texto con la función open()
f = open(nombre_fichero, "r")

In [None]:
# Nada más abrir el fichero para lectura estaremos en la posición cero
pos_0 = f.tell()
print("Pos. inicial:", pos_0)

Pos. inicial: 0


In [None]:
# Leemos la primera línea del fichero
linea_1 = f.readline()
pos_1 = f.tell()
print("Linea 1: ", linea_1)
print("Tras leer linea 1, pos:", pos_1)

Linea 1:  Lorem ipsum dolor sit amet,

Tras leer linea 1, pos: 28


In [None]:
# Leemos la segunda línea del fichero
linea_2 = f.readline()
pos_2 = f.tell()
print("Linea 2: ", linea_2)
print("Tras leer linea 2, pos:", pos_2)

Linea 2:  consectetur adipiscing elit,

Tras leer linea 2, pos: 57


In [None]:
# Nos volvemos a colocar al inicio del fichero
f.seek(0)
print("Volvemos al inicio del fichero")

0

Volvemos al inicio del fichero


In [None]:
# Leemos la primera linea de nuevo
linea_1_bis = f.readline()
pos_1_bis = f.tell()
print("Linea 1 (bis):", linea_1_bis)
print("Tras leer linea 1 (bis), pos:", pos_1_bis)

Linea 1 (bis): Lorem ipsum dolor sit amet,

Tras leer linea 1 (bis), pos: 28


In [None]:
# Ahora nos desplazamos a continuación de la segunda línea
f.seek(pos_2)
print("Saltamos tras la linea 2")
linea_3 = f.readline()
pos_3 = f.tell()
print("Linea 3: ", linea_3)
print("Tras leer linea 3, pos:", pos_3)

57

Saltamos tras la linea 2
Linea 3:  sed eiusmod tempor incidunt

Tras leer linea 3, pos: 85


In [None]:
# Cuando hemos terminado, debemos cerrar el fichero
f.close()

A lo largo de todos estos ejemplos hemos visto que debemos asegurarnos de cerrar un fichero una vez que hemos terminado de trabajar con él. Existe una forma alternativa de trabajar con ficheros en Python, más elegante y que se encarga de cerrar automáticamente el fichero, utilizando la cláusula `with`. Veamos cómo.


In [None]:
# Abrimos el fichero dentro de un bloque `with`
with open(nombre_fichero, "r") as f:
    # Dentro del bloque, podemos usar el objeto File de forma normal
    for linea in f:
        print(linea)

# Al salir del bloque `with`, el fichero se cierra automáticamente
print("¿El fichero está cerrado?", f.closed)

Lorem ipsum dolor sit amet,

consectetur adipiscing elit,

sed eiusmod tempor incidunt

ut labore et dolore magna aliqua.

¿El fichero está cerrado? True


La cláusula `with` nos permite definir e inicializar un _alias_ a partir de un objeto o expresión, de forma que podamos utilizarlo dentro del bloque de código que sigue a la cláusula. Al terminar el bloque, se ejecutan de forma automática las operaciones de finalización que tenga asociadas el objeto.

En este caso, usamos la cláusula `with` asociando el objeto `File` devuelto por la función `open()` al _alias_ `f`. Dentro del bloque `with` podemos acceder al fichero usando `f` como una variable normal, de las formas que ya hemos visto. La diferencia viene cuando se terminan de ejecutar todas las operaciones del bloque `with`. Cuando se llega al final del bloque, este se encarga de hacer el `close()` sobre el fichero de forma automática.

## La entrada y salida estándar

Si eres un usuario habitual de Linux o Unix (o incluso de Mac OS), probablemente ya estarás familiarizado con los conceptos de la entrada y salida estándar de un proceso.

Sin embargo, si solo has sido usuario de Windows o de Mac OS sin utilizar mucho la consola o terminal de línea de comandos, es fácil que no sepas a qué nos estamos refiriendo.

Podemos ver la entrada y salida estándar como unas conexiones a ficheros que se abren de forma automática para cualquier proceso del que se lance la ejecución. 

<img src="./img/fig_process_standard_io.png" width=350px />

La entrada estándar (comunmente `stdin`, por _standard input_) es una conexión solo de lectura a través de la que un programa puede recibir y leer datos generados desde el entorno en el que se lanzó. Por ejemplo, cuando lanzamos un programa desde el terminal o consola de texto, la conexión `stdin` recibe la entrada generada desde el teclado.  

La salida estándar (`stdout`, por _standard output_) es la conexión solo de escritura en la que se escribe por defecto cualquier mensaje o resultado de salida, cuando no se utiliza explícitamente otro fichero o conexión. Por ejemplo, cuando hacemos un `print()` en Python, se escribe en `stdout`. Si estamos ejecutando el programa desde un terminal o consola de texto, veremos la salida en el terminal.

Existe además una tercera conexión, la salida de error estándar o `stderr`. Es una conexión similar a `stdout`, solo de escritura, y que se utiliza como el canal por defecto en el que se escriben los mensajes de error, excepciones, etc.

En Python podemos acceder a estos ficheros a través del módulo `sys`. 

| Objeto     | Funciones |
|:-----------|:----------|
| sys.stdin  | sys.stdin.read()<br/>sys.stdin.readline()<br/>sys.stdin.readlines() |
| sys.stdout | sys.stdout.write()<br/>sys.stdout.writelines() |
| sys.stderr | sys.stderr.write()<br/>sys.stderr.writelines() |


El programa `loop_lee_stdin.py` es un pequeño ejemplo de cómo utilizar `stdin` y `stdout`.