# Entrada y salida

Hay diferentes métodos de presentar la salida de un programa; los datos pueden ser impresos de una forma legible por humanos, o escritos a un archivo para uso futuro

# Formateo elegante de la salida

Hasta ahora encontramos dos maneras de escribir valores: declaraciones de expresiones y la función **print()**. (Una tercer manera es usando el método **write()** de los objetos tipo archivo; el archivo de salida estándar puede referenciarse como **sys.stdout**.)

Frecuentemente se desea más control sobre el formateo de la salida que simplemente imprimir valores separados por espacios. Hay dos maneras de formatear la salida 

* La primera es hacer todo el manejo de las cadenas uno mismo: usando rebanado de cadenas y operaciones de concatenado.
* La otra forma es usar el método **str.format()**.

(El módulo string contiene una clase **string.Template** que ofrece otra forma de sustituir valores en las cadenas)

Luego lo que se debe formatear, ¿cómo convertir valores a cadenas? Python tiene maneras de convertir cualquier valor a una cadena usando las funciones **repr()** o **str()**

In [3]:
s = 'Hola mundo.'
str(s)

'Hola mundo.'

In [2]:
repr(s)

"'Hola mundo.'"

La función **str()** devuelve representaciones de los valores que son bastante legibles por humanos, mientras que **repr()** genera representaciones que pueden ser leídas por el el intérprete. Para objetos que no tienen una representación en particular para consumo humano, **str()** devolverá el mismo valor que **repr()**. Muchos valores, como números o estructuras como listas y diccionarios, tienen la misma representación usando cualquiera de las dos funciones

In [4]:
str(1/7)

'0.14285714285714285'

In [6]:
x = 10 * 3.25
y = 200 * 200
s = 'El valor de x es ' + repr(x) + ', y es ' + repr(y) + '...'
print(s)

El valor de x es 32.5, y es 40000...


El **repr()** de una cadena agrega apóstrofos y barras invertidas

In [7]:
hola = 'hola mundo\n'
holas = repr(hola)
print(holas)

'hola mundo\n'


El argumento de **repr()** puede ser cualquier objeto Python

In [8]:
repr((x, y, ('carne', 'huevos')))

"(32.5, 40000, ('carne', 'huevos'))"

Una manera de escribir una tabla de cuadrados y cubos...

In [9]:
for x in range(1, 11):
    print(repr(x).rjust(2), repr(x * x).rjust(3), end=' ')
    # notar el uso de 'end' en la linea anterior
    print(repr(x * x * x).rjust(4))

 1   1    1
 2   4    8
 3   9   27
 4  16   64
 5  25  125
 6  36  216
 7  49  343
 8  64  512
 9  81  729
10 100 1000


...otra manera usando **str.format()**

In [10]:
for x in range(1,11):
    print('{0:2d} {1:3d} {2:4d}'.format(x, x * x, x * x * x))

 1   1    1
 2   4    8
 3   9   27
 4  16   64
 5  25  125
 6  36  216
 7  49  343
 8  64  512
 9  81  729
10 100 1000


El primer ejemplo muestra el método **str.rjust()** de los objetos cadena, el cual ordena una cadena a la derecha en un campo del ancho dado llenándolo con espacios a la izquierda. Hay métodos similares **str.ljust()** y **str.center()**. Estos métodos no escriben nada, sólo devuelven una nueva cadena. Si la cadena de entrada es demasiado larga, no la truncan, sino la devuelven intacta; esto te romperá la alineación de tus columnas pero es normalmente mejor que la alternativa, que te estaría mintiendo sobre el valor.

Hay otro método, **str.zfill()**, el cual rellena una cadena numérica a la izquierda con ceros. Entiende signos positivos y negativos.

In [11]:
'12'.zfill(5)

'00012'

In [12]:
'-3.14'.zfill(7)

'-003.14'

In [13]:
'3.14159265359'.zfill(5)

'3.14159265359'

El uso básico del método **str.format()**

In [14]:
print('Somos los {} quienes decimos "{}!"'.format('caballeros', 'Nop'))

Somos los caballeros quienes decimos "Nop!"


Las llaves y caracteres dentro de las mismas son reemplazadas con los objetos pasados en el método **str.format()**. Un número en las llaves se refiere a la posición del objeto pasado en el método

In [15]:
print('{0} and {1}'.format('spam', 'eggs'))
print('{1} and {0}'.format('spam', 'eggs'))

spam and eggs
eggs and spam


Si se usan argumentos nombrados en el método **str.format()**, sus valores serán referidos usando el nombre del argumento

In [16]:
print('This {food} is {adjective}.'.format(
    food='spam', adjective='absolutely horrible'))

This spam is absolutely horrible.


Se pueden combinar arbitrariamente argumentos posicionales y nombrados

In [18]:
print('La historia de {0}, {1}, y {otro}.'.format('Bill', 'Manfred',
                                                  otro='Georg'))

La historia de Bill, Manfred, y Georg.


Se pueden usar **'!s'** (aplica **str()**) y **'!r'** (aplica **repr()**) para convertir el valor antes de que se formatee

In [31]:
import math
print('El valor de Pi es aproximadamente {}.'.format(math.pi))
print('El valor de Pi es aproximadamente {!r}.'.format(math.pi))

El valor de Pi es aproximadamente 3.141592653589793.
El valor de Pi es aproximadamente 3.141592653589793.


Un **':'** y especificador de formato opcionales pueden ir luego del nombre del campo. Esto aumenta el control sobre cómo el valor es formateado

In [32]:
import math
print('El valor de PI es aproximadamente {0:.3f}.'.format(math.pi))

El valor de PI es aproximadamente 3.142.


Pasando un entero luego del ':' causará que el campo sea de un mínimo número de caracteres de ancho. Esto es útil para hacer tablas lindas

In [33]:
tabla = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 7678}
for nombre, telefono in tabla.items():
    print('{0:10} ==> {1:10d}'.format(nombre, telefono))

Sjoerd     ==>       4127
Jack       ==>       4098
Dcab       ==>       7678


Para una cadena de formateo realmente larga, podría ser bueno hacer referencia a las variables a ser formateadas por el nombre en vez de la posición. Esto puede hacerse simplemente pasando el diccionario y usando corchetes '[]' para acceder a las claves

In [34]:
tabla = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
print('Jack: {Jack:d}; Sjoerd: {Sjoerd:d}; '
      'Dcab: {Dcab:d}'.format(**tabla))

Jack: 4098; Sjoerd: 4127; Dcab: 8637678


Esto es particularmente útil en combinación con la función integrada **vars()**, que devuelve un diccionario conteniendo todas las variables locales

### Viejo formateo de cadenas

El operador **%** también puede usarse para formateo de cadenas. Interpreta el argumento de la izquierda con el estilo de formateo de **sprintf()** para ser aplicado al argumento de la derecha, y devuelve la cadena resultante de esta operación de formateo

In [17]:
import math
print('El valor de PI es aproximadamente %5.3f.' % math.pi)

El valor de PI es aproximadamente 3.142.


# Leyendo y escribiendo archivos

La función **open()** devuelve un objeto archivo, y se usa normalmente con dos argumentos: **open(nombre_de_archivo, modo)**

In [18]:
f = open('../datos/archivos/archivo.txt', 'w')
print(f)

<_io.TextIOWrapper name='../datos/archivos/archivodetrabajo' mode='w' encoding='UTF-8'>


El primer argumento es una cadena conteniendo el nombre de archivo. El segundo argumento es otra cadena conteniendo unos pocos caracteres que describen la forma en que el archivo será usado. 

* **'r'** cuando el archivo será solamente leído,
* **'w'** para sólo escribirlo (un archivo existente con el mismo nombre será borrado),
* **'a'** abre el archivo para agregarle información; cualquier dato escrito al archivo será automáticamente agregado al final.
* **'r+'** abre el archivo tanto para leerlo como para escribirlo.

El argumento modo es opcional; si se omite se asume 'r'.

Normalmente los archivos se abren en modo texto, lo que significa que se pueden leer y escribir cadenas del y al archivo, las cuales se codifican utilizando un código específico. Si el código no es especificado, el valor predeterminado depende de la plataforma. Si se agrega **b** al modo el archivo se abre en modo binario: ahora los datos se leen y escriben en forma de objetos **bytes**. Se debería usar este modo para todos los archivos que no contengan texto.

Cuando se lee en modo texto, por defecto se convierten los fines de lineas que son específicos a las plataformas (**\\n** en Unix, **\\r\\n** en Windows) a solamente **\\n**. Cuando se escribe en modo texto, por defecto se convierten los **\\n** a los finales de linea específicos de la plataforma.

## Métodos de los objetos Archivo

Para leer el contenido de una archivo se usa **f.read(cantidad)**, el cual lee alguna cantidad de datos y los devuelve como una cadena de texto o bytes. Cantidad es un argumento numérico opcional. Cuando se omite cantidad o es negativo, el contenido entero del archivo será leido y devuelto. De otra manera, a lo sumo una cantidad de bytes son leídos y devueltos. Si se alcanzó el fin del archivo, **f.read()** devolverá una cadena vacía.

In [19]:
f = open('../datos/archivos/read.txt', 'r')
f.read()

'Este es el contenido del archivo\n'

In [20]:
f.read()

''

**f.readline()** lee una sola linea del archivo; el caracter de fin de linea **\\n** se deja al final de la cadena, y sólo se omite en la última linea del archivo si el mismo no termina en un fin de linea. Esto hace que el valor de retorno no sea ambiguo; si **f.readline()** devuelve una cadena vacía, es que se alcanzó el fin del archivo, mientras que una linea en blanco es representada por **'\n'**, una cadena conteniendo sólo un único fin de linea

In [28]:
f = open('../datos/archivos/readline.txt', 'r')
print(repr(f.readline()))
print(repr(f.readline()))
print(repr(f.readline()))
print(repr(f.readline()))

'Esta es la primer linea del archivo.\n'
'Segunda linea del archivo\n'
'\n'
''


Para leer líneas de un archivo, se puede iterar sobre el objeto archivo. Esto es eficiente en memoria, rápido, y conduce a un código más simple

In [29]:
f = open('../datos/archivos/iterame.txt', 'r')
for linea in f:
    print(linea, end='')

Esta es la primer linea del archivo.
Segunda linea del archivo
Tercera linea del archivo


Final del archivo


Para leer todas las líneas de un archivo en una lista también se pueden usar **list(f)** o **f.readlines()**

**f.write(cadena)** escribe el contenido de la cadena al archivo, devolviendo la cantidad de caracteres escritos

In [30]:
f = open('../datos/archivos/write.txt', 'w')
f.write('Esto es una prueba\n')

19

Para escribir algo más que una cadena, necesita convertirse primero a una cadena

In [33]:
f = open('../datos/archivos/tupla.txt', 'w')
valor = ('la respuesta', 42)
s = str(valor)
f.write(s)

20

**f.tell()** devuelve un entero que indica la posición actual en el archivo representada como número de bytes desde el comienzo del archivo en modo binario y un número opaco en modo texto.

Para cambiar la posición del objeto archivo, usá **f.seek(desplazamiento, desde_donde)**. La posición es calculada agregando el desplazamiento a un punto de referencia; el punto de referencia se selecciona del argumento **desde_donde**. Un valor **desde_donde** de **0** mide desde el comienzo del archivo, **1** usa la posición actual del archivo, y **2** usa el fin del archivo como punto de referencia. **desde_donde** puede omitirse, el default es **0**, usando el comienzo del archivo como punto de referencia.

In [44]:
f = open('../datos/archivos/binario.bin', 'rb+')
f.write(b'0123456789abcdef')
f.seek(5)     # Va al sexto byte en el archivo
print(repr(f.read(1)))
f.seek(-3, 2) # Va al tercer byte antes del final
print(repr(f.read(1)))

FileNotFoundError: [Errno 2] No such file or directory: '../datos/archivos/binario.bin'

En los archivos de texto, se permiten solamente desplazamientos con **seek** relativos al comienzo (con la excepción de ir justo al final con **seek(0, 2)**) y los únicos valores de desplazamiento válidos son aquellos retornados por **f.tell()**, o cero. Cualquier otro valor de desplazamiento produce un comportamiento indefinido.

Cuando hayas terminado con un archivo, llamá a **f.close()** para cerrar y liberar cualquier recurso del sistema tomado por el archivo abierto. Luego de llamar **f.close()**, los intentos de usar el objeto archivo fallarán automáticamente.

In [45]:
f = open('../datos/archivos/read.txt')
f.close()
f.read()

ValueError: I/O operation on closed file.

Es una buena práctica usar la declaración **with** cuando manejamos objetos archivo. Tiene la ventaja que el archivo es cerrado apropiadamente luego de que el bloque termina, incluso si se generó una excepción

In [46]:
with open('../datos/archivos/read.txt', 'r') as f:
    read_data = f.read()
f.closed

True