<p>
<font size='5' face='Georgia, Arial'>IIC2115 - Programación como herramienta para la ingeniería</font><br>
<font size='1'>Basado en material de Karim Pichara y Christian Pieringer. Todos los derechos reservados.</font>
</p>

# Input/Output (I/O)
En este capítulo estudiaremos a fondo el manejo de strings y archivos.

## Strings
Hasta ahora hemos trabajado muchas veces con strings, como sabemos, corresponden a una secuencia inmutable de caracteres. En Python 3, todos los strings se representan en Unicode, codificación que permite representar virtualmente cualquier caracter en cualquier lenguaje. Luego veremos más detalles sobre Unicode. Entonces pensemos que en Python un string es una secuencia inmutable de caracteres Unicode. Aquí algunas formas distintas de crear un string en Python:

In [None]:
a = "programando"
b = 'mucho'
c = '''un string
con múltiples
lineas'''

d = """Multiples con
     doble comillas"""
e = ("Tres" "Strings" " Juntos")
f = "un string " + "concatenado"

print(a)
print(b)
print(c)
print(d)
print(e)
print(f)

La clase str tiene muchos métodos para manipular strings, aquí podemos obtener la lista:

In [None]:
print(dir(str))

Aquí algunos ejemplos:

In [None]:
# El método isalpha retorna True si todos los caracteres del string están en el 
# alfabeto de algún lenguaje.
print("abñ".isalpha()) 

# Si hay algún número, espacio o puntuación dentro del string, retornará falso.
print("t/".isalpha())

# El método is digit retorna True si todos los caracteres en el string son dígitos
# numéricos
print("34".isdigit())

s = "estoy programando"
print(s.startswith("est"))
print(s.endswith("do"))

# Devuelve el indice donde comienza en s la secuencia que se pasa como argumento
print(s.find("y p"))

# El método index retorna el indice donde comienza la secuencia. Acepta dos argumentos 
# opcionales: la posición inicial donde comenzar la búsqueda y la posición final 
# (hasta dónde llega buscando). Se usan de la siguiente forma: 
# str.index('string', beg=1 end=len(s))
print(s.index('y', 4, 10))
print(s.index('p', 5, 10))

Otros métodos que actúan sobre strings retornan un string nuevo. Ejemplos:

In [None]:
s = "hola a todos, cómo están"
s2 = s.split(' ')
print(s2)
s3 = '#'.join(s2)
print(s3)
print(s.replace(' ', '**'))
print(s)
s5 = s.partition(' ')
print(s5)
print(s)

Como ya hemos visto muchas veces, podemos insertar valores de variables dentro de un string usando "format":

In [None]:
nombre = 'Juan Pérez'
nota = 4.5
if nota >= 4.0:
    resultado = 'aprobado'
else:
    resultado = 'reprobado'

template = "Hola {0}, estás {1}. Tu nota fue un {2}"
print(template.format(nombre, resultado, nota))

Si queremos incluir las llaves dentro del string, podemos hacer el "escape" usando doble llaves, por ejemplo, si queremos imprimir una simple definición de una clase en Java:

In [None]:
template = """
public class {0} 
{{
       public static void main(String[] args) 
       {{
           System.out.println({1});
       }} 
}}"""

print(template.format("MiClase", "'hola mundo'"));

A veces queremos incluir muchas variables dentro de un string, esto hace que sea difícil recordar el orden en que debemos escribirlas dentro de la función format. Una solución es usar argumentos con keywords en la función format:

In [None]:
print("{} {label} {}".format("x", "y", label="z"))

In [None]:
template = """
From: <{from_email}>
To: <{to_email}>
Subject: {subject}
{message}
"""

print(template.format(
    from_email = "halobel@ing.puc.cl",
    to_email = "cualquiera@example.com",
    message = "\nreproba3",#ver como Python concatena esto automáticamente 
    subject = "Este correo es urgente")
    )

Podemos incluso usar contenedores como listas, tuplas o diccionarios como argumentos dentro de la función format:

In [None]:
emails = ("a@ejemplo.com", "b@ejemplo.com")
message = {'subject': "Tienes un correo", 'message': "Este es un correo para ti"}
template = """
From: <{0[0]}>
To: <{0[1]}>
Subject: {message[subject]} {message[message]}
""" 
print(template.format(emails, message=message))

Podemos incluso usar un diccionario con listas e indexar la lista dentro del string:

In [None]:
mensaje = {"emails": ["yo@ejemplo.com", "tu@ejemplo.com"], "subject": "mira este correo", "message": "Sorry no era tan importante"}

template = """
From: <{0[emails][0]}>
To: <{0[emails][1]}>
Subject: {0[subject]}
{0[message]}"""

print(template.format(mensaje))

Esto puede ser aún mejor, podemos pasar cualquier objeto como argumento, por ejemplo, una instancia de una clase, luego dentro del string podemos acceder a cualquiera de los atributos del objeto:

In [None]:
class EMail:
    def __init__(self, from_addr, to_addr, subject, message):
        self.from_addr = from_addr
        self.to_addr = to_addr
        self.subject = subject
        self.message = message
        
email = EMail("a@ejemplo.com", "b@ejemplo.com","Tienes un correo","\nEl mensaje es inútil\n\nSaludos")
template = """
From: <{0.from_addr}>
To: <{0.to_addr}>
Subject: {0.subject}
{0.message}"""
print(template.format(email))

También podemos mejorar el formato de los strings que se imprimen, por ejemplo, en casos como la impresión de una tabla con datos, muchas veces queremos que datos pertenecientes a la misma variable se vean alineados en columnas:

In [None]:
compra = [('leche', 2, 120), ('pan', 3.5, 800), ('arroz', 1.75, 960)]

print("PRODUCTO  CANTIDAD   PRECIO   SUBTOTAL")
for producto, precio, cantidad in compra:
    subtotal = precio * cantidad
    print("{0:8s}{1: ^9d}    ${2: <8.2f}${3: >7.2f}".format(producto, cantidad, precio, subtotal))

Notar que dentro de cada llave existe un item tipo diccionario, es decir, antes de los dos puntos va el índice del argumento dentro de la función format. Después de los dos puntos, por ejemplo, "8s", significa que el dato es un string de 8 caracteres. Por default, si el string es más corto que los 8 caracteres, el resto se llenará con espacios (por la derecha). No olvidar que también por default si el string que ingresamos es más largo que los 8 caracteres, este no será truncado:

In [None]:
compra = [('lecheeeeeeeeeeeeeee', 2, 120), ('pan', 3.5, 800), ('arroz', 1.75, 960)]

print("PRODUCTO  CANTIDAD   PRECIO   SUBTOTAL")
for producto, precio, cantidad in compra:
    subtotal = precio * cantidad
    print("{0:8s}{1: ^9d}    ${2: <8.2f}${3: >7.2f}".format(producto, cantidad, precio, subtotal))

Podemos cambiar esta situación obligando a que el string sea truncado si se pasa del largo máximo, basta con agregar un punto (precisión) antes del número que indica el largo del string:

In [None]:
compra = [('lecheeeeeeeeeeeeeee', 2, 120), ('pan', 3.5, 800), ('arroz', 1.75, 960)]

print("PRODUCTO  CANTIDAD   PRECIO   SUBTOTAL")
for producto, precio, cantidad in compra:
    subtotal = precio * cantidad
    print("{0:.8s}{1: ^9d}    ${2: <8.2f}${3: >7.2f}".format(producto, cantidad, precio, subtotal))

Para la cantidad de producto el formato es {1: ^9d}, el 1 corresponde al índice del argumento en la función format, el espacio después de los dos puntos dice que los lugares vacíos deben ser llenados con espacios (en los tipos enteros el default es llenar con ceros), el símbolo ^ es para que el número quede centrado en el espacio disponible, "9d" significa que será un entero de hasta 9 dígitos. Notar que siempre el orden de estos parámetros (aunque son opcionales) debe ser (de izquierda a derecha después de los dos puntos): Primero el caracter para llenar los espacios vacíos, después el alineamiento, después el tamaño y finalmente el tipo.

Para el precio por ejemplo, {2: <8.2f} significa que el dato se leerá del tercer argumento de la función format, luego los lugares que queden libres se llenarán con espacios, el símbolo < significa que el alineamiento es a la izquierda, el formato será un float de hasta 8 caracteres, con dos decimales.

De la misma forma, para el subtotal, {3: >7.2f} significa que el dato se sacará del cuarto argumento dentro de la función format, el caracter de llenado será espacio, el alineamiento es a la derecha, será un float de 7 digitos, dos de ellos decimales e incluyendo el '.' como caracter.


# Manejo de Archivos

En general hasta ahora hemos operado con la lectura y escritura de archivos de texto, sin embargo los sistemas operativos representan los archivos como secuencias de bytes, no como texto. Dado que leer bytes y convertirlos a texto es una operación muy común en archivos, Python se encarga de manejar los bytes que vienen o van transformándolos a la respectiva representación en string con los encoders/decoders correspondientes. La ya conocida función "open" nos permite además de abrir archivos, ingresar como argumentos el set de caracteres que se usará para codificar los bytes y la estrategia que se debe serguir cuando aparezcan bytes inconsistentes con el formato:

In [None]:
file = open('archivo_ejemplo', "r", encoding='ascii', errors='replace')
print(file.read())
file.close()

In [None]:
contenido = "sorry pero ahora yo soy lo que habrá dentro del archivo"
file = open("archivo_ejemplo", "w", encoding="ascii", errors="replace")
file.write(contenido)
file.close()

Ahora, si nuevamente tratamos de leer el archivo como al comienzo:

In [None]:
file = open('archivo_ejemplo', "r", encoding='ascii', errors='replace')
print(file.read())
file.close()

Podemos también agregar contenido al final del archivo, reemplazando el modo de apertura del archivo, cambiando la "w" por una "a":

In [None]:
contenido = "\nyo me agregaré al final"
file = open("archivo_ejemplo", "a", encoding="ascii", errors="replace")
file.write(contenido)
file.close()

file = open('archivo_ejemplo', "r", encoding='ascii', errors='replace')
print(file.read())
file.close()

Para abrir un archivo como binario, simplemente debemos agregar una "b" por el lado derecho del modo de apertura, por ejemplo, "wb" o "rb". El archivo se comportará igual que un archivo de texto, sólo que sin la codificación automática de byte a texto.

In [None]:
contenido = b"abcde12"
file = open("archivo_ejemplo_2", "wb")
file.write(contenido)
file.close()

file = open('archivo_ejemplo_2', "rb")
print(file.read())
file.close()

Podemos además concatenar bytes simplemente con el operador suma, en el siguiente ejemplo construimos un contenido dinámico para ser escrito en un archivo de bytes, después leemos una cantidad fija de bytes desde el mismo archivo:

In [None]:
num_lineas = 100

file = open("archivo_ejemplo_3", "wb")
for i in range(num_lineas):
    # A la función "bytes" debemos pasarle un iterable con el contenido a convertir 
    # por eso le pasamos el entero dentro de una lista  
    contenido = b"linea_" + bytes([i]) + b" abcde12 "                                             
    file.write(contenido)
file.close()

file = open('archivo_ejemplo_3', "rb")
# El número dentro de la función read nos dice el número de bytes que se van a leer del archivo
print(file.read(41))
file.close()

## Context Manager
Dado que siempre necesitamos cerrar un archivo después de usarlo, debemos considerar la posibilidad de que ocurran excepciones mientras el archivo está abierto. Una forma clara de hacerlo es cerrar el archivo dentro de la sentencia finally: después de un try:. El problema es que esto genera mucho código extra. Afortuadamente en Python existe una forma de hacer lo mismo con menos código, a través de un "context manager", que se encarga de ejecutar las sentencias try y finally sin la necesidad de llamarlas directamente, sólo necesitamos llamar al archivo que abriremos con la sentencia with. Ejemplo:

In [None]:
with open("archivo_ejemplo_4", "r") as file:
    contenido = file.read()

El código anterior sería equivalente a hacer lo siguiente:

In [None]:
file = open("archivo_ejemplo_4", "r")
try:
    contenido = file.read()
finally:
    file.close()

Si ejecutamos dir en un objeto tipo archivo:

In [None]:
file = open("archivo_ejemplo_4", "w")
print(dir(file))
file.close()

Vemos que existen dos métodos llamados **\__enter\__** y **\__exit\__**. Estos dos métodos transforman el archivo en un "context manager". El método **\__exit\__** asegura que el archivo será cerrado incluso si aparece una excepción mientras esté abierto. El método **\__enter\__** inicializa el archivo o realiza cualquier acción necesaria para setear el contexto del objeto.

Para asegurarnos que un archivo usará los métodos **\__enter\__** y **\__exit\__**, simplemente debemos llamar a la apertura del archivo con el método **with**.

Podemos crear nuestros propios context managers, simplemente creamos cualquier clase, agregamos los métodos **\__enter\__** y **\__exit\__** y podemos llamar a nuestra clase a través del método **with**. Del siguiente ejemplo se puede ver cómo el método **\__exit\__** se ejecuta una vez que nos salimos del scope de la sentencia **with**.

In [None]:
import string, random

class StringUpper(list): 
        
    def __enter__(self):
        return self
    
    def __exit__(self, type, value, tb):
        for i in range(len(self)):
            self[i] = self[i].upper()
        

with StringUpper() as s_upper:
    for i in range(20):
        # Aquí se va seleccionando en forma aleatoria un ascii en minúsculas y las
        # agregamos a la lista
        s_upper.append(random.choice(string.ascii_lowercase))
    print(s_upper)
        
print(s_upper)

El código anterior simplemente corresponde a una clase que hereda de la clase **list**, al implementar los métodos **\__enter\__** y **\__exit\__** podemos instanciar la clase a través de un context manager, en este ejemplo en particular, el context manager se encarga de transformar todos los caracteres ascii de la lista a mayúsculas.