<p>
<font size='5' face='Georgia, Arial'>IIC-2233 Apunte Programaci√≥n Avanzada</font><br>
<font size='1'> Actualizados el 2024-1.</font>
</p>

# Tabla de contenidos

1. [I/O de archivos](#I/O-de-archivos)
2. [*Context Manager*](#Context-Manager)
3. [(Bonus) C√≥mo emular archivos para I/O](#(Bonus)-C√≥mo-emular-archivos-para-I/O)

## I/O de archivos

Hasta ahora, en IIC1103, han operado con la lectura y escritura de archivos de texto; sin embargo, los sistemas operativos representan los archivos como secuencias de *bytes*, no como texto. Dado que leer *bytes* y convertirlos a texto es una operaci√≥n muy com√∫n en archivos, los lenguajes de programaci√≥n proveen maneras de manejar los *bytes* para transformarlos a una representaci√≥n en *string* usando m√©todos de codificaci√≥n (*encoding*) y decodificaci√≥n (*decoding*). 

La funci√≥n `open` nos permite, adem√°s de abrir archivos, ingresar como argumentos el set de caracteres que se usar√° para codificar los *bytes* y la estrategia que se debe seguir cuando aparezcan *bytes* inconsistentes con el formato:

In [1]:
# Creamos un archivo con un texto de base.
contenido = "¬øQu√© pasa con las tildes? " \
    "¬øPor qu√© no aparecen los signos de interrogaci√≥n del comienzo? :("

# Guardamos el contenido en un archivo con encoding UTF-8
file = open("data/IO_archivo_ejemplo", "w", encoding='utf-8')
file.write(contenido)

# Pero leemos el mismo archivo con encoding ASCII
file = open('data/IO_archivo_ejemplo', "r", encoding='ascii', errors='replace')
print(file.read())
file.close()

ÔøΩÔøΩQuÔøΩÔøΩ pasa con las tildes? ÔøΩÔøΩPor quÔøΩÔøΩ no aparecen los signos de interrogaciÔøΩÔøΩn del comienzo? :(


En este caso, se a√±adi√≥ el argumento `errors="replace"` para indicar a la funci√≥n `open` c√≥mo debe manejr alg√∫n error del archivo cuando es incapaz de entender alg√∫n caracter. Por defecto, deber√≠a ocurrir un error, pero usando `"replace"` hacemos que no se caiga el programa y solo reemplace el caracter que no puede leer por el s√≠mbolo `ÔøΩ`.

Ahora, veamos c√≥mo cambia esto, si es que elegimos otro *encoding* para leer el contenido del archivo.

In [2]:
file = open('data/IO_archivo_ejemplo', "r", encoding='utf-8')
print(file.read())
file.close()

¬øQu√© pasa con las tildes? ¬øPor qu√© no aparecen los signos de interrogaci√≥n del comienzo? :(


Vemos que ahora s√≠ se muestran bien las tildes y los signos de interrogaci√≥n, pues al leer el archivo lo estamos haciendo con el mismo *encoding* con el que fue escrito. Ahora, escribiremos en el mismo archivo, un texto distinto, y luego leeremos el archivo para ver qu√© ocurre.

In [3]:
contenido = "sorry pero ahora yo soy lo que habr√° dentro del archivo"

file = open("data/IO_archivo_ejemplo", "w", encoding="utf-8")
file.write(contenido)
file.close()

file = open('data/IO_archivo_ejemplo', "r", encoding='utf-8')
print(file.read())
file.close()

sorry pero ahora yo soy lo que habr√° dentro del archivo


Como puedes haber notado, el archivo se sobrescribi√≥, y el nuevo texto en lugar de ser agregado al archivo, reemplaz√≥ lo que hab√≠a. Para agregar un nuevo texto al final de un archivo ya existente, debemos cambiar el modo de apertura del archivo cambiando la `w` de *write* por una `a`, de *append*. De esta forma, al escribir en el archivo, se va a hacer al final del archivo en lugar de reemplazar el contenido anterior.

In [4]:
contenido = "\nyo me agregar√© al final"

# Abrimos el archivo en modo append
file = open("data/IO_archivo_ejemplo", "a", encoding="utf-8")
file.write(contenido)
file.close()

# Abrimos el archivo en el modo de lectura (read)
file = open('data/IO_archivo_ejemplo', "r", encoding='utf-8')
print(file.read())
file.close()

sorry pero ahora yo soy lo que habr√° dentro del archivo
yo me agregar√© al final


Adem√°s de leer archivos de texto, podemos abrir archivos y leer sus *bytes* en lugar de texto. Para abrir un archivo como binario, simplemente debemos agregar una `b` por el lado derecho del modo de apertura. Por ejemplo, `wb` (*write bytes*) o `rb` (*read bytes*). El archivo se comportar√° igual que un archivo de texto, s√≥lo que sin la codificaci√≥n autom√°tica de *byte* a texto.

In [5]:
contenido = b"abcde12"

file = open("data/IO_archivo_ejemplo_2", "wb")
file.write(contenido)
file.close()

file = open('data/IO_archivo_ejemplo_2', "rb")
print(file.read())
file.close()

b'abcde12'


Podemos concatenar *bytes* simplemente con el operador `+`. En el siguiente ejemplo, construimos un contenido din√°mico para ser escrito en un archivo de *bytes*. Despu√©s leemos una cantidad fija de *bytes* desde el mismo archivo:

In [6]:
num_lineas = 100

file = open("data/IO_archivo_ejemplo_3", "wb")
for i in range(num_lineas):
    # A la funci√≥n "bytes" debemos pasarle un iterable con
    # el contenido a convertir por eso le pasamos el entero dentro de una lista
    contenido = b"linea_" + bytes([i]) + b" abcde12 "
    file.write(contenido)
file.close()

file = open('data/IO_archivo_ejemplo_3', "rb")
# El n√∫mero dentro de la funci√≥n read nos dice el n√∫mero de bytes que
# se van a leer del archivo
print(file.read(41))
file.close()

b'linea_\x00 abcde12 linea_\x01 abcde12 linea_\x02 a'


Vamos a utilizar este modo de abrir archivos como _bytes_ m√°s adelante en el curso üòÅ

## *Context Manager*

Dado que siempre necesitamos cerrar un archivo despu√©s de usarlo, debemos considerar la posibilidad de que ocurran excepciones mientras el archivo est√° abierto. 

Una forma clara de hacerlo es utilizar un bloque del tipo `try/finally` para cerrar el archivo. Este tipo de bloque primero ejecutar√° todo el contenido dentro del `try`. Luego, aunque haya un error en el c√≥dig, se ejecutar√° lo que est√© dentro del bloque `finally`. 


Sin embargo, esto genera bastante c√≥digo extra y requiere entender bien qu√© hace el bloque `try/finally`. Esto √∫ltimo lo vamos a aprender con detalle m√°s adelante. En Python existe una forma de hacer lo mismo con menos c√≥digo, a trav√©s de un *context manager*, que se encarga de ejecutar, por debajo, las sentencias `try` y `finally` sin la necesidad de llamarlas directamente. S√≥lo necesitamos llamar al archivo que queremos abrir usando la sentencia `with`. Veamos un ejemplo.

In [7]:
with open("data/IO_archivo_ejemplo_3", "r") as file:
    contenido = file.read()

El c√≥digo anterior ser√≠a equivalente a hacer lo siguiente:

In [8]:
file = open("data/IO_archivo_ejemplo_3", "r")
try:
    contenido = file.read()
finally:
    file.close()

Ahora, si ejecutamos `dir` en un objeto de tipo archivo:

In [9]:
file = open("data/IO_archivo_ejemplo_3", "w")
print(dir(file))
file.close()

['_CHUNK_SIZE', '__class__', '__del__', '__delattr__', '__dict__', '__dir__', '__doc__', '__enter__', '__eq__', '__exit__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_checkClosed', '_checkReadable', '_checkSeekable', '_checkWritable', '_finalizing', 'buffer', 'close', 'closed', 'detach', 'encoding', 'errors', 'fileno', 'flush', 'isatty', 'line_buffering', 'mode', 'name', 'newlines', 'read', 'readable', 'readline', 'readlines', 'reconfigure', 'seek', 'seekable', 'tell', 'truncate', 'writable', 'write', 'write_through', 'writelines']


Vemos que existen dos m√©todos llamados `__enter__` y `__exit__`. Estos dos m√©todos transforman el archivo en un *context manager*. El m√©todo `__exit__` asegura que el archivo ser√° cerrado incluso si aparece una excepci√≥n mientras est√© abierto. El m√©todo `__enter__` inicializa el archivo o realiza cualquier acci√≥n necesaria para ajustar el contexto del objeto.

Para asegurarnos que un archivo usar√° los m√©todos `__enter__` y `__exit__`, simplemente debemos llamar a la apertura del archivo con el m√©todo `with`.

Tambi√©n podemos crear nuestros propios *context managers* a partir de cualquier clase. Simplemente agregamos los m√©todos `__enter__` y `__exit__` y podemos llamar a nuestra clase a trav√©s del m√©todo `with`. Del siguiente ejemplo, se puede ver c√≥mo el m√©todo `__exit__` se ejecuta una vez que nos salimos del *scope* de la sentencia `with`.

In [10]:
import string
import random


class StringUpper:
    
    def __init__(self):
        print("1. Inicizalizando context manager")
        self.data = []

    def __enter__(self):
        print("2. Abriendo context manager y definiendo qu√© elemento ser√° el `as XXXX`")
        return self.data

    def __exit__(self, exc_type, exc_value, traceback):
        print("5. Cerrando context manager")
        i = 0
        for char in self.data:
            self.data[i] = char.upper()
            i+= 1
        


with StringUpper() as s_upper:
    # s_upper ser√° una lista seg√∫n lo definido en "__enter__"
    print("3. Primera l√≠nea dentro del context manager")
    
    for i in range(20):
        # Aqu√≠ seleccionamos, en forma aleatoria, un ascii en min√∫sculas
        # y las agregamos a la lista
        s_upper.append(random.choice(string.ascii_lowercase))
        
    print("\t" + str(s_upper))
    print("4. √öltima l√≠nea del context manager")

print("\t" + str(s_upper))

1. Inicizalizando context manager
2. Abriendo context manager y definiendo qu√© elemento ser√° el `as XXXX`
3. Primera l√≠nea dentro del context manager
	['f', 't', 'm', 'f', 't', 'l', 'i', 'x', 'l', 'd', 'd', 'o', 'v', 'a', 'c', 'm', 'e', 'o', 't', 'l']
4. √öltima l√≠nea del context manager
5. Cerrando context manager
	['F', 'T', 'M', 'F', 'T', 'L', 'I', 'X', 'L', 'D', 'D', 'O', 'V', 'A', 'C', 'M', 'E', 'O', 'T', 'L']


El c√≥digo anterior simplemente corresponde a una clase que implementar los m√©todos `__enter__` y `__exit__`. Con esto, podemos instanciar la clase a trav√©s de un *context manager*. En este ejemplo en particular, el *context manager* se encarga de transformar todos los caracteres ASCII de la lista a may√∫sculas cuando este es cerrado.

## (Bonus) C√≥mo emular archivos para I/O

Muchas veces tenemos que interactuar con algunos m√≥dulos de *software* que s√≥lo leen y escriben sus datos desde y hacia archivos. Si queremos comunicar nuestro c√≥digo que genera -por ejemplo, *strings*- para evitar tener que escribir nuestros datos en un archivo para que el otro programa los lea, podemos *emular* el tener un archivo usando los m√≥dulos de Python `StringIO` o `BytesIO`. El siguiente ejemplo muestra c√≥mo usar estos m√≥dulos:

In [11]:
from io import StringIO, BytesIO


# Aqu√≠ simulamos tener un archivo que contiene el string dado
file_in = StringIO("informaci√≥n como texto y m√°s")

# Aqu√≠ simulamos un archivo de Bytes para escribir la informaci√≥n
file_out = BytesIO()

char = file_in.read(1)
while char:
    file_out.write(char.encode("ascii", "ignore"))
    char = file_in.read(1)

buffer_ = file_out.getvalue()
print(buffer_)

b'informacin como texto y ms'
