# Clase 23. Archivos

<p>
<font size='5' face='Georgia, Arial'>IIC1103-07 Introducción a la Programación</font><br>
<font size='2'>Martes 03-Noviembre-2019</font><br>
<font size='2'>Contactos: Cristian Ruz, cruz@ing.puc.cl; Raúl Álvarez, rsalvarez@uc.cl</font>
</p>


Hasta ahora, cuando hemos entregado datos para ser procesador por nuestros programas, utilizamos `input()`. Esta función espera un ingreso manual de datos por parte del usuario (o un poco más automatizado como lo hace *hackerrank*). sin embargo, las aplicaciones actuales, tanto para procesamiento científico, para ciencia de datos, análisis estadístico o experimentos, utilizan archivos para intercambiar información.

En esta sección veremos algunos ejemplos para trabajar con archivos desde Python.

## Abrir y cerrar archivos

El primer paso para trabajar con archivos es abrirlos. La función `open` permite abrir un archivo y obtener una referencia a él. La función recibe un *string* con una **ruta** al archivo que queremos abrir. Una ruta es la secuencia de directorios que debemos abrir hasta llegar al nombre de archivo. Si no indicamos una ruta y sólo agregamos el nombre del archivo, el intérprete de Python lo buscará en el directorio actual.


In [3]:
## Abre un archivo, y lo cierre inmediatamente.
## Este archivo se llama 'Einstein.txt', y se encuentra dentro del directorio 'files'
archivo = open("files/Einstein.txt")

## trabajar con el archivo
print(type(archivo))

archivo.close()

<class '_io.TextIOWrapper'>


Este ejemplo abre un archivo y luego lo cierra mediante el método `close()`. La función `open()` retorna un objeto (de clase `_io.TextIOWrapper`) que permite trabajar con el contenido del archivo. Una vez que se ha terminado de trabajar con él, debemos cerrar el archivo. En ese momento se guarda cualquier cambio que hayamos hecho en él.

### Modos de apertura

Al abrir un archivo, podemos especificar qué queremos hacer con él. El segundo argumento de `open` es el **modo de apertura**, y es un _string_ que puede ser:
* `r`, indica que queremos abrir el archivo **sólo para lectura** (*read*). Si no se especifica nada, el modo es `r`.
* `w`, indica que queremos abrir el archivo **sólo para escritura** (*write*).
* `a`, indica que queremos abrir el archivo para **escribir al final** (*append*).

La diferencia fundamental entre los modos `w` y `a` es que `w` trata el archivo como un archivo nuevo. Si el archivo no existía, lo crea. Si el archivo ya existía, borra su contenido y empieza a escribir desde el inicio. En cambio el modo `a` permite abrir un archivo con contenido y escribir al final de él.



In [4]:
## Este código va a crear un archivo de nombre "prueba.txt" en directorio actual.
## Como resultado, quedará un archivo con este nombre y de contenido vacío (0 bytes)
archivo = open("prueba.txt", "w")

archivo.close()

### Lectura de datos

Cuando abrimos un archivo para leer su contenido (modo `r`), obtenemos un objeto que permite acceder al archivo abierto. Entre los métodos útiles para leer el contenido del archivo están:
* `read()` lee todo el contenido de una sola vez y lo retorna en una variable
* `readline()` lee una línea y la retorna como un `str`
* `readlines()` lee todo el contenido de una sola y lo retorna como una lista de `str` donde cada elemento de la lista es una línea del archivo

**La más fácil:** Pero si queremos ir procesando una línea del archivo a la vez, también podemos usar la construcción `for linea in archivo` donde, en cada iteración, `linea` es un `str` con la línea siguiente del archivo.

A continuación un ejemplo de cada método.

In [1]:
## archivo.read() lee todo el contenido de una sola vez en un `str`. 
## La mayoría de las veces vamos a querer leer el contenido de una línea a la vez
## porque querremos hacer algo con cada línea, así que no usaremos tanto este método 

archivo = open("files/Einstein.txt", "r")
archivo_completo = archivo.read()
print(archivo_completo)
archivo.close()

El amor es un mejor profesor que el deber.
Información no es conocimiento.
Nunca pierdas la sagrada curiosidad.
Si no puedes explicarlo de forma simple, no lo entiendes lo suficientemente bien.
Todos deben ser respetados como individuos, pero no idolatrados.

Nunca hagas algo contra tu conciencia incluso si la situación lo demanda.
Locura: hacer lo mismo una y otra vez, esperando diferentes resultados.
Un hombre debe buscar lo que es, no lo que piensa que es.
Una persona que nunca ha cometido un error nunca ha intentado algo nuevo.
Aprende del ayer, vive del hoy, espera del mañana.

Todo debe ser tan simple como es, pero no más sencillo.
La lógica te lleva del punto A al B. La imaginación te llevará donde sea.



In [6]:
## archivo.readline() lee una linea en cada ocasión.
## Cada línea retornada contiene un caracter de fin de línea: '\n' al final.
## Si queremos eliminar podemos usar linea.strip('\n') después de cada lectura.
## Retorna el string vacio "" si es que no queda nada más que leer.

archivo = open("files/Einstein.txt", "r")

# Lee una línea. Notar que queda un cambio de línea ('\n') al final
primera_linea = archivo.readline()
print("Línea 1: [" + primera_linea + "]")

# Podemos descartar el cambio de línea con strip()
primera_linea = primera_linea.strip()
print("Línea 1: [" + primera_linea + "]")

# Cada llamado retorna un linea más. Podemos eliminar el cambio de línea de inmediato
segunda_linea = archivo.readline().strip()
print("Línea 2: [" + segunda_linea + "]")

## Podemos leer hasta que 'readline' retorne ""
numero = 3
linea = archivo.readline()
while linea != "":
    linea = linea.strip()
    print("Línea " + str(numero) + ": [" + linea + "]")
    numero += 1
    linea = archivo.readline()
    


archivo.close()

Línea 1: [El amor es un mejor profesor que el deber.
]
Línea 1: [El amor es un mejor profesor que el deber.]
Línea 2: [Información no es conocimiento.]
Línea 3: [Nunca pierdas la sagrada curiosidad.]
Línea 4: [Si no puedes explicarlo de forma simple, no lo entiendes lo suficientemente bien.]
Línea 5: [Todos deben ser respetados como individuos, pero no idolatrados.]
Línea 6: []
Línea 7: [Nunca hagas algo contra tu conciencia incluso si la situación lo demanda.]
Línea 8: [Locura: hacer lo mismo una y otra vez, esperando diferentes resultados.]
Línea 9: [Un hombre debe buscar lo que es, no lo que piensa que es.]
Línea 10: [Una persona que nunca ha cometido un error nunca ha intentado algo nuevo.]
Línea 11: [Aprende del ayer, vive del hoy, espera del mañana.]
Línea 12: []
Línea 13: [Todo debe ser tan simple como es, pero no más sencillo.]
Línea 14: [La lógica te lleva del punto A al B. La imaginación te llevará donde sea.]


In [7]:
## archivo.readlines() retorna una lista con una línea en cada elemento
## Cada línea incluye el cambio de línea '\n'
archivo = open("files/Einstein.txt", "r")
lineas = archivo.readlines()
print("Líneas leídas:", len(lineas))
numero = 1
for linea in lineas:
    print(str(numero) + ": [" + linea.strip() +"]")
    numero += 1

archivo.close()

Líneas leídas: 14
1: [El amor es un mejor profesor que el deber.]
2: [Información no es conocimiento.]
3: [Nunca pierdas la sagrada curiosidad.]
4: [Si no puedes explicarlo de forma simple, no lo entiendes lo suficientemente bien.]
5: [Todos deben ser respetados como individuos, pero no idolatrados.]
6: []
7: [Nunca hagas algo contra tu conciencia incluso si la situación lo demanda.]
8: [Locura: hacer lo mismo una y otra vez, esperando diferentes resultados.]
9: [Un hombre debe buscar lo que es, no lo que piensa que es.]
10: [Una persona que nunca ha cometido un error nunca ha intentado algo nuevo.]
11: [Aprende del ayer, vive del hoy, espera del mañana.]
12: []
13: [Todo debe ser tan simple como es, pero no más sencillo.]
14: [La lógica te lleva del punto A al B. La imaginación te llevará donde sea.]


In [10]:
## Finalmente, la manera más fácil de procesar cada línea.
## Podemos usar la construcción for linea in archivo, para pasar por cada línea:

archivo = open("files/Einstein.txt", "r")
numero = 1
for linea in archivo:
    print(str(numero) + ": [" + linea.strip() +"]")
    numero += 1
archivo.close()

1: [El amor es un mejor profesor que el deber.]
2: [Información no es conocimiento.]
3: [Nunca pierdas la sagrada curiosidad.]
4: [Si no puedes explicarlo de forma simple, no lo entiendes lo suficientemente bien.]
5: [Todos deben ser respetados como individuos, pero no idolatrados.]
6: []
7: [Nunca hagas algo contra tu conciencia incluso si la situación lo demanda.]
8: [Locura: hacer lo mismo una y otra vez, esperando diferentes resultados.]
9: [Un hombre debe buscar lo que es, no lo que piensa que es.]
10: [Una persona que nunca ha cometido un error nunca ha intentado algo nuevo.]
11: [Aprende del ayer, vive del hoy, espera del mañana.]
12: []
13: [Todo debe ser tan simple como es, pero no más sencillo.]
14: [La lógica te lleva del punto A al B. La imaginación te llevará donde sea.]


### Escritura de datos

Si queremos escribir o agregar datos a un archivo, debemos abrir el archivo con el modo `"w"` si queremos partir de un archivo vacío, o bien con `"a"` si queremos escribir al final de un archivo existente.

Para escribir dentro de un archivo podemos utilizar un parámetro adicional para la función `print`.

In [13]:
## print puede escribir en un archivo abierto para escritura (o para append), si es que le pasamos 
archivo = open("prueba.txt", "w")
print("Esta es una línea de prueba", file=archivo)
print(file=archivo)
print("Acabamos de dejar una línea vacía", file=archivo)
nota_eximicion = 5.5
print("Y esta línea contiene", nota_eximicion, "que es la nota de eximición.", file=archivo)
archivo.close()



In [14]:
## Después de ejecutar el código de la celda anterior, podemos ejecutar éste para mostrar
## el contenido de "prueba.txt"
archivo = open("prueba.txt", "r")
for linea in archivo:
    print(linea.strip())
archivo.close()

Esta es una línea de prueba

Acabamos de dejar una línea vacía
Y esta línea contiene  5.5 que es la nota de eximición.


Y si hacemos lo mismo con el modo `"a"`, estaremos agregando el contenido nuevo al final del archivo.

In [16]:
## print puede escribir en un archivo abierto para escritura (o para append), si es que le pasamos 
archivo = open("prueba.txt", "a")
print("Esta es una línea de prueba", file=archivo)
print(file=archivo)
print("Acabamos de dejar una línea vacía", file=archivo)
nota_eximicion = 5.5
print("Y esta línea contiene", nota_eximicion, "que es la nota de eximición.", file=archivo)
archivo.close()


## Después de ejecutar el código de la celda anterior, podemos ejecutar éste para mostrar
## el contenido de "prueba.txt"
archivo = open("prueba.txt", "r")
for linea in archivo:
    print(linea.strip())
archivo.close()

Esta es una línea de prueba

Acabamos de dejar una línea vacía
Y esta línea contiene  5.5 que es la nota de eximición.
Esta es una línea de prueba

Acabamos de dejar una línea vacía
Y esta línea contiene 5.5 que es la nota de eximición.
Esta es una línea de prueba

Acabamos de dejar una línea vacía
Y esta línea contiene 5.5 que es la nota de eximición.
