# Archivo Entrada y Salida

Los programas requieren datos, y a veces muchos datos. Hay diferentes maneras de guardar y acceder a ello, pero una de las mas comunes es a traves del sistema de archivos de una computadora. Por tanto, trabajar con archivos es una herramienta sumamente util para cualquier programador. 

Operacions comunes involucran: guardando el dato de salida de un programa a un archivo de texto, limpiar un documento tabulado a fin que cada columna este en el formato correcto, o eliminar archivos grandes de un directorio en el disco duro.

En esta seccion aprenderemos a:
1. Leer y escribir archivos
2. Trabajar con rutas de archivos
3. Trabajar con archivos CSV

# Leer y escribir archivos

Hasta ahora hemos visto programas que toman dato de entrada del mismo programa o del usuario. Si han trabajado con muchos datos, estos metodos son problematicos. En muchas aplicaciones, el dato de entrada es leido de algun(os) archivo(s). Python tiene herramientas que nos permiten realizar estas operaciones.

## Escribir a un archivo

Para escribir un archivo de texto sin formato, podemos utilizar la funcion general incorporada `open()`. Cuando abrimos un archivo con `open()`, lo primero que debemos determinar es si realizamos una operacion de lectura o de escritura.

In [4]:
# abrir y escribir a un archivo
archivo_salida = open('hola.txt', 'w')  # abrimos en modo "w" de escritura

In [5]:
# escribimos una linea de texto con writelines()
archivo_salida.writelines('Este es mi primer archivo')
archivo_salida.close()

Cuando solo proporcionamos el nombre del archivo, este se creará en el mismo directorio que tiene el script, toda vez que no proporcionamos la ruta del archivo.

Cuando abrimos un archivo con `open()`, siempre debemos cerrar el archivo con `close()`. Python cierra automaticamente los archivos que uno abre, pero si no los cerramos, puede ocasionar problemas no esperados. 

Despues de ejecutar el script, observamos un archivo nuevo en el directorio denominado `hola.txt`, con la linea escrita `Este es mi primer archivo`.

In [7]:
# writelines() tambien toma una lista de lineas 
archivo_salida = open('hola.txt', 'w')  # si abrimos un archivo existente, el contenido viejo se borra
lineas = [
    'Este archivo es nuevo',
    'Contiene esta linea',
    'Esta otra linea tambien'
]
archivo_salida.writelines(lineas)  # las lineas son escritas seguidamente sin espacio
archivo_salida.close()

In [8]:
# para escribir en una linea nueva, insertemos el caracter de nueva linea "\n"
archivo_salida = open('hola.txt', 'w') 
lineas = [
    'Este archivo es nuevo',
    '\nContiene esta linea',     # \n en linea nueva
    '\nEsta otra linea tambien'  # \n en linea nueva
]
archivo_salida.writelines(lineas)  # las lineas son escritas seguidamente sin espacio
archivo_salida.close()

Si abrimos el archivo, observamos cada linea en una linea nueva:

```
Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
```

In [10]:
# podemos abrir el archivo en modo "a" que permita "adjuntar"
archivo_salida = open('hola.txt', 'a')  # abrimos el archivo pero no borra el contenido
archivo_salida.writelines('\nEsta linea se adjunta')  # linea nueva
archivo_salida.close()  

Si abrimos el archivo, observamos cada linea en una linea nueva:

```
Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
Esta linea se adjunta
```

## Leer un archivo

In [11]:
# abrimos el archivo en modo lectura "r" 
archivo_entrada = open('hola.txt', 'r')
print(archivo_entrada.readlines())  # utilizamos el metodo readlines() que retorna una lista de lineas
archivo_entrada.close()

['Este archivo es nuevo\n', 'Contiene esta linea\n', 'Esta otra linea tambien\n', 'Esta linea se adjunta\n', 'Esta linea se adjunta']


In [13]:
# ya que el archivo retorna una lista, podemos ciclar sobre la misma
archivo_entrada = open('hola.txt', 'r')
for linea in archivo_entrada.readlines():
    print(linea)
archivo_entrada.close()

Este archivo es nuevo

Contiene esta linea

Esta otra linea tambien

Esta linea se adjunta

Esta linea se adjunta


In [14]:
# observamos que hay una nueva linea vacia entre cada linea, podemos anular este comportamiento
archivo_entrada = open('hola.txt', 'r')
for linea in archivo_entrada.readlines():
    print(linea, end='')  # print incluye nueva linea automaticamente, especificamos comportamiento deseado end=''
archivo_entrada.close()

Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
Esta linea se adjunta
Esta linea se adjunta

In [18]:
# podemos leer linea por linea con readline() en singular
archivo_entrada = open('hola.txt', 'r')
linea = archivo_entrada.readline()  # lee la primera linea
while linea != '':  # si no hemos llegao al fin
    print(linea, end='')  # imprime la linea
    linea = archivo_entrada.readline()  # lee la proxima linea
archivo_entrada.close()

Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
Esta linea se adjunta
Esta linea se adjunta

Cuando Python lee un archivo, gestiona un tipo de marcador que recuerda su ubicacion en el documento. Es asi como el metodo readline() funciona, ya que lee la primera linea, y cuando el metodo se ejecuta nuevamente, Python lee el documento a partir de donde dejó el marcador la última vez, por tanto lee la próxima linea del documento, y asi sucesivamente hasta llegar al final del archivo. Cuando se cierra el archivo con `close()`, el marcado vuelve a reiniciarse, a fin de que la proxima vez empieze desde el principio del archivo. El metodo `readlines()` tambien se comporta de la misma manera. 

Esto lo podemos comprobar si leemos el archivo, ejecutamos readlines, y sin cerrar el archivo, ejecutamos nuevamente el metodo `readlines()`. Ya que el marcador sigue al final del documento, `readlines()` no retorna linea alguna, porque no hay nada que leer.

In [20]:
archivo_entrada = open('hola.txt', 'r')
print('Primera vez:')
for linea in archivo_entrada.readlines():
    print(linea, end='')
    
print('\n\nSegunda vez:')
for linea in archivo_entrada.readlines():
    print(linea, end='')
archivo_entrada.close()

Primera vez:
Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
Esta linea se adjunta
Esta linea se adjunta

Segunda vez:


In [21]:
# si queremos acceder al contenido del archivo nuevamente, es mejor guardarlo en una lista
archivo_entrada = open('hola.txt', 'r')

lineas = archivo_entrada.readlines()
    
print('Primera vez:')
for linea in lineas:
    print(linea, end='')
    
print('\n\nSegunda vez:')
for linea in lineas:
    print(linea, end='')
archivo_entrada.close()

Primera vez:
Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
Esta linea se adjunta
Esta linea se adjunta

Segunda vez:
Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
Esta linea se adjunta
Esta linea se adjunta

In [22]:
# para no tener que cerrar el archivo, Python lo hace automaticamente con la palabra with
# with establece un contexto
with open('hola.txt', 'r') as archivo:
    for line in archivo.readlines():
        print(line)

Este archivo es nuevo

Contiene esta linea

Esta otra linea tambien

Esta linea se adjunta

Esta linea se adjunta


In [24]:
# podemos abrir mutiples archivos en la misma operacion
with open('hola.txt', 'r') as fuente, open('salida.txt', 'w') as salida:
    for line in fuente.readlines():
        salida.write(line)

# todo el contenido del primer archivo se copio a este
with open('salida.txt', 'r') as archivo:
    for line in archivo.readlines():
        print(line)

Este archivo es nuevo

Contiene esta linea

Esta otra linea tambien

Esta linea se adjunta

Esta linea se adjunta


## Ejercicios

1. Abra y escriba un archivo que contenga varias lineas utilizando writelines()
2. Abra el archivo que escribio y lea sus contenidos con readlines() y readline()
3. Abra y lea el archivo que escribio utilizando with() 
4. Abra y lear al archivo que escribio utilizando with() y copie los contenidos del mismo a otro archivo

# Trabajando con Rutas en Python

Lo mas probable es que vamos a necesitar abrir archivos ubicados en otros directorios, y no solamente los archivos ubicados en el directorio actual donde reside el script. Para acceder a distintos directorions, podemos ingresar la ruta completa directamente como argumento a la funcion incorporada `open(ruta_absoluta_del_archivo)`

In [25]:
archivo = open('C:/home/adriaanbd/documentos/hola.txt', 'r')  # esta ruta no existe actualmente, es solo un ejemplo

FileNotFoundError: [Errno 2] No such file or directory: 'C:/home/adriaanbd/documentos/hola.txt'

Observemos el uso del `/`. Las rutas de Windows contienen un `\` en vez de un `/`, pero en Python podemos substituir el `\` por el `/`, toda vez que el `\` tiene un significado especial en Python por ser utilizado como un caracter de escape, lo que quiere decir que el caracter que le sigue inmediatamente, e.g. `\n` es tratado como caracter especial. Python entiende que el uso del `\` con el caracter a continuacion es un caracter especial. Por ejemplo, `\n` significa una nueva linea, `\t` significa un caracter `tab` que representa 2 o 4 caracteres de espacios en la misma linea.

In [None]:
# podemos utilizar el \ de la siguiente manera
path = r'C:\home\adriaanbd\documentos\hola.txt'  # no exista la ruta, es solo un ejemplo

## El modulo `os`

Si deseamos hacer algo mas avanzado con estructuras de archivos, vamos a tener que hacer uso del modulo `os`, que expone varias funciones del sistema operativo. Lo primero que tenemos que hacer es importar el modulo.

In [26]:
# esto importa el modulo al programa
import os 

In [None]:
# para crear un directorio nuevo en el directorio donde reside este programa
os.mkdir('mi-directorio')  

In [None]:
# para crear el directorio en una ruta especifica
ruta = 'C:/home/adriaanbd/documentos'  
os.mkdir(os.path.join(path, 'mi-directorio'))  # utilizemos os.path.join para concatenar dos strings

In [28]:
# pudimos haber concatenado asi tambien:
ruta = 'C:/home/adriaanbd/documentos'  
directorio = ruta + '/' + 'mi-directorio'
print(directorio)

C:/home/adriaanbd/documentos/mi-directorio


In [None]:
# para eliminar un directorio usemos rmdir()
os.rmdir(directorio)

In [29]:
# para obtener una lista de los archivos en un directorio usemos os.listdir()
os.listdir()

['contenido.ipynb',
 'intro.ipynb',
 'errores.ipynb',
 'contenido.md',
 'funciones-y-ciclos.ipynb',
 'file-entrada-salida.ipynb',
 '.ipynb_checkpoints',
 'otros-temas',
 'oop.ipynb',
 'numeros-y-matematica.ipynb',
 'tips.ipynb',
 'encontrando-resolviendo-errores.ipynb',
 '.git',
 'llamadas-y-textos',
 'logica-condicional-control-de-flujo.ipynb',
 'variables.ipynb',
 'strings.ipynb',
 'textos-llamadas.ipynb',
 'hola.txt',
 'juego-de-aventura.ipynb',
 'tuplas-listas-diccionarios.ipynb',
 '.python-version',
 'salida.txt']

In [30]:
# una lista de los archivos con terminacion txt usando endswith()
for archivo in os.listdir():
    if archivo.lower().endswith('txt'):
        print(archivo)

hola.txt
salida.txt


## el modulo `glob`

In [33]:
# este modulo nos ayuda a encontrar patrones con caracteres comodin
import glob
glob.glob('*.txt')  # el asterisco * es un comodin que representa todo, por tanto todo archivo con extension .txt

['hola.txt', 'salida.txt']

## Verificando la existencia de archivos y directorios

In [35]:
for archivo in os.listdir():
    print(os.path.isdir(archivo))  # es un directorio?

False
False
False
False
False
False
True
False
False
False
False
False
True
True
False
False
False
False
False
False
False
False
False


In [36]:
for archivo in os.listdir():
    print(os.path.isfile(archivo))  # es un archivo?

True
True
True
True
True
True
False
True
True
True
True
True
False
False
True
True
True
True
True
True
True
True
True


In [37]:
for archivo in os.listdir():
    print(os.path.exists(archivo))  # el archivo existe?

True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True
True


## Ejercicios

1. Imprime la ruta absoluta de todos los archivos y directorios en el directorio de `Documentos/` en su computador
2. Imprima la ruta absoluta de todos los archivos .txt en el directorio actual