# Archivo Entrada y Salida

Los programas requieren datos, y a veces muchos datos. Hay diferentes maneras de guardar y acceder a ello, pero una de las mas comunes es a traves del sistema de archivos de una computadora. Por tanto, trabajar con archivos es una herramienta sumamente util para cualquier programador. 

Operacions comunes involucran: guardando el dato de salida de un programa a un archivo de texto, limpiar un documento tabulado a fin que cada columna este en el formato correcto, o eliminar archivos grandes de un directorio en el disco duro.

En esta seccion aprenderemos a:
1. Leer y escribir archivos
2. Trabajar con rutas de archivos
3. Trabajar con archivos CSV

# Leer y escribir archivos

Hasta ahora hemos visto programas que toman dato de entrada del mismo programa o del usuario. Si han trabajado con muchos datos, estos metodos son problematicos. En muchas aplicaciones, el dato de entrada es leido de algun(os) archivo(s). Python tiene herramientas que nos permiten realizar estas operaciones.

## Escribir a un archivo

Para escribir un archivo de texto sin formato, podemos utilizar la funcion general incorporada `open()`. Cuando abrimos un archivo con `open()`, lo primero que debemos determinar es si realizamos una operacion de lectura o de escritura.

In [None]:
# abrir y escribir a un archivo
archivo_salida = open('hola.txt', 'w')  # abrimos en modo "w" de escritura

In [None]:
# escribimos una linea de texto con writelines()
archivo_salida.writelines('Este es mi primer archivo')
archivo_salida.close()

Cuando solo proporcionamos el nombre del archivo, este se creará en el mismo directorio que tiene el script, toda vez que no proporcionamos la ruta del archivo.

Cuando abrimos un archivo con `open()`, siempre debemos cerrar el archivo con `close()`. Python cierra automaticamente los archivos que uno abre, pero si no los cerramos, puede ocasionar problemas no esperados. 

Despues de ejecutar el script, observamos un archivo nuevo en el directorio denominado `hola.txt`, con la linea escrita `Este es mi primer archivo`.

In [None]:
# writelines() tambien toma una lista de lineas 
archivo_salida = open('hola.txt', 'w')  # si abrimos un archivo existente, el contenido viejo se borra
lineas = [
    'Este archivo es nuevo',
    'Contiene esta linea',
    'Esta otra linea tambien'
]
archivo_salida.writelines(lineas)  # las lineas son escritas seguidamente sin espacio
archivo_salida.close()

In [1]:
# para escribir en una linea nueva, insertemos el caracter de nueva linea "\n"
archivo_salida = open('hola.txt', 'w') 
lineas = [
    'Este archivo es nuevo',
    '\nContiene esta linea',     # \n en linea nueva
    '\nEsta otra linea tambien'  # \n en linea nueva
]
archivo_salida.writelines(lineas)  # las lineas son escritas seguidamente sin espacio
archivo_salida.close()

Si abrimos el archivo, observamos cada linea en una linea nueva:

```
Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
```

In [2]:
# podemos abrir el archivo en modo "a" que permita "adjuntar"
archivo_salida = open('hola.txt', 'a')  # abrimos el archivo pero no borra el contenido
archivo_salida.writelines('\nEsta linea se adjunta')  # linea nueva
archivo_salida.close()  

Si abrimos el archivo, observamos cada linea en una linea nueva:

```
Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
Esta linea se adjunta
```

## Leer un archivo

In [3]:
# abrimos el archivo en modo lectura "r" 
archivo_entrada = open('hola.txt', 'r')
print(archivo_entrada.readlines())  # utilizamos el metodo readlines() que retorna una lista de lineas
archivo_entrada.close()

['Este archivo es nuevo\n', 'Contiene esta linea\n', 'Esta otra linea tambien\n', 'Esta linea se adjunta']


In [4]:
# ya que el archivo retorna una lista, podemos ciclar sobre la misma
archivo_entrada = open('hola.txt', 'r')
for linea in archivo_entrada.readlines():
    print(linea)
archivo_entrada.close()

Este archivo es nuevo

Contiene esta linea

Esta otra linea tambien

Esta linea se adjunta


In [5]:
# observamos que hay una nueva linea vacia entre cada linea, podemos anular este comportamiento
archivo_entrada = open('hola.txt', 'r')
for linea in archivo_entrada.readlines():
    print(linea, end='')  # print incluye nueva linea automaticamente, especificamos comportamiento deseado end=''
archivo_entrada.close()

Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
Esta linea se adjunta

In [6]:
# podemos leer linea por linea con readline() en singular
archivo_entrada = open('hola.txt', 'r')
linea = archivo_entrada.readline()  # lee la primera linea
while linea != '':  # si no hemos llegao al fin
    print(linea, end='')  # imprime la linea
    linea = archivo_entrada.readline()  # lee la proxima linea
archivo_entrada.close()

Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
Esta linea se adjunta

Cuando Python lee un archivo, gestiona un tipo de marcador que recuerda su ubicacion en el documento. Es asi como el metodo `readline()` funciona, ya que lee la primera linea, y cuando el metodo se ejecuta nuevamente, Python lee el documento a partir de donde dejó el marcador la última vez, por tanto lee la próxima linea del documento, y asi sucesivamente hasta llegar al final del archivo. Cuando se cierra el archivo con `close()`, el marcador vuelve a reiniciarse, a fin de que la proxima vez pueda empezar desde el principio del archivo. El metodo `readlines()` tambien se comporta de la misma manera. 

Esto lo podemos comprobar si leemos el archivo, ejecutamos readlines, y sin cerrar el archivo, ejecutamos nuevamente el metodo `readlines()`. Ya que el marcador sigue al final del documento, `readlines()` no retorna linea alguna, porque no hay nada que leer.

In [7]:
archivo_entrada = open('hola.txt', 'r')
print('Primera vez:')
for linea in archivo_entrada.readlines():
    print(linea, end='')
    
print('\n\nSegunda vez:')
for linea in archivo_entrada.readlines():
    print(linea, end='')
archivo_entrada.close()

Primera vez:
Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
Esta linea se adjunta

Segunda vez:


In [8]:
# si queremos acceder al contenido del archivo nuevamente, es mejor guardarlo en una lista
archivo_entrada = open('hola.txt', 'r')

lineas = archivo_entrada.readlines()
    
print('Primera vez:')
for linea in lineas:
    print(linea, end='')
    
print('\n\nSegunda vez:')
for linea in lineas:
    print(linea, end='')
archivo_entrada.close()

Primera vez:
Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
Esta linea se adjunta

Segunda vez:
Este archivo es nuevo
Contiene esta linea
Esta otra linea tambien
Esta linea se adjunta

In [9]:
# para no tener que cerrar el archivo, Python lo hace automaticamente con la palabra with
# with establece un contexto
with open('hola.txt', 'r') as archivo:
    for line in archivo.readlines():
        print(line)

Este archivo es nuevo

Contiene esta linea

Esta otra linea tambien

Esta linea se adjunta


In [10]:
# podemos abrir mutiples archivos en la misma operacion
with open('hola.txt', 'r') as fuente, open('salida.txt', 'w') as salida:
    for line in fuente.readlines():
        salida.write(line)

# todo el contenido del primer archivo se copio a este
with open('salida.txt', 'r') as archivo:
    for line in archivo.readlines():
        print(line)

Este archivo es nuevo

Contiene esta linea

Esta otra linea tambien

Esta linea se adjunta


## Ejercicios

1. Abra y escriba un archivo que contenga varias lineas utilizando writelines()
2. Abra el archivo que escribio y lea sus contenidos con readlines() y readline()
3. Abra y lea el archivo que escribio utilizando with() 
4. Abra y lear al archivo que escribio utilizando with() y copie los contenidos del mismo a otro archivo

# Trabajando con Rutas en Python

Lo mas probable es que vamos a necesitar abrir archivos ubicados en otros directorios, y no solamente los archivos ubicados en el directorio actual donde reside el script. Para acceder a distintos directorions, podemos ingresar la ruta completa directamente como argumento a la funcion incorporada `open(ruta_absoluta_del_archivo)`.

```
archivo = open('C:/home/adriaanbd/documentos/hola.txt', 'r')
```

Observemos el uso del `/`. Las rutas de Windows contienen un `\` en vez de un `/`, pero en Python podemos substituir el `\` por el `/`, toda vez que el `\` tiene un significado especial en Python por ser utilizado como un caracter de escape, lo que quiere decir que el caracter que le sigue inmediatamente, e.g. `\n` es tratado como caracter especial. Python entiende que el uso del `\` con el caracter a continuacion es un caracter especial. Por ejemplo, `\n` significa una nueva linea, `\t` significa un caracter `tab` que representa 2 o 4 caracteres de espacios en la misma linea.

```
# podemos utilizar el \ de la siguiente manera
path = r'C:\home\adriaanbd\documentos\hola.txt'
```

## El modulo `os`

Si deseamos hacer algo mas avanzado con estructuras de archivos, vamos a tener que hacer uso del modulo `os`, que expone varias funciones del sistema operativo. Lo primero que tenemos que hacer es importar el modulo.

In [11]:
# esto importa el modulo al programa
import os 

In [16]:
# para crear un directorio nuevo en el directorio donde reside este programa
os.mkdir('mi-directorio')  

FileExistsError: [Errno 17] File exists: 'mi-directorio'

In [17]:
# para crear el directorio en una ruta especifica
ruta = 'mi-directorio'  
os.mkdir(os.path.join(ruta, 'subdirectorio'))  # utilizemos os.path.join para concatenar dos strings

In [12]:
# pudimos haber concatenado asi tambien:
ruta = 'C:/home/adriaanbd/documentos'  
directorio = ruta + '/' + 'mi-directorio'
print(directorio)

C:/home/adriaanbd/documentos/mi-directorio


In [21]:
ruta = 'mi-directorio'
directorio = os.path.join(ruta, 'subdirectorio')
directorio

'mi-directorio/subdirectorio'

In [22]:
# para eliminar un directorio usemos rmdir()
os.rmdir(directorio)

In [24]:
ruta = 'mi-directorio'
os.rmdir(ruta)

In [26]:
# para obtener una lista de los archivos en un directorio usemos os.listdir()
os.listdir()  # su dato de salida podrá ser distinto

['contenido.ipynb',
 '.vscode',
 'intro.ipynb',
 'errores.ipynb',
 'contenido.md',
 'funciones-y-ciclos.ipynb',
 'salida',
 'file-entrada-salida.ipynb',
 '.ipynb_checkpoints',
 'otros-temas',
 'oop.ipynb',
 '.gitignore',
 'numeros-y-matematica.ipynb',
 'tips.ipynb',
 'encontrando-resolviendo-errores.ipynb',
 '.git',
 'datos',
 'logica-condicional-control-de-flujo.ipynb',
 'variables.ipynb',
 'strings.ipynb',
 'textos-llamadas.ipynb',
 'hola.txt',
 'juego-de-aventura.ipynb',
 'tuplas-listas-diccionarios.ipynb',
 '.python-version',
 'salida.txt']

In [27]:
# una lista de los archivos con terminacion txt usando endswith()
for archivo in os.listdir():
    if archivo.lower().endswith('txt'):
        print(archivo)

hola.txt
salida.txt


## el modulo `glob`

In [28]:
# este modulo nos ayuda a encontrar patrones con caracteres comodin
import glob
glob.glob('*.txt')  # el asterisco * es un comodin que representa todo, por tanto todo archivo con extension .txt

['hola.txt', 'salida.txt']

## Verificando la existencia de archivos y directorios

In [42]:
for archivo in os.listdir():
    print(f'Archivo: "{archivo}", \nes un directorio: {os.path.isdir(archivo)}\n\n')  # es un directorio?

Archivo: "contenido.ipynb", 
es un directorio: False


Archivo: ".vscode", 
es un directorio: True


Archivo: "intro.ipynb", 
es un directorio: False


Archivo: "errores.ipynb", 
es un directorio: False


Archivo: "contenido.md", 
es un directorio: False


Archivo: "funciones-y-ciclos.ipynb", 
es un directorio: False


Archivo: "salida", 
es un directorio: True


Archivo: "file-entrada-salida.ipynb", 
es un directorio: False


Archivo: ".ipynb_checkpoints", 
es un directorio: True


Archivo: "otros-temas", 
es un directorio: False


Archivo: "oop.ipynb", 
es un directorio: False


Archivo: ".gitignore", 
es un directorio: False


Archivo: "numeros-y-matematica.ipynb", 
es un directorio: False


Archivo: "tips.ipynb", 
es un directorio: False


Archivo: "encontrando-resolviendo-errores.ipynb", 
es un directorio: False


Archivo: ".git", 
es un directorio: True


Archivo: "datos", 
es un directorio: True


Archivo: "logica-condicional-control-de-flujo.ipynb", 
es un directorio: False


A

In [41]:
for archivo in os.listdir():
    print(f'Archivo: "{archivo}" \nes un archivo: {os.path.isfile(archivo)}\n\n')  # es un archivo?

Archivo: "contenido.ipynb" 
es un archivo: True


Archivo: ".vscode" 
es un archivo: False


Archivo: "intro.ipynb" 
es un archivo: True


Archivo: "errores.ipynb" 
es un archivo: True


Archivo: "contenido.md" 
es un archivo: True


Archivo: "funciones-y-ciclos.ipynb" 
es un archivo: True


Archivo: "salida" 
es un archivo: False


Archivo: "file-entrada-salida.ipynb" 
es un archivo: True


Archivo: ".ipynb_checkpoints" 
es un archivo: False


Archivo: "otros-temas" 
es un archivo: True


Archivo: "oop.ipynb" 
es un archivo: True


Archivo: ".gitignore" 
es un archivo: True


Archivo: "numeros-y-matematica.ipynb" 
es un archivo: True


Archivo: "tips.ipynb" 
es un archivo: True


Archivo: "encontrando-resolviendo-errores.ipynb" 
es un archivo: True


Archivo: ".git" 
es un archivo: False


Archivo: "datos" 
es un archivo: False


Archivo: "logica-condicional-control-de-flujo.ipynb" 
es un archivo: True


Archivo: "variables.ipynb" 
es un archivo: True


Archivo: "strings.ipynb" 
es un

In [40]:
for archivo in os.listdir():
    print(f'Archivo: "{archivo}" \nexiste: {os.path.exists(archivo)}\n\n')  # el archivo existe?

Archivo: "contenido.ipynb" 
existe: True


Archivo: ".vscode" 
existe: True


Archivo: "intro.ipynb" 
existe: True


Archivo: "errores.ipynb" 
existe: True


Archivo: "contenido.md" 
existe: True


Archivo: "funciones-y-ciclos.ipynb" 
existe: True


Archivo: "salida" 
existe: True


Archivo: "file-entrada-salida.ipynb" 
existe: True


Archivo: ".ipynb_checkpoints" 
existe: True


Archivo: "otros-temas" 
existe: True


Archivo: "oop.ipynb" 
existe: True


Archivo: ".gitignore" 
existe: True


Archivo: "numeros-y-matematica.ipynb" 
existe: True


Archivo: "tips.ipynb" 
existe: True


Archivo: "encontrando-resolviendo-errores.ipynb" 
existe: True


Archivo: ".git" 
existe: True


Archivo: "datos" 
existe: True


Archivo: "logica-condicional-control-de-flujo.ipynb" 
existe: True


Archivo: "variables.ipynb" 
existe: True


Archivo: "strings.ipynb" 
existe: True


Archivo: "textos-llamadas.ipynb" 
existe: True


Archivo: "hola.txt" 
existe: True


Archivo: "juego-de-aventura.ipynb" 
existe:

## Ejercicios

1. Imprime la ruta absoluta de todos los archivos y directorios en el directorio de `Documentos/` en su computador
2. Imprima la ruta absoluta de todos los archivos .txt en el directorio actual

# Lea y Escriba Data CSV

Los archivos del dia a dia son un poco mas complicados que archivos simples de texto. Para modificar el contenido de estos archivo, necesitamos un poco mas de herramientas. 

Una manera comun para guardar datos de texto es en archivos CSV, que por sus siglas en ingles significa Valores Separados por Comma, toda vez que cada entrada en una fila de datos es usualmente separada de otras entrada con una coma. Por ejemplo:

```
Nombre, Apellido, Edad
Juan, Perez, 40
Juana, Perez, 45
```

Cada linea representa una fila de datos, incluyendo la primera fila que representa el encabezamiento de la informacion. Cada entrada aparece en el mismo orden para cada fila, con cada entrada separada de otras con comas. 

Python tiene un modulo `csv` que nos permite realizar operacions necesarias para la gestion de archivos CSV.

## Leer un archivo CSV

In [44]:
# leemos un archivo con csv.reader(archivo)
import csv
import os

archivo = 'datos/llamadas.csv'
with open(archivo, 'r') as datos:
    lector = csv.reader(datos)
    for registro in lector:
        print(registro)

['numero_saliente', 'numero_entrante', 'fecha_tiempo', 'tiempo_segundos']
['(473) 5373591', '(221) 3829872', '2019-08-23 07:13:28', '779']
['(712) 6079829', '(521) 9979466', '2019-06-02 19:01:04', '150']
['(170) 7207064', '(667) 9707152', '2019-02-18 11:22:21', '1425']
['(267) 6838416', '(704) 6053438', '2019-12-26 22:29:30', '3278']
['(202) 7159564', '(848) 5356715', '2019-11-11 14:06:47', '2823']
['(971) 4270187', '(312) 3476941', '2019-07-21 22:30:45', '2824']
['(688) 1872860', '(580) 6692170', '2019-01-05 20:40:15', '363']
['(527) 3643293', '(700) 6013130', '2019-03-21 10:25:15', '1090']
['(824) 3120489', '(736) 5219693', '2019-06-15 19:31:29', '2383']
['(135) 5879807', '(210) 4726824', '2019-12-11 06:37:28', '3289']
['(946) 9885969', '(967) 6260487', '2019-04-30 18:12:15', '266']
['(822) 1999029', '(394) 2159591', '2019-07-20 13:24:02', '3171']
['(214) 1831354', '(407) 4594421', '2019-10-22 18:27:53', '2987']
['(301) 9038508', '(117) 3599538', '2019-08-11 14:34:08', '472']
['(975)

## Escribir a un archivo

In [11]:
# escribimos un archivo con csv.writer(archivo)
import csv
import os

archivo = 'salida/ejemplo.csv'

# os.mkdir('salida')

nombres = [
    ['Nombre', 'Apellido'],
    ['Juan', 'Perez'],
    ['Juana', 'Perez']
]

with open(archivo, 'w') as salida:
    escritor = csv.writer(salida)
    escritor.writerows(nombres)

with open(archivo, 'r') as entrada:
    lector = csv.reader(entrada)
    print(list(lector))

[['Nombre', 'Apellido'], ['Juan', 'Perez'], ['Juana', 'Perez']]


## Ejercicios

1. Escriba un script que escriba un archivo csv con informacion inventada, puede ser cualquier cosa, pero que tenga columnas, e.g. Nombre, Apellido, Edad, etc.
2. Escriba un script que lea el archivo escrito e imprima cada fila del archivo

# Reto: Puntos de Acceso de la Red Nacional de Internet por Provincia

Escriba un script que lea el archivo csv `datos/rni-puntos-de-acceso.csv` (se le entregará) que contiene informacion de todos los puntos de acceso de la red nacional de internet de Panama, y escriba un archivo csv nuevo `datos/rni-pda-por-provincia.csv`, que contiene lo siguiente:
1. Provincia y Puntos de Acceso como encabezado
2. El nombre de la provincia, y el numero total de Puntos de Acceso como fila

In [45]:
# un ejemplo practico

import csv
import os

archivo = 'datos/rni-puntos-de-acceso.csv'
with open(archivo, 'r', encoding='latin-1') as entrada, open('salida/rni-pda-chiriqui.csv', 'w') as salida:
    lector = csv.reader(entrada)  # para leer
    escritor = csv.writer(salida)  # para escribir
    for registro in lector:
        provincia = registro[3]
        if provincia.startswith('Chi'):
            escritor.writerow(registro)

with open(archivo, 'r', encoding='latin-1') as entrada:
    lector = csv.reader(entrada)
    for registro in list(lector)[:5]:
        print(registro)

['Regi¢n', 'PA', 'Nombre', 'Provincia', 'Distrito', 'Corregimiento', 'Tipo UM', 'Latitude', 'Longitude', 'Fecha de Activaci¢n']
['1', '1', 'Colegio Rogelio Josu\x82 Ibarra', 'Bocas del Toro', 'Bocas del Toro', 'Bocas del Toro', 'FO', '9.340654', '-82.242499', '12/07/17']
['1', '3', 'Escuela Rep£blica de Nicaragua', 'Bocas del Toro', 'Bocas del Toro', 'Bocas del Toro', 'FO', '9.338938', '-82.242668', '12/07/17']
['1', '4', 'Gobernaci¢n', 'Bocas del Toro', 'Bocas del Toro', 'Bocas del Toro', 'FO', '9.297858', '-82.41136', '23/11/17']
['1', '5', 'Parque Sim¢n Bol¡var', 'Bocas del Toro', 'Bocas del Toro', 'Bocas del Toro', 'FO', '9.340183', '-82.240631', '12/07/17']


# Resumen

Hemos aprendido como trabajar con archivos en Python. Ahora podemos abrir un archivo para leer y escribir con la funcion `open()`, que toma dos argumentos: un string que contiene la ruta al archivo, y un string que contiene el modo de abrir el archivo, e.g. `r` para leer y `w` para escribir.

Tambien vimos como trabajar con archivos utilizando el modulo `os`, como crear y borrar directorios con `os.mkdir()` y `os.rmdir()`. 

Finalmente, aprendimos como trabajar con archivos CSV, que es un tipo de archivo estandar para guardar datos por categoria. Vimos como leer data en un CSV con `csv.reader()`, que retorna cada fila del CSV como una lista, y vimos como escribir filas de datos a un CSV utilizando `csv.writer()`.