# Archivos

Python nos permite interactuar con archivos externos en nuestra computadora. Este tipo de archivos puede ser de cuaquier tipo como un .txt, .mp3, un vídeo, un email, una base de datos, un .xls, etc. Es probable que para cierto tipo de archivos tengamos que instalar alguna librería pero esto se puede hacer de manera sencilla generalmente. 

Por ahora nos centraremos en las funciones propias de python que nos permiten abrir e interactuar con archivos básicos. 

Primero necesitamos un archivo, lo podemos crear en el directorio donde estemos trabajando pero por fines prácticos yo lo haré usando IPython.

### Creando un archivo con IPython
No te preocupes si no entiendes al cien porciento este paso, lo abordaremos más tarde, por ahora lo único que estoy haciendo es usar un decorador para crear un archivo llamado test.txt y escribiendo cierta información dentro de él

ADVERTENCIA: ESTA FUNCIÓN ES ESPECIAL PARA JUPYTER NOTEBOOKS, SI USAS UN IDE APARTE CREA EL ARCHIVO CON EL EDITOR DE TEXTO DE TU PREFERENCIA.


In [1]:
%%writefile test.txt
Hola, esto es mi archivo de prueba

Writing test.txt


### Abriendo un archivo en Python

Comencemos abriendo el archivo que acabamos de crear, este archivo esta en el mismo directorio que este notebook, por ahora estaremos trabajando así. 

Abrir un archivo es muy fácil, pero es igual de fácil cometer errores en la práctica real. Por ejemplo si queremos abrir un archivo llamado "SecretosDeEstado.txt" que no está en el directorio donde estemos corriendo nuestro código

In [2]:
myfile = open("SecretosDeEstado.txt")

FileNotFoundError: [Errno 2] No such file or directory: 'SecretosDeEstado.txt'

Para evitar este error hay que asegurarnos de que el archivo esté en el mismo directorio que nuestro notebook o script de Python, para esto podemos usar el comando $\textbf{pwd}$

In [3]:
pwd

'C:\\Users\\Quantum\\Documents\\Prope100cias\\Introducción a Python\\Objetos y estructuras de datos'

También es posible abrir archivos que no estén en el mismo directorio, esto se hace pasando la ruta absoluta del archivo

Para Windows se usan dobles \ para pasar la ruta:

myfile = open("C:\\Users\\YourUserName\\Home\\Folder\\myfile.txt")

Pero para MacOS y Linux se usa / para pasar la ruta:

myfile = open("/Users/YouUserName/Folder/myfile.txt")

Comencemos ahora

In [4]:
#Abrimos el archivo que ya creamos

myfile = open('test.txt')

In [5]:
# Para leer el contenido de un arcivo usamos read()
myfile.read()

'Hola, esto es mi archivo de prueba\n'

In [6]:
# ¿Qué pasa si queremos leer de nuevo el archivo?
myfile.read()

''

Esto pasa debido a que al  leer una vez, el "cursor" queda hasta el final del archivo así que al volver a leer no hay nada más que leer. Podemos resetear el "cursor" usando seek(index) para posicionar el cursor en cierto punto del archivo

In [7]:
#Reseteando el cursor al inicio del archivo
myfile.seek(0)

0

In [8]:
#Volviendo a leer
myfile.read()

'Hola, esto es mi archivo de prueba\n'

Podemos además leer un archivo línea por línea aunque para archivos muy grandes es mejor tener cuidado ya que hacer esto ocupa bastante memoria.

In [9]:
myfile.seek(0)
myfile.readlines()

['Hola, esto es mi archivo de prueba\n']

Siempre es recomendable cerrar un archivo desués de usarlo

In [10]:
myfile.close()

### Escribiendo en un archivo

open() solo nos permite abrir el archivo de manera predeterminada, para editarlo necesitamos pasar como argumento `'w'` para poder escribir en él.

In [None]:
##Escribiendo en test.txt 
myfile = open('test.txt','w')
myfile.close()

In [None]:
## También podemos usar 'w+' para leer y escribir en el archivo
myfile = open('test.txt','w+')

ADVERTENCIA: Usar w y w+ SOBREESCRIBE el archivo, es decir, todo el contenido antes de editar es borrado.

In [None]:
#Usando el método write() escribimos en el archivo
myfile.write('Nueva entrada')

In [None]:
myfile.seek(0)
myfile.read()

In [None]:
myfile.close()

### Añadiendo a un archivo

Con el argumento 'a', podemos abrir el archivo y añadir algo hasta el final del archivo, así todo lo escrito es añadido y no sobreescrito en el archivo. 'a+' permite abrir el archivo en modo lectura y escritura. Si el archivo no existe, entonces será creado.

In [None]:
my_file = open('test.txt','a+')
my_file.write('\nAñadimos más texto')
my_file.write('\nUn poco más.')

In [None]:
my_file.seek(0)
my_file.read()

In [None]:
my_file.seek(0)
print(my_file.read())

In [None]:
myfile.close()

### Añadiendo a un archivo usando IPython

Nuevamente usando IPython podemos editar el archivo


In [None]:
%%writefile -a test.txt

Este texto está siendo añadido
Hola jeje

Notemos que el primer salto de línea es necesario para insertar el texto en una nueva línea, de no ser así se insertará inmediatamente después de al última entrada y Jupyter no reconoce \n

### Iterando en un archivo

Una manera de leer un archivo por líneas sin saturar la memoria es mediante el uso de un ciclo `for`, este tema será visto a profundidad posteriormente, pero por ahora quiero mostrarte como realizar esta lectura.

Primero editemos nuestro archivo para que todo quede claro.

In [None]:
%%writefile test.txt
Primera Linea
Segunda Linea
Tercera Linea
Cuarta Linea
Quinta Linea

Ahora podemos decirle a Python que recorra cada línea del archivo y a cada una le haga algo:

In [None]:
for linea in open('test.txt'):
    print(linea)

Lo que acabamos de hacer tiene ciertas implicaciones:

1. La variable "linea" puede recibir cualquier nombre.
2. Como no llamamos al método read() del archivo, el texto entero no fue guardado en la memoria
3. Nota la indentación en el ciclo for, como spoiler esta indentación es muy importante en Python

¡Felicidades por terminar esta lección! ahora puedes editar de manera básica archivos en Python. c: