# FP15. Trabajando con archivos de texto simples

¡Hola hackers!

En esta oportunidad vamos a trabajar con archivos. Al final de esta lección, podrá abrir archivos y trabajar con ellos usando código.

Python puede manejar fácilmente el trabajo con archivos .txt (más adelante aprenderás a trabajar con otros formatos de archivo, como .csv). Repasemos las mejores prácticas para trabajar con archivos de texto simples en Python.

## <font color='blue'>Abrir un archivo</font>

Para usar un archivo y hacer algo con él, lo primero que debemos hacer es abrirlo. Sí, igual que como hacemos con un libro.<br>
Usaremos la función `open()`, de la siguiente forma:

``` python
my_file = open ('ruta_del_archivo/nombre_archivo.extensión')
```

* **ruta_del_archivo**, corresponde a la ruta (path) en el cual se encuentra el archivo; considera que puede hacer diferencias en el uso de los slash (/) o backslash (\\) dependiendo de si tu sistema operativo es MacOS, Linux o Windows.
* **file_name.extension**, el nombre que elegimos del archivo y su respectiva extensión.

In [None]:
!ls -la


In [29]:
# Por ejemplo si escribimos mal el nombre o el archivo no existe en el directorio actual,
# esta celda dará un error
my_file = open('nombre_inexistente.txt')

FileNotFoundError: ignored

Esto significa que ocurrieron dos cosas posibles, o el nombre del archivo es incorrecto o no se proporcionó la ruta del archivo correcta. Cuando trabajas en Colab la ruta hay que armarla desde tu Drive de Goole en la nube.

## <font color='red'>Importante</font>

Si estás trabajando en Colab, estás trabajando en la nube; por ello, antes de iniciar el trabajo con archivos, debes montar el Drive (de Google) en el cual estás trabajando.<br>
Para hacer eso usaremos el siguiente snippet de cógigo:

``` Python
from google.colab import drive
drive.mount('/content/drive')
```

El montar el Drive te permitirá en el futuro acceder a datos almacenados en la nube.

Veamos como hacer esto en el siguiente video.

### [Cómo montar mi Drive en Colab](https://youtu.be/hZFQ9tjXmVw)

In [None]:
from google.colab import drive
drive.mount('/content/drive')

In [30]:
ruta = '/content/drive/MyDrive/ICIIT/Cursos/202301/Taller de Programación/202301-Sección2/11 Lectura de Archivos/archivos/'

myfile = open(ruta + 'archivo_1.txt')

Cuando abrimos un archivo, creamos un nuevo objeto al cual le asignamos un puntero. En este caso, el objeto se llama *myfile* <br>
El puntero nos dirá en que parte del archivo estamos posicionados y al abrir el archivo quedará posicionado por defecto al inicio.<br>
Veamos el tipo de objeto:

In [31]:
type(myfile)

_io.TextIOWrapper

## <font color='blue'>Métodos asociados a nuestro nuevo objeto</font>
Ahora podemos llamar a varios métodos de lectura de este archivo de texto:

`read()` devuelve todo el contenido como una cadena:

In [32]:
myfile.read()

'Primera linea\nSegunda linea\nTercera linea\nCuarta linea\n'

Si ejecutas la sentencia anterior nuevamente, obtendrás un string vacío (''):

In [33]:
myfile.read()

''

Eso es porque el "cursor" está al final del archivo. Puedes restablecer el cursor al inicio usando el método `seek()`:

In [34]:
myfile.seek(2)

2

In [35]:
myfile.seek(4)

4

In [36]:
myfile.read()

'era linea\nSegunda linea\nTercera linea\nCuarta linea\n'

## <font color='green'>Actividad 1:</font> 
Qué pasa si usas `seek()` con el cursor en diferentes posiciones?<br>
Pon el cursor en las siguientes posiciones 10, 45 y 88.<br>
Analiza el resultado de cada una de ellas.
* Todas devolvieron resultados?
* Si alguna no lo hizo, por qué ocurrió eso?
* `seek()` cuenta los caracteres de escape incluidos (\n)?

Tip: 
1. Usa el método `seek(numero_posicion)`
2. Luego verifica con `myfile.read()`

In [None]:
# Tu código aquí ...



<font color='green'>Fin actividad 1</font>

## El método `readlines()`

Debido a que muchos archivos a menudo tienen **saltos de línea (\ n)**, a menudo la gente quiere usarlos como separadores y leer todo el archivo de texto como una lista, donde cada elemento de la lista es una cadena que representa una línea en el archivo de texto .

In [37]:
myfile.seek(0)

0

In [38]:
myfile.readlines()

['Primera linea\n', 'Segunda linea\n', 'Tercera linea\n', 'Cuarta linea\n']

In [39]:
len(myfile.readlines())

0

## <font color='green'>Actividad 2:</font> 
¿Qué tipo de objeto devuelve el método `readlines()`?
Determina el tipo de objeto que devuelve el método `readline()`

Tip:
1. Utiliza la función `type()` sobre `myfile.readlines()`

In [None]:
# Tu código aquí ...



<font color='green'>Fin actividad 2</font>

## <font color='blue'>**Ubicaciones de archivos cuando trabajas en modo local**</font>

Si estás trabajando con una versión de Python instalada en tu computador, puedes acceder a los archivos ubicados en tu disco duro. Si el archivo a abrir está en la misma carpeta del notebook, utiliza la siguiente instrucción:
``` python
      my_file = open ('nombre_archivo.extensión')  # No se incluye la ruta de acceso
```


Por el contrario, si deseas abrir archivos en otra ubicación de su computadora, simplemente ingresa la ruta completa o absoluta del archivo.

Para Windows, debe usar doble \\ (backslash) para que Python no trate el segundo \ como un carácter de escape, una ruta de archivo tiene la forma:
```python
     myfile = open ("C:\\Users\\YourUserName\\Home\\Folder\\myfile.txt")
```    

```python
     myfile = open (".\\myfile.txt")
``` 
Para MacOS y Linux, usa barras en la dirección opuesta (slash):
```python
     myfile = open ("/Usuarios/NombreDeUsuario/Carpeta/myfile.txt")
```    
Este fue un ejemplo, intenta abrir y leer el archivo usando *tu propia ruta*

## <font color='green'>Actividad 3:</font> 
### <font color='red'>Atención: realiza esta activiidad sólo si estás trabajando en modo local</font>
Abre el archivo text_file.txt usando tu propia ruta absoluta

Tip:
1. Busca tu ruta usando el Explorador de Windows o el Finder del Mac.
2. Abre el archivo de esta manera:
``` python
      myfile = open ("C:\\tu_ruta_va_aqui\\myfile.txt")
```
3. Recuerda separar las carpetas en su ruta con barras invertidas dobles ( \\\ ) en Windows o una barra simple ( / ) en Mac y Linux.

In [None]:
# Tu código aquí ...


<font color='green'>Fin actividad 3</font>

## <font color='blue'>**No te olvides de cerrar la puerta al salir**</font>

Como con el libro, cuando terminas de usarlo (leerlo) ... lo cierras.

En Python *siempre* cerramos los archivos que abrimos. Para hacer eso usamos el método `close()` de esta manera:

```Python
    myfile.close()
```

## <font color='green'>Actividad 4:</font> 
### Cierra el archivo

Tip:
1. Cierra el archivo abierto de esta forma:
```Python
    myfile.close()
```

In [None]:
# Tu código aquí ...

myfile.close()

<font color='green'>Fin actividad 4</font>

## Veamos un ejemplo completo

La secuencia completa sería la siguiente. Ajusta la ruta de acceso en la siguiente celda y ejecútala.

In [40]:
# Completa el código con la ruta de acceso correcta
myfile = open('/content/drive/MyDrive/ICIIT/Cursos/202301/Taller de Programación/202301-Sección2/11 Lectura de Archivos/archivos/archivo_1.txt')
lines = myfile.read()
print(lines)
myfile.close()

Primera linea
Segunda linea
Tercera linea
Cuarta linea



## <font color='blue'>**Best Practice ... la forma Paythonista !!**</font>
Es una buena práctica usar la declaración `with ...` para abrir archivos, esto te permite no preocuparte por tener que cerrar el archivo después de abrirlo. Aquí está la sintaxis:

<font color='red'>Atención: Recuerda corregir la ruta</font>

In [43]:
with open(ruta + 'archivo_1.txt') as myfile:
    # Fíjate en la indentación!
    # Veremos este tema de la indentación en profundidad más adelante
    lines = myfile.read()
    
    
# El archivo se cierra automáticamente después de la cláusula with ...
# el contenido quedo guardado en el string 'lines'

In [44]:
type(lines)

str

In [45]:
lines

'Primera linea\nSegunda linea\nTercera linea\nCuarta linea\n'

In [46]:
print(lines)

Primera linea
Segunda linea
Tercera linea
Cuarta linea



## <font color='blue'>**Opciones de lectura y escritura**</font>
La función `open()` tiene un segundo parámetro que le permite especificar si sólo desea poder leer el archivo, escribir en él o hacer ambas cosas.<br>
A continuación, se muestra una tabla con algunas de las opciones más importantes:

| Modos | Descripción |
|:----------------:|:--------|
|  r            | Abre un archivo solo para lectura.<br>El puntero de archivo se coloca al principio del archivo. Este es el modo por defecto |
| r+            | Abre un archivo para leer y escribir.<br>El puntero de archivo colocado al principio del archivo. |
|  w            | Abre un archivo solo para escritura. <br>Sobrescribe el archivo si existe. Si el archivo no existe, crea un nuevo archivo para escribir. |
|  w+          | Abre un archivo para escribir y leer.<br>Sobrescribe el archivo existente si el archivo existe. Si el archivo no existe, crea un nuevo archivo para leer y escribir. |
|  a      | Abre un archivo para agregar. <br>El puntero de archivo está al final del archivo si el archivo existe, es decir, el archivo está en modo adjuntar. <br>Si el archivo no existe, crea un nuevo archivo para escribir. |
|  ab       | Abre un archivo para agregar en formato binario.<br> El puntero de archivo está al final del archivo si el archivo existe, es decir, el archivo está en modo adjuntar. <br>Si el archivo no existe, crea un nuevo archivo para escribir |
|  a+          | Abre un archivo para agregarlo y leerlo. <br>El puntero de archivo está al final del archivo si el archivo existe. <br>El archivo se abre en el modo anexar. <br>Si el archivo no existe, crea un nuevo archivo para lectura y escritura. |




Siempre se muy consciente del directorio en el cual estás trabajando. Las siguientes líneas de código te dirán dónde estás actualmente.<br>
Por ahora no te preocupes sobre qué es `import os`; eso ya lo veremos más adelante.

In [47]:
import os
os.getcwd() # get current working directory


'/content'

In [52]:
# Probablemente second_file.txt no está en dicho directorio, 
# así es que recuerda corregir la ruta
f = open(ruta + 'archivo_2.txt')
f.read()

''

### Intentemos escribir en el archivo

In [51]:
# Este código te dará error ....

f = open(ruta + 'archivo_2.txt', 'w')
f.write("new line")

8

Por defecto, la función `open()` abre los archivos en modo lectura solamente. Luego, necesitamos decirle que queremos escribir en el archivo. <br>

## <font color='blue'>**Escribiendo archivos**</font>
Tal como vimos más arriba, utilizaremos el modo `w` para escribir en un archivo; sin ambargo, como éste no existe, primero lo creará y luego escribirá sobre él.

In [53]:
f = open(ruta + 'archivo_3.txt','w')

# La función 'write' además de escribir, retorna el número de caracteres escritos
f.write('Pedro Perez Pereita pobre pintor portugues\n')

43

In [54]:
f.close()

In [55]:
f = open(ruta + 'archivo_3.txt')
f.read()

'Pedro Perez Pereita pobre pintor portugues\n'

In [56]:
# Escribamos algo adicional
# Abriremos el archivo en modo escritura y lectura (w+)
f = open('/content/drive/MyDrive/ICIIT/Cursos/202301/Taller de Programación/202301-Sección2/11 Lectura de Archivos/archivos/archivo_3.txt','w+')  
# y escribimos en él
f.write('Esta es una linea adicional\n')

# Veamos que hay en el archivo hasta ahora
f.seek(0)
f.read()

'Esta es una linea adicional\n'

Observa cómo se ha sobrescrito el contenido previo (*'Creamos un nuevo archivo con una linea\n'*) !!<br> 
Si deseas agregar al archivo, debes usar el modo **`a+`** para escribir en él y luego poder leerlo.

In [57]:
f = open(
    '/content/drive/MyDrive/ICIIT/Cursos/202301/Taller de Programación/202301-Sección2/11 Lectura de Archivos/archivos/archivo_3.txt',
    'a+'
    )
f.write("Esta es una segunda línea adicional\n")
f.seek(0)
print(f.read())
f.close()

Esta es una linea adicional
Esta es una segunda línea adicional



## <font color='green'>Actividad 5:</font> 
Añade dos nuevas líneas al archivo *archivo_3.txt* recién creado.<br>
Verifica los contenidos.

Tip:
1. Necesitas abrir el archivo en modo `a+`
```python
     file_to_add = open('.../archivo_3.txt','a+')
```
2. Escribe dos líneas
```python
     file_to_add.write('New line')
```
3. Lee el archivo usando `read()`
4. Cierra el archivo usando `close()`

In [None]:
# Tu código aquí ...



<font color='green'>Fin actividad 5</font>

## <font color='green'>Actividad 6:</font> 
Haz lo mismo anterior pero utilizando la sentencia `with`. <br>
Verifica los contenidos.

Esta es la forma *pythonista* de abrir archivos!!

Tip:
1. Necesitarás usar la sentencia `with open ... ` 
```python
    with open('.../archivo_3.txt') as archivo:
```
2. Añade la siguiente línea
```python
    archivo.write('Esta vez abrimos el archivo como verdadero pythonista y agregamos una línea\n')
```
3. Lee el archivo utilizando `read()`

In [None]:
# Tu código aquí ...

       

<font color='green'>Fin actividad 6</font>

## <font color='blue'>Borrando archivos</font>
También podemos borrar los archivos que generamos. Para ello utilizamos la función `remove()`. No te preocupes por ahora de las instrucciónes `from ... import ...`; las veremos más adelante.

In [58]:
from os import remove
from os import path
# Verificamos que la ruta y el archivo existan
if path.exists("/content/drive/MyDrive/ICIIT/Cursos/202301/Taller de Programación/202301-Sección2/11 Lectura de Archivos/archivos/archivo_3.txt"):
 
    remove('/content/drive/MyDrive/ICIIT/Cursos/202301/Taller de Programación/202301-Sección2/11 Lectura de Archivos/archivos/archivo_3.txt')

Buen trabajo espías!!