[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/algoritmos-poli/sesiones_presenciales/blob/main/clase8/python-ReadFile.ipynb)

# Lectura de archivos en Python

Este notebook le enseñará sobre la lectura de archivos de texto en el Lenguaje de Programación Python. Al finalizar este laboratorio, usted sabrán cómo leer archivos de texto.

> **Importante** <br>
> Este notebook es una adaptación al español del notebook original [PY0101EN-4-1-ReadFile.ipynb](./ref-notebooks/PY0101EN-4-1-ReadFile.ipynb)

## Tabla de Contenidos

* [Descargue el archivo](#descargue-el-archivo)
* [Lectura de archivos de texto](#lectura-de-archivos-de-texto)
* [Una mejor forma de abrir un archivo](#una-mejor-forma-de-abrir-un-archivo)

## Descargue el archivo

Para empezar cree an archivo de texto llamado [`Example1.txt`](./data/Example1.txt) un directorio llamado `data` en el mismo directorio donde se encuentre este notebook.

<hr>

## Lectura de archivos de texto

Una forma de leer o escribir un archivo en Python es utilizar la función `open`. La función `open` proporciona un objeto de tipo Archivo (**`File` object**) que contiene los métodos y atributos necesarios para leer, guardar y manipular el archivo. En este notebook, únicamente cubriremos archivos **.txt**. El primer parámetro que se necesita es la ruta y el nombre del archivo. A continuación, se muestra un ejemplo:

<img src="./images/file_read/ReadOpen.png" width="500" />

El argumento de modo (`mode`) es opcional y su valor por defecto es `r`. En este notebook únicamente cubriremos dos modos:
* **`r`**: Modo de lectura (Read mode) para leer archivos.
* **`w`**: Modo de escritura (Write mode) para escribir archivos.

Para el siguiente ejemplo, utilizaremos el archivo de texto **Example1.txt**. El contenido del archivo se muestra a continuación:

<img src="./images/file_read/ReadFile.png" width="200" />

 We read the file: 

In [2]:
# Read the Example1.txt

path = "./data/"
filename1 = "Example1.txt"
example1 = path + filename1
file1 = open(example1, "r")

Se pueden visualizar los atributos del archivo.

El nombre del archivo:

In [3]:
# Print the path of file

file1.name

'./data/Example1.txt'

El modo en que se encuentra el objeto de archivo (`File object`):

In [4]:
# Print the mode of file, either 'r' or 'w'

file1.mode

'r'

Se puede leer el archivo y asignarlo a una variable:

In [5]:
# Read the file

FileContent = file1.read()
FileContent

'This is line 1 \nThis is line 2\nThis is line 3'

La secuencia de escape `\n` significa que hay una nueva línea.

Se puede imprimir el contenido del archivo:

In [6]:
# Print the file with '\n' as a new line

print(FileContent)

This is line 1 
This is line 2
This is line 3


El contenido del archivo es de tipo cadena (`string`):

In [8]:
# Type of file content

type(FileContent)

str

Se debe cerrar el objeto de archivo:

In [9]:
# Close file after finish

file1.close()

<hr>

## Una Mejor Forma de Abrir un Archivo

Utilizar la declaración `with` se considera una mejor práctica, ya que cierra automáticamente el archivo incluso si el código encuentra una excepción. El código ejecutará todo lo que se encuentre en el bloque indentado y luego cerrará el objeto de archivo.

In [10]:
# Open file using with

with open(example1, "r") as file1:
    FileContent = file1.read()
    print(FileContent)

This is line 1 
This is line 2
This is line 3


El objeto de archivo está cerrado, lo cual se puede verificar ejecutando la siguiente celda:

In [11]:
# Verify if the file is closed

file1.closed

True

Se puede visualizar la información contenida en el archivo:

In [12]:
# See the content of file

print(FileContent)

This is line 1 
This is line 2
This is line 3


La sintaxis es un poco confusa, ya que el objeto de archivo se encuentra después de la declaración `as`. Además, no cerramos el archivo de forma explícita. Por lo tanto, los pasos se resumen en la siguiente figura:

<img src="./images/file_read/ReadWith.png" width="500" />

No es necesario leer el archivo completo; por ejemplo, se pueden leer los primeros 4 caracteres pasando el número 4 como parámetro al método `.read()`:

In [13]:
# Read first four characters

with open(example1, "r") as file1:
    print(file1.read(4))

This


Once the method <code>.read(4)</code> is called the first 4 characters are called. If we call the method again, the next 4 characters are called. The output for the following cell will demonstrate the process for different inputs to the method <code>read()</code>:

Una vez que se llama al método `.read(4)`, se leen los primeros 4 caracteres. Si se llama al método nuevamente, se leerán los siguientes 4 caracteres. La salida de la siguiente celda demostrará el proceso para diferentes valores de entrada en el método `read()`:

In [14]:
# Read certain amount of characters

with open(example1, "r") as file1:
    print(file1.read(4))
    print(file1.read(4))
    print(file1.read(7))
    print(file1.read(15))

This
 is 
line 1 

This is line 2


El proceso se ilustra en la siguiente figura, donde cada color representa la porción del archivo leída después de cada llamada al método `read()`:

<img src="./images/file_read/ReadChar.png" width="500" />

A continuación, se presenta un ejemplo utilizando el mismo archivo, pero en su lugar, leemos 16, 5 y luego 9 caracteres en cada llamada:

In [15]:
# Read certain amount of characters

with open(example1, "r") as file1:
    print(file1.read(16))
    print(file1.read(5))
    print(file1.read(9))

This is line 1 

This 
is line 2


También se puede leer una línea del archivo a la vez utilizando el método `readline()`:

In [16]:
# Read one line

with open(example1, "r") as file1:
    print("first line: " + file1.readline())

first line: This is line 1 



Se puede utilizar un bucle para iterar sobre cada línea:

In [17]:
# Iterate through the lines

with open(example1,"r") as file1:
        i = 0;
        for line in file1:
            print("Iteration", str(i), ": ", line)
            i = i + 1;

Iteration 0 :  This is line 1 

Iteration 1 :  This is line 2

Iteration 2 :  This is line 3


Se puede utilizar el método `readlines()` para guardar el archivo de texto en una lista:

In [18]:
# Read all lines and save as a list

with open(example1, "r") as file1:
    FileasList = file1.readlines()

Cada elemento de la lista corresponde a una línea de texto:

In [19]:
# Print the first line

FileasList[0]

'This is line 1 \n'

In [20]:
# Print the second line

FileasList[1]

'This is line 2\n'

In [20]:
# Print the third line

FileasList[2]

'This is line 3'