INPUT OUTPUT DATA

Si alguna vez has utilizado una computadora, deberías saber qué son los archivos. Básicamente, los archivos son fragmentos de información o datos que guardamos para almacenarlos a largo plazo y reutilizarlos más tarde. Independientemente del tipo de archivo, en el fondo, todos los archivos están codificados en bits. La estructura de codificación depende del tipo de archivo. Para representar los distintos tipos de archivos, utilizamos extensiones de nombres de archivo, ya sea .txt, .py, .jpeg o cualquier otra.

A menudo necesitamos que nuestros programas Python lean datos de archivos externos, editen archivos existentes o creen archivos nuevos. Ya hemos leído muchos archivos con la función read_csv() de Pandas. En esta lección, aprenderemos cómo se pueden abrir archivos y trabajar con ellos (entrada y salida de archivos, o E/S de archivos para abreviar) en Python de una manera más general.

Nuestros ejemplos en esta lección se centrarán en archivos de texto, ya que son ampliamente utilizados para almacenar y transferir datos.

Leer desde archivos

Python tiene una función incorporada open() que puede abrir cualquier archivo. Todo lo que necesitamos hacer es pasar la ruta hacia el archivo a la función. Por defecto, los archivos se abren en modo “lectura”, lo que significa que podemos obtener información de los mismos, pero no podemos editarlos.

In [2]:
f =open('my_file.txt', mode='r')

Así es como se ve el contenido de my_file.txt:

"No entres dócilmente en esa buena noche"
[12, 13, 14]
100.42
Alice

pero esto es lo que obtendremos al imprimir f:

In [3]:
f = open('my_file.txt')
print(f)
f.close()

<_io.TextIOWrapper name='my_file.txt' mode='r' encoding='utf-8'>


La salida actual puede no ser la esperada, lo cual se debe a que la variable f, que representa el archivo abierto, es un objeto que requiere código adicional para leer su contenido. Por sí solo no puede hacer mucho, por lo tanto, necesitamos escribir código adicional para leer el contenido del archivo.

Al abrir un archivo se crea un objeto de tipo file:

In [4]:
f = open('my_file.txt')
print(type(f))
f.close()

<class '_io.TextIOWrapper'>


Ten en cuenta que también usamos el método close() para cerrar el archivo después de que hayamos terminado con él. Cerrar archivos cuando ya no se necesitan es una buena costumbre, de lo contrario ocupan memoria y pueden provocar problemas imprevistos.

Ahora vamos a leer nuestro archivo y mostrar su contenido. Una forma de hacerlo es recorrer cada línea del archivo e imprimir cada una de ellas:

In [5]:
f = open('my_file.txt')

for line in f:
    print(line)

f.close()

"No entres dócilmente en esa buena noche"

[12, 13, 14]

100.42

Alice


Imprimimos todo el contenido, pero había líneas en blanco extra que no estaban en el archivo original. Esto se debe a que el final de cada línea en my_file.txt termina con el carácter de nueva línea \\n y, por defecto, print() termina cada salida con un carácter de nueva línea también. Podemos arreglar esto usando en cada línea el método rstrip(), que elimina todos los espacios en blanco al final de una cadena:

In [6]:
f = open('my_file.txt')

for line in f:
    print(line.rstrip())

f.close()

"No entres dócilmente en esa buena noche"
[12, 13, 14]
100.42
Alice


El método anterior funciona, pero también podemos utilizar los métodos read() o readlines() para conseguir el mismo objetivo. El método read() lee todo el archivo como una sola cadena, mientras que el método readlines() crea una lista de cadenas, donde cada elemento de la lista es una línea del archivo:

In [7]:
f = open('my_file.txt')
print(f.read())

f.close()

"No entres dócilmente en esa buena noche"
[12, 13, 14]
100.42
Alice
