[![pythonista.io](imagenes/pythonista.png)](https://www.pythonista.io)

# Lectura y escritura de archivos.

Python tiene la capacidad de acceder y realizar operaciones de lectura/escritura sobre los documentos localizados en un sistema de archivos si el usuario cuenta con los permisos correspondientes.

## Flujos de datos en sistemas basados en *UNIX*.

Ls sistemas *UNIX*, *MacOS X* y *GNU/Linux* se basan en la premisa de que todo es un archivo un directorio, por lo que es común acceder a flujos de datos (streams) de dispositivos y/o procesos como si se accediera a un archivo binario. Este tipo de accesos están fuera del alcance de este curso introductorio.

## Tamaño y posición de los archivos.

Los archivos contienen una sucesión lineal de bytes o de caracteres.

La posición de cada byte o caracter corresponde a un número entero positivo iniciando a partir de ```0```.


## Apertura de un archivo con la función ```open()```.

La función ```open()``` tiene por objeto interactuar con el sistema de archivos local para crear, escribir, leer o desplazarse dentro de un archivo ya sea de texto o binario. 

```
open(<ruta>, <modo>)
```

Donde:

* ```<ruta>``` es un objeto de tipo ```str``` que indica la ruta en la que se encuentra el archivo.
* ```<modo>``` es un objeto de tipo ```str``` que indica la forma en la que Python accederá al archivo en cuestión.

**Nota:**

En el caso de Windows, las rutas utlizan la diagonal invertida ```\```. Debido a que la diagonal invertida es un caracter de escape de Python, es necesario agregar dos diagonales invertidas ```\\```.

### Modos de acceso a un archivo.

#### Por el tipo de acceso.

* El caracter ```'r'``` indica que se accederá a un archivo exclusivamente para su lectura y el apuntador se localizará en la posición ```0``` de dicho archivo. En caso de que el archivo no exista se desencadenará un error de tipo ```FileNotFoundError```.
* El caracter ```'w'``` indica que se creará un archivo nuevo para escritura. En caso de que ya exista ese archivo éste será reemplazado.
* El caracter ```'x'``` indica que se creará un archivo nuevo para escritura. En caso de que el archivo exista se emitirá un error de tipo ```FileExistsError```. 
* El caracter ```'a'``` indica que se accederá a un archivo para escritura. En caso de existir un archivo el puntero se localizará al final de éste. En caso de no existir, creará al archivo.
* Los caracteres ```'r+'``` indican que se accederá a un archivo para realizar operaciones de de escritura y lectura. En caso de que el archivo no exista se desencadenará un error de tipo ```FileNotFoundError```.

#### Por el tipo de archivo.

Los archivos de texto y los archivos binarios representan dos tipos de objeto distintos en Python.

* El caracter ```'t'``` indica que se trata de un archivo de texto. Este es el tipo de archivo que se usa por defecto.
* El caracter ```'b'``` indica que se trata de un archivo binario. Se creará un objeto específico dependiendo del tipo de acceso.



**Ejemplos:**

* ```'bw'``` indica que se creará o sobreescribirá un archivo binario y se accederá en modo de escritura.

* ```'a'``` indica que se accederá a un archivo de texto en modo escritura. Si el archivo existe, el puntero se posicionará al final de dicho archivo. Si el archivo no existe, este será creado.

* ```'br+'``` indica que se accederá a un archivo binario en modo escritura/lectura, situándose en la posición ```0``` del archivo.

* ```'tr'``` indica que se accederá a un archivo de texto existente en modo de lectura, situándose en la posición ```0``` del archivo.

### Tipos de objetos creados por ```open()```.

La función ```open()``` puede crear objetos que permiten relizar las operaciones de lectura y escritura de archivos.

La siguiente tabla describe los tipos de objetos que se crearán depenediendo del tipo de archivo y del tipo de acceso del que se trate.

|Tipo de accesso|Texto|Binario|
|:----------------:|:-------:|:---------:|
|Lectura|```_io.TextIOWrapper```|```_io.BufferedReader``` 
|Escritura|```_io.TextIOWrapper```|```_io.BufferedWriter```
|Escritura/Lectura|```_io.TextIOWrapper```|```_io.BufferedRandom```

## Atributos y métodos más utilizados para gestión de archivos comunes para archivos binarios y de texto.

### El atributo ```mode```.

Este atributo regresa un objeto de tipo ```str``` describiendo el modo de acceso al archivo.

```
<objeto de archivo>.mode
```

### El atributo ```name```.

Este atributo regresa un objeto de tipo ```str``` con la ruta del archivo.

```
<objeto de archivo>.name
```

### El método ```close()```.

Es imperativo que una vez que se hayan realizado todas las operaciones de entrada y de salida de archivos, este sea cerrado de manera adecuada. En caso de no hacerlo, es altamente probable que el archivo se encuentre en un estado inestable y se corra el riesgo de que la información contenida se corrompa o destruya.

```
<objeto de archivo>.close()
```

### El atributo ```closed```.

Este atributo regresará un objeto de tipo ```bool```.

* Regresará ```True``` indica que la conexión con el archivo está cerrada.
* Regresará ```False``` indica que la conexión con el archivo está abierta.

### El método ```writable()```.

Este método valida si el archivo está habilitado para escritura, regresando un objeto de tipo ```bool```. 

* Regresará ```True``` si el archivo está en modo de escritura.
* Regresará ```False``` si el archivo está exclusivamente en modo de lectura.

```
<objeto de archivo>.writable()
```

### El método ```readable()```.

Este método valida si el archivo está habilitado para escritura, regresando un objeto de tipo ```bool```. 

* Regresará ```True``` si el archivo está en modo de lectura.
* Regresará ```False``` si el archivo está exclusivamente en modo de lectura.

```
<objeto de archivo>.readable()
```

### El método ```seekable()```.

Este método valida si es posible trasladarse a lo largo del archivo. Devolverá ```True``` si es posible desplazarse dentro del archivo.

```
<objeto de archivo>.seekable()
```

### El método ```tell()```.

Regresará la posición en la que se encuentra el puntero dentro del archivo.

```
<objeto de archivo>.tell()
```

### El método ```seek()```.

Moverá el puntero a la posición indicada.

```
<objeto de archivo>.seek(<n>)
```

Donde:  

* ```<n>``` es el índice dentro de un archivo en el que se posicionará el apuntador.

### El método ```read()```.

En caso de que el archivo se encuentre en modo de lectura, este método leerá y regresará el contenido de un archivo en caso de que el archivo se encuentre en modo de lectura.

* Si se ingresa un número entero como argumento:
    * Leerá el número de posiciones indicadas en el argumento a partir de la posición en la que se encuentre.
    * Desplazará el puntero hasta la posición inicada.
    * Regresará el contenido leido.

* Si no se ingresa un argumento:
    * Leerá el archivo completo a partir de la posición en la que se encuentre.
    * Desplazará el puntero hasta el final del archivo.
    * Regresará el contenido leido.

```
<objeto de archivo>.read(<n>)
```

Donde:  

* ```<n>``` es el número de posiciones que leerá el método.

### El método```readline()```.

En caso de que el archivo se encuentre en modo de lectura, este método leerá y regresará el contenido que va desde la posición en la que se encuentra el puntero hasta encontrar un retorno de línea ```'\n'```. Cuando el puntero se encuentre al final del archivo (```EOF```), regresará un objeto de tipo ```str``` o ```bytes``` vacío.

```
<objeto de archivo>.readline()
```

### El método ```readlines()```.

En caso de que el archivo se encuentre en modo de lectura, este método leerá el contenido que va desde la posición en la que se encuentra el puntero hasta el final del archivo y regresará un objeto de tipo ```tuple``` en el que cada elemento corresponde a un objeto de tipo ```str``` o ```bytes``` conteniendo una línea del archivo.

```
<objeto de archivo>.readlines()
```

### El método ```write()```.

Este método escribirá en el archivo en caso de que el archivo se encuentre en modo de escritura. 

```
<objeto de archivo>.write(<contenido>)
```

* El contenido ingresado como argumento se escribirá partir de la posición en la que se encuentre el puntero.
* El contenido ingresado como argumento sobreescribirá al texto existente. 
* Una vez terminada la operación, regresará la nueva posición del puntero.



### El método ```writelines()```.

En caso de que el archivo se encuentre en modo de escritura, este método escribirá desde la posición en la que se encuentre el puntero cada elemento de una colección uno después de otro.

```
<objeto de archivo>.writelines(<colección>)
```

Donde:

* ```<colección>``` es una colección que contiene objetos de tipo ```str``` o ```bytes```.

**Nota:** Este método no añade saltos de línea ```"\n"```.

**Ejemplos:**

* La siguiente celda creará al archivo binario ```prueba.bin``` en el directorio en el que se encuentra esta notebook y lo abrirá en modo de escritura y el objeto resultante será nombrado ```mi_archivo```. 

In [None]:
mi_archivo = open("prueba.bin", "wb")

* La siguiente celda regresará el tipo de objeto al que pertenece el objeto ```mi_archivo```. El resultado es ```_io.BufferedWriter```.

In [None]:
type(mi_archivo)

* La siguiente celda desplegará la posición en la que se encuentra el apuntador. Debido a que el archivo apenas fue creado, regresará  ```0```.

In [None]:
mi_archivo.tell()

* Se escribirá en el archivo la cadena de bytes ```b'Hola, mundo.'```. Una vez realizada la operación, el método ```mi_archivo.write()``` regresará la nueva posición del puntero, la cual será ```12```.

In [None]:
mi_archivo.write(b'Hola, mundo.')

* La siguiente celda validará si es posible mover el apuntador a lo largo del archivo relacionado al objeto ```mi_archivo```. El resultado será ```True```.

In [None]:
mi_archivo.seekable()

* La siguiete celda regresará la posición actual de puntero en el archivo relacionado al objeto ```mi_archivo```. El resultado será ```12```. 

In [None]:
mi_archivo.tell()

* La siguiente celda regresará un objeto de tipo ```str``` indicando el modo de acceso usado. El resultado será ```'wb'```

In [None]:
mi_archivo.mode

* La siguiente celda regresará un objeto de tipo ```str``` contendiendo la ruta del archivo. El resultado será ```'prueba.bin'```

In [None]:
mi_archivo.name

* La siguiente celda cerrará la conexión entre el archivo ```prueba.bin``` y el objeto ```mi_archivo```.

In [None]:
mi_archivo.close()

* La siguiente celda verfificará si el archivo ligado a ```mi_archivo``` está abierto. El resutado será ```True```.

In [None]:
mi_archivo.closed

* Las siguientes celdas incluyen comandos del sistema operativo que desplegarán el contenido del archivo ```prueba.bin```.

* Para plataformas basadas en UNIX.

In [None]:
!cat prueba.bin

* Para plataformas Windows.

In [None]:
!type prueba.bin

* La siguiente celda abrirá al archivo ```prueba.bin``` en modo de lectura y crerá al objeto ```lee_archivo```.

In [None]:
lee_archivo = open("prueba.bin", "br")

* La siguiente celda regresará el tipo de objeto al que pertenece el objeto ```lee_archivo```. El resultado es ```_io.BufferedReader```.

In [None]:
type(lee_archivo)

* La siguiente celda regresará la posición del puntero. El resultado es ```0```.

In [None]:
lee_archivo.tell()

* La siguiente celda moverá el puntero a la posición ```5```.

In [None]:
lee_archivo.seek(5)

* La siguiente celda regresará el contenido desde la posición ```5``` hasta el final del archivo . El resultado es ```b' mundo.'```.

In [None]:
lee_archivo.read()

* La siguiente celda moverá el puntero a la posición ```0```.

In [None]:
lee_archivo.seek(0)

* La siguiente celda regresará 4 bytes del archivo desde la posición ```0```. El resultado es ```b'Hola'```.

In [None]:
lee_archivo.read(4)

* La siguiente celda cerrará la conexión entre el archivo ```prueba.bin``` y el objeto ```lee_archivo```.

In [None]:
lee_archivo.close()

## La declaración ```with ```.

La declaración ```with``` se utiliza con objetos que contienen un método ```close()```, permitiendo ejecutar el bloque de código que contiene, y que una vez ejecutado, ejecutrá el método ```close()``` del objeto.

```
with open (<ruta>, <modo>) as <nombre>:
    ...
    ...
```

Donde:

* ```<ruta>``` es un objeto de tipo ```str``` que indica la ruta en la que se encuentra el archivo.
* ```<modo>``` es un objeto de tipo ```str``` que indica la forma en la que Python accederá al archivo dado.
* ```<nombre>``` es el nombre que se le asignará al objeto generado por ```open()```.

**Ejemplos:**

* La siguiente celda realizará las siguientes acciones: 
    * Creará un  nuevo archivo de texto con el nombre ```prueba.txt```.
    * Al objeto generado por ```open()``` se le asignará el nombre ```archivo```.
    * Se escribirán 3 líneas usando el método ```archivo.writelines()``` ingresando ```["Hola.\n", "Bienvenido al curso de Python.\n", "Esperamos que sea una agradable experiencia.\n"] ``` como argumento.
    * Se desplegará la posición del puntero del archivo, correspondiente a ```85```.
    * Se desplegará el tipo de dato que es el objeto ```archivo```, correspondiente a ```<class '_io.TextIOWrapper'>```.
 * Se cerrará el archivo.

In [None]:
with open("prueba.txt", "w") as archivo:
    archivo.writelines(["Hola.\n",
                        "Bienvenido al curso de Python.\n", 
                        "Esperamos que sea una agradable experiencia.\n"])
    print(archivo.tell())
    print(type(archivo))

* Las siguientes celdas incluyen comandos del sistema operativo que desplegarán el contenido del archivo ```prueba.txt```.

* Para plataformas basadas en UNIX.

In [None]:
!cat prueba.txt

* Para la plataforma Windows.

In [None]:
!type prueba.txt

* La siguiente celda realizará las siguientes acciones: 
    * Creará un  nuevo archivo de texto con el nombre ```prueba.txt``` en modo de lectura.
    * Al objeto generado por ```open()``` se le asignará el nombre ```archivo```.
    * Se leerá y desplegará la primera línea de texto, la cual corresponde a ```Hola```.
    * Se leerán las siguientes líneas del documento y desplegará ```['Bienvenido al curso de Python.\n', 'Esperamos que sea una agradable experiencia.\n']```.
    * Se cerrará el archivo.

In [None]:
with open("prueba.txt", "r") as archivo:
    print(archivo.readline())
    print(archivo.readlines())

* La siguiente celda realizará las siguientes acciones: 
    * Creará un  nuevo archivo de texto con el nombre ```prueba.txt``` en modo de lectura.
    * Al objeto generado por ```open()``` se le asignará el nombre ```archivo```.
    * Se localizará el puntero en la posición ```12``` del archivo.
    * Se leerán todas líneas a partir de dicha posición.
    * Se desplegará cada línea.
    * Se cerrará el archivo.

In [None]:
with open("prueba.txt", "r") as archivo:
    archivo.seek(12)
    print(archivo.readlines())
    archivo.seek(0)
    for linea in archivo.readlines():
        print(linea)

* La siguiente celda realizará las siguientes acciones: 
    * Creará un  nuevo archivo de texto con el nombre ```prueba.txt``` en modo de inserción.
    * Al objeto generado por ```open()``` se le asignará el nombre ```archivo```.
    * Se desplegará la posición del puntero, correspondiente a ```85```.
    * Se añadirán 2 líneas de texto ingresando ```("\nNueva linea.\nAqui \ty alla."``` como argumento del método ```archivo.write()```.
    * Se desplegará la nueva posición del puntero, correspondiente a ```114```.
    * Se cerrará el archivo.

In [None]:
with open("prueba.txt", "a") as archivo:
    print(archivo.tell())
    archivo.write("\nNueva linea.\nAqui \ty alla.")
    print(archivo.tell())

* Las siguientes celdas incluyen comandos del sistema operativo que desplegarán el contenido del archivo ```prueba.txt```.

* Para plataformas basadas en UNIX.

In [None]:
!cat prueba.txt

* Para plataformas Windows.

In [None]:
!type prueba.txt

* La siguiente celda realizará las siguientes acciones: 
    * Creará un  nuevo archivo de texto con el nombre ```prueba.txt``` en modo de escritura/lectura.
    * Al objeto generado por ```open()``` se le asignará el nombre ```archivo```.
    * Se sobreescribirá el texto inicial ingresando ```"HOLA"``` como argumento del método ```archivo.write()```.
    * Se posicionará al puntero al inicio del archivo.
    * Se desplegará todo texto.
    * Se cerrará el archivo.

In [None]:
with open("prueba.txt", "r+") as archivo:
    archivo.write("HOLA")
    archivo.seek(0)
    print(archivo.read())

## Iteraciones con archivos de texto.

Cuando se utiliza un objeto de tipo archivo de texto en modo de lectura dentro de una estructura ```for``` ... ```in```, el comportamiento será idéntico a usar el método  ```readlines()```.

**Ejemplo:**

* Las siguiente celdas realizará las siguientes acciones de forma idéntica: 
    * Creará un  nuevo archivo de texto con el nombre ```prueba.txt``` en modo de escritura/lectura.
    * Al objeto generado por ```open()``` se le asignará el nombre ```archivo```.
    * Se desplegará cada línea del archivo.
    * Se cerrará el archivo.

In [None]:
with open("prueba.txt", "r") as archivo:
    for linea in archivo:
        print(linea)

In [None]:
with open("prueba.txt", "r") as archivo:
    for linea in archivo.readlines():
        print(linea)

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2020.</p>