## <font color='steelblue'>Introducción</font>

**Descripción:** Google Colab ofrece un entorno de ejecución en la nube, junto con un sistema de archivos virtual. En este cuaderno trabajamos la creación y gestión de archivos en el entorno virtual de Google Colab. Aprenderemos a trabajar con el directorio principal de contenidos y a crear y eliminar carpetas, así como a interaccionar con nuestro ordenador y contenido en internet. También aprenderemos a crear y abrir archivos para incorporar contenido o leerlo, así como a cerrarlos y eliminarlos, utilizando también opciones de programación avanzadas con el comando `with`, bucles `for` y la utilización de listas por comprensión.
La gestión eficiente de archivos será fundamental para automatizar tareas de gestión y procesado documental.


## <font color='steelblue'> Objetivos de aprendizaje

* Comprender la estructura del sistema de ficheros en Google Colab.
* Interaccionar con ficheros en nuestro ordenador y en internet.
* Utilizar el sistema de ficheros y aprender comandos básicos para gestionar archivos.
* Adquirir habilidades básicas para el manejo de archivos referidas a la lectura y la escritura.




## <font color='steelblue'> Contenidos </font>

1. El sistema de ficheros de Google Colab.
1. Importación y exportación de archivos.
1. Manejo básico de archivos.
1. Escritura y lectura de archivos.
1. Usos avanzados con archivos.

## <font color='steelblue'> 1. El sistema de archivos de Google Colab


En esta sección introducimos dos de los accesos que proporciona Colab para obtener información:

* El **ordenador local**, esto es, el dispositivo desde el que estamos trabajando con este cuaderno en el navegador *Chrome*.
* La **máquina virtual**, que es sobre la que trabaja *Google Colab* para ejecutar nuestro código. En este cuaderno, cuando hablemos del **sistema de archivos** nos estaremos refiriendo al que se incluye dentro de la máquina virtual.


Si queremos saber sobre qué computador o máquina virtual está conectado Google Colab y de qué características dispone, solamente debemos utilizar dos librerías: `platform` y `multiprocessing`. Importaremos la última librería como `mp` para facilitar su uso.

Veamos pues, las características de nuestra conexión Colab.

In [None]:
import platform
import multiprocessing as mp

print("Sistema            :", platform.system())
print("Release            :", platform.release())
print("Version            :", platform.version())
print("Equipo             :", platform.machine())
print("Procesador         :", platform.processor())
print("Arquitectura       :", platform.architecture()[0])
print('Número de CPU      :', mp.cpu_count())
print('')
print('Versión Python     :', platform.python_version())
print('compiler           :', platform.python_compiler())

Sistema            : Linux
Release            : 6.6.105+
Version            : #1 SMP Thu Oct  2 10:42:05 UTC 2025
Equipo             : x86_64
Procesador         : x86_64
Arquitectura       : 64bit
Número de CPU      : 2

Versión Python     : 3.12.12
compiler           : GCC 11.4.0


Dentro del entorno virtual de ejecución, Google Colab ofrece un espacio de almacenamiento temporal en la máquina virtual a la que nos conectamos, al que nos referiremos como **sistema de archivos de Google Colab**. Al ser temporal, cuando nos desconectemos del entorno de ejecución (al terminar nuestra sesión de trabajo), todo el contenido en el sistema de archivos se perderá, por lo que habremos de buscar otros medios de guardar el contenido que queramos conservar. Una opción puede ser conectar a nuestra unidad de Google Drive para almacenar allí de modo permanente el contenido, pero eso lo revisaremos en otros cuadernos.

De momento trabajamos dentro de la máquina virtual y conoceremos el sistema de archivos del que disponemos, en el que podremos crear carpetas y archivos y almacenar allí  el contenido con el trabajemos y también el que generemos a modo de ficheros.

Aprendemos en este cuaderno a crear y gestionar archivos y carpetas dentro de la máquina virtual a la que estemos conectados, e incluso interaccionar con nuestro ordenador.

### <font color='steelblue'>¿Qué es un archivo?

Un archivo o un fichero se refiere a un conjunto de información identificada con un nombre, que puede ser almacenada de manera permanente en el directorio de un dispositivo. Hasta llegar a este cuaderno, hemos estado leyendo *inputs* y escribiendo *ouputs* en la consola. En esta sección veremos cómo usar archivos de datos.

*Python* proporciona las funciones y los métodos básicos necesarios para manipular archivos de forma predeterminada. Puede realizar la mayor parte de la manipulación de archivos utilizando un objeto de tipo 'archivo'.

### <font color='steelblue'>Comandos *shell* o de terminal

Cualquier comando que funcione en un terminal de ejecución de cualquier sistema operativo, esto es, un *comando de shell*, puede ser usado en *Python* incluyendo delante una exclamación `!`. Es lo que hacíamos para instalar un paquete externo con el comando `!pip`.

Existen dos comandos interesantes para ubicarnos dónde estamos trabajando y saber qué tenemos en nuestro directorio de trabajo:
- `!pwd`, iniciales de *Print Working Directory*, nos indica en qué lugar/directorio nos encontramos del árbol de ficheros
-`!ls` proporciona una lista de los objetos dentro de la carpeta/directorio en que nos encontramos.  

In [None]:
!ls

adios.txt	auto_90_2.json	auto_90_4.json	hola.txt
auto_90_1.json	auto_90_3.json	auto_90_5.json	sample_data


In [None]:
!pwd

/content


Si queremos algo más de información sobre el contenido del directorio de trabajo, utilizamos el comando `-l` a continuación de solicitar el listado con `!ls`:
```
!ls -l
```

In [None]:
!ls -l

total 32
-rw-r--r-- 1 root root   11 Oct 14 07:04 adios.txt
-rw-r--r-- 1 root root 1036 Oct 14 07:04 auto_90_1.json
-rw-r--r-- 1 root root 1452 Oct 14 07:04 auto_90_2.json
-rw-r--r-- 1 root root 1172 Oct 14 07:04 auto_90_3.json
-rw-r--r-- 1 root root 1300 Oct 14 07:04 auto_90_4.json
-rw-r--r-- 1 root root 1164 Oct 14 07:04 auto_90_5.json
-rw-r--r-- 1 root root   10 Oct 14 07:04 hola.txt
drwxr-xr-x 1 root root 4096 Oct 10 13:36 sample_data


A lo largo del capítulo iremos haciendo uso de estos y otros comandos *shell* o de terminal.

#### <font color='steelblue'>Variables *shell*

En ocasiones cuando programamos, nos puede interesar incluir en nuestro código ciertos comandos *shell* para interaccionar con ellos. Esto se conseguirá creando **variables con comandos shell**, a las que llamar para conseguir las interacciones deseadas.

Siempre podemos guardar la salida de cualquier comando *shell* en un objeto de *Python*, simplemente creándolo con un nombre y asignándole dicha salida.

En nuestro ejemplo, podemos guardar en un objeto llamado 'contenido', el contenido de la carpeta */content*, que es la carpeta raíz en el espacio de trabajo virtual por defecto que nos proporciona Colab:

In [None]:
contenido = !ls /content
print(contenido)

['adios.txt\tauto_90_2.json\tauto_90_4.json\thola.txt', 'auto_90_1.json\tauto_90_3.json\tauto_90_5.json\tsample_data']


o almacenar el directorio en el que estamos trabajando en otro objeto llamado 'directorio':

In [None]:
directorio = !pwd
print(directorio)

['/content']


Los objetos en los que almacemanos el resultado de un comando *shell* son un tipo  especial de lista en *IPython*:

In [None]:
print(type(contenido))
print(type(directorio))

<class 'IPython.utils.text.SList'>
<class 'IPython.utils.text.SList'>


Estas listas se parecen mucho a las de *Python*, pero tienen funcionalidades adicionales, como los métodos de `grep` y `fields`, y las propiedades *s, n y p*, que permiten buscar, filtrar y mostrar los resultados de forma conveniente. Una explicación más extensa se puede consultar en el cuaderno [Comandos Linux en cuadernos Jupyter](https://colab.research.google.com/drive/1CXYgj2I1v93BLRnb8lEzaUuu8pIJlse4?usp=sharing).


A la hora de interaccionar con comandos *Shell* en nuestro programa, también podemos definir ubicaciones o nombres de ficheros como cadenas de caracteres, y utilizar dichos objetos, escritos entre llaves `{}`, para ejecutar un comando *shell*.

Veamos un ejemplo que liste el contenido de la carpeta */content/*.

In [None]:
# definimos una variable con el nombre del directorio raíz
principal = "/content"
print(f"\n El contenido de {principal} es:")
!ls {principal}


 El contenido de /content es:
adios.txt	auto_90_2.json	auto_90_4.json	hola.txt
auto_90_1.json	auto_90_3.json	auto_90_5.json	sample_data


In [None]:
/content/adios.txt

### <font color='steelblue'>Menú ARCHIVOS

Para acceder visualmente al directorio desde el que estamos trabajando, una vez nos hemos conectado a un entorno de ejecución en nuestro cuaderno Colab, hemos de pulsar el icono de carpeta que se encuentra en el menú vertical a la izquierda de nuestro cuaderno Colab:

<center><small><img src=https://raw.githubusercontent.com/ia4legos/Statistics/main/images/img_90_10_10.png></small></center>

Al clicarlo, accedemos al menú **ARCHIVOS**, que nos muestra el directorio base, *'/content'* y todo su contenido (que conseguíamos con `!ls`) como en la siguiente figura:

<center><small><img src=https://raw.githubusercontent.com/ia4legos/Statistics/main/images/img_90_10_20.png></small></center>

Observamos que hay una carpeta llamada *sample_data* y varios archivos que hemos precargado al ejecutar la configuración de este cuaderno, de tipo *.json* y *.txt*. Con ellos trabajaremos más adelante.

Si queremos cambiar el directorio de trabajo, debemos utilizar el comando "mágico" de *iPython* `%cd`. No funcionará sin embargo `!cd`, puesto que estamos ejecutando un comando de *Shell* en una subcapa temporal.

Por ejemplo, si queremos movernos a la carpeta *sample_data*, ejecutamos:

```
%cd /content/sample_data
```

y si queremos volver al directorio */content*, hemos de ejecutar de nuevo `%cd /content`. Al ejecutar cada uno de estos comandos, se visualiza en pantalla el directorio en el que estamos ubicados, ubicación que también podremos verificar ejecutando `!pwd`. Probémoslo, visualizando en el camino el contenido de la carpeta *sample_data*.



In [None]:
# movemos a la carpeta sample_data
%cd /content/sample_data
# visualizamos su contenido
!ls
# volvemos al directorio principal
%cd /content

/content/sample_data
anscombe.json		     california_housing_train.csv  mnist_train_small.csv
california_housing_test.csv  mnist_test.csv		   README.md
/content


Podríamos, sin embargo, haber visualizado el contenido de la carpeta *sample_data* sin necesidad de cambiar de directorio:

In [None]:
!ls /content/sample_data

Por otro lado, si queremos crear una carpeta nueva, utilizaremos el comando
```
!mkdir nombre_carpeta
```

Creamos a continuación una carpeta en el directorio principal, llamada *carpeta_de_prueba*, y verificamos el contenido de */content*, actualizado con dicha carpeta. En el panel izquierdo del cuaderno Colab también se actualizará dicho contenido.

In [None]:
!mkdir  carpeta_de_prueba
!ls

adios.txt	auto_90_2.json	auto_90_4.json	carpeta_de_prueba  sample_data
auto_90_1.json	auto_90_3.json	auto_90_5.json	hola.txt


Las carpetas no tienen terminación como los ficheros en el listado obtenido con `!ls`, y en el panel izquierdo carpetas y ficheros se visualizan con iconos distintos para diferenciarlos.

Solo podremos crear carpetas dentro del directorio principal */content*.

## <font color='steelblue'> 2. Importación y exportación de archivos


Si queremos trabajar en nuestro cuaderno Colab con algún archivo que tengamos en nuestro ordenador, hemos de importar el módulo `files` de la librería `google.colab`.

In [None]:
# utilidades de gestión de ficheros en G.Colab
from google.colab import files

### <font color='steelblue'>Descarga de archivos desde Colab

Para descargar al ordenador un fichero de nuestra carpeta de trabajo en Google Colab, hemos de utilizar la función `download()` del módulo `files`.

Descargamos a continuación dos de los ficheros de texto que tenemos en la carpeta */content*, para lo que hemos de volver a ubicarnos en ella.


In [None]:
%cd /content
files.download("hola.txt")
files.download("adios.txt")

/content


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

La primera vez que ejecutemos una descarga desde Colab, emergerá una pantalla a través de la cual habremos de dar permisos de descarga a nuestro ordenador. Clicando el en botón 'Permitir', aceptaremos las descargas desde Colab.

<center><small><img src=https://raw.githubusercontent.com/ia4legos/Statistics/main/images/img_90_20_10.png></small></center>

Los archivos se descargan uno a uno, y al hacerlo podremos elegir en qué ubicación de nuestro ordenador deseamos guardarlos.

### <font color='steelblue'>Subida de archivos a Colab

Procedemos ahora a la inversa: queremos subir archivos desde nuestro ordenador a nuestro espacio de trabajo en Google Colab.

La subida de archivos la ejecutamos con la función `files.upload()`. Dicha función la llamamos a través de un objeto o variable que hemos de crear, asignándole el resultado de llamar a dicha función de subida.

Para mostrar cómo funciona, nos movemos a la carpeta */content/carpeta_de_prueba*, y **subimos** los ficheros .txt que antes descargamos, creando el objeto `ficheros_subidos`. Al llamarla, emerge un menú a través del cual podemos ELEGIR ARCHIVOS del ordenador para subirlos o cancelar la subida.

<center><small><img src=https://raw.githubusercontent.com/ia4legos/Statistics/main/images/img_90_20_05.png></small></center>

Tras elegir y subir los archivos que queremos, aparece en pantalla un mensaje que muestra el resultado del proceso, con información del tamaño de cada fichero y la última fecha de modificación.

<center><small><img src=https://raw.githubusercontent.com/ia4legos/Statistics/main/images/img_90_20_06.png></small></center>

Ejecútalo a continuación.

In [None]:
%cd /content/carpeta_de_prueba
ficheros_subidos = files.upload()

/content/carpeta_de_prueba


Saving adios.txt to adios.txt
Saving hola.txt to hola.txt


Si visualizamos a continuación dicho objeto, nos muestra un diccionario en el que, para cada uno de los archivos subidos ofrece la clave (nombre del archivo) y el valor (datos subidos). Pruébalo.

In [None]:
ficheros_subidos

{'adios.txt': b'Adios clase', 'hola.txt': b'Hola clase'}

Comprobemos ahora estas últimas modificaciones realizadas en la carpeta de trabajo, */content/sample_data*. Aparecerán incluidos los ficheros que acabamos de subir.

In [None]:
!pwd
!ls -l

/content/carpeta_de_prueba
total 8
-rw-r--r-- 1 root root 11 Oct 14 07:20 adios.txt
-rw-r--r-- 1 root root 10 Oct 14 07:20 hola.txt


Si volvemos a subir los mismos ficheros, u otros con el mismo nombre, (`hola.txt`y `adios.txt` en nuestro caso), el sistema NO avisa de que ya existen y los renombra añadiendo al nombre un numeral correlativo entre paréntesis. En nuestro caso los subiría como `hola(1).txt` y `adios(1).txt`.

### <font color='steelblue'>Eliminación de archivos y carpetas en Colab

Para eliminar un fichero en nuestro espacio de trabajo en Google Colab, utilizaremos el comando `!rm` seguido del nombre del fichero a eliminar.

```
!rm fichero_a_eliminar
```


Eliminemos el fichero 'adios.txt' y comprobemos a continuación el contenido de la carpeta.

In [None]:
!rm adios.txt
!ls

hola.txt


Si queremos eliminar una carpeta, previamente tiene que estar vacía de ficheros. Para vaciarla, esto es, eliminar todo su contenido, utilizamos el comando:

```
!rm *.*
```

Una vez vacía la carpeta, hemos de movernos al directorio principal */content*, y desde allí eliminar la carpeta con el comando
```
!rmdir
```


Para probar todos estos comandos, eliminemos la carpeta */content/carpeta_de_prueba*, vaciándola primero y eliminándola a continuación desde el directorio */content*. Comprobamos después los objetos que quedan el el directorio principal.

In [None]:
#comprobamos que estamos en la carpeta_de_prueba
!pwd
# eliminamos todo el contenido
!rm *.*
# verificamos que está vacía
!ls
# nos movemos al directorio principal
%cd /content
# eliminamos la carpeta_de_prueba
!rmdir carpeta_de_prueba
!ls -l

/content/carpeta_de_prueba
/content
total 32
-rw-r--r-- 1 root root   11 Oct 14 07:04 adios.txt
-rw-r--r-- 1 root root 1036 Oct 14 07:04 auto_90_1.json
-rw-r--r-- 1 root root 1452 Oct 14 07:04 auto_90_2.json
-rw-r--r-- 1 root root 1172 Oct 14 07:04 auto_90_3.json
-rw-r--r-- 1 root root 1300 Oct 14 07:04 auto_90_4.json
-rw-r--r-- 1 root root 1164 Oct 14 07:04 auto_90_5.json
-rw-r--r-- 1 root root   10 Oct 14 07:04 hola.txt
drwxr-xr-x 1 root root 4096 Oct 10 13:36 sample_data


### <font color='steelblue'>Descarga de ficheros desde Internet a Google colab

Cuando queremos descargar un fichero en internet a nuestro espacio de trabajo en la máquina virtual de Google Colab, basta con utilizar el comando shell `wget` seguido de la url de descarga del fichero:
```
!wget url_fichero_internet
```

Descargamos a continuación el fichero *buenos_dias.txt* del repositorio en Github de **ia4legos**, usando su url de descarga, y verificamos a continuación que está cargado en nuestro directorio de trabajo en Colab.

In [None]:
# verificamos que estamos en el directorio principal
!pwd
# descarga del fichero 'adios.txt' ubicado en GitHub
!wget https://raw.githubusercontent.com/ia4legos/Statistics/main/archivos/buenos_dias.txt
# comprobación
!ls

/content
--2025-10-14 07:23:09--  https://raw.githubusercontent.com/ia4legos/Statistics/main/archivos/buenos_dias.txt
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.109.133, 185.199.108.133, 185.199.111.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.109.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 408 [text/plain]
Saving to: ‘buenos_dias.txt’


2025-10-14 07:23:09 (8.02 MB/s) - ‘buenos_dias.txt’ saved [408/408]

adios.txt	auto_90_2.json	auto_90_4.json	buenos_dias.txt  sample_data
auto_90_1.json	auto_90_3.json	auto_90_5.json	hola.txt


## <font color='steelblue'> 3. Manejo básico de archivos

Una vez tenemos accesibles en nuestra máquina virtual los ficheros con los que queremos trabajar, procedemos a describir operaciones básicas que necesitaremos para programar sobre ellos.

Suponemos en lo que sigue, que estamos ubicados en el espacio de trabajo donde también se ubican los ficheros que nos interesan. De no ser así, tendríamos que utilizar toda la ruta en la máquina virtual para llamarlos.

### <font color='steelblue'>Abrir archivos: `open()`</font>

Antes de poder leer o escribir un archivo debemos **abrirlo**, lo que implica crearlo si no existe, y prepararlo para acceder a él en cuanto existe. Esto lo hacemos con la función [`open()`](https://docs.python.org/3/library/functions.html#open), que viene integrada en *Python*. Esta función crea un objeto de tipo archivo.

La sintaxis básica para abrir un fichero es:

```
variable_fichero = open(nombre_fichero, modo_acceso)
```

donde:

* **nombre_fichero** es una cadena de texto que contiene el nombre del archivo al que desea acceder, incluida su extensión;

* **modo_acceso** determina el modo en que queremos acceder al archivo, esto es, para leer, escribir, añadir algo, etc. Por defecto está programado en modo lectura `"r"`.

Los diferentes modos de acceso a un archivo se escriben entrecomillados y son:

| Modos  | Descripción                          |
| :-------- | :----------------------------------- |
| `"r"` | Abre un archivo solo para lectura. Modo por defecto. |
| `"rb"`  | Abre un archivo para la lectura en modo binario. Modo por defecto en archivos binarios. |
| `"r+"`   | Abre un archivo para leer y escribir.  |
| `"rb+"`  | Abre un archivo para lectura y escritura en formato binario. |
| `"w"`   | Abre un archivo solo para escritura. Lo sobrescribe si ya existe. Si no existe, crea uno nuevo. |
| `"wb"`  | Abre un archivo para escribir solo en formato binario. Lo sobrescribe si ya existe. Si no existe, crea uno nuevo. |
| `"w+"`  | Abre un archivo para escribir y leer. Lo sobreescribe si ya existe. Si no existe, crea uno nuevo. |
| `"wb+"` | Abre un archivo para escribir y leer en formato binario. Lo sobreescribe si ya existe. Si no existe, crea uno nuevo. |
| `"a"`  | Abre un archivo para agregar contenido. Si no existe, crea uno nuevo. |
| `"ab"`   | Abre un archivo para anexar en formato binario. Si no existe, crea uno nuevo. |
| `"a+"`  | Abre un archivo para agregar y leer. Si no existe, crea uno nuevo. |
| `"ab+"`   | Abre un archivo para agregar y leer en formato binario. Si no existe, crea uno nuevo. |


En los modos de acceso relacionados con la creación de un archivo, es interesante saber que el puntero del archivo se coloca al inicio de él. En los relacionados con la agregación de contenido, el puntero está ubicado al final del contenido incluido en el fichero, para proseguir la incorporación desde ese punto.

### <font color='steelblue'>Atributos de los archivos</font>

Al utilizar la función `open()` conseguimos un objeto de tipo 'archivo', sobre el que podemos obtener diversa información en forma de atributos. Estos atributos los conseguimos añadiendo al nombre del objeto un punto `.` y el nombre del atributo. Estos atributos son:

| Atributo  | Descripción                          |
| :-------- | :----------------------------------- |
| `.closed` | Devuelve `True` si el archivo está cerrado, y `False` si está abierto. |
| `.mode`  | Da el modo de acceso con el que se abrió el archivo. |
| `.name` | Devuelve el nombre del archivo. |

Veamos a continuación un ejemplo. Utilicemos el fichero *adios.txt*, que está en el directorio principal. Lo vamos a abrir del modo 'solo lectura',, `"r"`. Su nombre como objeto o variable será `fichero`. A continuación visualizamos sus atributos.

In [None]:
fichero = open("adios.txt", "r")
print("¿Está cerrado?  : ", fichero.closed)
print("Modo de apertura : ", fichero.mode)
print("Nombre del fichero: ", fichero.name)

¿Está cerrado?  :  False
Modo de apertura :  r
Nombre del fichero:  adios.txt


El nombre y modo de acceso también se pueden ver si llamamos al objeto directamente:

In [None]:
fichero

<_io.TextIOWrapper name='adios.txt' mode='r' encoding='UTF-8'>

### <font color='steelblue'>Cerrar archivos: `close()`

La función `close()` aplicada a un objeto de tipo archivo **cierra** el archivo de modo que ya no es posible interaccionar con él en el programa hasta que se vuelva a abrir.

*Python* cierra automáticamente un archivo cuando la variable de referencia de un archivo se reasigna a otro archivo. De todas formas, es recomendable utilizar el método `close()` para cerrar un archivo.

Ejemplificamos su uso cerrando el archivo que hemos abierto anteriormente y comprobando sus atributos.

In [None]:
fichero.close()
print("¿Está cerrado?  : ", fichero.closed)
print("Modo de apertura : ", fichero.mode)
print("Nombre del fichero: ", fichero.name)

¿Está cerrado?  :  True
Modo de apertura :  r
Nombre del fichero:  adios.txt


Observamos que ahora el atributo `.closed` si nos devuelve el valor booleano `True`, es decir, sí está cerrado (o no está abierto).

**Nota:** No hay que confundir la función `close()` y el atributo `.closed`.

## <font color='steelblue'> 4. Escritura y lectura de archivos

Las variables de tipo fichero o archivo, proporcionan un conjunto de métodos de acceso a ellas. Veremos cómo usar las funciones que sirven para escribir y leer archivos. Para poder hacer cualquiera de estas acciones, debemos de tener el archivo abierto y guardado en una variable.

### <font color='steelblue'>Escribir: `write()`</font>

La función `write()` sirve para escribir contenido en un fichero abierto previamente con `open()`. Escribe cualquier cadena de texto en un archivo de texto, o código binario si se trata de un archivo abierto en modo binario.

Esta función por defecto no agrega saltos de línea, pero se pueden incluir intercalando en el texto `\n` cuando queramos saltar de línea.  

Vamos a ejemplificar su uso siguiendo estos pasos:

1. Abrimos en modo escritura, `w`, el fichero *prueba.txt* y lo asignamos al objeto `fichero`.
1. Utilizamos la función `write()` para escribir un texto.
1. Por último, lo cerramos.

Podemos utilizar `write()` tantas veces como queramos, mientras no se cierre el fichero.

In [None]:
# Abrimos el archivo (lo creamos nuevo)
fichero = open("prueba.txt", "w")

# Escribimos en el archivo
fichero.write("Esta es la primera línea.")
# incluimos un salto de línea
fichero.write("\n")
fichero.write("Hemos hecho un salto de línea.")
# incluimos varios saltos de línea integrándolos en el texto
fichero.write("\nY también podemos hacerlo así \n")
fichero.write("o así.")

# Cerramos el archivo
fichero.close()

Tras ejecutar el código anterior, podemos comprobar el resultado de la escritura al clicar sobre el icono del fichero 'prueba.txt', en el menú de ARCHIVOS. Aparecerá en la parte derecha de la pantalla lo siguiente:

<center><small><img src=https://raw.githubusercontent.com/ia4legos/Statistics/main/images/img_90_40_10.png></small></center>

Recordemos que si las cadenas de texto las escribimos entre triples comillas (`"""texto"""`), se respetan todos los saltos de línea que se escriban entre ellas. Utilizando esta herramienta, será pues más sencillo escribir contenido sin necesidad de forzar los saltos de línea con `\n`.

Volvamos a escribir el fichero de esta forma. Al volver a abrirlo en modo `"w"`, lo sobreescribiremos, eliminando el contenido que se incluyó previamente. Una vez lo ejecuta, comprueba el resultado abriendo el fichero desde el menú de ARCHIVOS.

In [None]:
# Abrimos el archivo (lo creamos nuevo)
fichero = open("prueba.txt", "w")

# Escribimos en el archivo
fichero.write("""Esta es la primera línea.
Hemos hecho un salto de línea.
Y tambien podemos hacerlo así
o así.""")

# Cerramos el archivo
fichero.close()

Con la ayuda de listas y bucles `for`, podemos abrir y escribir los ficheros que queramos.

A continuación vamos a crear tres nuevos ficheros que se llamarán *prueba1.txt*, *prueba2.txt* y *prueba3.txt*. Dentro de ellos escribiremos los números que los identifican, esto es, 1, 2 y 3, respectivamente, en formato *string*. Una vez hayas ejecutado el código a continuación, comprueba el resultado accediendo a los archivos creados desd el menú de ARCHIVOS.


In [None]:
for num in range(1,100):
    # Abrimos el fichero
    fichero = open(f"prueba{num}.txt", "w")

    # Escribimos en él
    fichero.write(str(num))

    # Lo cerramos
    fichero.close()

### <font color='steelblue'>Leer: `read()`

La función **read()** lee una cadena de texto de un archivo abierto. Es importante tener en cuenta que las cadenas de *Python* pueden tener datos binarios aparte de los datos de texto.

Probemos a leer el fichero *prueba.txt* que hemos creado antes. Ahora deberemos utilizar el modo de acceso `"r"`.

In [None]:
# Abrimos el fichero
fichero = open("prueba.txt", "r")

# Leemos el fichero
texto = fichero.read()

# Mostramos por pantalla el texto
print(texto)

# Cerramos el fichero
fichero.close()

34


A esta función, `read()`, podemos pasarle como argumento un numeral con el número de caracteres (bytes) que ha de leer. Si le faltan (porque el archivo es más corto que el número especificado), lee el archivo hasta el final.

Veamos cómo funciona.

In [None]:
# Abrimos el fichero
fichero = open("prueba.txt", "r")

# Leemos 25 caracteres
texto = fichero.read(25)

# Mostramos por pantalla el texto
print(texto)

# Cerramos el fichero
fichero.close()

Esta es la primera línea.


Si después de indicarle que lea cierto número de caracteres, volvemos a llamar a la función `read()` para leer, seguirá leyendo a partir de donde se quedó cuando la llamamos con anterioridad.

Veámoslo sobre el ejemplo.

In [None]:
# Abrimos el fichero
fichero = open("prueba.txt", "r")

# Leemos 25 bytes
texto1 = fichero.read(25)
# Leemos el resto
texto2 = fichero.read()

# Mostramos por pantalla los textos
print(texto1)
print(texto2)

# Cerramos el fichero
fichero.close()

Esta es la primera línea.

Hemos hecho un salto de línea.
Y tambien podemos hacerlo así
o así.


### <font color='steelblue'>Leer una línea: `readline()`

Cuando queremos leer solo algunas líneas específicas de un archivo, disponemos de la función `readline()`. Cada vez que la ejecutamos leerá la línea a continuación de la que leyó la última vez que se procesó.

Veamos su uso con el fichero 'prueba.txt'.

In [None]:
fichero=open("prueba.txt","r")
linea=fichero.readline()
contador=1
while linea != '':
    print(f'Línea {contador}:{linea}')
    linea=fichero.readline()
    contador+=1
fichero.close()


Línea 1:Esta es la primera línea.

Línea 2:Hemos hecho un salto de línea.

Línea 3:Y también podemos hacerlo así 

Línea 4:o así.


### <font color='steelblue'>Leer todas las líneas: `readlines()`

Otra función interesante para trabajar con ficheros es `readlines()`, que crea una lista con cada una de las líneas que hay en el fichero, de modo que luego podemos acceder fácilmente a cualquiera de ellas.

Veamos cómo funciona.

In [None]:
# Abriendo el fichero
fichero = open("prueba.txt", "r")

# Leemos las líneas
lineas = fichero.readlines()
# Cerramos el fichero
fichero.close()

# Mostramos la lista
print(lineas)
# Mostramos la primera línea
print("Primera línea:",lineas[0])


['Esta es la primera línea.\n', 'Hemos hecho un salto de línea.\n', 'Y tambien podemos hacerlo así\n', 'o así.']
Primera línea: Esta es la primera línea.



Al final de cada línea, muestra el comando de salto de línea.

Esta función incluye al final de cada línea, el comando de salto de línea, `\n`.

Mostremos a continuación con un bucle `for` cada una de las líneas por separado.

In [None]:
# Abriendo el fichero
fichero = open("prueba.txt", "r")

# Leemos las líneas
lineas = fichero.readlines()

# Cerramos el fichero
fichero.close()

# Bucle for
for i in range(len(lineas)):
  # Mostramos las líneas una a una
  print("Línea ",i+1,":",lineas[i])



Línea  1 : Esta es la primera línea.

Línea  2 : Hemos hecho un salto de línea.

Línea  3 : Y tambien podemos hacerlo así

Línea  4 : o así.


## <font color='steelblue'> 5. Usos avanzados con archivos

### <font color='steelblue'>La sentencia `with`

La sentencia `with` en *Python* se puede utilizar junto a las funciones `read`, `readline` y `readlines` para hacer el código más limpio y legible. Simplifica la gestión de recursos comunes como, por ejemplo, los flujos de archivos.

A diferencia de las implementaciones anteriores, no será necesario llamar a `file.close()` cuando se utiliza la sentencia `with`. La propia sentencia asegura la correcta adquisición y liberación de recursos.



Veamos qué ocurre cuando utilizamos esta sentencia junto a las funciones de lectura que vimos en el apartado anterior.

In [None]:
with open("prueba.txt", 'r') as fichero:
    texto = fichero.read()

print(texto)

Esta es la primera línea.
Hemos hecho un salto de línea.
Y tambien podemos hacerlo así
o así.


In [None]:
with open("prueba.txt", 'r') as fichero:
    linea = fichero.readline()

print(linea)

Esta es la primera línea.



In [None]:
with open("prueba.txt", 'r') as fichero:
    lineas = fichero.readlines()

print(lineas)

['Esta es la primera línea.\n', 'Hemos hecho un salto de línea.\n', 'Y también podemos hacerlo así \n', 'o así.']


Si lo utilizamos sin llamar a ninguna de estas funciones, `read()`, `readline()` o `readlines()`, lee el texto del archivo por líneas (como si hubiéramos llamado a `readlines()`, pero sin incluir `\n` al final de cada línea.

In [None]:
with open("prueba.txt", 'r') as fichero:
  for linea in fichero:
    print(linea)

Esta es la primera línea.

Hemos hecho un salto de línea.

Y también podemos hacerlo así 

o así.


Como vemos, genera un salto de línea entre las líneas consecutivas (cuando lo encuentra en el texto), que podemos evitar con la función `rstrip()`.

In [None]:
with open("prueba.txt", 'r') as fichero:
    for linea in fichero:
        print(linea.rstrip())

Esta es la primera línea.
Hemos hecho un salto de línea.
Y también podemos hacerlo así
o así.


Este último resultado lo podemos reproducir, generando una lista y con algo más de código, con la función `readlines()`, a través de una lista por comprensión:

In [None]:
with open("prueba.txt", 'r') as fichero:
    lineas = [linea.rstrip() for linea in fichero.readlines()]

print(lineas)

['Esta es la primera línea.', 'Hemos hecho un salto de línea.', 'Y también podemos hacerlo así', 'o así.']


### <font color='steelblue'>Posicionamiento

La función `tell()` es útil cuando hacemos múltiples instancias a un fichero en un programa, para saber, en cada momento, en qué posición se apunta dentro del archivo. Nos indica pues, a partir de qué punto va a seguir leyendo o escribiendo cuando hagamos otra instancia a las funciones de lectura y/o escritura.

Veamos cómo funciona con el ejemplo anterior, en el que leíamos solo los primeros 25 caracteres.

In [None]:
with open("prueba.txt", "r") as fichero:
  texto = fichero.read(25)
  print(f"La cadena que hemos leído es: {texto}")
  posicion = fichero.tell()
  print(f"Posición actual del archivo : {posicion}")

La cadena que hemos leído es: Esta es la primera línea.
Posición actual del archivo : 26


Con la función `seek()` podemos cambiar la posición del puntero en el fichero sobre el que trabajamos. Contiene dos argumentos:

- **`offset`**, que indica el número de caracteres (bytes) que ha de correr el puntero desde la posición actual o el origen especificado con el siguiente argumento `from`;
- **`from`** especifica la posición desde la que ha de correr `offset` caracteres (bytes). Puede tomar valores: 0 (desde el inicio del fichero), 1 (desde la posición actual del puntero), y 2 (desde el final del fichero hacia atrás, por lo que el argumento `offset` habrá de ir en negativo).

A modo de ejemplo, si tenemos un fichero 'f', conseguiremos los siguientes resultados:

- `f.seek(n)` : Ir al byte *n* del fichero
- `f.seek(n,0)` : Equivalente a lo anterior
- `f.seek(n,1)` : Desplazarnos *n* bytes a partir de la posición actual del fichero
- `f.seek(-n,2)` : Situarnos *n* bytes antes del final de fichero.


Para poder ejecutar la función `seek()` con diferentes argumentos *from*, debemos leer los ficheros con el modo `"rb"` o `"rb+"`, de modo que los caracteres especiales como tildes, aparecerán codificados y se visualizarán de modo extraño.


Veamos un ejemplo a continuación.

In [None]:
with open("prueba.txt", "rb+") as fichero:
  # Colocamos el puntero al principio del fichero
  posicion = fichero.seek(0, 0)
  print("Posición actual del archivo: ", posicion)
  # leemos 25 caracteres
  texto = fichero.read(25)
  print("Desde el inicio, la cadena de lectura de 25 bytes es: ", texto)

  # Avanzamos 8 posiciones más desde donde nos quedamos
  posicion = fichero.seek(8, 1)
  print("Posición actual del archivo: ", posicion)
  texto = fichero.read(5)
  print("Ahora la cadena de lectura de 5 bytes es: ", texto)

  # El puntero se coloca 25 caracteres antes del final
  posicion = fichero.seek(-25, 2)
  print("Posición actual del archivo: ", posicion)
  texto = fichero.read(20)
  print("Por último, la cadena de lectura es: ", texto)
  print("Posición final:",fichero.tell())

Posición actual del archivo:  0
Desde el inicio, la cadena de lectura de 25 bytes es:  b'Esta es la primera l\xc3\xadnea'
Posición actual del archivo:  33
Ahora la cadena de lectura de 5 bytes es:  b'hecho'
Posición actual del archivo:  72
Por último, la cadena de lectura es:  b'emos hacerlo as\xc3\xad\no '
Posición final: 92


## <font color='steelblue'>Reto

Para verificar tu aprendizaje de los contenidos en
este cuaderno, te proponemos el siguiente Reto.

### **Ejercicio 1**

Crea una carpeta que se llame *reto* en el directorio principal de la máquina virtual de Google Colab (*/content*). Una vez la hayas creado, comprueba que está vacía.

**Nota:** Utiliza dos celdas de código, una para crear la carpeta y otra para la comprobación.

In [None]:
## Crear la carpeta




In [None]:
## Listar su contenido




### **Ejercicio 2**

En la carpeta que has creado (*reto*), añade 10 ficheros diferentes con nombres *fichero_x.txt*, donde la *x* sean un número (correlativo) del 0 al 9. Dentro de cada fichero, introduce el siguiente texto: "Hola, este es el fichero x", siendo *x* otra vez el número que identifica al archivo. Por último, comprueba que se han generado correctamente los 10 ficheros en esta carpeta.

**Ayuda:** Comprueba que estás en la carpeta correcta y ayúdate de un bucle *for*.

### **Ejercicio 3**

¡Vaya! Nos hemos equivocado con el número de ficheros que queríamos. En realidad solo necesitamos que estén los ficheros etiquetados del 1 al 5. Elimina los restantes y comprueba que solo quedan los que queremos.



### **Ejercicio 4**

Vuelve al directorio principal (*/content*), y genera allí un fichero llamado *poema.txt*. Incluye este pequeño extracto de una obra de Becquer:

<small><img src=https://raw.githubusercontent.com/ia4legos/Statistics/main/images/img_90_reto_aprendiz_4.png></small>

Una vez generado, muestra por pantalla su contenido. Realiza la escritura en una celda de código y la lectura en otra.

**Nota:** Respeta TODOS los saltos de línea.

In [None]:
## Escritura






In [None]:
## Lectura






### **Ejercicio 5**

Con el fichero que has generado en el ejercicio anterior (*poema.txt*) muestra por pantalla la primera línea y luego, solo el poema (a partir de la posición 70).

**Ayuda:** Considera utilizar la función `seek`.
