<p><img src="https://progra-fing-usach.github.io/IMGs/logo-fing.png" alt="LogoUSACH" width="40%" align="right" hspace="10px" vspace="0px"></p>

# Archivos

## Definición

In [None]:
# Importación para cargar el propio directorio de Drive en Google Colab
from google.colab import drive
# La cuenta de Google Drive estará en la carpeta señalada
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


Hasta ahora solo se ha trabajado obteniendo información solicitándola al usuario mediante el uso del teclado (con ayuda de la función `input()`), pero existen otras fuentes de donde poder obtener datos para poder realizar los procesos solicitados. En esta unidad, se extraerá la información desde archivos (o ficheros). Estos se caracterizan por tener una ruta o dirección, un nombre específico y un formato determinado. Esta información es de vital importancia al momento de querer generar una extracción de datos, puesto que, de no tenerla o escribirla de manea errada puede ocasionar que Python no logre la comunicación con el documento y, por ende, falle la extracción de información.

Considerando que este curso es solo una introducción a la programación, solo se trabajará con archivos de texto plano `.txt` y archivos de valores separados por coma o  `.csv`.

Para lograr extraer la información desde el documento, se debe trabajar con un nuevo tipo de objeto, el cual se conoce de manera como **`File`**, y entrega las herramientas necesarias (métodos) para poder interactuar con los archivos mencionados.

## Apertura de Archivos

Para lograr la comunicación deseada, lo primero que se necesita hacer es abrir el documento y realizar la lectura respectiva de la información que contiene el archivo. Para ello se utiliza el siguiente mecanismo:

```python
with open(<nombre_archivo_con_extensión>,<modo_acceso>) as <identificador>:
```

*   El **`nombre_archivo_con_extensión`**: es el nombre con el que se comunicará el programa. A modo de ejemplo, `"datos_covid.txt"`.
*   El **`modo_acceso`** es la sigla con la que se indica la acción que se desea realizar con el archivo de texto. Debe ser entregado en formato `string`. A nivel de curso, se verán tres opciones para acceder a un archivo:
   *   **`r`**: del inglés *reading*, indica que el archivo será abierto en modo **lectura**:
      *   El objeto File **podrá leer** la información del archivo, pero no está autorizado para modificarla.
      *   En caso de no existir el archivo, el programa **arrojará un mensaje de error** (`FileNotFoundError`).
      *   Este modo es el **modo por defecto**, por lo que si, al llamar a la función `open`, no se especifica el modo de acceso, este será **`r`**.
   *   **`w`**: del inglés *writing*, indica que el archivo será abierto en modo **escritura**:
      *   El objeto File **podrá escribir** información en el archivo.
      *   En caso de no existir el archivo, el programa **creará un archivo en blanco** con el nombre indicado **en la misma dirección** en el que se encuentra el programa.
      *   En caso de existir el archivo, el programa **borrará el contenido del archivo**.
   *   **`a`**: del inglés *append* , indica que el archivo será abierto en modo de añadidura o **agregación**. En este modo:
      *   El objeto File **podrá escribir** información en el archivo.
      *   En caso de no existir el archivo, el programa **creará un archivo en blanco** con el nombre indicado **en la misma dirección** en el que se encuentra el programa.
      *   Este caso de existir el archivo, el programa **escribirá luego del contenido del archivo**.

Con lo anterior, se ha establecido la comunicación que se trendrá con el archivo de texto. No obstante, aún no se indica cómo se leerá o escribirá información desde o hacia el archivo respectivo.

## Métodos de archivos

Para trabajar con archivos, Python ofrece algunas funciones y métodos propios del tipo de dato File.

Entre los métodos más comunes se pueden mencionar:

*   **`<archivo>.close()`**: indica que el archivo en uso debe **cerrarse**. Esto es necesario para que el archivo se guarde de manera correcta en el dispositivo de almacenamiento del equipo, es decir, enviar los datos desde la **memoria principal**, donde están siendo operados y consultados, al **disco duro** o unidad de datos, donde son almacenados de forma permanente. Cabe señalar que si se accede al archivo con el ambiente **with**, no es necesario cerrar el documento.
*   **`<archivo>.readlines()`**: método que devuelve una **lista** en donde cada elemento es una línea del archivo leído.
*   **`<archivo>.read()`**: método que devuelve un **string** con el contenido del archivo leído.
* **`<archivo>.readline()`**: método que lee línea a línea los contenidos de un archivo. Cada vez que lo invoco entrega una nueva línea. Retorna un string vacío cuando ya no quedan contenidos por leer.
*   **`<archivo>.write(<string>)`**: escribe un string en el archivo mencionado. Este string es el argumento del método `.write()`. Es importante mencionar que este método escribe un único string. Lo que significa que, si se desean escribir varios mensajes, se debe generar un único string mediante concatenaciones o repetir la operación `.write()` hasta completar el mensaje requerido. 

 * Este método, escribe exactamente el string que el usuario le entregue, por lo que es necesario incorporar un salto de línea cada vez que se utilice (`\n`) para pasar a la línea siguiente. 


A continuación se muestran dos ejemplos de lectura de un documento utilizado los métodos  **`<archivo>.read()`** y **`<archivo>.readlines()`** respectivamente.

Es importante destacar que los métodos de lectura, solo funcionan cuando el archivo está abierto en modo de lectura, mientras que los de escritura solo funcionan sobre archivos abiertos en modo de escritura o agregación.

In [None]:
# Ejemplo: lectura de archivo mediante el método .read()

### BLOQUE DE DEFINICIONES

## Definición de Funciones
def leer_archivo(nombre_archivo):
    """Función que lee la información de un archivo de texto plano (.txt)

    Entrada: 1 string (str)
    Salida: 1 lista (list)
    """
    with open(nombre_archivo,"r") as archivo:
        texto = archivo.read()
    return texto
    
### BLOQUE PRINCIPAL

## Entrada
# Se ingresa el nombre del archivo anteponiendo la dirección en donde se encuentra
nombre_archivo = "/content/drive/MyDrive/Proyecto Python/entrada.txt"
lectura = leer_archivo(nombre_archivo)

## Salida
print(lectura)

HOLA
Este es un texto de ejemplo
Soy un archivo .txt, por lo que almaceno texto sin formato, y la única información que guardo es el texto mismo


In [None]:
# Ejemplo: lectura de archivo mediante el método .readlines()

### BLOQUE DE DEFINICIONES
## Definición de Funciones
def leer_archivo(nombre_archivo):
    """Función que lee la información de un archivo de texto plano (.txt)
    Entrada: 1 string (str)
    Salida: 1 lista (list)
    """
    with open(nombre_archivo,"r") as archivo:
        lista_texto = archivo.readlines()
    return lista_texto
    
### BLOQUE PRINCIPAL
## Entrada
# Se ingresa el nombre delarchivo anteponiendo la dirección en donde se encuentra
nombre_archivo = "/content/drive/MyDrive/Proyecto Python/entrada.txt"
lectura = leer_archivo(nombre_archivo)

## Salida
print(lectura)

['HOLA\n', 'Este es un texto de ejemplo\n', 'Soy un archivo .txt, por lo que almaceno texto sin formato, y la única información que guardo es el texto mismo']


Para aterrizar los conceptos vistos, se propone un ejercicio en el que se desea saber la cantidad de consonantes que tiene un determinado archivo de texto plano. Una vez que se obtenga la cantidad de consonantes, se debe agregar un mensaje al documento indicando lo siguiente:

```
La cantidad de consonantes que hay en este documento es de ...
```

In [None]:
# Ejemplo: Programa que calcula la cantidad de consonante que tiene un archivo y lo informa en el mismo documento

### BLOQUE DE DEFINICIONES
## Definición de constantes
VOCALES = "AEIOU"


## Definición de Funciones
def leer_archivo(nombre_archivo):
    """Función que lee la información de un archivo de texto plano (.txt)

    Entrada: 1 string (str)
    Salida: 1 lista (list)
    """
    with open(nombre_archivo,"r") as archivo:
        texto = archivo.read()
    return texto


def calcular_consonantes(texto):
  """Función que calcula las consonantes en el texto

  Entrada: texto a evaluar (str)
  Salida: cantidad de consonantes (int)
  """
  texto = texto.upper()
  i = 0
  contador = 0

  while i < len(texto):
    if texto[i].isalpha() and not texto[i] in VOCALES:
      contador = contador + 1
    i = i + 1
  return contador


def escribir_archivo(nombre_archivo, contenido):
  """Función que añade la cantidad de consonantes al archivo

  Entradas: nombre del archivo (str) y cantidad de consonantes (int)
  Salida: True, si se realizó bien la escritura (fallo, en otro caso)
  """
  contenido = str(contenido)
  mensaje = "La cantidad de consonantes que hay en este documento es de" + contenido
  
  with open(nombre_archivo,"a") as archivo:
    archivo.write("\n\n" + mensaje)
  return True

    
### BLOQUE PRINCIPAL
## Entrada
# Se ingresa el nombre del archivo anteponiendo la dirección en donde se encuentra
nombre_archivo = "/content/drive/MyDrive/Proyecto Python/entrada.txt"
lectura = leer_archivo(nombre_archivo)

## Procesamiento
consonantes = calcular_consonantes(lectura)

## Salida
escribir_archivo(nombre_archivo,consonantes)

True

## Escritura usando `print()`

Adicionalmente es posible escribir en archivos usando directamente la función `print()`, esta tiene algunos parámetros interesantes que no hemos mencionado hasta el momento.

Estos parámetros especiales son de tipo keyword, es decir, debo usar su nombre para poder usarlos y son:
* `sep`: indica cuál es el caracter para separar los elementos a imprimir (por defecto es el caracter espacio)
* `end`: indica cuál es el caracter de fin (por defecto es un salto de línea)
* `file`: indica en qué archivo queremos guardar el resultado del print(), para Python, la consola en la cuál nos muestra los resultados es un archivo más, por lo que podemos redirigir el resultado de la función a un archivo distinto cambiando este parámetro.


Un ejemplo de escritura usando `print()` se presenta a continuación.

In [None]:
# Ejemplo: Escritura de dos líneas de texto en un archivo 'example.txt' usando print.
nota_pedro = 5.0
nota_juan = 6.7
with open('example.txt', 'w') as arc:
    print('Pedro', nota_pedro, sep=': ', file=arc)
    print('Juan', nota_juan, sep=': ', file=arc)


Vale la pena notar que en este caso no cambiamos el parámetro `end`, pues queremos que Python escriba un salto de línea al final de cada `print()`.

## PRECAUCIONES SOBRE ARCHIVOS



Un aspecto importante a considerar es que al usar archivos estamos manipulando directamente el disco duro de nuestro computador y por lo tanto podemos:
* Sobre-escribir elementos importantes.
* Corromper archivos existentes.
* Crear programas que agreguen información al disco duro hasta llenarlo.

Por ejemplo, el código presentado a continuación escribe 1.000 archivos en la misma carpeta del programa, sin embargo, si yo validara mal la condición del while e hiciera un ciclo infinito, podría construir un programa que creara millones de copias del archivo, como estas tienen nombres distintos, cada copia ocupará espacio en el disco hasta llenarlo. Esto lo podríamos conseguir cambiando un par de instrucciones en el siguiente código.



In [None]:
# Ejemplo: Programa que escribe 1.000 archivos con el mismo texto
i = 0
while i < 1000:
  nombre_archivo = 'archivo' + str(i) + '.txt'
  with open(nombre_archivo, 'w') as archivo:
    archivo.write('el mismo texto')
  i = i + 1

# Bibliografía

Ceder, V. L. (2010). Using the filesystem. En *The Quick Python Book* (2.a ed., p. 147). Manning Publications.

GeeksforGeeks. (2022, 16 mayo). *File Handling in Python*. Recuperado 5 de agosto de 2022, de https://www.geeksforgeeks.org/file-handling-python/

Shaw, Z. (2017). Reading files. En *Learn Python 3 the Hard Way* (p. 48). Addison-Wesley.