# Introducción


*   La memoria del computador permite almacenar datos (valores y programas) con los que el computador puede ejecutar una tarea.
*   Existen dispositivos externos a la memoria donde se pueden guardar datos que pueden ser usados por el computador. Estos pueden ser discos duros, cintas, memorias SD, USB, CD’s, entre otras.
*  Un archivo es una unidad lógica de almacenamiento de datos en dispositivos externos (no memoria principal). Se dice unidad lógica porque todos los bytes almacenados en un archivo se ven como una sola unidad que tiene un inicio y un fin, sin importar lo que esos bytes estén representando.
*  El tamaño (coloquialmente peso) de un archivo es el número de bytes que almacena.



# Tipos
Aunque existen muchos tipos de archivos, los programadores los clasifican en dos tipos básicos:


*   Texto: Cuando cada byte representa un ASCII (en algunos casos UTF-8 o UTF-16) como los archivos .txt; los de páginas web .html; los de código fuente en muchos lenguajes de programación .py, .c, .java, .cpp, .tex; los de formato abierto para representar datos en forma de tabla como .csv.
*   Binario: Cuando cada byte representa algo diferente o requiere un conjunto de bytes para representar algo, como los archivos de imagen .jpg, .png, de documento .doc, .pdf, .xls, .ods, comprimidos .rar, .zip, entre otros.



# Operaciones


*   Crear:  Crear un archivo en un dispositivo externo desde el programa.
*   Abrir: Darle permiso al programa de acceder al contenido almacenado por el archivo en diferentes modos, ya sea leer (traer datos del archivo al programa), escribir (guardar datos del programa en el archivo), adicionar (agregar datos del programa al final del archivo), y/o moverse.
*  Cerrar: Quitarle al programa el permiso de leer, escribir, adicionar, y/o moverse en el contenido del archivo.
*  Eliminar: Remover desde el programa un archivo de un dispositivo externo.




# Confirguración de la practica


*   Descarguue los archivos desde el siguiente [link](https://github.com/arleserp/MinTIC2022/raw/master/files.zip)
*   Descrompima el zip
*   Cargue los archivos a **COLAB**



# Modos de apertura de un archivo


## Direccionamiento
Es posible trabajar con direccionamiento absoluto o relativo en Python. En los siguientes ejemplos se realizará direccionamiento relativo a partir de la carpeta donde se ejecuta el código. En esta carpeta hay una carpeta llamada files y por ejemplo, allí se encuentra el archivo 'data.txt'.


Para dar soporte a los diferentes sistemas operativos como Windows y Linux, y trabajar con direccionamiento absoluto se toma como nombre del archivo la ruta completa del archivo:


*   "C:\\ThisFolder\\workData.txt"
*   "C:/ThisFolder/workData.txt"



## Abrir y leer un archivo (open y with)

El comando open(ruta del archivo, ’r’) toma un nombre de archivo y modo como argumentos. r abre el archivo en modo de lectura (read). Adicionalmente y como buena práctica de programación en Python se utilizará el comando with que permite cerrar el archivo automáticamente y asegura un uso propio del archivo, mientras éste está bajo el alcance del entorno del comando with.

In [1]:
with open("files/data.txt", "r") as f:
  data = f.read()
  print(data)

FileNotFoundError: [Errno 2] No such file or directory: 'files/data.txt'

## Escribir y crear un archivo (open y with)
El comando open(ruta del archivo, ’w’) abre el archivo en modo de escritura creando el archivo si no existe (write)  ́o sobreescribiendo el archivo si existe. El siguiente código crea el archivo wdata.txt en la carpeta files:

In [3]:
with open("files/wdata.txt", "w") as f:
  data = "estamos escribiendo en el archivo 123\n"
  f.write(data)
  f.write(data)
  f.write(data)

## Agregar contenido a un archivo existente (open y with)
El comando open(ruta del archivo, ’a’) abre el archivo en modo de adjuntar creando el archivo si no existe (append )  ́o escribiendo al final del archivo si existe. El siguiente código escribe al final del archivo wdata.txt:

In [None]:
with open("files/wdata.txt", "a") as f: 
  data = "más cosas\n"
  f.write(data)
  f.write(data)
  f.write(data)

## Otros modos de apertura de archivos
Otros modos de abrir archivos en Python son


*   'r+': (read /write ) Este modo es usado cuando se desean hacer cambios al archivo y a la vez leer información. El puntero del archivo se ubica al principio del archivo.
*   'a+': (append /read ) Se abre el archivo para escribir y leer del archivo. El puntero del archivo se ubica al final del archivo.
*  '-x': (exclusive creation ): usado exclusivamente para crear un archivo. Si existe un archivo con el mismo nombre la función fallará.
*  b: Para leer archivos binarios se agrega la letra b al final del modificador. Por ejemplo, para leer “rb”, y los otros serían “wb”, “ab”, “r+b” y “a+b”.


# Lecturas de archivos

## Lectura de un archivo de texto (read)
Para leer el contenido de un archivo se puede usar read(). Sin parámetros, leerá el archivo entero y almacenará el contenido como un string, si es un archivo de texto o como objetos en bytes si se trata de un archivo binario. Si se trata de leer un archivo más grande que la memoria disponible no se podrá leer todo el archivo de una vez.

In [4]:
with open("files/data1.txt", "r") as f:
  print(f.read())


Esta es la línea 1: abcabcabc
Esta es la línea 2: abcabcabc
Esta es la línea 3: abcabcabc


## Lectura de un archivo con t ́ıldes (read)
En caso de tener problemas de codificación se puede agregar el parámetro encoding="utf-8" al comando with open. El siguiente código abre el archivo para lectura y especifica que tiene como juego de caracteres la codificación utf-8:

In [5]:
with open("files/data1.txt", "r", encoding="utf-8") as f:
    print(f.read())

Esta es la línea 1: abcabcabc
Esta es la línea 2: abcabcabc
Esta es la línea 3: abcabcabc


## Leer byte a byte (read)
En algunos casos no se desea leer la totalidad del contenido de un archivo, sino solamente una fracción, en ese caso el comando read() admite un paráametro entero que especifica cuantos bytes se leen y deja el apuntador justo después del último byte leído.


In [6]:
with open("files/data1.txt", "r", encoding="utf-8") as f:
  linea1 = f.read(6)
  linea2 = f.read(10)
  
print(linea1)
print(linea2)

Esta e
s la línea


## Leer archivo línea por línea
Es posible leer un archivo línea por línea utilizando el comando readline(). Esta es una forma eficiente en memoria de leer un archivo


In [7]:
with open("files/data1.txt", "r", encoding="utf-8") as f:
    linea1 = f.readline()
    linea2 = f.readline()
print(linea1, end="")
print(linea2, end="")

Esta es la línea 1: abcabcabc
Esta es la línea 2: abcabcabc


## Cargar las líneas de un archivo como una lista
Es posible cargar todas las líneas del archivo como una lista si se utiliza el comando readlines().


In [8]:
with open("files/data1.txt", "r", encoding="utf-8") as f:
    print("Nombre del archivo: ", f.name)
    lista = f.readlines()
print(lista)


Nombre del archivo:  files/data1.txt
['Esta es la línea 1: abcabcabc\n', 'Esta es la línea 2: abcabcabc\n', 'Esta es la línea 3: abcabcabc']


## Procesar un archivo de forma eficiente
La forma más sencilla y eficiente, de abrir y procesar un archivo de texto es iterar línea por línea el archivo, así como se muestra a continuación

In [10]:
with open("files/data1.txt", "r", encoding="utf-8") as f:
  for line in f:
    print(line, end="")

Esta es la línea 1: abcabcabc
Esta es la línea 2: abcabcabc
Esta es la línea 3: abcabcabc

# Escritura de archivos



## Escritura de archivos

A menudo se prefiere utilizar a+ como el modo de apertura para escribir un archivo porque permite añadir datos al final del mismo. Utilizar w+ borrará cualquier dato que existe en el archivo y pues produciráa un archivo en limpio para trabajar.


In [11]:
with open("files/data2.txt", "a+", encoding="utf-8") as f: 
  f.write("\nEsta es la l ́ınea 4: abcabcabc")

## Escribir datos que no son de tipo cadena en un archivo
Si se desea escribir datos que no son cadenas de texto en un archivo es necesario convertir cada dato a string con el comando str() así como se muestra a continuación.


In [12]:
values = [1234, 5678, 9012, 3.14159265, False]
with open("files/data3.txt", "w+") as f:
  for value in values:
      str_value = str(value)
      f.write(str_value)
      f.write("\n")

## Seek: ubicarse en un archivo

A veces es necesario moverse al principio del archivo o a alguna posición específica en un archivo dado. La forma más fácil de hacerlo es utilizar el comando o método


```
seek(offset, from_what)
```

offset es el número de bytes desde la posición from_what.

Hay algunos valores por defecto para la posición from_what así:



*   0: Principio del archivo
*   1: Posición actual
*   2: Al final del archivo

Con archivos de texto 0 ó seek(0,2), lo llevarán al final del archivo.




In [13]:
with open("files/data4.txt", "r", encoding="utf-8") as f:
  f.seek(11,0)
  for line in f:
      print(line, end="")

letras
1234
5678


# Otras operaciones de interés


## Determinar tamaño de un archivo en bytes
Para obtener la longitud de un archivo o la posición en donde se encuentra dentro del archivo se puede usar el método o comando


```
tell()
```



In [14]:
with open("files/data4.txt", "a+") as f:
  print(f.tell())

31


# Editando archivos
La forma más fácil de editar un archivo dado es guardar el archivo entero en una lista y utilizar el comando list.insert(i,x), que permite insertar nuevos datos a la lista. Una vez creada la lista se puede unir (join) de nuevo y escribir ésto en el archivo.

In [15]:
with open("files/data5.txt", "r", encoding="utf-8") as f:
  list_content = f.readlines()
list_content.insert(1, "Esta es la l ́ınea 1.5: jajaja\n")
with open("files/data5.txt", "w", encoding="utf-8") as f:
    contenido = "".join(list_content)
    f.write(contenido)

# Listar archivos y directorios
En las versiones modernas de Python una alternativa a os.listdir() es utilizar os.scandir() (desde Python 3.5) y pathlib.Path(). El módulo os trae funciones de utilidad para remover archivos (remove), crear directorios (mkdir(path)), etc.

In [16]:
import os
entries = os.scandir("files/")
for entry in entries:
    print(entry.name + ", es directorio: "
    + str(entry.is_dir()) + ", size: " +
    str(entry.stat().st_size) + " bytes.")

data.txt, es directorio: False, size: 14 bytes.
data4.txt, es directorio: False, size: 31 bytes.
wdataegghgg.txt, es directorio: False, size: 36 bytes.
python_es.txt, es directorio: False, size: 33754 bytes.
data5.txt, es directorio: False, size: 126 bytes.
copy.jpg, es directorio: False, size: 59808 bytes.
.ipynb_checkpoints, es directorio: True, size: 4096 bytes.
data1.txt, es directorio: False, size: 94 bytes.
data3.txt, es directorio: False, size: 32 bytes.
data2.txt, es directorio: False, size: 164 bytes.
discurso.jpg, es directorio: False, size: 59808 bytes.
programming_powers.pkl, es directorio: False, size: 154 bytes.
wdatas.txt, es directorio: False, size: 117 bytes.
wdata.txt, es directorio: False, size: 114 bytes.
names.txt, es directorio: False, size: 220 bytes.
SalesJan2009.csv, es directorio: False, size: 130480 bytes.


# El módulo pickle


## Guardar estructuras de datos en archivos: pickle
A veces se desea almacenar información contenida en objetos Python, (diccionarios ó listas por ejemplo). En este caso se puede utilizar el módulo pickle con su método dump, para serializar objetos.

In [None]:
import pickle
name = ["mohit", "bhaskar", "manish"]
skill = ["Python", "Python", "Java"]
dict1 = dict([(k,v) for k,v in zip(name, skill)])
with open("files/programming_powers.pkl", "wb") as p_file:
  pickle.dump(name, p_file)
  pickle.dump(skill, p_file)
  pickle.dump(dict1, p_file)

## Cargar estructuras de datos desde archivos: pickle
Para realizar el proceso inverso de serialización (leer de archivo los objetos serializados con pickle), se puede seguir el método load

In [17]:
import pickle
with open("files/programming_powers.pkl", "rb") as p_file:
    list1 = pickle.load(p_file)
    list2 = pickle.load(p_file)
    dict1 = pickle.load(p_file)
print(list1)
print(list2)
print(dict1)

['mohit', 'bhaskar', 'manish']
['Python', 'Python', 'Java']
{'mohit': 'Python', 'bhaskar': 'Python', 'manish': 'Java'}


# Copiar un archivo binario
Una imagen de tipo *.jpg es un archivo de tipo binario. Con cierto procesamiento es posible crear una copia de la imagen de la siguiente manera


In [18]:
with open("files/discurso.jpg", "rb") as imagen:
  data = imagen.read()
with open("files/copy.jpg", "wb") as f:
  f.write(data)

# Sugerencia
Se sugiere consultar un manual de Python o de sus librerías para determinar si ya existe un método para lo que se quiera realizar con respecto a archivos.

# Ejericios


*   Dado el archivo de texto files/SalesJan2009.csv, procese el archivo para obtener las compras realizadas en un país dado
*   Dado el archivo de texto files/SalesJan2009.csv, procese el archivo para obtener las compras realizadas con un medio de pago dado.

