# ⚡ *`Manipulación de archivos (ficheros)`* ⚡

## Manipulación de archivos

Recomendado, ver clase en video de MoureDev:

https://youtu.be/TbcEqkabAWU?t=15524

### Método with open

Esta es la forma general en la que se van a manipular todos los archivos, salvo excepciones que requieran importar algunas librerías, o se destaquen algunas otras formas de hacerlo.

- Es una forma segura y limpia de manejar archivos.
- Se asegura de cerrar el archivo automáticamente cuando termina el bloque, aunque haya un error.

> Ventaja: No se necesita usar file.close(): el archivo se cierra solo al salir del bloque.

| Tipo de archivo                 | ¿Se puede abrir con `open`?                     | Notas                                                  |
|--------------------------------|--------------------------------------------------|--------------------------------------------------------|
| `.txt`, `.csv`                 | ✅ Sí                                            | Lectura y escritura directa como texto.                |
| `.json`                        | ✅ Sí                                            | Usás `json.load(f)` o `json.dump(...)`.                |
| `.xml`, `.html`                | ✅ Sí                                            | Ideal usar librerías específicas para parsear.         |
| `.log`, `.md`, etc.            | ✅ Sí                                            | Cualquier texto plano.                                 |
| `.jpg`, `.png`, `.mp3`, `.pdf`, `.exe` | ⚠️ Sí, pero en modo binario (`'rb'`, `'wb'`) | No se leen como texto, sino como bytes.                |


#### Esta es la forma más utilizada con `with open`

In [None]:
path = "../files/archivo_prueba.txt"
texto_1 = "\nAbriendo el archivo con with open"
texto_2 = "\nEscribiendo en el archivo con with"

with open(path, "a", encoding='utf-8') as file:
    file.write(texto_1)
    file.write(texto_2)

# argumentos del método with open()
# ruta: la ubicación del archivo (puede ser absoluta o relativa).
# modo: define cómo se abrirá el archivo (ver tabla más abajo).
# encoding (opcional): se recomienda 'utf-8' para archivos de texto en español.

#### 📌 ¿Qué argumentos recibe with open(...)?

La función `open()` recibe varios argumentos, pero los más comunes son:

- `file`: Ruta del archivo (puede ser relativa o absoluta).
- `mode`: Modos de apertura. Algunos ejemplos:
  - `"r"`: lectura (read),
  - `"w"`: escritura (sobrescribe),
  - `"a"`: agregar contenido (append),
  - `"b"`: modo binario (por ejemplo `"rb"` para leer binario),
  - `"x"`: crear nuevo archivo (falla si ya existe).
- `encoding`: Codificación del archivo, por ejemplo `'utf-8'`. Recomendado para trabajar con texto.

🔸 En el ejemplo:

```python
with open(path, "a", encoding='utf-8') as file:

```


#### Modos para abrir archivos en Python con `open()` (los más usados)

| Modo  | Lectura | Escritura | Crea si no existe | Sobrescribe | Empieza al inicio | Añade al final | Descripción |
|-------|---------|-----------|-------------------|--------------|-------------------|----------------|-------------|
| `"r"`   | ✅ Sí     | ❌ No      | ❌ No              | ❌ No         | ✅ Sí              | ❌ No           | Lee un archivo. Falla si no existe. |
| `"w"`   | ❌ No     | ✅ Sí      | ✅ Sí              | ✅ Sí         | ✅ Sí              | ❌ No           | Escribe (sobrescribe) un archivo. Lo borra si existe. |
| `"a"`   | ❌ No     | ✅ Sí      | ✅ Sí              | ❌ No         | ❌ No              | ✅ Sí           | Escribe al final del archivo. No borra lo anterior. |
| `"r+"`  | ✅ Sí     | ✅ Sí      | ❌ No              | ❌ No*        | ✅ Sí              | ❌ No           | Lee y escribe sin borrar. No crea si no existe. Puede dejar basura si no usás `truncate()`. |
| `"w+"`  | ✅ Sí     | ✅ Sí      | ✅ Sí              | ✅ Sí         | ✅ Sí              | ❌ No           | Lee y escribe, pero borra todo al abrir. |
| `"a+"`  | ✅ Sí     | ✅ Sí      | ✅ Sí              | ❌ No         | ❌ No              | ✅ Sí           | Lee y escribe al final. No borra nada, útil para logs. |


Detalles extra:

- "r" y "r+" fallan si el archivo no existe.

- "w" y "w+" crean el archivo y lo borran si ya existe.

- "a" y "a+" agregan contenido al final, sin borrar lo anterior.

- En "a+", para leer primero, hay que hacer seek(0) para ir al principio.

Tabla con todos los modos:

| Modo    | Significado              | Descripción rápida                                                                 |
|---------|--------------------------|-------------------------------------------------------------------------------------|
| `"r"`   | Read                     | Solo lectura. Falla si el archivo no existe.                                       |
| `"w"`   | Write                    | Solo escritura. Crea el archivo si no existe y sobrescribe si existe.             |
| `"a"`   | Append                   | Solo escritura. Crea el archivo si no existe y agrega al final si ya existe.      |
| `"r+"`  | Read + Write             | Lectura y escritura. No crea el archivo si no existe. No borra contenido anterior. Puede dejar basura si no usás `truncate()`. |
| `"w+"`  | Write + Read             | Escritura y lectura. Borra el contenido del archivo si existe. Lo crea si no existe. |
| `"a+"`  | Append + Read            | Escritura al final + lectura. Crea si no existe. No borra el contenido.           |
| `"x"`   | Create (exclusive)       | Crea un nuevo archivo. Falla si ya existe. Evita sobreescritura.                  |
| `"x+"`  | Create + Read/Write      | Crea archivo y permite lectura/escritura. Falla si ya existe.                     |
| `"rb"`  | Read Binary              | Lectura en modo binario (por ejemplo, imágenes, audio, PDF).                      |
| `"wb"`  | Write Binary             | Escritura en modo binario. Crea y borra si ya existe.                             |
| `"ab"`  | Append Binary            | Escritura en modo binario al final del archivo.                                   |
| `"rb+"` | Read + Write Binary      | Lectura y escritura en binario. No borra contenido.                               |
| `"wb+"` | Write + Read Binary      | Escritura y lectura en binario. Borra todo al abrir.                              |
| `"ab+"` | Append + Read Binary     | Agrega contenido binario al final + lectura. No borra.                            |
| `"xb"`  | Create Binary            | Crea nuevo archivo binario. Falla si ya existe.                                   |
| `"xb+"` | Create + Read/Write Bin  | Crea archivo binario y permite lectura/escritura. Falla si ya existe.             |


### Archivos .txt

#### Utilizando pathlib
Si el archivo no existe genera un error, por lo que es necesario crearlo previamente 

In [46]:
from pathlib import Path
from time import ctime

archivo = Path("../files/archivo.txt")

# archivo.exists()
# archivo.rename()
# archivo.unlink()

# print(archivo.stat())

print("acceso:", ctime(archivo.stat().st_atime))
print("creación:", ctime(archivo.stat().st_ctime)) 
print("modificación:", ctime(archivo.stat().st_mtime))

acceso: Sun Apr 13 06:34:54 2025
creación: Sun Apr 13 06:33:07 2025
modificación: Sun Apr 13 06:34:51 2025


##### Escribir en el archivo

In [47]:
texto = archivo.read_text("utf-8").split("\n")
texto.insert(0, "Hola mundo")
archivo.write_text("\n".join(texto), "utf-8")

22

##### Leer el texto

In [48]:
texto = archivo.read_text()
print(texto)

Hola mundo
Hola mundo



#### De otra forma, con "open" (forma recomendada)

#### Escritura
Con esta forma, si el archivo no existe, lo crea

In [None]:
# No es necesaria la importación de io para abrir archivos en modo texto, pero es recomendable
# from io import open

# "w" escritura, si no existe lo crea. Si existe, lo sobreescribe
texto = "Yo, soy Iron man"
archivo = open("../files/archivo.txt", "w", encoding='utf-8') # para que pueda leer caracteres especiales como ñ, tildes, etc.
archivo.write(texto)
archivo.close()

#### Agregar texto

In [207]:
# Escribir y sobrescribir si ya existe
# Importante
# No olvidar el parámetro de encoding='utf-8' para que pueda leer caracteres especiales como ñ, tildes, etc.
archivo = open("../files/archivo.txt", "a+", encoding='utf-8')
texto_1 = "\nMi verdadero nombre es Nahuel\nMi lenguaje preferido es Python"
texto_2 = "\nAunque también me gusta JavaScript"

# Escribir en el archivo
archivo.write(texto_1)
archivo.write(texto_2)

archivo.close()

#### Lectura

In [208]:
##### lectura
archivo = open("../files/archivo.txt", "r", encoding='utf-8')
texto = archivo.read()
archivo.close()
print(texto)

Yo, soy Iron man
Mi verdadero nombre es Nahuel
Mi lenguaje preferido es Python
Aunque también me gusta JavaScript


#### Lectura como lista

In [209]:
##### lectura como lista
archivo = open("../files/archivo.txt", "r", encoding='utf-8')
texto = archivo.readlines()
archivo.close()
print(texto)

['Yo, soy Iron man\n', 'Mi verdadero nombre es Nahuel\n', 'Mi lenguaje preferido es Python\n', 'Aunque también me gusta JavaScript']


#### with
con with no es necesario tener que abrir y cerrar la conexión (recomendado)

#### Escribir y agregar

In [210]:
path = "../files/archivo.txt"
texto_1 = "\nAbriendo el archivo con with"
texto_2 = "\nEscribiendo en el archivo con with"

with open(path, "a", encoding='utf-8') as file:
    file.write(texto_1)
    file.write(texto_2)

#### Lectura por lista

In [211]:
path = "../files/archivo.txt"
with open(path, "r", encoding='utf-8') as archivo:
    # cargar todo el archivo en una lista
    print("Lectura por lista con readlines() : ")
    lista = archivo.readlines()
    print(lista)
    print(lista[0])

Lectura por lista con readlines() : 
['Yo, soy Iron man\n', 'Mi verdadero nombre es Nahuel\n', 'Mi lenguaje preferido es Python\n', 'Aunque también me gusta JavaScript\n', 'Abriendo el archivo con with\n', 'Escribiendo en el archivo con with']
Yo, soy Iron man



#### Lectura línea por línea

Método seek() para moverse por el archivo

Se le pasa por argumento, un número para indicar la posición en el texto

In [212]:
path = "../files/archivo.txt"

with open(path, "r", encoding='utf-8') as archivo:
    # carga línea por línea
    print("Lectura línea por línea con seek() y for:\n")
    # seek(0) para volver al inicio del archivo y poder leerlo nuevamente
    archivo.seek(0)
    for linea in archivo:
        print(linea)

Lectura línea por línea con seek() y for:

Yo, soy Iron man

Mi verdadero nombre es Nahuel

Mi lenguaje preferido es Python

Aunque también me gusta JavaScript

Abriendo el archivo con with

Escribiendo en el archivo con with


#### Lectura y escritura en una posición específica

In [None]:
path = "../files/archivo.txt"
# r+ para leer y escribir
# w+ para escribir y leer, pero borra el contenido del archivo
# a+ para añadir y leer, pero no borra el contenido del archivo
with open(path, "r+", encoding='utf-8') as archivo:
    texto = archivo.readlines()
    print(texto)
    archivo.seek(0)
    # sobreescribiendo la primera línea, en la lista es la posición 0
    # pero en el archivo es la línea 1
    texto[0] = "Yo, soy Batman\n"
    # retorna la lista sin la última modificación
    archivo.writelines(texto)
    archivo.truncate()
    
# ¿Por qué archivo.truncate() al final?
# Si el nuevo contenido total ocupa menos bytes que el original, los caracteres que quedaron del contenido anterior no se borran automáticamente, y se mantienen ahí. Por eso, van a aparecer letras “fantasmas”, que en realidad son letras que quedan de remanente del contenido anterior.
    

['Yo, soy Batman\n', 'Mi verdadero nombre es Nahuel\n', 'Mi lenguaje preferido es Python\n', 'Aunque también me gusta JavaScript\n', 'Abriendo el archivo con with\n', 'Escribiendo en el archivo con with']


In [216]:
print("\nIterando el archivo con for y escribiendo cada línea:\n")
for linea in texto:
    print(linea)


Iterando el archivo con for y escribiendo cada línea:

Yo, soy Batman

Mi verdadero nombre es Nahuel

Mi lenguaje preferido es Python

Aunque también me gusta JavaScript

Abriendo el archivo con with

Escribiendo en el archivo con with


#### Eliminar el archivo

In [62]:
import os

os.remove("../files/archivo.txt")

### Archivos JSON

- Leer un JSON desde archivo con json.load()
- Guardar un diccionario en un archivo con json.dump()
- Convertir diccionarios a JSON y viceversa (json.dumps() / json.loads())

In [None]:
import json
from pathlib import Path

# JSON
# JavaScript Object Notation
# Este es el formato más común por el cual las APIs, sobre todo
# las APIs REST, comparten o brindan información cuando se las
# consume. "Te envían un JSON".

# escribir json
# productos = [
#     {"id":1, "name": "Surfboard"},
#     {"id":2, "name": "Bicicleta"},
#     {"id":3, "name": "Skate"},
# ]

# data = json.dumps(productos)
# print(data)

# Path("archivos/productos.json").write_text(data)

# leer json
data = Path("../files/productos.json").read_text(encoding="utf-8")
productos = json.loads(data)
print(productos)

# modificar json
productos[0]["name"] = "Medialunas"
Path("archivos/productos.json").write_text(json.dumps(productos))
print(productos)


In [None]:
### File Handling ###

import xml
import csv
import json
import os

# Clase en vídeo (03/11/22): https://www.twitch.tv/videos/1642512950

# .json file


json_file = open("../files/my_file.json", "w+")

json_test = {
    "name": "Brais",
    "surname": "Moure",
    "age": 35,
    "languages": ["Python", "Swift", "Kotlin"],
    "website": "https://moure.dev"}

json.dump(json_test, json_file, indent=2)

json_file.close()

with open("../files/my_file.json") as my_other_file:
    for line in my_other_file.readlines():
        print(line)

json_dict = json.load(open("Intermediate/my_file.json"))
print(json_dict)
print(type(json_dict))
print(json_dict["name"])


# .xlsx file
# import xlrd # Debe instalarse el módulo

# .xml file

# ¿Te atreves a practicar cómo trabajar con este tipo de ficheros?


### Archivos .csv

- Leer archivos CSV con csv.reader() o csv.DictReader()
- Escribir con csv.writer() o csv.DictWriter()
> Cuidado con los delimitadores si no es coma (,), a veces son ; o \t

In [None]:
# .csv file

csv_file = open("Intermediate/my_file.csv", "w+")

csv_writer = csv.writer(csv_file)
csv_writer.writerow(["name", "surname", "age", "language", "website"])
csv_writer.writerow(["Brais", "Moure", 35, "Python", "https://moure.dev"])
csv_writer.writerow(["Roswell", "", 2, "COBOL", ""])

csv_file.close()

with open("Intermediate/my_file.csv") as my_other_file:
    for line in my_other_file.readlines():
        print(line)

In [None]:
import csv
import os

# escribir
with open("archivos/archivo.csv", "w") as archivo:
    writer = csv.writer(archivo)
    writer.writerow(["twit_id", "user_id", "text"]) 
    writer.writerow([1000, 1, "Este es un twit"]) 
    writer.writerow([1001, 2, "otro twit!"])
    

# leer 
with open("archivos/archivo.csv") as archivo:
    reader = csv.reader(archivo)
    print(list(reader))
    archivo.seek(0)
    for linea in reader:
        print(linea)
        
# actualizar CSV
with open("archivos/archivo.csv") as r, open("archivos/archivo_temp.csv", "w") as w:
    reader = csv.reader(r)
    writer = csv.writer(w)
    for linea in reader:
        if linea[0] == "1000":
            writer.writerow([1000, 1, "texto modificado"])
        else:
            writer.writerow(linea)
    os.remove("archivos/archivo.csv")
    os.rename("archivos/archivo_temp.csv", "archivos/archivo.csv")

### Archivos comprimidos

In [None]:
from pathlib import Path
from zipfile import ZipFile

# para comprimir archivos
with ZipFile("../files/comprimidos.zip", "w") as zip:
    # el primer * es para cualquier nombre de archivo
    # el segundo * es para indicar cualquier extensión
    # cualquier archivo que tenga cualquier nombre y cualquier extensión: "*.*"
    for path in Path().rglob("*.*"):
         print(path)
         if str(path) != "archivos/comprimidos.zip":
             zip.write(path)
         

# para leer de archivos comprimidos
with ZipFile("archivos/comprimidos.zip") as zip:
    # print(zip.namelist())
    info = zip.getinfo("archivos/comprimidos.py")  
    print(
        info.file_size,
        info.compress_size
    )   
    zip.extractall("archivos/descomprimidos")





## Ejercicios

## **Fin Notebook**