# **SEMANA 7 - ARCHIVOS Y FORMATOS DE DATOS**

Nuestro objetivo será aprender a usar Python para automatizar tareas repetitivas de manejo de archivos y datos, aprovechando módulos de la librería estándar (os, shutil, csv, json, zipfile) y comprendiendo la noción de scripts CLI (argparse).

# Módulos os y shutil

Con os y shutil aprenderás a interactuar con el sistema operativo desde Python: crear, mover, copiar y borrar archivos o carpetas, listar directorios y automatizar tareas de organización que normalmente harías a mano.

Esto convierte a Python en un asistente para manejar tu computadora y datos de forma más rápida y repetible.

# Archivos CSV y JSON
CSV y JSON son los formatos de datos más usados en el mundo real: CSV se asocia a Excel y Google Sheets, mientras que JSON es el lenguaje estándar para APIs y aplicaciones web.

Dominar su lectura y escritura en Python te permite integrar tus programas con hojas de cálculo, sistemas externos y flujos de datos modernos.

# Comprensión y descompresión (zipfile)
Con el módulo zipfile verás cómo comprimir y descomprimir archivos directamente en Python, algo esencial para automatizar respaldos, enviar datasets o empaquetar proyectos.

Esto evita hacerlo manualmente y te da control sobre cómo compartes y recibes información en entornos profesionales.

Comencemos con la semana.

# Módulos OS y shutil

En proyectos no basta con trabajar con datos dentro de Python.

Muchas veces necesitas *interactuar con el sistema operativo* para crear carpetas, mover archivos, limpiar directorios o automatizar procesos repetitivos.

-El módulo *os* te permite comunicarte directamente con el sistema de archivos: listar, crear, eliminar y mover carpetas/archivos.

-El módulo *shutil* complementa con operaciones de más alto nivel, como copiar, mover o comprimir directorios completos.

Con estas herramientas, Python se convierte en un *administrador automático de archivos*, algo que puedes usar en Google Colab, en tu computadora o en servidores reales.

## El módulo os. Acceso al sistema operativo
El módulo os es la puerta de entrada a funcionalidades básicas del sistema operativo.

Permite interactuar con el sistema de archivos.

En *Colab*, esto significa trabajar en el espacio temporal que se crea cuando abres la sesión (si no montas Google Drive, todo se borra al cerrar).

In [1]:
import os

# Mostrar el directorio actual
print("Directorio actual:", os.getcwd())

# Crear una carpeta
os.mkdir("carpeta_demo")

# Listar archivos y carpetas en el directorio actual
print("Contenido después de crear carpeta:", os.listdir())

# Crear subcarpetas de forma anidada
os.makedirs("carpeta_demo/subcarpeta/subsubcarpeta")
print("Contenido carpeta_demo:", os.listdir("carpeta_demo"))

# Renombrar carpeta
os.rename("carpeta_demo", "carpeta_renombrada")
print("Contenido tras renombrar:", os.listdir())

# Eliminar carpeta vacía
os.rmdir("carpeta_renombrada/subcarpeta/subsubcarpeta")

Directorio actual: /content
Contenido después de crear carpeta: ['.config', 'carpeta_demo', 'sample_data']
Contenido carpeta_demo: ['subcarpeta']
Contenido tras renombrar: ['.config', 'carpeta_renombrada', 'sample_data']


En Colab, si intentas borrar una carpeta con contenido, os.rmdir() dará error. Para eso entra shutil.

## Módulo shutil. Operaciones con mayor nivel
El módulo shutil complementa a os con funciones de nivel más alto: copiar, mover o borrar directorios completos.

In [2]:
import shutil

# Crear un archivo de prueba
with open("demo.txt", "w") as f:
    f.write("Hola desde Colab!")

# Copiar archivo
shutil.copy("demo.txt", "demo_copia.txt")
print("Archivos después de copiar:", os.listdir())

# Mover archivo
shutil.move("demo_copia.txt", "demo_movido.txt")
print("Archivos después de mover:", os.listdir())

# Crear un directorio con archivos
os.makedirs("backup", exist_ok=True)
with open("backup/file1.txt", "w") as f:
    f.write("Respaldo 1")

with open("backup/file2.txt", "w") as f:
    f.write("Respaldo 2")

print("Contenido de backup:", os.listdir("backup"))

# Copiar directorio completo
shutil.copytree("backup", "backup_copia")
print("Carpetas tras copytree:", os.listdir())

# Eliminar directorio completo
shutil.rmtree("backup_copia")
print("Carpetas tras eliminar:", os.listdir())

Archivos después de copiar: ['.config', 'demo.txt', 'carpeta_renombrada', 'demo_copia.txt', 'sample_data']
Archivos después de mover: ['.config', 'demo.txt', 'carpeta_renombrada', 'demo_movido.txt', 'sample_data']
Contenido de backup: ['file1.txt', 'file2.txt']
Carpetas tras copytree: ['.config', 'demo.txt', 'carpeta_renombrada', 'backup_copia', 'demo_movido.txt', 'backup', 'sample_data']
Carpetas tras eliminar: ['.config', 'demo.txt', 'carpeta_renombrada', 'demo_movido.txt', 'backup', 'sample_data']


## Ejemplo integrado
Imagina que estás corriendo experimentos en Colab y quieres organizar los resultados en carpetas por *fecha*.

In [3]:
import os
import shutil
from datetime import datetime

# Crear una carpeta con la fecha actual
fecha = datetime.now().strftime("%Y-%m-%d")
carpeta_resultados = f"resultados_{fecha}"
os.makedirs(carpeta_resultados, exist_ok=True)

# Generar archivos simulados
for i in range(1, 4):
    with open(f"experimento_{i}.txt", "w") as f:
        f.write(f"Resultado del experimento {i}")

print("Archivos creados en raíz:", os.listdir())

# Mover todos los archivos de experimento a la carpeta de resultados
for archivo in os.listdir():
    if archivo.startswith("experimento_"):
        shutil.move(archivo, os.path.join(carpeta_resultados, archivo))

print("Contenido en carpeta de resultados:", os.listdir(carpeta_resultados))

Archivos creados en raíz: ['.config', 'demo.txt', 'carpeta_renombrada', 'demo_movido.txt', 'experimento_1.txt', 'resultados_2025-12-17', 'experimento_2.txt', 'experimento_3.txt', 'backup', 'sample_data']
Contenido en carpeta de resultados: ['experimento_1.txt', 'experimento_2.txt', 'experimento_3.txt']


Este flujo refleja un caso real en Colab.

-Crear archivos de salida

-Agruparlos por fecha

-Organizarlos automáticamente.

----

## Ejercicio 1
Crea una carpeta llamada dataset y dentro tres subcarpetas: train, test, validation.

Luego, muestra en pantalla la lista de subcarpetas creadas.

In [4]:
import os

# Crear estructura de carpetas
os.makedirs("dataset/train", exist_ok=True)
os.makedirs("dataset/test", exist_ok=True)
os.makedirs("dataset/validation", exist_ok=True)

# Listar contenido
print("Subcarpetas dentro de dataset:", os.listdir("dataset"))

Subcarpetas dentro de dataset: ['validation', 'test', 'train']


## Ejercicio 2
Crea un archivo data.txt con el texto "sample data".

Después, haz una copia llamada data_backup.txt.

Finalmente, mueve el archivo original a la carpeta dataset/train.

In [5]:
import shutil

# Crear archivo
with open("data.txt", "w") as f:
    f.write("sample data")

# Copiar archivo
shutil.copy("data.txt", "data_backup.txt")

# Mover archivo original a dataset/train
shutil.move("data.txt", "dataset/train/data.txt")

print("Archivos en dataset/train:", os.listdir("dataset/train"))
print("Archivos en raíz:", os.listdir())

Archivos en dataset/train: ['data.txt']
Archivos en raíz: ['.config', 'demo.txt', 'carpeta_renombrada', 'demo_movido.txt', 'dataset', 'resultados_2025-12-17', 'data_backup.txt', 'backup', 'sample_data']


## Ejercicio 3
Dentro de la carpeta dataset/test, crea un archivo test.txt con el texto "test file".

Después, elimina por completo la carpeta dataset/test (aunque contenga ese archivo).

In [6]:
# Crear archivo dentro de dataset/test
with open("dataset/test/test.txt", "w") as f:
    f.write("test file")

print("Contenido de dataset/test antes de borrar:", os.listdir("dataset/test"))

# Eliminar carpeta completa
shutil.rmtree("dataset/test")

print("Contenido de dataset después de eliminar test:", os.listdir("dataset"))

Contenido de dataset/test antes de borrar: ['test.txt']
Contenido de dataset después de eliminar test: ['validation', 'train']


-------------

# Archivos CSV y JSON


En la práctica, pocas veces guardamos datos en .txt simples.

Los formatos más usados en proyectos reales son:

-*CSV (Comma-Separated Values)* → datos en tablas (como Excel o Google Sheets).

-*JSON (JavaScript Object Notation)* → datos jerárquicos, usados en APIs y configuraciones.

## Archivos CSV en Python
Un *CSV* guarda datos en forma de tabla, separados por comas (o punto y coma, tabulador, etc.).

Un ejemplo de alumnos.csv:

Un ejemplo de alumnos.csv:



nombre,edad,curso

Ana,20,Python

Luis,22,Java

Marta,21,Python

Python ofrece el módulo estándar csv.

Revisemos cómo funcionaría un ejemplo más completo en Colab.

In [8]:
import csv

# Crear un archivo CSV
with open("alumnos.csv", "w", newline="", encoding="utf-8") as f:
    escritor = csv.writer(f)
    escritor.writerow(["nombre", "edad", "curso"])
    escritor.writerow(["Ana", 20, "Python"])
    escritor.writerow(["Luis", 22, "Java"])
    escritor.writerow(["Marta", 21, "Python"])

# Leer el archivo CSV
with open("alumnos.csv", "r", encoding="utf-8") as f:
    lector = csv.reader(f)
    for fila in lector:
        print(fila)

['nombre', 'edad', 'curso']
['Ana', '20', 'Python']
['Luis', '22', 'Java']
['Marta', '21', 'Python']


Lo que está ocurriendo:

-writerow escribe una fila.

-Cada fila es una lista de strings o números.

-Al leer, csv.reader devuelve listas de strings.

## Usar DictReader y DictWriter
Muchas veces es más práctico manejar cada fila como un diccionario (clave → valor).

Veamos con un ejemplo en Colab:

In [9]:
# Escribir con DictWriter
with open("alumnos_dict.csv", "w", newline="", encoding="utf-8") as f:
    campos = ["nombre", "edad", "curso"]
    escritor = csv.DictWriter(f, fieldnames=campos)
    escritor.writeheader()
    escritor.writerow({"nombre": "Ana", "edad": 20, "curso": "Python"})
    escritor.writerow({"nombre": "Luis", "edad": 22, "curso": "Java"})

# Leer con DictReader
with open("alumnos_dict.csv", "r", encoding="utf-8") as f:
    lector = csv.DictReader(f)
    for fila in lector:
        print(fila)

{'nombre': 'Ana', 'edad': '20', 'curso': 'Python'}
{'nombre': 'Luis', 'edad': '22', 'curso': 'Java'}


El resultado es que ahora cada fila es un diccionario.

In [10]:
{'nombre': 'Ana', 'edad': '20', 'curso': 'Python'}

{'nombre': 'Ana', 'edad': '20', 'curso': 'Python'}

## Archivos JSON en Python
Un JSON guarda datos como diccionarios o listas anidadas.

Este es un ejemplo de config.json.

In [None]:
{
  "version": 1,
  "debug": true,
  "usuarios": [
    {"nombre": "Ana", "edad": 20},
    {"nombre": "Luis", "edad": 22}
  ]
}

En Python se maneja con el módulo json.

Veamos un ejemplo en Colab.

In [13]:
import json

# Crear JSON
datos = {
    "version": 1,
    "debug": True,
    "usuarios": [
        {"nombre": "Ana", "edad": 20},
        {"nombre": "Luis", "edad": 22}
    ]
}

with open("config.json", "w", encoding="utf-8") as f:
    json.dump(datos, f, ensure_ascii=False, indent=2)

# Leer JSON
with open("config.json", "r", encoding="utf-8") as f:
    cargado = json.load(f)
    print("JSON cargado:", cargado)

JSON cargado: {'version': 1, 'debug': True, 'usuarios': [{'nombre': 'Ana', 'edad': 20}, {'nombre': 'Luis', 'edad': 22}]}


Consideraciones en este último proceso:

-*json.dump(objeto, archivo)*. Guarda en archivo.

-*json.load(archivo)*. Lee archivo.

-*ensure_ascii=False* mantiene caracteres latinos (ú, ñ).

-*indent=2* hace que se vea bonito (formato legible).

## Diferencias prácticas CSV vs JSON
Ambos son universales y Python los soporta de manera nativa.

A partir de ahí, cada uno puede enfocarse en diferentes situaciones.

## CSV (Comma-Separated Values)
-Es como una *tabla de Excel o Google Sheets*.

-Cada fila = un registro.

-Cada columna = un campo.

Sirve para datos planos y repetitivos (todos los registros tienen las mismas columnas).

In [None]:
nombre,edad,curso
Ana,20,Python
Luis,22,Java
Marta,21,Python

En Colab, lo leerías así:

In [15]:
import csv

with open("alumnos.csv", "w", newline="", encoding="utf-8") as f:
    escritor = csv.writer(f)
    escritor.writerow(["nombre", "edad", "curso"])
    escritor.writerow(["Ana", 20, "Python"])
    escritor.writerow(["Luis", 22, "Java"])

with open("alumnos.csv", "r", encoding="utf-8") as f:
    lector = csv.reader(f)
    for fila in lector:
        print(fila)

['nombre', 'edad', 'curso']
['Ana', '20', 'Python']
['Luis', '22', 'Java']


Ideal cuando tienes listas de registros iguales: ventas, inventarios, alumnos, notas.

## JSON (JavaScript Object Notation)
-Es como guardar un *diccionario de Python en un archivo*.

-Soporta *listas dentro de listas*, y no todos los registros tienen que tener los mismos campos.

-Es el formato que más usan las *APIs* y los sistemas modernos.

In [16]:
[
  {"nombre": "Ana", "edad": 20, "curso": "Python"},
  {"nombre": "Luis", "edad": 22, "curso": "Java"}
]

[{'nombre': 'Ana', 'edad': 20, 'curso': 'Python'},
 {'nombre': 'Luis', 'edad': 22, 'curso': 'Java'}]

En Colab, lo leerías así:

In [17]:
import json

alumnos = [
    {"nombre": "Ana", "edad": 20, "curso": "Python"},
    {"nombre": "Luis", "edad": 22, "curso": "Java"}
]

# Guardar en JSON
with open("alumnos.json", "w", encoding="utf-8") as f:
    json.dump(alumnos, f, ensure_ascii=False, indent=2)

# Leer de JSON
with open("alumnos.json", "r", encoding="utf-8") as f:
    cargado = json.load(f)
    print(cargado)

[{'nombre': 'Ana', 'edad': 20, 'curso': 'Python'}, {'nombre': 'Luis', 'edad': 22, 'curso': 'Java'}]


## Ejemplo 1
Tienes una *lista de alumnos* con nombre, edad y curso.

Cada registro tiene los *mismos campos* → se comporta como una *tabla*.

In [18]:
import csv

# Guardar alumnos en formato CSV
with open("alumnos.csv", "w", newline="", encoding="utf-8") as f:
    escritor = csv.writer(f)
    escritor.writerow(["nombre", "edad", "curso"])
    escritor.writerow(["Ana", 20, "Python"])
    escritor.writerow(["Luis", 22, "Java"])
    escritor.writerow(["Marta", 21, "Python"])

# Leer archivo CSV
with open("alumnos.csv", "r", encoding="utf-8") as f:
    lector = csv.reader(f)
    for fila in lector:
        print(fila)

['nombre', 'edad', 'curso']
['Ana', '20', 'Python']
['Luis', '22', 'Java']
['Marta', '21', 'Python']


## Ejemplo 2
Ahora un *pedido de cliente*: incluye ID, nombre y una *lista de productos*.

Aquí hay *anidación* (1 pedido → varios ítems).

In [19]:
import json

pedido = {
    "id": 101,
    "cliente": "Acme Corp",
    "items": [
        {"sku": "A1", "cantidad": 2, "precio": 50.0},
        {"sku": "B2", "cantidad": 1, "precio": 120.0}
    ],
    "total": 220.0
}

# Guardar pedido en JSON
with open("pedido.json", "w", encoding="utf-8") as f:
    json.dump(pedido, f, ensure_ascii=False, indent=2)

# Leer archivo JSON
with open("pedido.json", "r", encoding="utf-8") as f:
    cargado = json.load(f)
    print(cargado)

{'id': 101, 'cliente': 'Acme Corp', 'items': [{'sku': 'A1', 'cantidad': 2, 'precio': 50.0}, {'sku': 'B2', 'cantidad': 1, 'precio': 120.0}], 'total': 220.0}


## Ejemplo 3
Algunas películas tienen director, otras no.

Unas tienen año de estreno, otras solo género.

Usaremos JSON porque permite que cada registro tenga distintos atributos sin “forzar” columnas vacías como en CSV.

In [20]:
import json

# Lista de películas con datos opcionales
peliculas = [
    {"titulo": "Matrix", "año": 1999, "director": "Wachowski"},
    {"titulo": "Avatar", "año": 2009},  # falta director
    {"titulo": "Interestelar", "genero": "Ciencia ficción"},  # falta año
]

# Guardar en JSON
with open("peliculas.json", "w", encoding="utf-8") as f:
    json.dump(peliculas, f, ensure_ascii=False, indent=2)

# Leer archivo JSON
with open("peliculas.json", "r", encoding="utf-8") as f:
    data = json.load(f)
    print(data)


# [
#    {'titulo': 'Matrix', 'año': 1999, 'director': 'Wachowski'},
#    {'titulo': 'Avatar', 'año': 2009},
#    {'titulo': 'Interestelar', 'genero': 'Ciencia ficción'}
# ]

[{'titulo': 'Matrix', 'año': 1999, 'director': 'Wachowski'}, {'titulo': 'Avatar', 'año': 2009}, {'titulo': 'Interestelar', 'genero': 'Ciencia ficción'}]


----

## Ejercicio 1
Crea un archivo nombres.csv con tres nombres en una sola columna. Luego, léelo e imprime cada nombre.

In [21]:
import csv

# Crear el archivo
with open("nombres.csv", "w", newline="", encoding="utf-8") as f:
    escritor = csv.writer(f)
    escritor.writerow(["nombre"])
    escritor.writerow(["Ana"])
    escritor.writerow(["Luis"])
    escritor.writerow(["Marta"])

# Leer el archivo
with open("nombres.csv", "r", encoding="utf-8") as f:
    lector = csv.reader(f)
    for fila in lector:
        print(fila)

['nombre']
['Ana']
['Luis']
['Marta']


## Ejercicio 2
Crea un archivo alumnos.csv con columnas: nombre, edad.

Luego, léelo e imprime la edad de cada alumno.

In [22]:
import csv

# Crear CSV
with open("alumnos.csv", "w", newline="", encoding="utf-8") as f:
    escritor = csv.writer(f)
    escritor.writerow(["nombre", "edad"])
    escritor.writerow(["Ana", 20])
    escritor.writerow(["Luis", 22])

# Leer CSV e imprimir solo edad
with open("alumnos.csv", "r", encoding="utf-8") as f:
    lector = csv.DictReader(f)  # podemos acceder por nombre de columna
    for fila in lector:
        print("Edad de", fila["nombre"], ":", fila["edad"])

Edad de Ana : 20
Edad de Luis : 22


## Ejercicio 3
Crea un archivo usuario.json con un diccionario que tenga nombre y edad.

Léelo y muestra un mensaje "Hola, <nombre>. Tienes <edad> años."

In [23]:
import json

# Guardar JSON
usuario = {"nombre": "Ana", "edad": 20}
with open("usuario.json", "w", encoding="utf-8") as f:
    json.dump(usuario, f, ensure_ascii=False, indent=2)

# Leer JSON
with open("usuario.json", "r", encoding="utf-8") as f:
    u = json.load(f)
    print(f"Hola, {u['nombre']}. Tienes {u['edad']} años.")

Hola, Ana. Tienes 20 años.


## Ejercicio 4
Crea un archivo tareas.json con una lista de tareas (cada tarea tiene titulo y hecha como True/False).

Léelo e imprime solo las tareas que *no estén hechas*.

In [24]:
import json

# Guardar lista en JSON
tareas = [
    {"titulo": "Estudiar Python", "hecha": False},
    {"titulo": "Hacer ejercicio", "hecha": True},
    {"titulo": "Leer un libro", "hecha": False},
]
with open("tareas.json", "w", encoding="utf-8") as f:
    json.dump(tareas, f, ensure_ascii=False, indent=2)

# Leer y filtrar
with open("tareas.json", "r", encoding="utf-8") as f:
    lista = json.load(f)
    for t in lista:
        if not t["hecha"]:
            print("Pendiente:", t["titulo"])

Pendiente: Estudiar Python
Pendiente: Leer un libro


## Ejercicio 5
Convierte la lista de tareas.json en un archivo tareas.csv con columnas titulo y hecha.

In [25]:
import csv, json

# Leer JSON
with open("tareas.json", "r", encoding="utf-8") as f:
    lista = json.load(f)

# Guardar en CSV
with open("tareas.csv", "w", newline="", encoding="utf-8") as f:
    campos = ["titulo", "hecha"]
    escritor = csv.DictWriter(f, fieldnames=campos)
    escritor.writeheader()
    escritor.writerows(lista)

# Verificar
with open("tareas.csv", "r", encoding="utf-8") as f:
    print(f.read())

titulo,hecha
Estudiar Python,False
Hacer ejercicio,True
Leer un libro,False



-----------

# Compresión y descompresión (zipfile)


Para comenzar con esto, debemos hablar sobre los archivos .zip.

Un archivo *ZIP* es un contenedor que puede guardar *uno o varios archivos* dentro de un solo archivo comprimido.

*Ventajas principales*:

-*Reduce tamaño* (menos espacio en disco).

-*Agrupa archivos* (más fácil compartir varios).

-*Compatibilidad universal* (Windows, Mac, Linux, Gmail, etc. lo leen).

## El módulo zipfile en Python
Python trae un módulo integrado llamado zipfile que nos permite:

-*Crear un ZIP* para comprimir archivos.

-*Agregar más archivos* a un ZIP existente.

-*Leer qué contiene un ZIP*.

-*Extraer (descomprimir)* archivos de un ZIP.

-*Elegir el nivel de compresión*.

## Crear un archivo ZIP desde cero
Modo: "w" (write).

Esto crea un archivo ZIP nuevo. Si ya existía, se sobrescribe.

In [26]:
import zipfile

# Crear 2 archivos de ejemplo
with open("archivo1.txt", "w") as f:
    f.write("Este es el archivo 1")
with open("archivo2.txt", "w") as f:
    f.write("Este es el archivo 2")

# Crear un ZIP nuevo y guardar los archivos
with zipfile.ZipFile("mis_archivos.zip", "w") as z:
    z.write("archivo1.txt")
    z.write("archivo2.txt")

print("ZIP creado")

ZIP creado


Ahora tenemos un archivo mis_archivos.zip que contiene archivo1.txt y archivo2.txt.

## Agregar archivos a un ZIP existente
Modo: "a" (append).

Sirve para *sumar archivos* a un ZIP ya creado.

In [27]:
with open("archivo3.txt", "w") as f:
    f.write("Este es el archivo 3")

with zipfile.ZipFile("mis_archivos.zip", "a") as z:
    z.write("archivo3.txt")

print("Archivo agregado al ZIP existente")

Archivo agregado al ZIP existente


mis_archivos.zip ahora contiene archivo1.txt, archivo2.txt y archivo3.txt.

## Ver el contenido de un ZIP
Para revisar lo que hay dentro, usamos .namelist().

In [28]:
with zipfile.ZipFile("mis_archivos.zip", "r") as z:
    print("Contenido del ZIP:", z.namelist())

Contenido del ZIP: ['archivo1.txt', 'archivo2.txt', 'archivo3.txt']


Esto devuelve una lista de nombres de archivos que están dentro del ZIP.

## Extraer archivos (descomprimir)
Podemos recuperar los archivos con .extractall().

In [29]:
with zipfile.ZipFile("mis_archivos.zip", "r") as z:
    z.extractall("carpeta_extraida")

print("Archivos extraídos en la carpeta 'carpeta_extraida'")

Archivos extraídos en la carpeta 'carpeta_extraida'


Crea una carpeta nueva llamada carpeta_extraida con todos los archivos del ZIP.

## Compresión profunda (ZIP_DEFLATED)
Por defecto, zipfile guarda los archivos sin comprimir demasiado.

Si quieres reducir realmente el tamaño, usa el parámetro compression=zipfile.ZIP_DEFLATED.

In [30]:
with zipfile.ZipFile("comprimido.zip", "w", compression=zipfile.ZIP_DEFLATED) as z:
    z.write("archivo1.txt")
    z.write("archivo2.txt")

print("ZIP con compresión real creado")

ZIP con compresión real creado


Esto genera un ZIP más pequeño, útil si los archivos son grandes (texto, CSV, JSON).

Cuando indicas compression=zipfile.ZIP_DEFLATED, Python usa un *algoritmo de compresión llamado DEFLATE*.

Este algoritmo:

-Elimina redundancias (texto repetido, espacios, patrones).

-Representa datos de forma más compacta.

*Diferencias de modos*

-"w". Crea un ZIP nuevo (borra el anterior si ya existe).

-"a". Agrega archivos a un ZIP existente.

-"r". Abre un ZIP solo para leerlo.

-------------

## Ejercicio 1
Crea un archivo mensaje.txt con el texto "Hola desde Python".

Después, crea un archivo mensaje.zip que contenga ese archivo.

In [31]:
import zipfile

# Crear archivo de texto
with open("mensaje.txt", "w") as f:
    f.write("Hola desde Python")

# Crear ZIP con el archivo
with zipfile.ZipFile("mensaje.zip", "w") as z:
    z.write("mensaje.txt")

print("ZIP creado con mensaje.txt")

ZIP creado con mensaje.txt


## Ejercicio 2
Crea los archivos nota1.txt y nota2.txt.

Agrega ambos al archivo mensaje.zip sin borrar lo que ya tenía.

In [32]:
# Crear archivos extra
with open("nota1.txt", "w") as f:
    f.write("Primera nota")
with open("nota2.txt", "w") as f:
    f.write("Segunda nota")

# Agregar archivos al ZIP existente (modo append)
with zipfile.ZipFile("mensaje.zip", "a") as z:
    z.write("nota1.txt")
    z.write("nota2.txt")

print("Archivos agregados al ZIP")

Archivos agregados al ZIP


## Ejercicio 3
Muestra en pantalla todos los archivos que contiene mensaje.zip.

In [33]:
with zipfile.ZipFile("mensaje.zip", "r") as z:
    contenido = z.namelist()
    print("Archivos en el ZIP:", contenido)

Archivos en el ZIP: ['mensaje.txt', 'nota1.txt', 'nota2.txt']


## Ejercicio 4
Descomprime todo el contenido de mensaje.zip en una carpeta llamada extraidos.

In [34]:
with zipfile.ZipFile("mensaje.zip", "r") as z:
    z.extractall("extraidos")

print("Archivos extraídos en carpeta 'extraidos'")

Archivos extraídos en carpeta 'extraidos'


## Ejercicio 5
Crea un archivo de texto muy grande y guárdalo dos veces:

-En un ZIP sin compresión.

-En un ZIP con ZIP_DEFLATED. Compara tamaños.

In [35]:
import os

# Archivo de texto grande (repetitivo)
with open("grande.txt", "w") as f:
    f.write("Python es genial!\n" * 10000)

# ZIP sin compresión
with zipfile.ZipFile("sin_compresion.zip", "w", compression=zipfile.ZIP_STORED) as z:
    z.write("grande.txt")

# ZIP con compresión
with zipfile.ZipFile("con_compresion.zip", "w", compression=zipfile.ZIP_DEFLATED) as z:
    z.write("grande.txt")

# Mostrar tamaños
print("Tamaño original:", os.path.getsize("grande.txt"), "bytes")
print("ZIP sin compresión:", os.path.getsize("sin_compresion.zip"), "bytes")
print("ZIP con compresión:", os.path.getsize("con_compresion.zip"), "bytes")

Tamaño original: 180000 bytes
ZIP sin compresión: 180118 bytes
ZIP con compresión: 596 bytes
