In [None]:
from google.colab import drive
import os
import tarfile
from pathlib import Path

def extract_tar(tar_path: str, dest_dir: str) -> None:
    """
    Extrae un archivo .tar, .tar.gz o .tgz en la carpeta destino.

    Parámetros
    ----------
    tar_path : str
        Ruta completa al archivo .tar(.gz) que deseas descomprimir.
    dest_dir : str
        Carpeta donde se extraerán los archivos.
    """
    tar_path  = Path(tar_path).expanduser().resolve()
    dest_dir  = Path(dest_dir).expanduser().resolve()

    # 1. Verificación de existencia
    if not tar_path.is_file():
        raise FileNotFoundError(f"No se encontró el archivo: {tar_path}")

    # 2. Crear carpeta destino
    dest_dir.mkdir(parents=True, exist_ok=True)

    # 3. Seleccionar modo según extensión
    mode = "r:gz" if tar_path.suffixes[-2:] in [[".tar", ".gz"], [".tgz"]] else "r:"

    # 4. Extraer
    with tarfile.open(tar_path, mode) as tar:
        members = tar.getmembers()
        tar.extractall(path=dest_dir)

    # 5. Resumen
    print(f"✔ Extraídos {len(members):,} ficheros dentro de: {dest_dir}")

TAR_PATH    = "/content/drive/MyDrive/Procesamiento Imagenes/Taller_3_sistema_recuperacion_texto_imagen/256_ObjectCategories.tar"
EXTRACT_DIR = "/content/drive/MyDrive/Procesamiento Imagenes/Taller_3_sistema_recuperacion_texto_imagen/Caltech_Data"

extract_tar(TAR_PATH, EXTRACT_DIR)

✔ Extraídos 30,868 ficheros dentro de: /content/drive/MyDrive/Procesamiento Imagenes/Taller_3_sistema_recuperacion_texto_imagen/Caltech_Data
