In [11]:
import os
import pandas as pd

# Detectar si estamos ejecutando en Kaggle
in_kaggle = "KAGGLE_KERNEL_RUN_TYPE" in os.environ

if in_kaggle:
    print("Ejecutando en Kaggle\n")

    # Ruta del dataset montado en "Input"
    dataset_dir = "/kaggle/input/madrid-province-rent-data"

else:
    print("Ejecutando en entorno local\n")

    # Cargar la API key desde el fichero .env
    from dotenv import load_dotenv
    import kagglehub

    load_dotenv()
    os.environ["KAGGLE_API_KEY"] = os.getenv("KAGGLE_API_KEY")

    # Comprobar si ya tenemos una copia local en ./data
    local_data_dir = os.path.join(os.getcwd(), "data")
    os.makedirs(local_data_dir, exist_ok=True)
    local_csv_path = os.path.join(local_data_dir, "madrid-rent.csv")

    if os.path.exists(local_csv_path):
        print("CSV ya disponible localmente en ./data/")
        dataset_dir = local_data_dir  # Redirigir dataset_dir para usar la carpeta local
    else:
        # Descargar el dataset con kagglehub si no está ya en caché
        dataset_dir = os.path.expanduser("~/.cache/kagglehub/datasets/mapecode/madrid-province-rent-data")

        if not os.path.exists(dataset_dir):
            print("Dataset no encontrado en caché. Descargando desde Kaggle...")
            dataset_dir = kagglehub.dataset_download("mapecode/madrid-province-rent-data")
        else:
            print("Dataset encontrado en caché:", dataset_dir)

        # Buscar el CSV y copiarlo a ./data
        for root, dirs, files in os.walk(dataset_dir):
            for file in files:
                if file.endswith(".csv"):
                    csv_path_temp = os.path.join(root, file)
                    pd.read_csv(csv_path_temp).to_csv(local_csv_path, index=False)
                    print(f"CSV copiado a: {local_csv_path}")
                    break
            else:
                continue
            break

# Busca el archivo CSV dentro del dataset_dir
csv_path = None
for root, dirs, files in os.walk(dataset_dir):
    for file in files:
        if file.endswith(".csv"):
            csv_path = os.path.join(root, file)
            break
    if csv_path:
        break

# Cargar y mostrar el dataset
if csv_path:
    print(f"\nCSV encontrado: {csv_path}")
    df = pd.read_csv(csv_path)
    print("\nPrimeras filas del dataset:")
    display(df.head())
else:
    print("No se encontró ningún archivo CSV")

Ejecutando en entorno local

CSV ya disponible localmente en ./data/

CSV encontrado: /Users/asierortizgarcia/DocumentosMac/Git/module-2-notebooks/data/mpg.csv

Primeras filas del dataset:


Unnamed: 0,mpg,cylinders,displacement,horsepower,weight,acceleration,model_year,origin,name
0,18.0,8,307.0,130.0,3504,12.0,70,usa,chevrolet chevelle malibu
1,15.0,8,350.0,165.0,3693,11.5,70,usa,buick skylark 320
2,18.0,8,318.0,150.0,3436,11.0,70,usa,plymouth satellite
3,16.0,8,304.0,150.0,3433,12.0,70,usa,amc rebel sst
4,17.0,8,302.0,140.0,3449,10.5,70,usa,ford torino
