In [1]:
import os
import pandas as pd

# Detectar si estamos ejecutando en Kaggle
in_kaggle = "KAGGLE_KERNEL_RUN_TYPE" in os.environ

if in_kaggle:
    print("Ejecutando en Kaggle\n")

    # Ruta del dataset montado en "Input"
    dataset_dir = "/kaggle/input/madrid-province-rent-data"

else:
    print("Ejecutando en entorno local\n")

    # Cargar la API key desde el fichero .env
    from dotenv import load_dotenv
    import kagglehub

    load_dotenv()
    os.environ["KAGGLE_API_KEY"] = os.getenv("KAGGLE_API_KEY")

    # Comprobar si ya tenemos una copia local en ./data
    local_data_dir = os.path.join(os.getcwd(), "data")
    os.makedirs(local_data_dir, exist_ok=True)
    local_csv_path = os.path.join(local_data_dir, "madrid-rent.csv")

    if os.path.exists(local_csv_path):
        print("CSV ya disponible localmente en ./data/")
        dataset_dir = local_data_dir  # Redirigir dataset_dir para usar la carpeta local
    else:
        # Descargar el dataset con kagglehub si no está ya en caché
        dataset_dir = os.path.expanduser("~/.cache/kagglehub/datasets/mapecode/madrid-province-rent-data")

        if not os.path.exists(dataset_dir):
            print("Dataset no encontrado en caché. Descargando desde Kaggle...")
            dataset_dir = kagglehub.dataset_download("mapecode/madrid-province-rent-data")
        else:
            print("Dataset encontrado en caché:", dataset_dir)

        # Buscar el CSV y copiarlo a ./data
        for root, dirs, files in os.walk(dataset_dir):
            for file in files:
                if file.endswith(".csv"):
                    csv_path_temp = os.path.join(root, file)
                    pd.read_csv(csv_path_temp).to_csv(local_csv_path, index=False)
                    print(f"CSV copiado a: {local_csv_path}")
                    break
            else:
                continue
            break

# Obtener la ruta al CSV final según el entorno
if in_kaggle:
    # Buscar en el dataset descargado en Kaggle
    csv_path = None
    for root, dirs, files in os.walk(dataset_dir):
        for file in files:
            if file.endswith(".csv"):
                csv_path = os.path.join(root, file)
                break
        if csv_path:
            break
else:
    # En local está en ./data con nombre madrid-rent.csv
    csv_path = os.path.join("data", "madrid-rent.csv")

# Cargar y mostrar el dataset
if os.path.exists(csv_path):
    print(f"\nCSV encontrado: {csv_path}")
    df = pd.read_csv(csv_path)
    print("\nPrimeras filas del dataset:")
    display(df.head())
else:
    print("No se encontró el archivo CSV esperado")

Ejecutando en entorno local

CSV ya disponible localmente en ./data/

CSV encontrado: data/madrid-rent.csv

Primeras filas del dataset:


Unnamed: 0,web_id,url,title,type,price,deposit,private_owner,professional_name,floor_built,floor_area,...,terrace,balcony,storeroom,swimming_pool,garden_area,location,district,subdistrict,postalcode,last_update
0,99439319,https://www.idealista.com/en/inmueble/99439319/,"Flat / apartment for rent in pablo luna, 4",Flat,1400,,False,Silcasas Ochocientas,60,,...,True,False,False,False,False,"pablo luna, 4, Subdistrict Castilla, District ...",Chamartín,Castilla,28046.0,7 November
1,99439586,https://www.idealista.com/en/inmueble/99439586/,Penthouse for rent in calle de Bolivia,Penthouse,1300,1.0,False,Cruzity,77,,...,False,False,False,False,False,"Calle de Bolivia, Subdistrict Bernabéu-Hispano...",Chamartín,Bernabéu-Hispanoamérica,28016.0,7 November
2,99439169,https://www.idealista.com/en/inmueble/99439169/,Duplex for rent in calle de la constancia,Duplex,950,1.0,False,Mm Home,72,68.0,...,True,False,False,False,False,"Calle de la constancia, Urb. no, Subdistrict P...",Chamartín,Prosperidad,28002.0,7 November
3,26925909,https://www.idealista.com/en/inmueble/26925909/,"Flat / apartment for rent in Urb. el viso, El ...",Flat,2975,1.0,False,B&H Partners,160,,...,True,False,False,True,False,"Urb. el viso, Subdistrict El Viso, District Ch...",Chamartín,El Viso,,7 November
4,99440018,https://www.idealista.com/en/inmueble/99440018/,Studio flat for rent in luis cabrera,Studio,650,1.0,False,Madrid en Propiedad,30,,...,False,True,False,False,False,"luis cabrera, Subdistrict Prosperidad, Distric...",Chamartín,Prosperidad,28002.0,7 November
