In [6]:
import os
import pandas as pd

# Detectar si estamos ejecutando en Kaggle
in_kaggle = "KAGGLE_KERNEL_RUN_TYPE" in os.environ

if in_kaggle:
    print("Ejecutando en Kaggle\n")

    # Ruta del dataset montado en "Input"
    dataset_dir = "/kaggle/input/madrid-idealista-property-listings"

else:
    print("Ejecutando en entorno local\n")

    # Cargar la API key desde el fichero .env
    from dotenv import load_dotenv
    import kagglehub

    load_dotenv()
    os.environ["KAGGLE_API_KEY"] = os.getenv("KAGGLE_API_KEY")

    # Comprobar si ya tenemos una copia local en ./data
    local_data_dir = os.path.join(os.getcwd(), "data")
    os.makedirs(local_data_dir, exist_ok=True)
    local_csv_path = os.path.join(local_data_dir, "madrid-listings.csv")

    if os.path.exists(local_csv_path):
        print("CSV ya disponible localmente en ./data/")
        dataset_dir = local_data_dir  # Redirigir dataset_dir para usar la carpeta local
    else:
        # Descargar el dataset con kagglehub si no está ya en caché
        dataset_dir = os.path.expanduser("~/.cache/kagglehub/datasets/kanchana1990/madrid-idealista-property-listings")

        if not os.path.exists(dataset_dir):
            print("Dataset no encontrado en caché. Descargando desde Kaggle...")
            dataset_dir = kagglehub.dataset_download("kanchana1990/madrid-idealista-property-listings")
        else:
            print("Dataset encontrado en caché:", dataset_dir)

        # Buscar el CSV y copiarlo a ./data
        for root, dirs, files in os.walk(dataset_dir):
            for file in files:
                if file.endswith(".csv"):
                    csv_path_temp = os.path.join(root, file)
                    pd.read_csv(csv_path_temp).to_csv(local_csv_path, index=False)
                    print(f"CSV copiado a: {local_csv_path}")
                    break
            else:
                continue
            break

# Obtener la ruta al CSV final según el entorno
if in_kaggle:
    # Buscar en el dataset descargado en Kaggle
    csv_path = None
    for root, dirs, files in os.walk(dataset_dir):
        for file in files:
            if file.endswith(".csv"):
                csv_path = os.path.join(root, file)
                break
        if csv_path:
            break
else:
    # En local está en ./data con nombre madrid-listings.csv
    csv_path = os.path.join("data", "madrid-listings.csv")

# Cargar y mostrar el dataset
if os.path.exists(csv_path):
    print(f"\nCSV encontrado: {csv_path}")
    df = pd.read_csv(csv_path)
    print("\nPrimeras filas del dataset:")
    display(df.head())
else:
    print("No se encontró el archivo CSV esperado")

Ejecutando en entorno local

CSV ya disponible localmente en ./data/

CSV encontrado: data/madrid-listings.csv

Primeras filas del dataset:


Unnamed: 0,url,listingUrl,title,id,price,baths,rooms,sqft,description,address,typology,advertiserProfessionalName,advertiserName
0,https://www.idealista.com/inmueble/104027174/,https://www.idealista.com/venta-viviendas/madr...,Piso en venta en calle de Villanueva,104027174,1920000,3,3,183,Residencia única con acabados de la más alta c...,"Recoletos, Madrid",Pisos,Promora Madrid,Promora Madrid
1,https://www.idealista.com/inmueble/102321942/,https://www.idealista.com/venta-viviendas/madr...,Piso en venta en calle de Núñez de Balboa,102321942,1995000,3,3,170,"Preciosa reforma a estrenar, con terrazas y ga...","Castellana, Madrid",Pisos,Madrid MMC,Engel & Völkers Madrid
2,https://www.idealista.com/inmueble/103334142/,https://www.idealista.com/venta-viviendas/madr...,Piso en venta en Conde Orgaz-Piovera,103334142,1300000,3,4,270,DE SALAS CONSULTORES INMOBILIARIOS MAV02679 le...,"Hortaleza, Madrid",Pisos,De Salas Consultores Inmobiliarios,De Salas Consultores Inmobiliarios
3,https://www.idealista.com/inmueble/104161987/,https://www.idealista.com/venta-viviendas/madr...,Piso en venta en Nueva España,104161987,1650000,3,3,248,Gilmar Real Estate vende espectacular piso en ...,"Chamartín, Madrid",Pisos,departamento comercial,Gilmar Viso - Chamartín
4,https://www.idealista.com/inmueble/103989666/,https://www.idealista.com/venta-viviendas/madr...,Piso en venta en calle de Claudio Coello,103989666,1590750,3,3,116,Descubre esta impresionante vivienda exterior ...,"Recoletos, Madrid",Pisos,Walter Haus Salamanca,Walter Haus Madrid
