In [1]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# URL base de pisos.com
url_base = "https://www.pisos.com/venta/pisos-madrid/"

# Lista para almacenar los datos extraídos
inmuebles = []

# Mantener un set para evitar duplicados
inmuebles_set = set()

# Función de scraping para pisos.com
def scrapear_pagina(num_pages):
    # Recorrer varias páginas mediante la construcción de URLs
    for page in range(1, num_pages + 1):
        url = f"{url_base}{page}/"
        print(f"Scraping página: {url}")
        
        # Abrir la página actual
        driver.get(url)
        
        # Esperar explícitamente a que los anuncios estén presentes
        anuncios = WebDriverWait(driver, 20).until(
            EC.presence_of_all_elements_located((By.CLASS_NAME, 'ad-preview'))
        )
        print(f"Se encontraron {len(anuncios)} anuncios en la página {page}.")

        # Extraer información de cada anuncio
        for anuncio in anuncios:
            try:
                # Extraer el título del anuncio
                titulo = anuncio.find_element(By.CLASS_NAME, 'ad-preview__title').text if anuncio.find_elements(By.CLASS_NAME, 'ad-preview__title') else 'Sin título'
                
                # Extraer la ubicación del anuncio
                ubicacion = anuncio.find_element(By.CLASS_NAME, 'ad-preview__subtitle').text if anuncio.find_elements(By.CLASS_NAME, 'ad-preview__subtitle') else 'Sin ubicación'
                
                # Extraer el precio
                precio = anuncio.find_element(By.CLASS_NAME, 'ad-preview__price').text if anuncio.find_elements(By.CLASS_NAME, 'ad-preview__price') else 'Sin precio'
                
                # Extraer los detalles adicionales (habitaciones, baños, etc.)
                detalles = anuncio.find_elements(By.CLASS_NAME, 'ad-preview__char')
                habitaciones = detalles[0].text if len(detalles) > 0 else 'Sin información'
                banos = detalles[1].text if len(detalles) > 1 else 'Sin información'
                metros_cuadrados = detalles[2].text if len(detalles) > 2 else 'Sin información'
                planta = detalles[3].text if len(detalles) > 3 else 'Sin información'

                # Generar un identificador único para evitar duplicados
                identificador = f"{titulo}-{ubicacion}-{precio}-{habitaciones}-{banos}-{metros_cuadrados}-{planta}"
                
                # Verificar si el identificador ya está en el set
                if identificador not in inmuebles_set:
                    inmuebles.append({
                        'Título': titulo,
                        'Ubicación': ubicacion,
                        'Precio': precio,
                        'Habitaciones': habitaciones,
                        'Baños': banos,
                        'Metros Cuadrados': metros_cuadrados,
                        'Planta': planta
                    })
                    inmuebles_set.add(identificador)  # Añadir al set para evitar duplicados
            except Exception as e:
                print(f"Error extrayendo información: {e}")

# Llamada a la función de scraping para pisos.com (puedes ajustar el número de páginas a recorrer)
scrapear_pagina(337)

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('pisos4.csv', index=False)

print("Datos extraídos y guardados en pisos4.csv")


Scraping página: https://www.pisos.com/venta/pisos-madrid/1/
Se encontraron 31 anuncios en la página 1.
Scraping página: https://www.pisos.com/venta/pisos-madrid/2/
Se encontraron 31 anuncios en la página 2.
Scraping página: https://www.pisos.com/venta/pisos-madrid/3/
Se encontraron 31 anuncios en la página 3.
Scraping página: https://www.pisos.com/venta/pisos-madrid/4/
Se encontraron 31 anuncios en la página 4.
Scraping página: https://www.pisos.com/venta/pisos-madrid/5/
Se encontraron 31 anuncios en la página 5.
Scraping página: https://www.pisos.com/venta/pisos-madrid/6/
Se encontraron 31 anuncios en la página 6.
Scraping página: https://www.pisos.com/venta/pisos-madrid/7/
Se encontraron 31 anuncios en la página 7.
Scraping página: https://www.pisos.com/venta/pisos-madrid/8/
Se encontraron 31 anuncios en la página 8.
Scraping página: https://www.pisos.com/venta/pisos-madrid/9/
Se encontraron 31 anuncios en la página 9.
Scraping página: https://www.pisos.com/venta/pisos-madrid/10/
Se

In [3]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# URL base de pisos.com
url_base = "https://www.pisos.com/venta/pisos-madrid/"

# Lista para almacenar los datos extraídos
inmuebles = []

# Mantener un set para evitar duplicados
inmuebles_set = set()

# Función de scraping para pisos.com
def scrapear_pagina(num_pages):
    for page in range(1, num_pages + 1):
        url = f"{url_base}{page}/"
        print(f"Scraping página: {url}")
        
        # Intentar abrir la página y capturar posibles errores
        try:
            driver.get(url)
        except Exception as e:
            print(f"Error cargando la página {page}: {e}")
            time.sleep(10)  # Esperar un poco antes de reintentar
            continue  # Saltar a la siguiente página si falla

        try:
            # Esperar explícitamente a que los anuncios estén presentes
            anuncios = WebDriverWait(driver, 30).until(
                EC.presence_of_all_elements_located((By.CLASS_NAME, 'ad-preview'))
            )
            print(f"Se encontraron {len(anuncios)} anuncios en la página {page}.")
        except Exception as e:
            print(f"Error cargando los anuncios de la página {page}: {e}")
            time.sleep(10)  # Esperar un poco antes de reintentar
            continue  # Saltar esta página si ocurre un error

        # Extraer información de cada anuncio
        for anuncio in anuncios:
            try:
                # Extraer el título del anuncio
                titulo = anuncio.find_element(By.CLASS_NAME, 'ad-preview__title').text if anuncio.find_elements(By.CLASS_NAME, 'ad-preview__title') else 'Sin título'
                
                # Extraer la ubicación del anuncio
                ubicacion = anuncio.find_element(By.CLASS_NAME, 'ad-preview__subtitle').text if anuncio.find_elements(By.CLASS_NAME, 'ad-preview__subtitle') else 'Sin ubicación'
                
                # Extraer el precio
                precio = anuncio.find_element(By.CLASS_NAME, 'ad-preview__price').text if anuncio.find_elements(By.CLASS_NAME, 'ad-preview__price') else 'Sin precio'
                
                # Extraer los detalles adicionales (habitaciones, baños, etc.)
                detalles = anuncio.find_elements(By.CLASS_NAME, 'ad-preview__char')
                habitaciones = detalles[0].text if len(detalles) > 0 else 'Sin información'
                banos = detalles[1].text if len(detalles) > 1 else 'Sin información'
                metros_cuadrados = detalles[2].text if len(detalles) > 2 else 'Sin información'
                planta = detalles[3].text if len(detalles) > 3 else 'Sin información'

                # Generar un identificador único más preciso para evitar duplicados
                identificador = f"{titulo}-{ubicacion}-{precio}-{habitaciones}-{banos}-{metros_cuadrados}-{planta}"
                
                # Verificar si el identificador ya está en el set
                if identificador not in inmuebles_set:
                    inmuebles.append({
                        'Título': titulo,
                        'Ubicación': ubicacion,
                        'Precio': precio,
                        'Habitaciones': habitaciones,
                        'Baños': banos,
                        'Metros Cuadrados': metros_cuadrados,
                        'Planta': planta
                    })
                    inmuebles_set.add(identificador)  # Añadir al set para evitar duplicados
            except Exception as e:
                print(f"Error extrayendo información de un anuncio en la página {page}: {e}")
        
        # Añadir un tiempo de espera entre cada página
        time.sleep(10)  # Ajustar el tiempo de espera si es necesario

# Llamada a la función de scraping para pisos.com (ajusta el número de páginas a recorrer)
scrapear_pagina(337)

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('pisos5.csv', index=False)

print("Datos extraídos y guardados en pisos5.csv")


Scraping página: https://www.pisos.com/venta/pisos-madrid/1/
Se encontraron 31 anuncios en la página 1.
Scraping página: https://www.pisos.com/venta/pisos-madrid/2/
Se encontraron 31 anuncios en la página 2.
Scraping página: https://www.pisos.com/venta/pisos-madrid/3/
Se encontraron 31 anuncios en la página 3.
Scraping página: https://www.pisos.com/venta/pisos-madrid/4/
Se encontraron 31 anuncios en la página 4.
Scraping página: https://www.pisos.com/venta/pisos-madrid/5/
Se encontraron 31 anuncios en la página 5.
Scraping página: https://www.pisos.com/venta/pisos-madrid/6/
Se encontraron 31 anuncios en la página 6.
Scraping página: https://www.pisos.com/venta/pisos-madrid/7/
Se encontraron 31 anuncios en la página 7.
Scraping página: https://www.pisos.com/venta/pisos-madrid/8/
Se encontraron 31 anuncios en la página 8.
Scraping página: https://www.pisos.com/venta/pisos-madrid/9/
Se encontraron 31 anuncios en la página 9.
Scraping página: https://www.pisos.com/venta/pisos-madrid/10/
Se

In [1]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# URL base del listado de pisos en Madrid
url_base = "https://www.pisos.com/venta/pisos-madrid/"

# Lista para almacenar los datos extraídos
inmuebles = []

# Mantener un set para evitar duplicados
inmuebles_set = set()

# Función de scraping para un piso en concreto
def scrapear_piso(url_piso):
    try:
        driver.get(url_piso)
        
        # Esperar a que se carguen las características
        WebDriverWait(driver, 20).until(
            EC.presence_of_element_located((By.CLASS_NAME, 'features__content'))
        )
        
        # Extraer el precio
        precio = driver.find_element(By.CSS_SELECTOR, '.price').text
        
        # Extraer las características
        caracteristicas = driver.find_elements(By.CLASS_NAME, 'features__feature')
        
        # Extraer cada característica individual
        superficie_construida = caracteristicas[0].find_element(By.CLASS_NAME, 'features__value').text
        superficie_util = caracteristicas[1].find_element(By.CLASS_NAME, 'features__value').text
        habitaciones = caracteristicas[2].find_element(By.CLASS_NAME, 'features__value').text
        banos = caracteristicas[3].find_element(By.CLASS_NAME, 'features__value').text
        planta = caracteristicas[4].find_element(By.CLASS_NAME, 'features__value').text
        antiguedad = caracteristicas[5].find_element(By.CLASS_NAME, 'features__value').text
        
        # Extraer el título del anuncio
        titulo = driver.find_element(By.CLASS_NAME, 'detail-info').text
        
        # Generar un identificador único para evitar duplicados
        identificador = f"{titulo}-{superficie_construida}-{precio}"
        
        # Verificar si el identificador ya está en el set
        if identificador not in inmuebles_set:
            inmuebles.append({
                'Título': titulo,
                'Superficie Construida': superficie_construida,
                'Superficie Útil': superficie_util,
                'Habitaciones': habitaciones,
                'Baños': banos,
                'Planta': planta,
                'Antigüedad': antiguedad,
                'Precio': precio
            })
            inmuebles_set.add(identificador)  # Añadir al set para evitar duplicados
    except Exception as e:
        print(f"Error extrayendo información: {e}")

# Función para scrapear varias páginas de anuncios
def scrapear_paginas(num_paginas):
    for pagina in range(1, num_paginas + 1):
        url = f"{url_base}{pagina}/"
        print(f"Scraping página: {url}")
        
        # Abrir la página del listado
        driver.get(url)
        
        # Esperar a que los anuncios estén presentes
        WebDriverWait(driver, 20).until(
            EC.presence_of_all_elements_located((By.CLASS_NAME, 'ad-preview'))
        )
        
        # Extraer los enlaces a los detalles de cada inmueble
        anuncios = driver.find_elements(By.CLASS_NAME, 'ad-preview__title')
        for anuncio in anuncios:
            enlace = anuncio.find_element(By.TAG_NAME, 'a').get_attribute('href')
            scrapear_piso(enlace)
            time.sleep(1)  # Añadir una pequeña espera para evitar sobrecarga del servidor

# Llamada a la función de scraping para pisos.com (puedes ajustar el número de páginas a recorrer)
scrapear_paginas(10)

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid.csv', index=False)

print("Datos extraídos y guardados en venta_madrid.csv")


Scraping página: https://www.pisos.com/venta/pisos-madrid/1/


NoSuchElementException: Message: no such element: Unable to locate element: {"method":"tag name","selector":"a"}
  (Session info: chrome=130.0.6723.60); For documentation on this error, please visit: https://www.selenium.dev/documentation/webdriver/troubleshooting/errors#no-such-element-exception
Stacktrace:
	GetHandleVerifier [0x00423853+24035]
	(No symbol) [0x003ABBE4]
	(No symbol) [0x0028C2D3]
	(No symbol) [0x002CDC86]
	(No symbol) [0x002CDECB]
	(No symbol) [0x002C3CE1]
	(No symbol) [0x002EFED4]
	(No symbol) [0x002C3C04]
	(No symbol) [0x002F0124]
	(No symbol) [0x0030953F]
	(No symbol) [0x002EFC26]
	(No symbol) [0x002C218C]
	(No symbol) [0x002C310D]
	GetHandleVerifier [0x006C9683+2800659]
	GetHandleVerifier [0x0072423E+3172302]
	GetHandleVerifier [0x0071CE52+3142626]
	GetHandleVerifier [0x004C6C00+692624]
	(No symbol) [0x003B4BFD]
	(No symbol) [0x003B1908]
	(No symbol) [0x003B1AA0]
	(No symbol) [0x003A3F50]
	BaseThreadInitThunk [0x768B7BA9+25]
	RtlInitializeExceptionChain [0x76FBC0CB+107]
	RtlClearBits [0x76FBC04F+191]


In [4]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import NoSuchElementException, TimeoutException
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# URL base del listado de pisos en Madrid
url_base = "https://www.pisos.com/venta/pisos-madrid/"

# Lista para almacenar los datos extraídos
inmuebles = []

# Mantener un set para evitar duplicados
inmuebles_set = set()

# Función de scraping para un piso en concreto
def scrapear_piso(url_piso):
    try:
        driver.get(url_piso)
        
        # Esperar a que se carguen las características
        WebDriverWait(driver, 20).until(
            EC.presence_of_element_located((By.CLASS_NAME, 'features__content'))
        )
        
        # Extraer el precio
        try:
            precio = driver.find_element(By.CLASS_NAME, 'details-featured__price').text
        except NoSuchElementException:
            precio = 'No disponible'
        
        # Extraer las características
        caracteristicas = driver.find_elements(By.CLASS_NAME, 'features__feature')
        
        # Inicializar variables de características con valores predeterminados
        superficie_construida = 'No disponible'
        superficie_util = 'No disponible'
        habitaciones = 'No disponible'
        banos = 'No disponible'
        planta = 'No disponible'
        antiguedad = 'No disponible'
        
        # Extraer cada característica individual si existe
        try:
            superficie_construida = caracteristicas[0].find_element(By.CLASS_NAME, 'features__value').text
        except IndexError:
            pass
        try:
            superficie_util = caracteristicas[1].find_element(By.CLASS_NAME, 'features__value').text
        except IndexError:
            pass
        try:
            habitaciones = caracteristicas[2].find_element(By.CLASS_NAME, 'features__value').text
        except IndexError:
            pass
        try:
            banos = caracteristicas[3].find_element(By.CLASS_NAME, 'features__value').text
        except IndexError:
            pass
        try:
            planta = caracteristicas[4].find_element(By.CLASS_NAME, 'features__value').text
        except IndexError:
            pass
        try:
            antiguedad = caracteristicas[5].find_element(By.CLASS_NAME, 'features__value').text
        except IndexError:
            pass
        
        # Extraer el título del anuncio
        try:
            titulo = driver.find_element(By.CLASS_NAME, 'detail-info').text
        except NoSuchElementException:
            titulo = 'No disponible'
        
        # Generar un identificador único para evitar duplicados
        identificador = f"{titulo}-{superficie_construida}-{precio}"
        
        # Verificar si el identificador ya está en el set
        if identificador not in inmuebles_set:
            inmuebles.append({
                'Título': titulo,
                'Superficie Construida': superficie_construida,
                'Superficie Útil': superficie_util,
                'Habitaciones': habitaciones,
                'Baños': banos,
                'Planta': planta,
                'Antigüedad': antiguedad,
                'Precio': precio,
                'URL': url_piso
            })
            inmuebles_set.add(identificador)  # Añadir al set para evitar duplicados
    except TimeoutException:
        print(f"Timeout al cargar la página: {url_piso}")
    except Exception as e:
        print(f"Error extrayendo información: {e}")

# Función para scrapear varias páginas de anuncios
def scrapear_paginas(num_paginas):
    for pagina in range(1, num_paginas + 1):
        url = f"{url_base}{pagina}/"
        print(f"Scraping página: {url}")
        
        # Abrir la página del listado
        driver.get(url)
        
        # Esperar a que los anuncios estén presentes
        try:
            WebDriverWait(driver, 20).until(
                EC.presence_of_all_elements_located((By.CLASS_NAME, 'details__col-right'))
            )
        except TimeoutException:
            print(f"Timeout al cargar la página de listados: {url}")
            continue
        
        # Extraer los enlaces a los detalles de cada inmueble
        anuncios = driver.find_elements(By.CLASS_NAME, 'navigation-arrow--text')
        for anuncio in anuncios:
            enlace = anuncio.get_attribute('href')
            scrapear_piso(enlace)
            time.sleep(1)  # Añadir una pequeña espera para evitar sobrecarga del servidor

# Llamada a la función de scraping para pisos.com (puedes ajustar el número de páginas a recorrer)
scrapear_paginas(10)

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid.csv', index=False)

print("Datos extraídos y guardados en venta_madrid.csv")


Scraping página: https://www.pisos.com/venta/pisos-madrid/1/
Timeout al cargar la página de listados: https://www.pisos.com/venta/pisos-madrid/1/
Scraping página: https://www.pisos.com/venta/pisos-madrid/2/
Timeout al cargar la página de listados: https://www.pisos.com/venta/pisos-madrid/2/
Scraping página: https://www.pisos.com/venta/pisos-madrid/3/
Timeout al cargar la página de listados: https://www.pisos.com/venta/pisos-madrid/3/
Scraping página: https://www.pisos.com/venta/pisos-madrid/4/
Timeout al cargar la página de listados: https://www.pisos.com/venta/pisos-madrid/4/
Scraping página: https://www.pisos.com/venta/pisos-madrid/5/
Timeout al cargar la página de listados: https://www.pisos.com/venta/pisos-madrid/5/
Scraping página: https://www.pisos.com/venta/pisos-madrid/6/
Timeout al cargar la página de listados: https://www.pisos.com/venta/pisos-madrid/6/
Scraping página: https://www.pisos.com/venta/pisos-madrid/7/
Timeout al cargar la página de listados: https://www.pisos.com/

In [1]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import NoSuchElementException, TimeoutException
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# URL base del listado de pisos en Madrid
url_base = "https://www.pisos.com/comprar/atico-nino_jesus28007-45066276232_997608/"

# Lista para almacenar los datos extraídos
inmuebles = []

# Mantener un set para evitar duplicados
inmuebles_set = set()

# Función de scraping para un piso en concreto
def scrapear_piso(url_piso):
    try:
        driver.get(url_piso)
        
        # Esperar a que se carguen las características del anuncio
        WebDriverWait(driver, 20).until(
            EC.presence_of_element_located((By.CLASS_NAME, 'features__content'))
        )
        
        # Extraer el precio
        try:
            precio = driver.find_element(By.CLASS_NAME, 'details-featured__price').text
        except NoSuchElementException:
            precio = 'No disponible'
        
        # Extraer las características
        caracteristicas = driver.find_elements(By.CLASS_NAME, 'features__feature')
        
        # Inicializar variables de características con valores predeterminados
        superficie_construida = 'No disponible'
        superficie_util = 'No disponible'
        habitaciones = 'No disponible'
        banos = 'No disponible'
        planta = 'No disponible'
        antiguedad = 'No disponible'
        
        # Extraer cada característica individual si existe
        try:
            superficie_construida = caracteristicas[0].find_element(By.CLASS_NAME, 'features__value').text
        except IndexError:
            pass
        try:
            superficie_util = caracteristicas[1].find_element(By.CLASS_NAME, 'features__value').text
        except IndexError:
            pass
        try:
            habitaciones = caracteristicas[2].find_element(By.CLASS_NAME, 'features__value').text
        except IndexError:
            pass
        try:
            banos = caracteristicas[3].find_element(By.CLASS_NAME, 'features__value').text
        except IndexError:
            pass
        try:
            planta = caracteristicas[4].find_element(By.CLASS_NAME, 'features__value').text
        except IndexError:
            pass
        try:
            antiguedad = caracteristicas[5].find_element(By.CLASS_NAME, 'features__value').text
        except IndexError:
            pass
        
        # Extraer el título del anuncio
        try:
            titulo = driver.find_element(By.CLASS_NAME, 'detail-info').text
        except NoSuchElementException:
            titulo = 'No disponible'
        
        # Generar un identificador único para evitar duplicados
        identificador = f"{titulo}-{superficie_construida}-{precio}"
        
        # Verificar si el identificador ya está en el set
        if identificador not in inmuebles_set:
            inmuebles.append({
                'Título': titulo,
                'Superficie Construida': superficie_construida,
                'Superficie Útil': superficie_util,
                'Habitaciones': habitaciones,
                'Baños': banos,
                'Planta': planta,
                'Antigüedad': antiguedad,
                'Precio': precio,
                'URL': url_piso
            })
            inmuebles_set.add(identificador)  # Añadir al set para evitar duplicados
    except TimeoutException:
        print(f"Timeout al cargar la página: {url_piso}")
    except Exception as e:
        print(f"Error extrayendo información: {e}")

# Función para scrapear varias páginas de anuncios
def scrapear_paginas(num_paginas):
    for pagina in range(1, num_paginas + 1):
        url = f"{url_base}{pagina}/"
        print(f"Scraping página: {url}")
        
        # Abrir la página del listado
        driver.get(url)
        
        # Esperar a que los anuncios estén presentes
        try:
            WebDriverWait(driver, 20).until(
                EC.presence_of_all_elements_located((By.CLASS_NAME, 'details__col-right'))
            )
        except TimeoutException:
            print(f"Timeout al cargar la página de listados: {url}")
            continue
        
        # Extraer los enlaces a los detalles de cada inmueble
        anuncios = driver.find_elements(By.CLASS_NAME, 'navigation-arrow--text')
        for anuncio in anuncios:
            enlace = anuncio.get_attribute('href')
            scrapear_piso(enlace)
            # Ya no es necesario el sleep aquí porque estamos usando WebDriverWait

# Llamada a la función de scraping para pisos.com (puedes ajustar el número de páginas a recorrer)
scrapear_paginas(10)

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid.csv', index=False)

print("Datos extraídos y guardados en venta_madrid.csv")


Scraping página: https://www.pisos.com/comprar/atico-nino_jesus28007-45066276232_997608/1/
Timeout al cargar la página de listados: https://www.pisos.com/comprar/atico-nino_jesus28007-45066276232_997608/1/
Scraping página: https://www.pisos.com/comprar/atico-nino_jesus28007-45066276232_997608/2/
Timeout al cargar la página de listados: https://www.pisos.com/comprar/atico-nino_jesus28007-45066276232_997608/2/
Scraping página: https://www.pisos.com/comprar/atico-nino_jesus28007-45066276232_997608/3/
Timeout al cargar la página de listados: https://www.pisos.com/comprar/atico-nino_jesus28007-45066276232_997608/3/
Scraping página: https://www.pisos.com/comprar/atico-nino_jesus28007-45066276232_997608/4/
Timeout al cargar la página de listados: https://www.pisos.com/comprar/atico-nino_jesus28007-45066276232_997608/4/
Scraping página: https://www.pisos.com/comprar/atico-nino_jesus28007-45066276232_997608/5/



KeyboardInterrupt



In [2]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import NoSuchElementException, TimeoutException
from webdriver_manager.chrome import ChromeDriverManager

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# URL del piso que mencionas
url_piso = "https://www.pisos.com/comprar/atico-nino_jesus28007-45066276232_997608/"

# Función para scrapear las características de un piso en concreto
def scrapear_piso(url_piso):
    try:
        driver.get(url_piso)
        
        # Esperar a que se carguen las características
        WebDriverWait(driver, 20).until(
            EC.presence_of_element_located((By.CLASS_NAME, 'features-container'))
        )
        
        # Extraer las características específicas
        caracteristicas = driver.find_elements(By.CLASS_NAME, 'features__feature')
        
        # Diccionario para almacenar las características
        datos_piso = {}
        
        # Recorrer las características y almacenarlas en el diccionario
        for caracteristica in caracteristicas:
            try:
                label = caracteristica.find_element(By.CLASS_NAME, 'features__label').text
                value = caracteristica.find_element(By.CLASS_NAME, 'features__value').text
                datos_piso[label] = value
            except NoSuchElementException:
                continue
        
        # Imprimir las características del piso
        print("Características del piso:")
        for key, value in datos_piso.items():
            print(f"{key}: {value}")
        
    except TimeoutException:
        print(f"Timeout al cargar la página: {url_piso}")
    except Exception as e:
        print(f"Error extrayendo información: {e}")

# Llamada a la función para el piso que mencionas
scrapear_piso(url_piso)

# Cerrar el navegador
driver.quit()


Características del piso:
: 


In [19]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# URL del primer piso en concreto
url_piso = "https://www.pisos.com/venta/pisos-madrid/"

# Lista para almacenar los datos extraídos
inmuebles = []

# Función para scrapear un inmueble y navegar al siguiente
def scrapear_y_navegar(url_piso, num_pisos):
    # Repetir el proceso por el número de pisos deseados
    for i in range(num_pisos):
        driver.get(url_piso)

        # Esperar a que se carguen las características (con un máximo de 30 segundos)
        try:
            WebDriverWait(driver, 30).until(
                EC.presence_of_element_located((By.CLASS_NAME, 'features__content'))
            )
        except Exception as e:
            print(f"No se pudo cargar el contenido de la página {url_piso}: {e}")
            break

        # Extraer las características del inmueble
        caracteristicas = driver.find_elements(By.CLASS_NAME, 'features__feature')

        # Inicializar un diccionario para almacenar las características
        datos_piso = {}

        # Extraer cada característica individualmente
        for caracteristica in caracteristicas:
            try:
                label = caracteristica.find_element(By.CLASS_NAME, 'features__label').text.strip()  # El nombre de la característica
                value = caracteristica.find_element(By.CLASS_NAME, 'features__value').text.strip()  # El valor de la característica
                datos_piso[label] = value
            except Exception as e:
                print(f"Error extrayendo característica: {e}")
                continue

        # Guardar los datos extraídos en la lista de inmuebles
        inmuebles.append(datos_piso)

        # Intentar encontrar el enlace al siguiente piso
        try:
            siguiente_piso = driver.find_element(By.CLASS_NAME, 'navigation__link--next').get_attribute('href')
            print(f"Navegando al siguiente piso: {siguiente_piso}")
            url_piso = siguiente_piso  # Actualizar la URL para el siguiente piso
        except Exception as e:
            print("No se pudo encontrar el enlace al siguiente inmueble o no hay más inmuebles.")
            break

        # Añadir una pausa para no sobrecargar el servidor
        time.sleep(2)

# Llamar a la función para scrapear y navegar por 5 pisos (ajusta el número según tus necesidades)
scrapear_y_navegar(url_piso, 10)

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid_detalles.csv', index=False)

print("Datos extraídos y guardados en venta_madrid_detalles.csv")


No se pudo cargar el contenido de la página https://www.pisos.com/venta/pisos-madrid/: Message: 
Stacktrace:
	GetHandleVerifier [0x00423853+24035]
	(No symbol) [0x003ABBE4]
	(No symbol) [0x0028C2D3]
	(No symbol) [0x002CDC86]
	(No symbol) [0x002CDECB]
	(No symbol) [0x0030B9D2]
	(No symbol) [0x002EFED4]
	(No symbol) [0x0030953F]
	(No symbol) [0x002EFC26]
	(No symbol) [0x002C218C]
	(No symbol) [0x002C310D]
	GetHandleVerifier [0x006C9683+2800659]
	GetHandleVerifier [0x0072423E+3172302]
	GetHandleVerifier [0x0071CE52+3142626]
	GetHandleVerifier [0x004C6C00+692624]
	(No symbol) [0x003B4BFD]
	(No symbol) [0x003B1908]
	(No symbol) [0x003B1AA0]
	(No symbol) [0x003A3F50]
	BaseThreadInitThunk [0x768B7BA9+25]
	RtlInitializeExceptionChain [0x76FBC0CB+107]
	RtlClearBits [0x76FBC04F+191]

Datos extraídos y guardados en venta_madrid_detalles.csv


In [21]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# URL del primer piso en concreto
url_piso = "https://www.pisos.com/comprar/atico-nino_jesus28007-45066276232_997608/"

# Lista para almacenar los datos extraídos
inmuebles = []

# Función para scrapear un inmueble y navegar al siguiente
def scrapear_y_navegar(url_piso, num_pisos):
    # Repetir el proceso por el número de pisos deseados
    for i in range(num_pisos):
        driver.get(url_piso)

        # Esperar a que se carguen las características
        try:
            WebDriverWait(driver, 30).until(
                EC.presence_of_element_located((By.CLASS_NAME, 'features__content'))
            )
        except Exception as e:
            print(f"No se pudo cargar el contenido de la página {url_piso}: {e}")
            break

        # Inicializar un diccionario para almacenar las características
        datos_piso = {}

        try:
            # Extraer las características del inmueble
            caracteristicas = driver.find_elements(By.CLASS_NAME, 'features__feature')
            for caracteristica in caracteristicas:
                try:
                    label = caracteristica.find_element(By.CLASS_NAME, 'features__label').text.strip()
                    value = caracteristica.find_element(By.CLASS_NAME, 'features__value').text.strip()
                    datos_piso[label] = value
                except Exception as e:
                    print(f"Error extrayendo característica: {e}")
                    continue  # Si no se encuentra la característica, continuar con la siguiente

            # Guardar los datos extraídos en la lista de inmuebles
            inmuebles.append(datos_piso)

        except Exception as e:
            print(f"Error extrayendo las características del inmueble: {e}")

        # Intentar encontrar el enlace al siguiente piso
        try:
            siguiente_piso = driver.find_element(By.CLASS_NAME, 'navigation__link--next').get_attribute('href')
            print(f"Navegando al siguiente piso: {siguiente_piso}")
            url_piso = siguiente_piso  # Actualizar la URL para el siguiente piso
        except Exception as e:
            print("No se pudo encontrar el enlace al siguiente inmueble o no hay más inmuebles.")
            break

        # Añadir una pausa para no sobrecargar el servidor
        time.sleep(2)

# Llamar a la función para scrapear y navegar por 5 pisos (ajusta el número según tus necesidades)
scrapear_y_navegar(url_piso, 10)

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid_detalles.csv', index=False)

print("Datos extraídos y guardados en venta_madrid_detalles.csv")


Error extrayendo característica: Message: no such element: Unable to locate element: {"method":"css selector","selector":".features__value"}
  (Session info: chrome=130.0.6723.60); For documentation on this error, please visit: https://www.selenium.dev/documentation/webdriver/troubleshooting/errors#no-such-element-exception
Stacktrace:
	GetHandleVerifier [0x00423853+24035]
	(No symbol) [0x003ABBE4]
	(No symbol) [0x0028C2D3]
	(No symbol) [0x002CDC86]
	(No symbol) [0x002CDECB]
	(No symbol) [0x002C3CE1]
	(No symbol) [0x002EFED4]
	(No symbol) [0x002C3C04]
	(No symbol) [0x002F0124]
	(No symbol) [0x0030953F]
	(No symbol) [0x002EFC26]
	(No symbol) [0x002C218C]
	(No symbol) [0x002C310D]
	GetHandleVerifier [0x006C9683+2800659]
	GetHandleVerifier [0x0072423E+3172302]
	GetHandleVerifier [0x0071CE52+3142626]
	GetHandleVerifier [0x004C6C00+692624]
	(No symbol) [0x003B4BFD]
	(No symbol) [0x003B1908]
	(No symbol) [0x003B1AA0]
	(No symbol) [0x003A3F50]
	BaseThreadInitThunk [0x768B7BA9+25]
	RtlInitiali

In [22]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# URL base de pisos.com
url_base = "https://www.pisos.com/venta/pisos-madrid/"

# Lista para almacenar los datos extraídos
inmuebles = []

# Mantener un set para evitar duplicados
inmuebles_set = set()

# Función de scraping para pisos.com
def scrapear_pagina(num_pages):
    # Recorrer varias páginas mediante la construcción de URLs
    for page in range(1, num_pages + 1):
        url = f"{url_base}{page}/"
        print(f"Scraping página: {url}")
        
        # Abrir la página actual
        driver.get(url)
        
        # Esperar explícitamente a que los anuncios estén presentes
        anuncios = WebDriverWait(driver, 20).until(
            EC.presence_of_all_elements_located((By.CLASS_NAME, 'ad-preview'))
        )
        print(f"Se encontraron {len(anuncios)} anuncios en la página {page}.")

        # Extraer información de cada anuncio
        for anuncio in anuncios:
            try:
                # Extraer el título del anuncio si está presente
                try:
                    titulo = anuncio.find_element(By.CLASS_NAME, 'ad-preview__title').text
                except:
                    titulo = 'Sin título'
                
                # Extraer la ubicación del anuncio si está presente
                try:
                    ubicacion = anuncio.find_element(By.CLASS_NAME, 'ad-preview__subtitle').text
                except:
                    ubicacion = 'Sin ubicación'
                
                # Extraer el precio si está presente
                try:
                    precio = anuncio.find_element(By.CLASS_NAME, 'ad-preview__price').text
                except:
                    precio = 'Sin precio'
                
                # Extraer los detalles adicionales (habitaciones, baños, etc.)
                detalles = anuncio.find_elements(By.CLASS_NAME, 'ad-preview__char')
                habitaciones = detalles[0].text if len(detalles) > 0 else 'Sin información'
                banos = detalles[1].text if len(detalles) > 1 else 'Sin información'
                metros_cuadrados = detalles[2].text if len(detalles) > 2 else 'Sin información'
                planta = detalles[3].text if len(detalles) > 3 else 'Sin información'

                # Generar un identificador único más preciso combinando más campos
                identificador = f"{titulo}-{ubicacion}-{precio}-{habitaciones}-{banos}-{metros_cuadrados}-{planta}"
                
                # Verificar si el identificador ya está en el set
                if identificador not in inmuebles_set:
                    inmuebles.append({
                        'Título': titulo,
                        'Ubicación': ubicacion,
                        'Precio': precio,
                        'Habitaciones': habitaciones,
                        'Baños': banos,
                        'Metros Cuadrados': metros_cuadrados,
                        'Planta': planta
                    })
                    inmuebles_set.add(identificador)  # Añadir al set para evitar duplicados
            except Exception as e:
                print(f"Error extrayendo información: {e}")

# Llamada a la función de scraping para pisos.com (puedes ajustar el número de páginas a recorrer)
scrapear_pagina(20)

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('pisos6.csv', index=False)

print("Datos extraídos y guardados en pisos6.csv")


Scraping página: https://www.pisos.com/venta/pisos-madrid/1/
Se encontraron 31 anuncios en la página 1.
Scraping página: https://www.pisos.com/venta/pisos-madrid/2/
Se encontraron 31 anuncios en la página 2.
Scraping página: https://www.pisos.com/venta/pisos-madrid/3/
Se encontraron 31 anuncios en la página 3.
Scraping página: https://www.pisos.com/venta/pisos-madrid/4/
Se encontraron 31 anuncios en la página 4.
Scraping página: https://www.pisos.com/venta/pisos-madrid/5/
Se encontraron 31 anuncios en la página 5.
Scraping página: https://www.pisos.com/venta/pisos-madrid/6/
Se encontraron 31 anuncios en la página 6.
Scraping página: https://www.pisos.com/venta/pisos-madrid/7/
Se encontraron 31 anuncios en la página 7.
Scraping página: https://www.pisos.com/venta/pisos-madrid/8/
Se encontraron 31 anuncios en la página 8.
Scraping página: https://www.pisos.com/venta/pisos-madrid/9/
Se encontraron 31 anuncios en la página 9.
Scraping página: https://www.pisos.com/venta/pisos-madrid/10/
Se

In [6]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# URL base de la primera página
url_base = "https://www.pisos.com/venta/pisos-madrid/"

# Lista para almacenar los datos extraídos
inmuebles = []

# Función para scrapear las características de un inmueble
def scrapear_detalles_inmueble():
    try:
        # Extraer título
        titulo = driver.find_element(By.CSS_SELECTOR, 'h1').text
        
        # Extraer precio
        try:
            precio = driver.find_element(By.CSS_SELECTOR, 'span.price').text
        except:
            precio = 'Sin precio'
        
        # Extraer características
        caracteristicas = {}
        detalles = driver.find_elements(By.CSS_SELECTOR, 'div.features__feature')
        for detalle in detalles:
            try:
                label = detalle.find_element(By.CLASS_NAME, 'features__label').text
                value = detalle.find_element(By.CLASS_NAME, 'features__value').text
                caracteristicas[label] = value
            except:
                print("Error extrayendo característica, continuando con el siguiente...")
        
        # Añadir los detalles extraídos a la lista de inmuebles
        inmuebles.append({
            'Título': titulo,
            'Precio': precio,
            **caracteristicas
        })
    
    except Exception as e:
        print(f"Error extrayendo detalles del inmueble: {e}")

# Función para eliminar el pop-up
def eliminar_popup():
    try:
        # Verifica si el popbox está visible
        popbox = driver.find_element(By.CLASS_NAME, 'popbox.visible')
        if popbox:
            # Usar JavaScript para eliminar el pop-up del DOM
            driver.execute_script("""
                var element = document.getElementsByClassName('popbox visible')[0];
                if (element) {
                    element.parentNode.removeChild(element);
                }
            """)
            print("Pop-up eliminado exitosamente.")
    except:
        print("No se encontró el pop-up o ya fue eliminado.")

# Función para navegar entre inmuebles
def scrapear_todos_inmuebles():
    # Abrir la primera página
    driver.get(url_base)
    
    while True:
        try:
            # Eliminar pop-up si está presente
            eliminar_popup()
            
            # Esperar a que el anuncio esté clicable
            anuncio = WebDriverWait(driver, 20).until(
                EC.element_to_be_clickable((By.CLASS_NAME, 'ad-preview__title'))
            )
            
            # Intentar hacer clic usando JavaScript para evitar el error de intercepción
            driver.execute_script("arguments[0].scrollIntoView(true);", anuncio)
            time.sleep(1)  # Añadir una pequeña espera para asegurar que el scroll se complete
            driver.execute_script("arguments[0].click();", anuncio)
            
            # Extraer detalles del inmueble
            scrapear_detalles_inmueble()
            
            # Esperar y buscar el botón "Siguiente"
            try:
                siguiente_boton = WebDriverWait(driver, 20).until(
                    EC.element_to_be_clickable((By.LINK_TEXT, 'Siguiente →'))
                )
                siguiente_boton.click()
                time.sleep(2)  # Espera antes de continuar con el siguiente anuncio
            except:
                print("No se pudo encontrar el enlace al siguiente inmueble o no hay más inmuebles.")
                break
            
        except Exception as e:
            print(f"Error navegando entre inmuebles: {e}")
            break

# Llamar a la función para scrapear los inmuebles
scrapear_todos_inmuebles()

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid_detalles.csv', index=False)

print("Datos extraídos y guardados en venta_madrid_detalles.csv")


No se encontró el pop-up o ya fue eliminado.
Error extrayendo característica, continuando con el siguiente...
Error extrayendo característica, continuando con el siguiente...
Error extrayendo característica, continuando con el siguiente...
Error extrayendo característica, continuando con el siguiente...
No se pudo encontrar el enlace al siguiente inmueble o no hay más inmuebles.
Datos extraídos y guardados en venta_madrid_detalles.csv


In [7]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# URL base de la primera página
url_base = "https://www.pisos.com/venta-madrid/"

# Lista para almacenar los datos extraídos
inmuebles = []

# Función para scrapear las características de un inmueble
def scrapear_detalles_inmueble():
    try:
        # Extraer título
        titulo = driver.find_element(By.CSS_SELECTOR, 'h1').text if driver.find_elements(By.CSS_SELECTOR, 'h1') else 'Sin título'
        
        # Extraer precio
        precio = driver.find_element(By.CSS_SELECTOR, 'span.price').text if driver.find_elements(By.CSS_SELECTOR, 'span.price') else 'Sin precio'
        
        # Extraer características
        caracteristicas = {}
        detalles = driver.find_elements(By.CSS_SELECTOR, 'div.features__feature')
        for detalle in detalles:
            try:
                label = detalle.find_element(By.CLASS_NAME, 'features__label').text if detalle.find_elements(By.CLASS_NAME, 'features__label') else 'Sin información'
                value = detalle.find_element(By.CLASS_NAME, 'features__value').text if detalle.find_elements(By.CLASS_NAME, 'features__value') else 'Sin valor'
                caracteristicas[label] = value
            except Exception as e:
                print(f"Error extrayendo característica: {e}, continuando con el siguiente...")
        
        # Añadir los detalles extraídos a la lista de inmuebles
        inmuebles.append({
            'Título': titulo,
            'Precio': precio,
            **caracteristicas
        })
    
    except Exception as e:
        print(f"Error extrayendo detalles del inmueble: {e}")

# Función para eliminar el pop-up
def eliminar_popup():
    try:
        # Verifica si el popbox está visible
        popbox = driver.find_element(By.CLASS_NAME, 'popbox.visible')
        if popbox:
            # Usar JavaScript para eliminar el pop-up del DOM
            driver.execute_script("""
                var element = document.getElementsByClassName('popbox visible')[0];
                if (element) {
                    element.parentNode.removeChild(element);
                }
            """)
            print("Pop-up eliminado exitosamente.")
    except:
        print("No se encontró el pop-up o ya fue eliminado.")

# Función para navegar entre inmuebles
def scrapear_todos_inmuebles():
    # Abrir la primera página
    driver.get(url_base)
    
    while True:
        try:
            # Eliminar pop-up si está presente
            eliminar_popup()
            
            # Esperar a que el anuncio esté clicable
            anuncio = WebDriverWait(driver, 20).until(
                EC.element_to_be_clickable((By.CLASS_NAME, 'ad-preview__title'))
            )
            
            # Intentar hacer clic usando JavaScript para evitar el error de intercepción
            driver.execute_script("arguments[0].scrollIntoView(true);", anuncio)
            time.sleep(1)  # Añadir una pequeña espera para asegurar que el scroll se complete
            driver.execute_script("arguments[0].click();", anuncio)
            
            # Extraer detalles del inmueble
            scrapear_detalles_inmueble()
            
            # Esperar y buscar el botón "Siguiente"
            try:
                siguiente_boton = WebDriverWait(driver, 20).until(
                    EC.element_to_be_clickable((By.LINK_TEXT, 'Siguiente →'))
                )
                siguiente_boton.click()
                time.sleep(2)  # Espera antes de continuar con el siguiente anuncio
            except:
                print("No se pudo encontrar el enlace al siguiente inmueble o no hay más inmuebles.")
                break
            
        except Exception as e:
            print(f"Error navegando entre inmuebles: {e}")
            break

# Llamar a la función para scrapear los inmuebles
scrapear_todos_inmuebles()

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid_detalles.csv', index=False)

print("Datos extraídos y guardados en venta_madrid_detalles.csv")


No se encontró el pop-up o ya fue eliminado.
No se pudo encontrar el enlace al siguiente inmueble o no hay más inmuebles.
Datos extraídos y guardados en venta_madrid_detalles.csv


In [10]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# Lista para almacenar los datos extraídos
inmuebles = []

# Función para scrapear las características de un inmueble
def scrapear_detalles_inmueble():
    try:
        # Espera explícita para asegurarse de que el título esté disponible
        titulo = WebDriverWait(driver, 20).until(
            EC.presence_of_element_located((By.CSS_SELECTOR, 'h1'))
        ).text if driver.find_elements(By.CSS_SELECTOR, 'h1') else 'Sin título'
        
        # Espera explícita para el precio
        precio = driver.find_element(By.CSS_SELECTOR, 'span.price').text if driver.find_elements(By.CSS_SELECTOR, 'span.price') else 'Sin precio'
        
        # Extraer características (ajustamos el selector si es necesario)
        caracteristicas = {}
        detalles = driver.find_elements(By.CSS_SELECTOR, 'div.features__feature')
        for detalle in detalles:
            try:
                label = detalle.find_element(By.CLASS_NAME, 'features__label').text if detalle.find_elements(By.CLASS_NAME, 'features__label') else 'Sin información'
                value = detalle.find_element(By.CLASS_NAME, 'features__value').text if detalle.find_elements(By.CLASS_NAME, 'features__value') else 'Sin valor'
                caracteristicas[label] = value
            except Exception as e:
                print(f"Error extrayendo característica: {e}, continuando con el siguiente...")

        # Añadir los detalles extraídos a la lista de inmuebles
        inmuebles.append({
            'Título': titulo,
            'Precio': precio,
            **caracteristicas
        })
    
    except Exception as e:
        print(f"Error extrayendo detalles del inmueble: {e}")

# Función para eliminar el pop-up si aparece
def eliminar_popup():
    try:
        # Verifica si el popbox está visible y lo elimina
        popbox = driver.find_element(By.CLASS_NAME, 'popbox.visible')
        if popbox:
            driver.execute_script("arguments[0].parentNode.removeChild(arguments[0]);", popbox)
            print("Pop-up eliminado exitosamente.")
    except:
        print("No se encontró el pop-up o ya fue eliminado.")

# Función para scrapear todos los inmuebles
def scrapear_todos_inmuebles():
    driver.get("https://www.pisos.com/venta/pisos-madrid/")
    
    while True:
        try:
            # Eliminar el pop-up si aparece
            eliminar_popup()
            
            # Extraer detalles del inmueble
            scrapear_detalles_inmueble()
            
            # Verificar si el botón "Siguiente" está presente y clicarlo
            try:
                siguiente_boton = WebDriverWait(driver, 20).until(
                    EC.element_to_be_clickable((By.CLASS_NAME, 'navigation__link--next'))
                )
                siguiente_boton.click()
                time.sleep(2)  # Espera antes de continuar al siguiente inmueble
            except:
                print("No se pudo encontrar el botón 'Siguiente', terminando el scraping.")
                break

        except Exception as e:
            print(f"Error navegando entre inmuebles: {e}")
            break

# Llamar a la función para scrapear los inmuebles
scrapear_todos_inmuebles()

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid_detalles.csv', index=False)

print("Datos extraídos y guardados en venta_madrid_detalles.csv")


No se encontró el pop-up o ya fue eliminado.
No se pudo encontrar el botón 'Siguiente', terminando el scraping.
Datos extraídos y guardados en venta_madrid_detalles.csv


In [12]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# Lista para almacenar los datos extraídos
inmuebles = []

# Función para scrapear las características de un inmueble
def scrapear_detalles_inmueble():
    try:
        # Esperar a que el título esté presente y extraerlo
        titulo = WebDriverWait(driver, 20).until(
            EC.presence_of_element_located((By.TAG_NAME, 'h1'))
        ).text if driver.find_elements(By.TAG_NAME, 'h1') else 'Sin título'
        
        # Extraer el precio
        precio = driver.find_element(By.CLASS_NAME, 'details__featured__price').text if driver.find_elements(By.CLASS_NAME, 'details__featured__price') else 'Sin precio'
        
        # Extraer características
        caracteristicas = {}
        detalles = driver.find_elements(By.CLASS_NAME, 'features__feature')
        for detalle in detalles:
            try:
                label = detalle.find_element(By.CLASS_NAME, 'features__label').text if detalle.find_elements(By.CLASS_NAME, 'features__label') else 'Sin información'
                value = detalle.find_element(By.CLASS_NAME, 'features__value').text if detalle.find_elements(By.CLASS_NAME, 'features__value') else 'Sin valor'
                caracteristicas[label] = value
            except Exception as e:
                print(f"Error extrayendo característica: {e}, continuando con el siguiente...")
        
        # Añadir los detalles extraídos a la lista de inmuebles
        inmuebles.append({
            'Título': titulo,
            'Precio': precio,
            **caracteristicas
        })
    
    except Exception as e:
        print(f"Error extrayendo detalles del inmueble: {e}")

# Función para extraer los enlaces de los inmuebles en la página de listados
def obtener_enlaces_inmuebles():
    enlaces = []
    try:
        # Esperar a que los anuncios estén presentes y obtener los enlaces
        anuncios = WebDriverWait(driver, 20).until(
            EC.presence_of_all_elements_located((By.CLASS_NAME, 'ad-preview__title'))
        )
        for anuncio in anuncios:
            enlace = anuncio.find_element(By.TAG_NAME, 'a').get_attribute('href')
            enlaces.append(enlace)
        return enlaces
    except Exception as e:
        print(f"Error obteniendo enlaces de inmuebles: {e}")
        return enlaces

# Función principal para scrapear todos los inmuebles
def scrapear_todos_inmuebles(num_paginas):
    for pagina in range(1, num_paginas + 1):
        url_pagina = f"https://www.pisos.com/venta/pisos-madrid/{pagina}/"
        print(f"Scraping página: {url_pagina}")
        driver.get(url_pagina)
        
        # Obtener los enlaces de los inmuebles en la página actual
        enlaces = obtener_enlaces_inmuebles()
        
        # Navegar a cada enlace de inmueble y extraer los datos
        for enlace in enlaces:
            try:
                driver.get(enlace)
                scrapear_detalles_inmueble()
                time.sleep(1)  # Añadir una pequeña espera para evitar sobrecargar el servidor
            except Exception as e:
                print(f"Error navegando al enlace {enlace}: {e}")

# Llamada a la función de scraping para pisos.com (puedes ajustar el número de páginas a recorrer)
scrapear_todos_inmuebles(10)

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid_detalles.csv', index=False)

print("Datos extraídos y guardados en venta_madrid_detalles.csv")


Scraping página: https://www.pisos.com/venta/pisos-madrid/1/
Error obteniendo enlaces de inmuebles: Message: no such element: Unable to locate element: {"method":"tag name","selector":"a"}
  (Session info: chrome=130.0.6723.60); For documentation on this error, please visit: https://www.selenium.dev/documentation/webdriver/troubleshooting/errors#no-such-element-exception
Stacktrace:
	GetHandleVerifier [0x00423853+24035]
	(No symbol) [0x003ABBE4]
	(No symbol) [0x0028C2D3]
	(No symbol) [0x002CDC86]
	(No symbol) [0x002CDECB]
	(No symbol) [0x002C3CE1]
	(No symbol) [0x002EFED4]
	(No symbol) [0x002C3C04]
	(No symbol) [0x002F0124]
	(No symbol) [0x0030953F]
	(No symbol) [0x002EFC26]
	(No symbol) [0x002C218C]
	(No symbol) [0x002C310D]
	GetHandleVerifier [0x006C9683+2800659]
	GetHandleVerifier [0x0072423E+3172302]
	GetHandleVerifier [0x0071CE52+3142626]
	GetHandleVerifier [0x004C6C00+692624]
	(No symbol) [0x003B4BFD]
	(No symbol) [0x003B1908]
	(No symbol) [0x003B1AA0]
	(No symbol) [0x003A3F50]
	

KeyboardInterrupt: 

In [14]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# Lista para almacenar los datos extraídos
inmuebles = []

# Función para scrapear las características de un inmueble
def scrapear_detalles_inmueble():
    try:
        # Esperar a que el título esté presente y extraerlo
        titulo = WebDriverWait(driver, 20).until(
            EC.presence_of_element_located((By.TAG_NAME, 'h1'))
        ).text if driver.find_elements(By.TAG_NAME, 'h1') else 'Sin título'
        
        # Extraer el precio
        precio = driver.find_element(By.CLASS_NAME, 'details__featured__price').text if driver.find_elements(By.CLASS_NAME, 'details__featured__price') else 'Sin precio'
        
        # Extraer características
        caracteristicas = {}
        detalles = driver.find_elements(By.CLASS_NAME, 'features__feature')
        for detalle in detalles:
            try:
                label = detalle.find_element(By.CLASS_NAME, 'features__label').text if detalle.find_elements(By.CLASS_NAME, 'features__label') else 'Sin información'
                value = detalle.find_element(By.CLASS_NAME, 'features__value').text if detalle.find_elements(By.CLASS_NAME, 'features__value') else 'Sin valor'
                caracteristicas[label] = value
            except Exception as e:
                print(f"Error extrayendo característica: {e}, continuando con el siguiente...")
        
        # Añadir los detalles extraídos a la lista de inmuebles
        inmuebles.append({
            'Título': titulo,
            'Precio': precio,
            **caracteristicas
        })
    
    except Exception as e:
        print(f"Error extrayendo detalles del inmueble: {e}")

# Función para navegar entre inmuebles usando el botón "Siguiente"
def navegar_siguiente_inmueble():
    try:
        # Verificar si el botón "Siguiente" está presente y clicarlo
        siguiente_boton = WebDriverWait(driver, 20).until(
            EC.element_to_be_clickable((By.CLASS_NAME, 'navigation__link--next'))
        )
        siguiente_boton.click()
        time.sleep(2)  # Espera antes de continuar al siguiente inmueble
    except Exception as e:
        print("No se pudo encontrar el botón 'Siguiente', terminando el scraping.")
        return False
    return True

# Función principal para scrapear todos los inmuebles
def scrapear_todos_inmuebles():
    # Abrir la primera página de inmuebles
    driver.get("https://www.pisos.com/venta/pisos-madrid/")
    
    while True:
        try:
            # Extraer detalles del inmueble actual
            scrapear_detalles_inmueble()
            
            # Intentar navegar al siguiente inmueble
            if not navegar_siguiente_inmueble():
                break

        except Exception as e:
            print(f"Error navegando entre inmuebles: {e}")
            break

# Llamar a la función para scrapear los inmuebles
scrapear_todos_inmuebles()

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid_detalles.csv', index=False)

print("Datos extraídos y guardados en venta_madrid_detalles.csv")


No se pudo encontrar el botón 'Siguiente', terminando el scraping.
Datos extraídos y guardados en venta_madrid_detalles.csv


In [16]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# Lista para almacenar los datos extraídos
inmuebles = []

# Función para scrapear las características de un inmueble
def scrapear_detalles_inmueble():
    try:
        # Esperar a que el título esté presente y extraerlo
        titulo = WebDriverWait(driver, 20).until(
            EC.presence_of_element_located((By.TAG_NAME, 'h1'))
        ).text if driver.find_elements(By.TAG_NAME, 'h1') else 'Sin título'
        
        # Extraer el precio
        precio = driver.find_element(By.CLASS_NAME, 'details__featured__price').text if driver.find_elements(By.CLASS_NAME, 'details__featured__price') else 'Sin precio'
        
        # Extraer características
        caracteristicas = {}
        detalles = driver.find_elements(By.CLASS_NAME, 'features__feature')
        for detalle in detalles:
            try:
                label = detalle.find_element(By.CLASS_NAME, 'features__label').text if detalle.find_elements(By.CLASS_NAME, 'features__label') else 'Sin información'
                value = detalle.find_element(By.CLASS_NAME, 'features__value').text if detalle.find_elements(By.CLASS_NAME, 'features__value') else 'Sin valor'
                caracteristicas[label] = value
            except Exception as e:
                print(f"Error extrayendo característica: {e}, continuando con el siguiente...")
        
        # Añadir los detalles extraídos a la lista de inmuebles
        inmuebles.append({
            'Título': titulo,
            'Precio': precio,
            **caracteristicas
        })
    
    except Exception as e:
        print(f"Error extrayendo detalles del inmueble: {e}")

# Función para navegar entre inmuebles usando el botón "Siguiente"
def navegar_siguiente_inmueble():
    try:
        # Desplazarse al botón "Siguiente" y esperar a que sea clicable
        siguiente_boton = WebDriverWait(driver, 20).until(
            EC.element_to_be_clickable((By.CLASS_NAME, 'navigation__link--next'))
        )
        # Asegurarse de que el botón es visible y desplazarse hasta él
        driver.execute_script("arguments[0].scrollIntoView(true);", siguiente_boton)
        time.sleep(1)  # Añadir una pequeña espera para asegurarse de que el scroll se complete
        siguiente_boton.click()
        time.sleep(2)  # Espera antes de continuar al siguiente inmueble
        return True
    except Exception as e:
        print(f"No se pudo encontrar o hacer clic en el botón 'Siguiente', terminando el scraping: {e}")
        return False

# Función principal para scrapear todos los inmuebles
def scrapear_todos_inmuebles():
    # Abrir la primera página de inmuebles
    driver.get("https://www.pisos.com/venta/pisos-madrid/")
    
    while True:
        try:
            # Extraer detalles del inmueble actual
            scrapear_detalles_inmueble()
            
            # Intentar navegar al siguiente inmueble
            if not navegar_siguiente_inmueble():
                break

        except Exception as e:
            print(f"Error navegando entre inmuebles: {e}")
            break

# Llamar a la función para scrapear los inmuebles
scrapear_todos_inmuebles()

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid_detalles.csv', index=False)

print("Datos extraídos y guardados en venta_madrid_detalles.csv")


No se pudo encontrar o hacer clic en el botón 'Siguiente', terminando el scraping: Message: 
Stacktrace:
	GetHandleVerifier [0x00423853+24035]
	(No symbol) [0x003ABBE4]
	(No symbol) [0x0028C2D3]
	(No symbol) [0x002CDC86]
	(No symbol) [0x002CDECB]
	(No symbol) [0x0030B9D2]
	(No symbol) [0x002EFED4]
	(No symbol) [0x0030953F]
	(No symbol) [0x002EFC26]
	(No symbol) [0x002C218C]
	(No symbol) [0x002C310D]
	GetHandleVerifier [0x006C9683+2800659]
	GetHandleVerifier [0x0072423E+3172302]
	GetHandleVerifier [0x0071CE52+3142626]
	GetHandleVerifier [0x004C6C00+692624]
	(No symbol) [0x003B4BFD]
	(No symbol) [0x003B1908]
	(No symbol) [0x003B1AA0]
	(No symbol) [0x003A3F50]
	BaseThreadInitThunk [0x768B7BA9+25]
	RtlInitializeExceptionChain [0x76FBC0CB+107]
	RtlClearBits [0x76FBC04F+191]

Datos extraídos y guardados en venta_madrid_detalles.csv


In [17]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# Lista para almacenar los datos extraídos
inmuebles = []

# Función para scrapear las características de un inmueble
def scrapear_detalles_inmueble():
    try:
        # Esperar a que el título esté presente y extraerlo
        titulo = WebDriverWait(driver, 30).until(
            EC.presence_of_element_located((By.TAG_NAME, 'h1'))
        ).text if driver.find_elements(By.TAG_NAME, 'h1') else 'Sin título'
        
        # Extraer el precio
        precio = driver.find_element(By.CLASS_NAME, 'details__featured__price').text if driver.find_elements(By.CLASS_NAME, 'details__featured__price') else 'Sin precio'
        
        # Extraer características
        caracteristicas = {}
        detalles = driver.find_elements(By.CLASS_NAME, 'features__feature')
        for detalle in detalles:
            try:
                label = detalle.find_element(By.CLASS_NAME, 'features__label').text if detalle.find_elements(By.CLASS_NAME, 'features__label') else 'Sin información'
                value = detalle.find_element(By.CLASS_NAME, 'features__value').text if detalle.find_elements(By.CLASS_NAME, 'features__value') else 'Sin valor'
                caracteristicas[label] = value
            except Exception as e:
                print(f"Error extrayendo característica: {e}, continuando con el siguiente...")
        
        # Añadir los detalles extraídos a la lista de inmuebles
        inmuebles.append({
            'Título': titulo,
            'Precio': precio,
            **caracteristicas
        })
    
    except Exception as e:
        print(f"Error extrayendo detalles del inmueble: {e}")

# Función para navegar entre inmuebles usando el botón "Siguiente"
def navegar_siguiente_inmueble():
    try:
        # Desplazarse al botón "Siguiente" y esperar a que sea clicable
        siguiente_boton = WebDriverWait(driver, 30).until(
            EC.presence_of_element_located((By.CLASS_NAME, 'navigation__link--next'))
        )
        # Asegurarse de que el botón es visible y desplazarse hasta él
        driver.execute_script("arguments[0].scrollIntoView(true);", siguiente_boton)
        time.sleep(1)  # Añadir una pequeña espera para asegurarse de que el scroll se complete
        siguiente_boton.click()
        time.sleep(2)  # Espera antes de continuar al siguiente inmueble
        return True
    except Exception as e:
        print(f"No se pudo encontrar o hacer clic en el botón 'Siguiente', terminando el scraping: {e}")
        return False

# Función principal para scrapear todos los inmuebles
def scrapear_todos_inmuebles():
    # Abrir la primera página de inmuebles
    driver.get("https://www.pisos.com/comprar/duplex-centro_la_estacion_prado_de_la_laguna-4294468571_109700/")
    
    while True:
        try:
            # Extraer detalles del inmueble actual
            scrapear_detalles_inmueble()
            
            # Intentar navegar al siguiente inmueble
            if not navegar_siguiente_inmueble():
                break

        except Exception as e:
            print(f"Error navegando entre inmuebles: {e}")
            break

# Llamar a la función para scrapear los inmuebles
scrapear_todos_inmuebles()

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid_detalles.csv', index=False)

print("Datos extraídos y guardados en venta_madrid_detalles.csv")


No se pudo encontrar o hacer clic en el botón 'Siguiente', terminando el scraping: Message: 
Stacktrace:
	GetHandleVerifier [0x00423853+24035]
	(No symbol) [0x003ABBE4]
	(No symbol) [0x0028C2D3]
	(No symbol) [0x002CDC86]
	(No symbol) [0x002CDECB]
	(No symbol) [0x0030B9D2]
	(No symbol) [0x002EFED4]
	(No symbol) [0x0030953F]
	(No symbol) [0x002EFC26]
	(No symbol) [0x002C218C]
	(No symbol) [0x002C310D]
	GetHandleVerifier [0x006C9683+2800659]
	GetHandleVerifier [0x0072423E+3172302]
	GetHandleVerifier [0x0071CE52+3142626]
	GetHandleVerifier [0x004C6C00+692624]
	(No symbol) [0x003B4BFD]
	(No symbol) [0x003B1908]
	(No symbol) [0x003B1AA0]
	(No symbol) [0x003A3F50]
	BaseThreadInitThunk [0x768B7BA9+25]
	RtlInitializeExceptionChain [0x76FBC0CB+107]
	RtlClearBits [0x76FBC04F+191]

Datos extraídos y guardados en venta_madrid_detalles.csv


In [19]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import time

# Inicializar el navegador
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# Lista para almacenar los datos extraídos
inmuebles = []

# Función para scrapear las características de un inmueble
def scrapear_detalles_inmueble():
    try:
        # Esperar a que el título esté presente y extraerlo
        titulo = WebDriverWait(driver, 30).until(
            EC.presence_of_element_located((By.TAG_NAME, 'h1'))
        ).text if driver.find_elements(By.TAG_NAME, 'h1') else 'Sin título'
        
        # Extraer el precio
        precio = driver.find_element(By.CLASS_NAME, 'details__featured__price').text if driver.find_elements(By.CLASS_NAME, 'details__featured__price') else 'Sin precio'
        
        # Extraer características
        caracteristicas = {}
        detalles = driver.find_elements(By.CLASS_NAME, 'features__feature')
        for detalle in detalles:
            try:
                label = detalle.find_element(By.CLASS_NAME, 'features__label').text if detalle.find_elements(By.CLASS_NAME, 'features__label') else 'Sin información'
                value = detalle.find_element(By.CLASS_NAME, 'features__value').text if detalle.find_elements(By.CLASS_NAME, 'features__value') else 'Sin valor'
                caracteristicas[label] = value
            except Exception as e:
                print(f"Error extrayendo característica: {e}, continuando con el siguiente...")
        
        # Añadir los detalles extraídos a la lista de inmuebles
        inmuebles.append({
            'Título': titulo,
            'Precio': precio,
            **caracteristicas
        })
    
    except Exception as e:
        print(f"Error extrayendo detalles del inmueble: {e}")

# Función para manejar clics en el botón "Siguiente"
def intentar_navegar_siguiente():
    intentos = 3  # Número de intentos para encontrar y hacer clic en el botón "Siguiente"
    for intento in range(intentos):
        try:
            # Desplazarse al botón "Siguiente" y esperar a que sea clicable
            siguiente_boton = WebDriverWait(driver, 30).until(
                EC.element_to_be_clickable((By.CLASS_NAME, 'navigation__link--next'))
            )
            driver.execute_script("arguments[0].scrollIntoView(true);", siguiente_boton)
            time.sleep(1)  # Añadir una pequeña espera para asegurarse de que el scroll se complete
            siguiente_boton.click()
            time.sleep(2)  # Espera antes de continuar al siguiente inmueble
            return True
        except Exception as e:
            print(f"Intento {intento+1} fallido al hacer clic en 'Siguiente': {e}")
    print("No se pudo encontrar o hacer clic en el botón 'Siguiente' después de varios intentos.")
    return False

# Función principal para scrapear todos los inmuebles
def scrapear_todos_inmuebles():
    # Abrir la primera página de inmuebles
    driver.get("https://www.pisos.com/venta/pisos-madrid/")
    
    while True:
        try:
            # Extraer detalles del inmueble actual
            scrapear_detalles_inmueble()
            
            # Intentar navegar al siguiente inmueble
            if not intentar_navegar_siguiente():
                break

        except Exception as e:
            print(f"Error navegando entre inmuebles: {e}")
            break

# Llamar a la función para scrapear los inmuebles
scrapear_todos_inmuebles()

# Cerrar el navegador
driver.quit()

# Guardar los datos en un archivo CSV
df = pd.DataFrame(inmuebles)
df.to_csv('venta_madrid_detalles.csv', index=False)

print("Datos extraídos y guardados en venta_madrid_detalles.csv")


Intento 1 fallido al hacer clic en 'Siguiente': Message: 
Stacktrace:
	GetHandleVerifier [0x00423853+24035]
	(No symbol) [0x003ABBE4]
	(No symbol) [0x0028C2D3]
	(No symbol) [0x002CDC86]
	(No symbol) [0x002CDECB]
	(No symbol) [0x0030B9D2]
	(No symbol) [0x002EFED4]
	(No symbol) [0x0030953F]
	(No symbol) [0x002EFC26]
	(No symbol) [0x002C218C]
	(No symbol) [0x002C310D]
	GetHandleVerifier [0x006C9683+2800659]
	GetHandleVerifier [0x0072423E+3172302]
	GetHandleVerifier [0x0071CE52+3142626]
	GetHandleVerifier [0x004C6C00+692624]
	(No symbol) [0x003B4BFD]
	(No symbol) [0x003B1908]
	(No symbol) [0x003B1AA0]
	(No symbol) [0x003A3F50]
	BaseThreadInitThunk [0x768B7BA9+25]
	RtlInitializeExceptionChain [0x76FBC0CB+107]
	RtlClearBits [0x76FBC04F+191]

Intento 2 fallido al hacer clic en 'Siguiente': Message: 
Stacktrace:
	GetHandleVerifier [0x00423853+24035]
	(No symbol) [0x003ABBE4]
	(No symbol) [0x0028C2D3]
	(No symbol) [0x002CDC86]
	(No symbol) [0x002CDECB]
	(No symbol) [0x0030B9D2]
	(No symbol) [0x