In [5]:
import requests
from bs4 import BeautifulSoup
import json

# Función para realizar scraping de propiedades
def scrape_properties(city_url, city_name):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36'
    }
    response = requests.get(city_url, headers=headers)
    soup = BeautifulSoup(response.text, 'html.parser')

    properties = []

    # Encuentra las tarjetas de propiedad, ajusta los selectores según la estructura del HTML
    for property_card in soup.find_all('div', class_='card-info'):  # Ajusta según la página
        try:
            price = property_card.find('span', class_='item-price').text.strip().replace('$', '').replace('.', '').strip()
            size = property_card.find('span', class_='item-surface').text.strip() if property_card.find('span', class_='item-surface') else 'N/A'
            bedrooms = property_card.find('span', class_='item-rooms').text.strip() if property_card.find('span', class_='item-rooms') else 'N/A'
            link = property_card.find('a', href=True)['href']

            properties.append({
                'precio': int(price),
                'tamano': size,
                'habitaciones': bedrooms,
                'link': link
            })
        except AttributeError:
            continue  # Ignora si falta información

    return {
        "nombre": city_name,
        "propiedades": properties
    }

# URLs de las ciudades a scrapear
urls = {
    'Montevideo': 'https://www.zonaprop.com.uy/inmuebles-venta-montevideo.html',
    'Punta del Este': 'https://www.zonaprop.com.uy/inmuebles-venta-punta-del-este.html',
    'Salto': 'https://www.zonaprop.com.uy/inmuebles-venta-salto.html'
}

# Inicializar la lista de todas las ciudades y sus propiedades
ciudades = []

# Recolectar datos de cada ciudad
for city, url in urls.items():
    city_data = scrape_properties(url, city)
    ciudades.append(city_data)

# Guardar los datos en un archivo JSON
with open('propiedades.json', 'w') as json_file:
    json.dump({"ciudades": ciudades}, json_file, indent=4)

print("Scraping completado. Datos guardados en 'propiedades.json'.")


Scraping completado. Datos guardados en 'propiedades.json'.
