In [1]:
import requests
from bs4 import BeautifulSoup
import sqlite3
import csv
import time

# Paso 1: Definir funciones para extraer y almacenar datos

def extract_data_from_page(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.content, "html.parser")
    
    records = []
    
    for item in soup.find_all("div", class_="re-Card"):
        title = item.find("span", class_="re-Card-title").text.strip()
        price = item.find("span", class_="re-Card-price").text.strip()
        location = item.find("div", class_="re-Card-location").text.strip()
        records.append((title, price, location))
    
    return records

def save_to_database(records):
    conn = sqlite3.connect("fotocasa_properties.db")
    cursor = conn.cursor()
    
    cursor.execute('''
        CREATE TABLE IF NOT EXISTS properties (
            id INTEGER PRIMARY KEY,
            title TEXT,
            price TEXT,
            location TEXT
        )
    ''')
    
    cursor.executemany('''
        INSERT INTO properties (title, price, location) VALUES (?, ?, ?)
    ''', records)
    
    conn.commit()
    conn.close()

def save_to_csv(records):
    csv_filename = "fotocasa_properties.csv"
    csv_headers = ["Title", "Price", "Location"]

    with open(csv_filename, "w", newline="", encoding="utf-8") as csv_file:
        csv_writer = csv.writer(csv_file)
        csv_writer.writerow(csv_headers)
        csv_writer.writerows(records)

# Paso 2: Obtener y almacenar datos de las 28 páginas

base_url = "https://www.fotocasa.es/es/comprar/viviendas/espana/todas-las-zonas/l?sortType=publicationDate&text=Galicia&page="
total_pages = 28
all_records = []

for page in range(1, total_pages + 1):
    page_url = base_url + str(page)
    records = extract_data_from_page(page_url)
    all_records.extend(records)
    time.sleep(2)  # Agrega un retraso para ser respetuoso con el sitio web
    print(f"Procesada página {page}/{total_pages}")

save_to_database(all_records)
save_to_csv(all_records)


Procesada página 1/28
Procesada página 2/28
Procesada página 3/28
Procesada página 4/28
Procesada página 5/28
Procesada página 6/28
Procesada página 7/28
Procesada página 8/28
Procesada página 9/28
Procesada página 10/28
Procesada página 11/28
Procesada página 12/28
Procesada página 13/28
Procesada página 14/28
Procesada página 15/28
Procesada página 16/28
Procesada página 17/28
Procesada página 18/28
Procesada página 19/28
Procesada página 20/28
Procesada página 21/28
Procesada página 22/28
Procesada página 23/28
Procesada página 24/28
Procesada página 25/28
Procesada página 26/28
Procesada página 27/28
Procesada página 28/28


In [2]:
save_to_database(all_records)
save_to_csv(all_records)
print("Datos guardados en la base de datos y en el archivo CSV.")


Datos guardados en la base de datos y en el archivo CSV.
