#### EXTRA WEB SCRAPING
#### Nombre: Edison Quizhpe
#### Fecha: 05/01/2025

##### Realizar una prueba en Python para dos librerías diferentes.

##### 1.	Prueba con BeatifulSoup.

In [22]:
import requests
from bs4 import BeautifulSoup
import time

def scrape_books(url):
    start_time = time.time()
    response = requests.get(url)

    # Verificar si la solicitud fue exitosa
    if response.status_code != 200:
        print(f"Error: No se pudo acceder a la página. Código de estado: {response.status_code}")
        return

    soup = BeautifulSoup(response.text, "html.parser")

    # Extraer títulos, precios y calificaciones de los libros
    books = []
    for book in soup.find_all("article", class_="product_pod"):
        title = book.h3.a["title"]  # Título del libro
        price = book.find("p", class_="price_color").text.strip()  # Precio
        rating = book.find("p", class_="star-rating")["class"][1]  # Calificación
        books.append({"title": title, "price": price, "rating": rating})

    elapsed_time = time.time() - start_time
    return {
        "library": "BeautifulSoup",
        "books": books,
        "elapsed_time": elapsed_time,
    }

if __name__ == "__main__":
    url = "http://books.toscrape.com/"
    result_bs = scrape_books(url)

    if result_bs:
        print(f"Resultados con libreria BeautifulSoup:")
        print(f"Tiempo Ejecución: {result_bs['elapsed_time']:.6f} segundos")
        if result_bs["books"]:
            for book in result_bs["books"][:5]:  # Mostrar los primeros 5 libros
                print(f"{book['title']} - {book['price']} - {book['rating']} rating")
        else:
            print("No se encontraron libros. Verifica los selectores CSS o la estructura de la página.")


Resultados con libreria BeautifulSoup:
Tiempo Ejecución: 0.788831 segundos
A Light in the Attic - Â£51.77 - Three rating
Tipping the Velvet - Â£53.74 - One rating
Soumission - Â£50.10 - One rating
Sharp Objects - Â£47.82 - Four rating
Sapiens: A Brief History of Humankind - Â£54.23 - Five rating


##### 2.	Prueba con Selenium.

In [25]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
import time

def scrape_airbnb(url):
    # Iniciar el navegador con WebDriverManager para manejar ChromeDriver automáticamente
    service = Service(ChromeDriverManager().install())
    driver = webdriver.Chrome(service=service)
    driver.get(url)
    
    time.sleep(3)  # Esperar a que la página se cargue completamente

    # Desplazar la página para cargar más propiedades (si es necesario)
    driver.execute_script("window.scrollTo(0, document.documentElement.scrollHeight);")
    time.sleep(3)  # Esperar que se carguen más resultados

    # Extraer los títulos de las propiedades (usando un selector adecuado)
    property_titles = []
    
    # Aquí utilizamos un selector basado en el nombre de las propiedades
    properties = driver.find_elements(By.CSS_SELECTOR, '.t1jojoys')  # Ajustar selector según la página

    for property in properties:
        title = property.text.strip()
        if title:  # Asegurarse de que el título no esté vacío
            property_titles.append(title)
    
    driver.quit()  # Cerrar el navegador
    return property_titles

if __name__ == "__main__":
    url = "https://www.airbnb.com/s/Ecuador"  # Ejemplo: página de búsqueda en Ecuador
    property_titles = scrape_airbnb(url)

    if property_titles:
        print(f"Resultados con libreria Selenium:")
        print(f"Propiedades encontradas:")
        for title in property_titles[:10]:  # Mostrar los primeros 10 títulos
            print(f"- {title}")
    else:
        print("No se encontraron propiedades. Verifica los selectores CSS o la estructura de la página.")


Resultados con libreria Selenium:
Propiedades encontradas:
- Apartamento en Puerto Ayora
- Cabaña en Montañita
- Alojamiento en Pedro Vicente Maldonado
- Alojamiento en Puerto Cayo
- Apartamento en Puerto Baquerizo Moreno
- Alojamiento en Baños de Agua Santa
- Apartamento en Atacames
- Condo en Playas
- Villa en General Villamil
- Condo en Santa Elena


##### Realizar scraping de un sitio web de su elección.
##### Utilizando la libreria Selenium voy a realizar la implementación en Ebay.

In [29]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
import time

def scrape_tia(url):
    # Iniciar el navegador con WebDriverManager para manejar ChromeDriver automáticamente
    service = Service(ChromeDriverManager().install())
    driver = webdriver.Chrome(service=service)
    driver.get(url)
    
    time.sleep(3)  # Esperar a que la página se cargue completamente

    # Desplazar la página para cargar más productos si es necesario
    driver.execute_script("window.scrollTo(0, document.documentElement.scrollHeight);")
    time.sleep(3)  # Esperar que se carguen más resultados

    # Extraer los productos o elementos de la página (ajustar el selector CSS si es necesario)
    products = []
    
    # Aquí seleccionamos los elementos que contienen los productos (ajustar selector según la página)
    items = driver.find_elements(By.CSS_SELECTOR, '.product-item')  # Cambiar selector según la estructura

    for item in items:
        product_name = item.text.strip()
        if product_name:  # Asegurarse de que el nombre no esté vacío
            products.append(product_name)
    
    driver.quit()  # Cerrar el navegador
    return products

if __name__ == "__main__":
    url = "https://www.tia.com.ec"  # Página principal de Tía
    products = scrape_tia(url)

    if products:
        print(f"Resultados con Selenium:")
        print(f"Productos encontrados:")
        for product in products[:10]:  # Mostrar los primeros 10 productos
            print(f"- {product}")
    else:
        print("No se encontraron productos. Verifica los selectores CSS o la estructura de la página.")


Resultados con Selenium:
Productos encontrados:
- 0
Agregar
$199,00
$239,00
Marca HONOR
CELULAR X7C 8GB/256GB HONOR NEGRO
- 0
Agregar
$199,00
$239,00
Marca HONOR
CELULAR X7C 8GB/256GB HONOR VERDE
- 0
Agregar
$319,00
$349,00
Marca MOTOROLA
CELULAR MOTO EDGE 50 FUSION 8GB/256GB MOTOROLA AZUL
- 0
Agregar
$319,00
$349,00
Marca MOTOROLA
CELULAR MOTO EDGE 50 FUSION 8GB/256GB MOTOROLA MAGENTA
- 0
Agregar
$859,00
Marca SONY
PLAYSTATION 5 SLIM VERSION DISCO BUNDLE FORNITE SONY
- 0
Agregar
$759,00
Marca SONY
PLAYSTATION 5 SLIM DIGITAL EDICION BUNLDE FORNITE SONY
- 0
Agregar
$979,00
Marca MICROSOFT
CONSOLA XBOX SERIES X 16GB/1TB SSD MICROSOFT GRATIS CONTROL
- 0
Agregar
$649,00
Marca NINTENDO
CONSOLA VERSION OLED 4GB/64GB NINTENDO SWITCH
