In [1]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# Lista de URLs de las dos páginas
urls = [
    'https://www.vinissimus.com/es/region/espana/vinos-de-madrid/',
    'https://www.vinissimus.com/es/region/espana/vinos-de-madrid/?serializer=summary-all-opts&sort_by=%5B%7B%22field%22%3A%22opciones.in_stock%22%2C%22order%22%3A%22asc%22%7D%2C%7B%22field%22%3A%22ranking%22%2C%22order%22%3A%22asc%22%7D%5D&cursor=36'
]

# Lista para almacenar los datos de todas las páginas
wines_data = []

# Función para extraer datos de una página
def extract_wine_data(page_url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
    response = requests.get(page_url, headers=headers)
    
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        # Encontrar todos los elementos que contienen información de los vinos
        wine_items = soup.find_all('div', class_='product-list-item')
        for item in wine_items:
            try:
                # Extraer el nombre del vino
                name_tag = item.find('h2', class_='title heading')
                name = name_tag.text.strip() if name_tag else 'N/A'
            except:
                name = 'N/A'

            try:
                # Extraer la bodega
                winery_tag = item.find('div', class_='cellar-name')
                winery = winery_tag.text.strip() if winery_tag else 'N/A'
            except:
                winery = 'N/A'

            try:
                # Extraer la región
                region_tag = item.find('div', class_='region')
                region = region_tag.text.strip() if region_tag else 'N/A'
            except:
                region = 'N/A'

            try:
                # Extraer el precio
                price_section = item.find('p', class_='price uniq small')
                price = price_section.text.strip() if price_section else 'N/A'
            except AttributeError:
                price = 'N/A'

            # Agregar los datos de este vino a la lista
            wines_data.append({
                'Nombre del Vino': name,
                'Bodega': winery,
                'Región': region,
                'Precio': price
            })
    else:
        print(f'Error al acceder a la página: {response.status_code}')

# Extraer datos de ambas páginas
for url in urls:
    print(f'Extrayendo datos de: {url}')
    extract_wine_data(url)

# Crear un DataFrame con los datos combinados
df = pd.DataFrame(wines_data)

# Mostrar la tabla
print(df)

# Guardar los datos en un archivo CSV
df.to_csv('vinos_madrid.csv', index=False, encoding='utf-8')
print("Datos guardados en 'vinos_madrid.csv'")


Extrayendo datos de: https://www.vinissimus.com/es/region/espana/vinos-de-madrid/
Extrayendo datos de: https://www.vinissimus.com/es/region/espana/vinos-de-madrid/?serializer=summary-all-opts&sort_by=%5B%7B%22field%22%3A%22opciones.in_stock%22%2C%22order%22%3A%22asc%22%7D%2C%7B%22field%22%3A%22ranking%22%2C%22order%22%3A%22asc%22%7D%5D&cursor=36
                                      Nombre del Vino  \
0                                      El Rincón 2015   
1                     La Maldición Malvar Blanco 2022   
2         Las Moradas de San Martín Albillo Real 2022   
3                                   4 Monos GR10 2022   
4   Las Moradas de San Martín Libro Once Las Luces...   
..                                                ...   
64               Bernabeleva Arroyo del Tórtolas 2017   
65                             El Tamboril Tinto 2021   
66                               Cyster Garnacha 2018   
67                          Las Bacantes Albillo 2019   
68                       