In [1]:

import requests
from bs4 import BeautifulSoup
import pandas as pd

# Lista de URLs de las páginas de vinos gallegos
urls = [
    'https://distribucionescarreiras.com/region/vinos-gallegos/',
    'https://distribucionescarreiras.com/region/vinos-gallegos/page/2/',
    'https://distribucionescarreiras.com/region/vinos-gallegos/page/3/'
]

# Lista para almacenar los datos de todas las páginas
wines_data = []

# Función para extraer datos de una página
def extract_wine_data(page_url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
    response = requests.get(page_url, headers=headers)
    
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        # Encontrar todos los productos en la página
        wine_items = soup.find_all('li', class_='product')  
        for item in wine_items:
            try:
                # Extraer el nombre del vino
                name_tag = item.find('p', class_='woocommerce-loop-product__title')
                name = name_tag.text.strip() if name_tag else 'N/A'
            except:
                name = 'N/A'

            try:
                # Extraer la bodega
                winery_tag = item.find('p', class_='fs12 mulish c-dark text-uppercase libre')
                winery = winery_tag.text.strip() if winery_tag else 'N/A'
            except:
                winery = 'N/A'

            try:
                # Extraer el precio
                price_tag = item.find('span', class_='woocommerce-Price-amount')
                price = price_tag.text.strip().replace(',', '.').strip() if price_tag else 'N/A'
            except:
                price = 'N/A'

            # Agregar los datos de este vino a la lista
            wines_data.append({
                'Nombre del Vino': name,
                'Bodega': winery,
                'Precio (€)': price
            })
    else:
        print(f'Error al acceder a la página: {response.status_code}')

# Extraer datos de todas las páginas
for url in urls:
    print(f'Extrayendo datos de: {url}')
    extract_wine_data(url)

# Crear un DataFrame con los datos combinados
df = pd.DataFrame(wines_data)

# Mostrar la tabla
print(df)

# Guardar los datos en un archivo CSV
df.to_csv('vinos_gallegos.csv', index=False, encoding='utf-8')
print("Datos guardados en 'vinos_gallegos.csv'")


Extrayendo datos de: https://distribucionescarreiras.com/region/vinos-gallegos/
Extrayendo datos de: https://distribucionescarreiras.com/region/vinos-gallegos/page/2/
Extrayendo datos de: https://distribucionescarreiras.com/region/vinos-gallegos/page/3/
                            Nombre del Vino         Bodega Precio (€)
0                             Acivro Mencía  Ribeira Sacra     11.98€
1                         Agoreira Garnacha     Valdeorras      8.33€
2                 Alma de Autor Mencía 2021      Monterrei      8.75€
3             Altos de Torona Albariño 2022    Rías Baixas     10.06€
4                Altos de Torona Rosal 2022    Rías Baixas     11.32€
5                         Altos Torona Brut    Rías Baixas     16.50€
6                             Carallán 2022    Rías Baixas      8.40€
7        Carlos Villanueva Edición Especial        Ribeiro     25.00€
8                 Carlos Villanueva Godello        Ribeiro     11.40€
9         Cuesta de los Olivos Godello 2023  R