In [6]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

def get_recipe_data(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')
    
    # Obtener el nombre de la receta desde el título de la página
    recipe_name_tag = soup.find('title')
    recipe_name = recipe_name_tag.get_text(strip=True) if recipe_name_tag else 'No Title'
    
    # Obtener la descripción desde una meta etiqueta
    description_tag = soup.find('meta', {'name': 'description'})
    description = description_tag['content'] if description_tag else 'No Description'
    
    # Obtener los ingredientes y pasos de las listas específicas
    ingredients = [li.get_text(strip=True) for li in soup.find_all('li', class_='ingredient')]
    steps = [p.get_text(strip=True) for p in soup.find_all('p', class_='step')]
    
    return {
        'recipe-name': recipe_name,
        'description': description,
        'ingredients': ingredients,
        'steps': steps
    }

# Lista de URLs de recetas
urls = [
    'https://www.allrecipes.com/recipe/104493/stuffed-strawberries/'
]

# Crear una lista para almacenar los datos
data = []

# Rastrear cada URL y recopilar los datos
for i, url in enumerate(urls):
    recipe_data = get_recipe_data(url)
    if recipe_data:
        recipe_data['id'] = i + 1  # Agregar un ID único a cada receta
        data.append(recipe_data)

# Crear el DataFrame
df = pd.DataFrame(data, columns=['id', 'recipe-name', 'description', 'ingredients', 'steps'])

# Mostrar el DataFrame
print(df)

# Guardar el DataFrame en un archivo CSV si lo deseas
df.to_csv('recipes.csv', index=False)


   id recipe-name     description ingredients steps
0   1    No Title  No Description          []    []
