# Ejercicio de Web Scraping
#### Nombre: Cristina Molina
#### Objetivo:
##### El objetivo de este ejercicio es construir un scraper web que recoja datos de un sitio web elegido. Aprenderás a enviar solicitudes HTTP, analizar el contenido HTML, extraer datos relevantes y almacenarlos en un formato estructurado.

##### Ejemplo:
##### Para este ejercicio, extraeremos datos de recetas del sitio web seleccionado. Nuestro scraper recogerá información como el título de cada receta, los ingredientes listados, los pasos para la preparación y cualquier otro detalle importante proporcionado en el sitio.

##### Paso 1: Importar librerías


In [1]:
from bs4 import BeautifulSoup

##### Paso 2: Leer el archivo HTML


In [2]:
# Leer el archivo HTML
with open('./Ensalada.html', 'r', encoding='utf-8') as file:
    content = file.read()

##### Paso 3: Crear objeto BeautifulSoup

In [3]:
# Crear objeto BeautifulSoup
soup = BeautifulSoup(content, 'html.parser')


##### Paso 4: Definir funciones

In [4]:
def extract_text_from_nested_tags(tag):
    """Extrae y une el texto de una etiqueta y sus etiquetas anidadas."""
    return ' '.join(tag.stripped_strings)

def get_recipe_information(soup):
    # Extraer el título de la receta
    title = soup.find('h1').text.strip() if soup.find('h1') else 'No title available'

    # Extraer los ingredientes
    ingredients = []
    for li in soup.find_all('li', class_='recipe-detail__list-item'):
        ingredients.append(extract_text_from_nested_tags(li))
    ingredients = ', '.join(ingredients)

    # Extraer el método de preparación
    steps = []
    method_section = soup.find('h2', string='Método')
    if method_section:
        method_steps = method_section.find_next('ol')
        if method_steps:
            for li in method_steps.find_all('li'):
                steps.append(extract_text_from_nested_tags(li))
    steps = ' '.join(steps)

    return {
        'Title': title,
        'Ingredients': ingredients,
        'Method': steps
    }


##### Paso 5: Obtener y mostrar la información de la receta

In [5]:
# Obtener la información de la receta
recipe_info = get_recipe_information(soup)

# Imprimir los resultados
for key, value in recipe_info.items():
    print(f"{key}: {value}\n")


Title: Receta de ensalada vietnamita con pollo y fideos

Ingredients: 125 g (4 oz) de fideos de arroz, ½ pepino, 150 g (5 oz) de restos de pollo cocido, desmenuzado, 1 zanahoria mediana cortada en tiras finas, 3 ramitas de menta, hojas picadas, más unas cuantas más para decorar, gran puñado de brotes de soja, 50 g (2 oz) de maní salado, picado grueso, para servir, ½ lima rallada y exprimida, 2 cucharadas de azúcar moreno suave, 2 cucharadas de vinagre de arroz, 2 cucharadas de salsa de pescado, 1 chile rojo largo, sin semillas, finamente picado (y cortado en rodajas extra finas para decorar)

Method: Cocine los fideos según las instrucciones del paquete, luego refrésquelos con agua fría y viértalos en un tazón grande. Corte el pepino a lo largo por la mitad, retire las semillas con una cucharilla y córtelo en tiras finas con un pelador. Escalde los brotes de soja durante al menos 15 segundos en agua hirviendo y déjelos enfriar. Agregue las tiras a los fideos y luego agregue el pollo , 