# Intro a BeatifulSoup

### Librerias

In [7]:
import requests
from bs4 import BeautifulSoup

### Url

In [36]:
url = 'https://www.falabella.com.pe/falabella-pe/product/20888778/Huawei-Watch-Gt5pro-46mm-Black/20888778'

### **Headers in requests**  
Algunos servidores web bloquean solicitudes que no provengan de navegadores reales (como scripts o bots). Al incluir un User-Agent común (como el de Chrome), el servidor cree que la solicitud proviene de un navegador legítimo y es más probable que responda correctamente.

Navegador: Chrome.

Versión: 91.0.4472.124 (número de compilación).

In [46]:
headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
    }
response = requests.get(url, headers=headers)
response.raise_for_status() 
soup = BeautifulSoup(response.text, 'html.parser')

### **Respuesta 200**  
Esta es la respuesta HTTP que indica que una solicitud fue exitosa (usando librerías como requests en Python).

¿Qué significa?
200 = "OK" (Éxito)

El servidor recibió la solicitud y devolvió los datos correctamente.

In [47]:
response

<Response [200]>

### **Método `find()` en BeautifulSoup**  

El método **`find()`** se usa en BeautifulSoup para **localizar el primer elemento HTML** que coincida con un criterio de búsqueda (etiqueta, clase, ID, etc.).  

---

#### **Sintaxis Básica**  
```python
elemento = soup.find(nombre_etiqueta, atributos)
```  
- **`nombre_etiqueta`**: Nombre de la etiqueta HTML (`'div'`, `'a'`, `'h1'`, etc.).  
- **`atributos`** (opcional): Diccionario con atributos como `class`, `id`, etc.  

---

#### **Ejemplos Prácticos**  

1. **Buscar una etiqueta específica**:  
   ```python
   primer_h1 = soup.find('h1')  # Encuentra el primer <h1>
   ```

2. **Buscar por clase**:  
   ```python
   div_contenedor = soup.find('div', class_='contenedor')  # class_ (con guión bajo)
   ```

3. **Buscar por ID**:  
   ```python
   seccion = soup.find('div', id='header')  # Encuentra <div id="header">
   ```

4. **Buscar con múltiples atributos**:  
   ```python
   boton = soup.find('button', {'class': 'btn', 'type': 'submit'})
   ```


# Ejercicios

1. Extraer el nombre del producto

In [54]:
titulo=soup.find("div", class_="jsx-783883818 product-name-wrapper")
print(titulo.text)

Huawei Watch Gt5pro 46mm Black


2. Extraer el nuevo precio

In [58]:
precio=soup.find("span", class_="copy12 primary senary jsx-2835692965 bold line-height-29")
print(precio.text)

S/  999  


3. Extraer el precio anterior

In [73]:
precio_anterior=soup.find("span", class_="copy1 primary medium jsx-2835692965 normal crossed line-height-19")
print(precio_anterior.text)

S/  1,299  


4. Extraer el valor del descuento

In [75]:
descuento=soup.find("span", class_="jsx-1029649255 copy5 primary jsx-2835692965 bold discount-badge-item")
print(descuento.text)

-23%
