In [1]:
from bs4 import BeautifulSoup

html_text = """
<div class="lista-produtos">
  <div class="produto destaque">
    <h2 class="titulo">Café Especial</h2>
    <span class="preco">R$ 25,90</span>
  </div>

  <div class="produto">
    <h2 class="titulo">Chá Verde</h2>
    <span class="preco">R$ 15,00</span>
  </div>

  <div class="produto">
    <h2 class="titulo">Chocolate Quente</h2>
    <span class="preco promocao">R$ 18,00</span>
  </div>
</div>
"""

soup = BeautifulSoup(html_text, "html.parser")


#### 1. Navegar na árvore: parent, children, next_sibling

parent: pegar a “tag mãe” e a classe dela

In [2]:
preco = soup.find("span", class_="preco")  # primeiro preço: R$ 25,90

mae = preco.parent
print(mae.name)          # div
print(mae.get("class"))  # ['produto', 'destaque']

avo = mae.parent
print(avo.get("class"))  # ['lista-produtos']


div
['produto', 'destaque']
['lista-produtos']


#### 2. children / contents: ver os filhos diretos

In [3]:
produto = soup.find("div", class_="produto")  # primeiro produto

print("FILHOS (contents):")
for filho in produto.contents:
    print("->", repr(filho))

print("\nFILHOS TAGS (ignorando \\n):")
for filho in produto.children:
    if filho.name is not None:
        print(f"{filho.name}: {filho.get_text(strip=True)}")


FILHOS (contents):
-> '\n'
-> <h2 class="titulo">Café Especial</h2>
-> '\n'
-> <span class="preco">R$ 25,90</span>
-> '\n'

FILHOS TAGS (ignorando \n):
h2: Café Especial
span: R$ 25,90


#### 3. next_sibling / previous_sibling: irmão seguinte

In [4]:
primeiro_produto = soup.find("div", class_="produto")  # Café Especial

# pode ter \n no meio, por isso às vezes é melhor usar find_next_sibling
print("RAW next_sibling:", repr(primeiro_produto.next_sibling))

segundo_produto = primeiro_produto.find_next_sibling("div")
print("Segundo produto:", segundo_produto.select_one(".titulo").get_text(strip=True))
# -> "Chá Verde"


RAW next_sibling: '\n'
Segundo produto: Chá Verde


#### 4. Buscar relativo ao elemento: find_next_sibling etc.

Aqui a ideia é: “já tenho um elemento, quero o próximo da mesma ‘linha’”.

In [5]:
produto_destacado = soup.find("div", class_="destaque")

proximo = produto_destacado.find_next_sibling("div", class_="produto")
print(proximo.select_one(".titulo").get_text(strip=True))  # "Chá Verde"

# e o seguinte depois dele:
terceiro = proximo.find_next_sibling("div", class_="produto")
print(terceiro.select_one(".titulo").get_text(strip=True))  # "Chocolate Quente"


Chá Verde
Chocolate Quente


#### 5. Procurar “mais pra frente”: find_next e find_all_next
find_next: próximo elemento adiante na página

In [6]:
titulo_cafe = soup.find("h2", string="Café Especial")

proximo_preco = titulo_cafe.find_next("span", class_="preco")
print(proximo_preco.get_text(strip=True))  # "R$ 25,90"


R$ 25,90


#### 6. Se você estivesse em outro ponto e quisesse “o próximo preço depois disso”, é o mesmo padrão.

find_all_next: todos os que vierem depois

In [7]:
titulo_cha = soup.find("h2", string="Chá Verde")

# todos os preços que aparecem depois do "Chá Verde"
prec_os = titulo_cha.find_all_next("span", class_="preco")
for p in prec_os:
    print(p.get_text(strip=True))
# R$ 15,00
# R$ 18,00

R$ 15,00
R$ 18,00
