## Utilizando Web-Scraping para fazer pesquisa de preço

#### Passo 1: instalar bibliotecas

In [1]:
# Remova o comentário(#) da linha abaixo caso esteja executando este script pela primeira vez
!pip install requests
!pip install beautifulsoup4

Collecting requests
  Downloading requests-2.32.5-py3-none-any.whl.metadata (4.9 kB)
Downloading requests-2.32.5-py3-none-any.whl (64 kB)
   ---------------------------------------- 0.0/64.7 kB ? eta -:--:--
   ------ --------------------------------- 10.2/64.7 kB ? eta -:--:--
   ------------------------- -------------- 41.0/64.7 kB 653.6 kB/s eta 0:00:01
   ---------------------------------------- 64.7/64.7 kB 698.7 kB/s eta 0:00:00
Installing collected packages: requests
Successfully installed requests-2.32.5



[notice] A new release of pip is available: 24.0 -> 25.2
[notice] To update, run: python.exe -m pip install --upgrade pip


Collecting beautifulsoup4
  Downloading beautifulsoup4-4.13.4-py3-none-any.whl.metadata (3.8 kB)
Collecting soupsieve>1.2 (from beautifulsoup4)
  Downloading soupsieve-2.7-py3-none-any.whl.metadata (4.6 kB)
Downloading beautifulsoup4-4.13.4-py3-none-any.whl (187 kB)
   ---------------------------------------- 0.0/187.3 kB ? eta -:--:--
   -- ------------------------------------- 10.2/187.3 kB ? eta -:--:--
   -------------- ------------------------ 71.7/187.3 kB 975.2 kB/s eta 0:00:01
   ---------------------------------------- 187.3/187.3 kB 1.6 MB/s eta 0:00:00
Downloading soupsieve-2.7-py3-none-any.whl (36 kB)
Installing collected packages: soupsieve, beautifulsoup4
Successfully installed beautifulsoup4-4.13.4 soupsieve-2.7



[notice] A new release of pip is available: 24.0 -> 25.2
[notice] To update, run: python.exe -m pip install --upgrade pip


#### Passo 2: Importar bibliotecas

In [3]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

#### Passo 3: Formatar link de busca

In [7]:
# copie e cole o modelo do link de busca 
url_de_busca = 'https://lista.mercadolivre.com.br/'

#informe a palavra chave para busca
palavra_chave = 'smart tv 70'

#formatar palavra chave conforme o modelo
palavra_chave = palavra_chave.replace(' ','-' )

#formar o link 
link = url_de_busca+palavra_chave
print(link)

https://lista.mercadolivre.com.br/smart-tv-70


#### Passo 4: Obter informações do link

In [10]:
#Requisita informações do site
response = requests.get(link)

#Verifica status de acesso
print('Cód de Status:', response.status_code)

Cód de Status: 403


Esse **403 Forbidden** acontece porque o Mercado Livre (assim como outros grandes e-commerces) possui mecanismos de proteção contra bots e scrapers simples, e o requests.get() sem nenhum cabeçalho já denuncia que não é um navegador “de verdade”.

#### 4.1 Usar um User-Agent válido

Alguns sites **bloqueiam requisições que não parecem vir de navegadores**. Então você pode **enviar cabeçalhos simulando um browser**.

##### Para criar um User-Agent (real)
- Identifique qual é a versão do seu navegador acessando, por exemplo, a URL chrome://settings/help
- Crie um cabeçalho com a versão do seu navegador.

In [11]:
#Criando um cabeçalho com User agent
headers = {'User-Agent': 'Chrome/139.0.7258.128 '}

#Requisita informações do site
response = requests.get(link, headers = headers)

#Verifica status de acesso
print('Cód de Status:', response.status_code)


Cód de Status: 200


In [14]:
soup = BeautifulSoup(response.content, 'html.parser')

#### Passo 5: Encontrar elementos

In [15]:
#Encontra as informações contidas na tag de resultado de busca
resultados = soup.find_all(class_ = 'ui-search-layout__item')

#Conta quantos resultados apareceram na primeira pagina
len(resultados)

33

#### Passo 6: Visualizar links dos produtos

In [17]:
#Criar uma lista vazia para guardar os links
lista_de_links = []

#Criar um laço de repetição para filtrar todos os links
for i in resultados:
    lista_de_links.append(i.find('a')['href'])

#Vizualizar links
for j in lista_de_links:
    print(j)

https://www.mercadolivre.com.br/smart-tv-58-philco-led-4k-google-tv-hdr10-p58kga/p/MLB48895726#polycard_client=search-nordic&searchVariation=MLB48895726&wid=MLB4060862571&position=3&search_layout=grid&type=product&tracking_id=46ffd7d8-ea9b-4497-8288-c3bd35429ba3&sid=search
https://www.mercadolivre.com.br/smart-tv-70-crystal-uhd-4k-70du8000-2024-samsung/p/MLB35650763#polycard_client=search-nordic&searchVariation=MLB35650763&wid=MLB4660135102&position=4&search_layout=grid&type=product&tracking_id=46ffd7d8-ea9b-4497-8288-c3bd35429ba3&sid=search
https://www.mercadolivre.com.br/smart-tv-50-philco-ptv50va4regb-roku-tv-led-dolby-audio/p/MLB44408782#polycard_client=search-nordic&searchVariation=MLB44408782&wid=MLB3972474057&position=5&search_layout=grid&type=product&tracking_id=46ffd7d8-ea9b-4497-8288-c3bd35429ba3&sid=search
https://www.mercadolivre.com.br/smart-tv-aoc-roku-led-50-4k-50u612578g-hdmiusb-preto/up/MLBU3044199534#polycard_client=search-nordic&searchVariation=MLBU3044199534&wid=MLB

#### Passo 7: Extrarir informações de cada produto listado

In [20]:
#Requisitando informações do link do produto e criando objetos BeautifulSoup
produto = BeautifulSoup(requests.get(lista_de_links[0], headers = headers).content, 'html.parser')

In [21]:
#Selecionar o titulo
produto.find(class_='ui-pdp-title').text

'Smart Tv 58 Philco Led 4k Google Tv Hdr10 P58kga'

In [22]:
#Selecionar preço
produto.find(class_="ui-pdp-price__second-line").text

'R$2.137,4834% OFFno Pix'

In [23]:
#Selecionar quantidade de vendas
produto.find(class_="ui-pdp-subtitle").text

'Novo  |  +5mil vendidos'

In [24]:
#Selecionar a descrição
produto.find(class_="ui-pdp-description").text

'DescriçãoA Smart TV Philco 58” 4K UHD P58KGA com Google TV foi desenvolvida para quem busca aliar alta qualidade de imagem, conectividade inteligente e excelente custo-benefício. Com tela de 58 polegadas, resolução Ultra HD e suporte a HDR10, ela proporciona uma experiência visual rica em detalhes, cores vibrantes e contraste superior — ideal para filmes, séries, esportes e games. Seu design moderno com bordas finas confere sofisticação ao ambiente, seja na sala de estar, quarto ou até em espaços comerciais.Equipada com o sistema operacional Google TV, a P58KGA oferece uma navegação fluida, intuitiva e altamente personalizada. O acesso direto a aplicativos como Netflix, YouTube, Prime Video e Globoplay, além de milhares de outros via Google Play, transforma a televisão em um verdadeiro hub de entretenimento. Com controle remoto por voz, comandos integrados ao Google Assistente e Chromecast embutido, o usuário tem liberdade total para interagir com a TV sem tocar em nenhum botão.Outro 

#### Criar tabela para armazenar dados

In [28]:
#Criar o nome de cada coluna
colunas = ['Titulo','Preço','Quantidade de vendas','Descrisção do produto']

#Criar tabela com as coluns informadas
tabela = pd.DataFrame(columns = colunas)

#Vizualizar tabela
tabela

Unnamed: 0,Titulo,Preço,Quantidade de vendas,Descrisção do produto


In [32]:
id = 0 #Contador

for j in lista_de_links:
    try:
        #Requisitando informações do link do produto e criando objetos BeautifulSoup
        produto = BeautifulSoup(requests.get(j, headers = headers).content, 'html.parser')

        #Selecionar o titulo
        titulo = produto.find(class_='ui-pdp-title').text
        
        #Selecionar preço
        preco = produto.find(class_="ui-pdp-price__second-line").text

        #Selecionar quantidade de vendas
        vendidos = produto.find(class_="ui-pdp-subtitle").text

        #Selecionar a descrição
        descricao = produto.find(class_="ui-pdp-description").text

        #Insere uma nova linha na tabela com as informações do produto
        tabela.loc[len(tabela)] = [titulo, preco, vendidos, descricao]
    except:
        print(f'Houve um problema no link de índice: {id}')
    #Incrementar uma posição no contador
    id = id+1

Houve um problema no link de índice: 0
Houve um problema no link de índice: 1
Houve um problema no link de índice: 2
Houve um problema no link de índice: 3
Houve um problema no link de índice: 4
Houve um problema no link de índice: 5
Houve um problema no link de índice: 6
Houve um problema no link de índice: 7
Houve um problema no link de índice: 8
Houve um problema no link de índice: 9
Houve um problema no link de índice: 10
Houve um problema no link de índice: 11
Houve um problema no link de índice: 12
Houve um problema no link de índice: 13
Houve um problema no link de índice: 14
Houve um problema no link de índice: 15
Houve um problema no link de índice: 16
Houve um problema no link de índice: 17
Houve um problema no link de índice: 18
Houve um problema no link de índice: 19
Houve um problema no link de índice: 20
Houve um problema no link de índice: 21
Houve um problema no link de índice: 22
Houve um problema no link de índice: 23
Houve um problema no link de índice: 24
Houve um p

In [33]:
#Visualizar tabela preeenchida
tabela

Unnamed: 0,Titulo,Preço,Quantidade de vendas,Descrisção do produto
0,Smart Tv 58 Philco Led 4k Google Tv Hdr10 P58kga,"R$2.137,4834% OFFno Pix",Novo | +5mil vendidos,DescriçãoA Smart TV Philco 58” 4K UHD P58KGA c...
1,Smart TV 70'' Crystal UHD 4K 70DU8000 2024 Sam...,"R$4.209,4127% OFFno Pix ouSaldo no Mercado Pago",Novo | +1000 vendidos,"DescriçãoFINA, ELEGANTE E INTELIGENTE: NUNCA F..."
2,Smart TV 50” Philco PTV50VA4REGB Roku TV LED D...,R$1.88337% OFF,Novo | +10mil vendidos,DescriçãoA Smart TV Philco PTV50VA4REGB é a es...
3,Smart Tv Aoc Roku Led 50'' 4k 50u6125/78g Hdmi...,"R$2.377,82",Novo | 4 vendidos,"DescriçãoSomos a Mega Byte, loja física e onli..."
4,Smart Tv Philips 50 4k 50pug7019 Google Tv Com...,R$1.84914% OFF,Novo | +10mil vendidos,DescriçãoSmart TV Philips Série 7019 - Google...
5,Smart Tv Philips 70 4k Google Tv Comando De Vo...,R$3.69921% OFF,Novo | +100 vendidos,DescriçãoSmart TV Philips Série 7019 - Google...
6,Smart Tv 70'' 70pug7408/78 70 4k Google Tv Phi...,R$4.0996% OFF,Novo | +1000 vendidos,DescriçãoIMAGENS VIBRANTES SEMPRE!A Smart TV P...
7,Samsung Smart Tv 70 Crystal Uhd 4k U8500f 2025...,"R$5.276,67",Novo | +5 vendidos,"DescriçãoSamsung Smart TV 70"" Crystal UHD 4K U..."
8,Samsung Smart Tv 70 Polegadas Qled 4k Q65d 2024,"R$6.598,89",Novo | +100 vendidos,DescriçãoProcessador Quantum Lite 4KTransforme...
9,Smart Tv 50 Philco Ptv50va4regb Roku Tv Led Do...,"R$1.844,1032% OFFno Pix",Novo | +100 vendidos,DescriçãoA Smart TV Philco PTV50VA4REGB é a es...


#### Passo 8: Salvar tabela em uma planilha de Excel

In [34]:
tabela.to_excel('Lista de produtos.xlsx')

### Exercício 1: Encontrar uma solução para listar todos os resultados quando houver 2 ou mais páginas de resultado

### Exercício 1.1 (extra): Formatar os dados da tabela

### Exercício 2: Faça o mesmo processo para outro marketplace, por exemplo, Magazine Luiza, Amazon, etc.