In [2]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

url = 'https://www.vivareal.com.br/venda/sp/campinas/apartamento_residencial/'



# Realiza a requisição HTTP
response = requests.get(url)

# Verifica se a requisição foi bem sucedida
if response.status_code == 200:
    # Cria o objeto BeautifulSoup para fazer o parsing do HTML
    soup = BeautifulSoup(response.content, 'html.parser')

    # Busca pelos anúncios presentes na página
    anuncios = soup.find_all('article', {'class': 'property-card__container'})

    # Lista vazia para armazenar os dados dos anúncios
    data = []

    # Loop pelos anúncios para extrair as informações desejadas
    for anuncio in anuncios:
        titulo = anuncio.find('span', {'class': 'property-card__title'}).text.strip()
        endereco = anuncio.find('span', {'class': 'property-card__address'}).text.strip()
        area = anuncio.find('li', {'class': 'property-card__detail-area'}).text.strip()
        quartos = anuncio.find('li', {'class': 'property-card__detail-room'}).text.strip()
        banheiros = anuncio.find('li', {'class': 'property-card__detail-bathroom'}).text.strip()
        garagens = anuncio.find('li', {'class': 'property-card__detail-garage'}).text.strip()
        preco = anuncio.find('div', {'class': 'property-card__price'}).text.strip()
        condominio_tag = anuncio.find('div', {'class': 'property-card__price-details--condo'})

        if condominio_tag:
            condominio_tag = condominio_tag.find('strong', {'class': 'js-condo-price'})
            condominio = condominio_tag.text.strip() if condominio_tag else None
        else:
            condominio = None


        # Adiciona os dados à lista
        data.append([titulo, endereco, area, quartos, banheiros, garagens, preco, condominio])

    # Cria um dataframe com os dados
    df = pd.DataFrame(data, columns=['Título', 'Endereço', 'Área', 'Quartos', 'Banheiros', 'Garagens', 'Preço', 'Condomínio'])

    # Exibe o dataframe
    display(df)
else:
    print('Não foi possível obter os dados da página.')

Unnamed: 0,Título,Endereço,Área,Quartos,Banheiros,Garagens,Preço,Condomínio
0,"Apartamento com Quarto à Venda, 50m²","Rua Antônio Cesarino, 841 - Centro, Campinas - SP",50 m²,1 Quarto,2 Banheiros,1 Vaga,R$ 460.000,R$ 680
1,Reserva Serena,Rodovia Governador Doutor Adhemar Pereira de B...,360 m²,-- Quarto,-- Banheiro,-- Vaga,A partir de R$ 482.400,
2,"Apartamento com 2 Quartos à Venda, 55m²","Rua Manoel Sylvestre de Freitas Filho, 75 - Ja...",55 m²,2 Quartos,2 Banheiros,1 Vaga,R$ 260.000,R$ 350
3,"Apartamento com 3 Quartos à Venda, 116m²","Rua Ministro Oscar Saraiva, 40 - Jardim das Pa...",116 m²,3 Quartos,2 Banheiros,2 Vagas,R$ 730.000 Preço abaixo do mercado,R$ 995
4,"Apartamento com 3 Quartos à Venda, 73m²","Rua Rafael Sampaio, 500 - Jardim Guanabara, Ca...",73 m²,3 Quartos,2 Banheiros,1 Vaga,R$ 420.000,R$ 670
5,"Apartamento com 3 Quartos à Venda, 80m²","Rua Jacy Teixeira Camargo, 240 - Jardim do Lag...",80 m²,3 Quartos,2 Banheiros,2 Vagas,R$ 420.000 Preço abaixo do mercado,R$ 729
6,"Apartamento com 3 Quartos à Venda, 58m²","Avenida Washington Luís, 4300 - Vila Marieta, ...",58 m²,3 Quartos,1 Banheiro,1 Vaga,R$ 334.900,R$ 425
7,"Apartamento com 2 Quartos à Venda, 51m²","Avenida Padre Guilherme Ary - Vila Satúrnia, C...",51 m²,2 Quartos,1 Banheiro,1 Vaga,R$ 400.000,R$ 450
8,Next Residence,"Rua Álvares Machado, 248 - Centro, Campinas - SP",55 m²,2 Quartos,2 Banheiros,1 Vaga,Sob Consulta,
9,"Apartamento com 2 Quartos à Venda, 54m²","Rua Campos do Jordão, 449 - Fundação da Casa P...",54 m²,2 Quartos,2 Banheiros,1 Vaga,R$ 380.000,R$ 450


In [2]:
#teste para caputrar comodidades

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}

response = requests.get(url, headers=headers)

soup = BeautifulSoup(response.text, 'html.parser')

primeiro_anuncio = soup.find('article', {'class': 'property-card__container js-property-card'})

ul_comodidades = primeiro_anuncio.find('ul', {'class': 'property-card__amenities'})

if ul_comodidades:
    comodidades = [comodidade.get('title') for comodidade in ul_comodidades.find_all('li')]
    print(comodidades)
else:
    print('Comodidades não encontradas')

['Churrasqueira', 'Elevador', 'Condomínio fechado', 'Academia', 'Aceita animais', None]


In [3]:
url = 'https://www.vivareal.com.br/venda/sp/campinas/apartamento_residencial/'

# Input do número total de páginas
num_paginas = int(input("Digite o número total de páginas: "))

# Lista vazia para armazenar os dados dos anúncios
data = []

# Loop pelas páginas para extrair as informações dos anúncios
for i in range(1, num_paginas + 1):
    # URL da página atual
    url_atual = url + f'?pagina={i}'

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}

response = requests.get(url, headers=headers)

soup = BeautifulSoup(response.text, 'html.parser')

primeiro_anuncio = soup.find('article', {'class': 'property-card__container js-property-card'})

ul_comodidades = primeiro_anuncio.find('ul', {'class': 'property-card__amenities'})

if ul_comodidades:
    comodidades = [comodidade.get('title') for comodidade in ul_comodidades.find_all('li')]
    print(comodidades)
else:
    print('Comodidades não encontradas')
    
anuncios = soup.find_all('article', {'class': 'property-card__container js-property-card'})
comodidades_unicas = set()

# Obter todas as comodidades presentes nos anúncios
for anuncio in anuncios:
    ul_comodidades = anuncio.find('ul', {'class': 'property-card__amenities'})
    if ul_comodidades:
        comodidades = [comodidade.get('title') for comodidade in ul_comodidades.find_all('li')]
        comodidades_unicas.update(comodidades)

# Criar DataFrame
df_amenities = pd.DataFrame(columns=list(comodidades_unicas))

# Preencher DataFrame com presença/ausência de cada comodidade em cada anúncio
for i, anuncio in enumerate(anuncios):
    ul_comodidades = anuncio.find('ul', {'class': 'property-card__amenities'})
    if ul_comodidades:
        comodidades = {comodidade.get('title'): True for comodidade in ul_comodidades.find_all('li')}
    else:
        comodidades = {}
    df_amenities.loc[i] = {comodidade: comodidades.get(comodidade, False) for comodidade in comodidades_unicas}
    
print(df_amenities)



Digite o número total de páginas: 1
['Piscina', 'Mobiliado', 'Elevador', 'Condomínio fechado', 'Varanda', None]
    Jardim  Interfone  Condomínio fechado  Mobiliado  Elevador  \
0    False      False                True       True      True   
1    False      False               False      False     False   
2    False      False                True      False     False   
3     True      False                True      False     False   
4    False      False                True      False      True   
5    False      False               False      False     False   
6    False      False                True      False      True   
7    False      False               False      False     False   
8    False      False               False      False     False   
9    False      False                True      False      True   
10   False      False                True      False      True   
11   False      False               False      False     False   
12   False      False         

In [4]:
df = pd.concat([df, df_amenities], axis=1)
print(df)
df.to_excel('teste de pag2.xlsx')

                                      Título  \
0      Apartamento com  Quarto à Venda, 50m²   
1                             Reserva Serena   
2    Apartamento com 2 Quartos à Venda, 55m²   
3   Apartamento com 3 Quartos à Venda, 116m²   
4    Apartamento com 3 Quartos à Venda, 73m²   
5    Apartamento com 3 Quartos à Venda, 80m²   
6    Apartamento com 3 Quartos à Venda, 58m²   
7    Apartamento com 2 Quartos à Venda, 51m²   
8                             Next Residence   
9    Apartamento com 2 Quartos à Venda, 54m²   
10   Apartamento com 2 Quartos à Venda, 47m²   
11  Apartamento com 3 Quartos à Venda, 240m²   
12  Apartamento com 3 Quartos à Venda, 119m²   
13   Apartamento com 2 Quartos à Venda, 53m²   
14   Apartamento com 2 Quartos à Venda, 61m²   
15                       HM Smart Ouro Verde   
16  Apartamento com 2 Quartos à Venda, 108m²   
17   Apartamento com 3 Quartos à Venda, 75m²   
18   Apartamento com 2 Quartos à Venda, 64m²   
19   Apartamento com 3 Quartos à Venda, 