In [17]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

url = 'https://www.vivareal.com.br/venda/sp/campinas/apartamento_residencial/'

# Input do número total de páginas
num_paginas = int(input("Digite o número total de páginas: "))

# Lista vazia para armazenar os dados dos anúncios
data = []

# Loop pelas páginas para extrair as informações dos anúncios
for i in range(1, num_paginas + 1):
    # URL da página atual
    url_atual = url + f'?pagina={i}'

    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
    }

    response = requests.get(url_atual, headers=headers)

    soup = BeautifulSoup(response.text, 'html.parser')

    anuncios = soup.find_all('article', {'class': 'property-card__container js-property-card'})

    for anuncio in anuncios:
        # Extrair informações do anúncio
        endereco = anuncio.find('span', {'class': 'property-card__address'}).text.strip()
        area = anuncio.find('span', {'class': 'property-card__detail-area'}).text.strip()
        quartos = anuncio.find('li', {'class': 'property-card__detail-room'}).span.text.strip()
        banheiros = anuncio.find('li', {'class': 'property-card__detail-bathroom'}).span.text.strip()
        vagas = anuncio.find('li', {'class': 'property-card__detail-garage'}).span.text.strip()
        valor = anuncio.find('div', {'class': 'property-card__price'}).text.strip()

        # Extrair preço do condomínio
        condominio_tag = anuncio.find('div', {'class': 'property-card__price-details--condo'})
        if condominio_tag:
            condominio = condominio_tag.text.strip()
        else:
            condominio = '0'

        # Extrair comodidades do anúncio
        ul_comodidades = anuncio.find('ul', {'class': 'property-card__amenities'})
        if ul_comodidades:
            comodidades = [comodidade.get('title') for comodidade in ul_comodidades.find_all('li')]
        else:
            comodidades = [False] * len(df_amenities.columns) # Retorna lista com False caso não encontre comodidades

        # Salvar informações em um dicionário
        anuncio_dict = {
            'Endereço': endereco,
            'Área': area,
            'Quartos': quartos,
            'Banheiros': banheiros,
            'Vagas': vagas,
            'Valor': valor,
            'Condomínio': condominio
        }
        anuncio_dict.update({comodidade: True for comodidade in comodidades})
        data.append(anuncio_dict)

# Criar DataFrame
df = pd.DataFrame(data)

# Reordenar as colunas do DataFrame
colunas = ['Endereço', 'Área', 'Quartos', 'Banheiros', 'Vagas', 'Valor', 'Condomínio']
colunas += [coluna for coluna in df.columns if coluna not in colunas]
df = df[colunas]

# Salvar DataFrame em um arquivo Excel
df.to_excel('anuncios.xlsx', index=False)

print(df)


Digite o número total de páginas: 1
                                             Endereço   Área Quartos  \
0   Rua Jacy Teixeira Camargo, 240 - Jardim do Lag...     80       3   
1   Rodovia Governador Doutor Adhemar Pereira de B...    360      --   
2   Rua Campos do Jordão, 449 - Fundação da Casa P...     54       2   
3   Rua Pedro Vieira da Silva, 595 - Jardim Santa ...     77       3   
4      Rua João Iamarino, 3 - Taquaral, Campinas - SP     50       2   
5   Rua Ministro Oscar Saraiva, 40 - Jardim das Pa...    116       3   
6   Avenida Nélsia Vannucci, 105 - Loteamento Chac...     75       3   
7   Avenida Padre Guilherme Ary - Vila Satúrnia, C...     51       2   
8    Rua Álvares Machado, 248 - Centro, Campinas - SP     55       2   
9                             Taquaral, Campinas - SP     61       2   
10  Rua Baronesa Geraldo de Resende, 534 - Taquara...    240       3   
11  Rua Pinheiros, 200 - Vila Industrial, Campinas...     68       3   
12      Jardim Myrian Moreir