# Scraping vivanuncios

In [1]:
# Librerías necesarias
import pandas as pd
import requests
from bs4 import BeautifulSoup

## Anuncios departamentos en renta (Nuevo León, Mex.)

In [2]:
# URL de la páginas de Vivanuncios
urls_1 = [
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/v1c1300l1018p1', 
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-2/v1c1300l1018p2', 
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-3/v1c1300l1018p3',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-4/v1c1300l1018p4',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-5/v1c1300l1018p5',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-6/v1c1300l1018p6',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-7/v1c1300l1018p7',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-8/v1c1300l1018p8',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-9/v1c1300l1018p9',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-10/v1c1300l1018p10',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-11/v1c1300l1018p11',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-12/v1c1300l1018p12',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-13/v1c1300l1018p13',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-14/v1c1300l1018p14',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-15/v1c1300l1018p15',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-16/v1c1300l1018p16',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-17/v1c1300l1018p17',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-18/v1c1300l1018p18',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-19/v1c1300l1018p19',
    'https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-20/v1c1300l1018p20'
]

### Haciendo la solicitud y obteniendo el contenido

In [3]:
# Definir la lista de resultados
results_1 = []

# Recorrer cada URL con User-Agent para simular un navegador
for url in urls_1:
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
    }
    
    # Realiza la solicitud HTTP
    response = requests.get(url, headers=headers)

    # Verifica que la solicitud fue exitosa
    if response.status_code == 200:
        # Extrae el contenido HTML de la página
        html_content = response.content
        
        # Usa BeautifulSoup para analizar el HTML
        soup = BeautifulSoup(html_content, 'html.parser')
        
        # Encontrar todos los contenedores de anuncios
        ad_containers = soup.find_all('div', class_='CardContainer-sc-1tt2vbg-5 fvuHxG')
        
        # Comprobar si se encontraron anuncios
        if not ad_containers:
            print(f"No se encontraron anuncios en {url}")
        
        # Extraer información de cada contenedor
        for ad in ad_containers:
            # Precio
            price = ad.find('div', class_='PostingCardPriceBlock-sc-12dh9kl-0 diTcpX')
            price = price.get_text(strip=True) if price else 'No disponible'
            
            # Dirección
            address = ad.find('div', class_='LocationAddress-sc-ge2uzh-0 jszIDc postingAddress')
            address = address.get_text(strip=True) if address else 'No disponible'
            
            # Ubicación
            location = ad.find('h2', class_='LocationLocation-sc-ge2uzh-2 fziprF')
            location = location.get_text(strip=True) if location else 'No disponible'
            
            # Características
            features = ad.find('h3', class_='PostingMainFeaturesBlock-sc-1uhtbxc-0 cHDgeO')
            features = features.get_text(strip=True) if features else 'No disponible'
            
            # Descripción
            description = ad.find('h3', class_='PostingDescription-sc-i1odl-11 fECErU')
            description = description.get_text(strip=True) if description else 'No disponible'
            
            # Agregar resultados a la lista
            results_1.append({
                'Precio': price,
                'Dirección': address,
                'Ubicación': location,
                'Características': features,
                'Descripción': description,
            })
        
        print(f"Se encontraron {len(ad_containers)} anuncios en {url}")

    else:
        print(f"Error: No se pudo acceder a la página {url} (status code: {response.status_code})")

# Crear un DataFrame y exportar a CSV
df_1 = pd.DataFrame(results_1)
print(f"Número total de anuncios encontrados: {len(df_1)}")



Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/v1c1300l1018p1
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-2/v1c1300l1018p2
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-3/v1c1300l1018p3
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-4/v1c1300l1018p4
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-5/v1c1300l1018p5
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-6/v1c1300l1018p6
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-7/v1c1300l1018p7
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-departamentos-en-renta/nuevo-leon/page-8/v1c1300l1018p8
Se encontraron 30 anuncios en https://www.vivanuncios.c

In [4]:
# Informacion general del nuevo dataframe
df_1.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 600 entries, 0 to 599
Data columns (total 5 columns):
 #   Column           Non-Null Count  Dtype 
---  ------           --------------  ----- 
 0   Precio           600 non-null    object
 1   Dirección        600 non-null    object
 2   Ubicación        600 non-null    object
 3   Características  600 non-null    object
 4   Descripción      600 non-null    object
dtypes: object(5)
memory usage: 23.6+ KB


In [5]:
# Exportar a csv
df_1.to_csv('departamentos_renta.csv', index=False)

## Anuncios casas en renta (Nuevo León, Mex.)

In [6]:
# URL de la páginas de Vivanuncios
urls_2 = [
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/v1c1299l1018p1', 
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-2/v1c1299l1018p2', 
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-3/v1c1299l1018p3',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-4/v1c1299l1018p4',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-5/v1c1299l1018p5',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-6/v1c1299l1018p6',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-7/v1c1299l1018p7',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-8/v1c1299l1018p8',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-9/v1c1299l1018p9',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-10/v1c1299l1018p10',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-11/v1c1299l1018p11',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-12/v1c1299l1018p12',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-13/v1c1299l1018p13',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-14/v1c1299l1018p14',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-15/v1c1299l1018p15',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-16/v1c1299l1018p16',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-17/v1c1299l1018p17',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-18/v1c1299l1018p18',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-19/v1c1299l1018p19',
    'https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-20/v1c1299l1018p20'
]

### Haciendo la solicitud y obteniendo el contenido

In [7]:
# Definir la lista de resultados
results_2 = []

# Recorrer cada URL con User-Agent para simular un navegador
for url in urls_2:
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
    }
    
    # Realiza la solicitud HTTP
    response = requests.get(url, headers=headers)

    # Verifica que la solicitud fue exitosa
    if response.status_code == 200:
        # Extrae el contenido HTML de la página
        html_content = response.content
        
        # Usa BeautifulSoup para analizar el HTML
        soup = BeautifulSoup(html_content, 'html.parser')
        
        # Encontrar todos los contenedores de anuncios
        ad_containers = soup.find_all('div', class_='CardContainer-sc-1tt2vbg-5 fvuHxG')
        
        # Comprobar si se encontraron anuncios
        if not ad_containers:
            print(f"No se encontraron anuncios en {url}")
        
        # Extraer información de cada contenedor
        for ad in ad_containers:
            # Precio
            price = ad.find('div', class_='PostingCardPriceBlock-sc-12dh9kl-0 diTcpX')
            price = price.get_text(strip=True) if price else 'No disponible'
            
            # Dirección
            address = ad.find('div', class_='LocationAddress-sc-ge2uzh-0 jszIDc postingAddress')
            address = address.get_text(strip=True) if address else 'No disponible'
            
            # Ubicación
            location = ad.find('h2', class_='LocationLocation-sc-ge2uzh-2 fziprF')
            location = location.get_text(strip=True) if location else 'No disponible'
            
            # Características
            features = ad.find('h3', class_='PostingMainFeaturesBlock-sc-1uhtbxc-0 cHDgeO')
            features = features.get_text(strip=True) if features else 'No disponible'
            
            # Descripción
            description = ad.find('h3', class_='PostingDescription-sc-i1odl-11 fECErU')
            description = description.get_text(strip=True) if description else 'No disponible'
            
            # Agregar resultados a la lista
            results_2.append({
                'Precio': price,
                'Dirección': address,
                'Ubicación': location,
                'Características': features,
                'Descripción': description,
            })
        
        print(f"Se encontraron {len(ad_containers)} anuncios en {url}")

    else:
        print(f"Error: No se pudo acceder a la página {url} (status code: {response.status_code})")

# Crear un DataFrame y exportar a CSV
df_2 = pd.DataFrame(results_2)
print(f"Número total de anuncios encontrados: {len(df_2)}")

Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/v1c1299l1018p1
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-2/v1c1299l1018p2
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-3/v1c1299l1018p3
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-4/v1c1299l1018p4
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-5/v1c1299l1018p5
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-6/v1c1299l1018p6
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-7/v1c1299l1018p7
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-8/v1c1299l1018p8
Se encontraron 30 anuncios en https://www.vivanuncios.com.mx/s-casas-en-renta/nuevo-leon/page-9/v1c1299l1018p9
Se encon

In [8]:
# Informacion general del nuevo dataframe
df_2.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 600 entries, 0 to 599
Data columns (total 5 columns):
 #   Column           Non-Null Count  Dtype 
---  ------           --------------  ----- 
 0   Precio           600 non-null    object
 1   Dirección        600 non-null    object
 2   Ubicación        600 non-null    object
 3   Características  600 non-null    object
 4   Descripción      600 non-null    object
dtypes: object(5)
memory usage: 23.6+ KB


In [9]:
# Exportar a csv
df_2.to_csv('casas_renta.csv', index=False)