# Beautiful Soup Tutorial

Como científico de datos, tarde o temprano llegarás a un punto en el que tendrás que recopilar grandes cantidades de datos. Ya sea un proyecto o por pasatiempo y no siempre podremos contar con las API, pero tranquilo tenemos el web scraping... ¡Y una de las mejores herramientas de web scraping es Beautiful Soup!

## ¿Pero.... qué es el web scraping?

En pocas palabras, el web scraping es la recopilación automatizada de datos de sitios web (para ser más precisos, del contenido HTML de los sitios web).

En este Jupyter, aprenderás los conceptos básicos sobre cómo extraer datos de HTML. 

Lo harás extrayendo datos de la página en la cual se encuentran alquileres de pisos en Barcelona

### Conoce a tus nuevos mejores amigos: 

- Beautiful Soup
- Requests

In [1]:
%pip install beautifulsoup4

Collecting beautifulsoup4
  Downloading beautifulsoup4-4.12.2-py3-none-any.whl (142 kB)
     ---------------------------------------- 0.0/143.0 kB ? eta -:--:--
     -------------------------------------- 143.0/143.0 kB 4.3 MB/s eta 0:00:00
Collecting soupsieve>1.2 (from beautifulsoup4)
  Downloading soupsieve-2.5-py3-none-any.whl.metadata (4.7 kB)
Downloading soupsieve-2.5-py3-none-any.whl (36 kB)
Installing collected packages: soupsieve, beautifulsoup4
Successfully installed beautifulsoup4-4.12.2 soupsieve-2.5
Note: you may need to restart the kernel to use updated packages.


Para obtener la experiencia completa de Beautiful Soup, también deberás instalar un parser, dentro de ellos tenemos..

- html.parser
- lxml
- html5lib


Vamos a utilizar el lxml ya que es el mas rápido 

In [2]:
%pip install lxml

Collecting lxml
  Downloading lxml-4.9.4-cp311-cp311-win_amd64.whl.metadata (3.8 kB)
Downloading lxml-4.9.4-cp311-cp311-win_amd64.whl (3.8 MB)
   ---------------------------------------- 0.0/3.8 MB ? eta -:--:--
   ---------------------------------------- 0.0/3.8 MB 991.0 kB/s eta 0:00:04
   -- ------------------------------------- 0.2/3.8 MB 2.4 MB/s eta 0:00:02
   ----- ---------------------------------- 0.5/3.8 MB 3.8 MB/s eta 0:00:01
   --------- ------------------------------ 0.9/3.8 MB 5.1 MB/s eta 0:00:01
   -------------- ------------------------- 1.4/3.8 MB 6.2 MB/s eta 0:00:01
   ------------------- -------------------- 1.9/3.8 MB 7.0 MB/s eta 0:00:01
   ------------------------ --------------- 2.3/3.8 MB 7.4 MB/s eta 0:00:01
   ----------------------------- ---------- 2.8/3.8 MB 7.8 MB/s eta 0:00:01
   ----------------------------------- ---- 3.3/3.8 MB 8.1 MB/s eta 0:00:01
   ---------------------------------------  3.8/3.8 MB 8.3 MB/s eta 0:00:01
   -----------------------

Se necesita una cosa más para que podamos comenzar a hacer web scraping, y es la biblioteca de ```requests```. Con ```requests``` podemos solicitar páginas web de sitios web.

In [3]:
%pip install requests

Note: you may need to restart the kernel to use updated packages.


Ahora asi manos a la obra..

## Mi primer scraping

Como siempre lo primero es importar las librerías 

In [4]:
from bs4 import BeautifulSoup as bs
import requests
import pandas as pd
import numpy as np

Ahora, estamos listos para solicitar nuestra primera página web. No es nada complicado: guardamos la URL que queremos raspar en la variable URL, luego solicitamos la URL (requests.get (url)) y guardamos la respuesta en la variable de respuesta:

In [6]:
url = "https://www.yaencontre.com/alquiler/pisos/barcelona"
response = requests.get(url)

Cómo saber si se guardo correctamente el sitio web?

In [7]:
print(response)

<Response [200]>


Posibles respuestas:

- [Respuestas informativas](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#information_responses) (100–199)
- [Respuestas exitosas](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#successful_responses) (200–299)
- [Mensajes de redirección](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#redirection_messages) (300–399)
- [Respuestas de error del cliente](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#client_error_responses) (400–499)
- [Respuestas de error del servidor](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#server_error_responses) (500–599)

Pero necesitamos el contenido HTML de la página web solicitada, así que como siguiente paso guardamos el contenido de la respuesta a html:

In [8]:
html = response.content

Lo podemos imprimir para ver su estructura

In [9]:
print(html)

b'<!doctype html>\n    <html lang="es" class="notranslate page-results variantContainer withBreadcrumb" translate="no">\n      <head>\n        \n        <title data-rh="true">Pisos y viviendas en alquiler en Barcelona \xc2\xb7 5.347 pisos y viviendas disponibles - yaencontre</title>\n        <meta data-rh="true" name="title" content="Pisos y viviendas en alquiler en Barcelona \xc2\xb7 5.347 pisos y viviendas disponibles - yaencontre"/><meta data-rh="true" name="description" content="5.347 Pisos y viviendas en alquiler en Barcelona. Anuncios de pisos y viviendas de particulares y agencias inmobiliarias. \xc2\xa1Encontrar\xc3\xa1s lo que est\xc3\xa1s buscando!"/><meta data-rh="true" name="robots" content="index, follow"/><meta data-rh="true" name="language" content="es"/>\n        <meta name="viewport" content="width=device-width, height=device-height, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" /><meta name="theme-color" content="#e5005a" /><meta http-equiv="content-type" co

Este es el resultado obtenido en HTML de la página de los pisos de Barcelona, pero es realmente difícil de leer...

Pero para eso usamos BeautifulSoup y lxml

Cómo lo hacemos?..

Creamos un objeto BeautifulSoup llamado soup con la siguiente línea de código:

In [10]:
soup = bs(html)

bs?

> from bs4 import BeautifulSoup as bs

El primer parámetro del método bs() es html (que fue la variable en la que guardamos ese contenido HTML difícil de leer de la URL de los alquileres de Barcelona)

El segundo parámetro ('lxml'), es el parser que se usa en html 

Ahora vamos a ver el cambio

In [11]:
soup

<!DOCTYPE html>
<html class="notranslate page-results variantContainer withBreadcrumb" lang="es" translate="no">
<head>
<title data-rh="true">Pisos y viviendas en alquiler en Barcelona · 5.347 pisos y viviendas disponibles - yaencontre</title>
<meta content="Pisos y viviendas en alquiler en Barcelona · 5.347 pisos y viviendas disponibles - yaencontre" data-rh="true" name="title"/><meta content="5.347 Pisos y viviendas en alquiler en Barcelona. Anuncios de pisos y viviendas de particulares y agencias inmobiliarias. ¡Encontrarás lo que estás buscando!" data-rh="true" name="description"/><meta content="index, follow" data-rh="true" name="robots"/><meta content="es" data-rh="true" name="language"/>
<meta content="width=device-width, height=device-height, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" name="viewport"/><meta content="#e5005a" name="theme-color"/><meta content="text/html; charset=utf-8" http-equiv="content-type"/><meta content="IE=EDGE" http-equiv="x-ua-compatible"/>

## Cómo navegar por un objeto de Beautiful Soup

HTML consta de elementos como enlaces, párrafos, encabezados, bloques, etc. Estos elementos están envueltos entre etiquetas; dentro de la etiqueta de apertura y cierre se puede encontrar el contenido del elemento.

Los elementos HTML también pueden tener atributos que contienen información adicional sobre el elemento. Los atributos se definen en las etiquetas de apertura con la siguiente sintaxis: nombre del atributo = "valor del atributo".

Ahora que hemos aprendido algo de HTML básico, finalmente podemos comenzar a extraer datos de soup. Simplemente escriba un nombre de etiqueta después de soup y un punto (como soup.title), y observe cómo se desarrolla la magia:

In [13]:
soup.title

<title data-rh="true">Pisos y viviendas en alquiler en Barcelona · 5.347 pisos y viviendas disponibles - yaencontre</title>

In [14]:
soup.h1

<h1 class="d-ellipsis title-results">5.347 Pisos y viviendas en alquiler en Barcelona</h1>

Eliminamos las etiquetas

In [15]:
soup.h1.get_text()

'5.347 Pisos y viviendas en alquiler en Barcelona'

¿Qué sucede si solo necesita el atributo de un elemento? Tampoco hay problema:

In [16]:
#Si en inspeccionar, hacemos Ctrl+F y buscamos <a>, encontramos la primera etiqueta a
soup.a

<a class="icon-logo" href="/"></a>

In [19]:
soup.a["href"]  #Son lo mismo
soup.a.get("href")

'/'

También podemos..
> soup.a.get("href")

La sintaxis de soup.```cualquier_etiqueta``` devuelve solo el primer elemento con ese nombre de etiqueta. En lugar de soup.```cualquier_etiqueta```, también puedes usar el método .find() y obtendrás exactamente el mismo resultado:

In [20]:
print("Sin utilizar método .find()")
soup.h1
print(soup.h1)
print("Utilizando método .find()")
soup.find("h1")


Sin utilizar método .find()
<h1 class="d-ellipsis title-results">5.347 Pisos y viviendas en alquiler en Barcelona</h1>
Utilizando método .find()


<h1 class="d-ellipsis title-results">5.347 Pisos y viviendas en alquiler en Barcelona</h1>

A menudo, no solo necesitas uno, sino todos los elementos (por ejemplo, cada enlace en una página). Para eso es bueno el método .find_all():

In [22]:
soup.find_all("a")

[<a class="icon-logo" href="/"></a>,
 <a class="classPublishAdvise text-default-color" href="/poner-anuncio" target="_blank"><span>PUBLICAR</span> anuncio</a>,
 <a class="classPublishAdvise text-default-color d-none--tablet" href="https://localgest.yaencontre.com/" rel="nofollow" target="_blank">Profesionales</a>,
 <a class="d-none--tablet" href="/">yaencontre</a>,
 <a class="link" href="/alquiler/pisos/barcelona-provincia">Barcelona (provincia)</a>,
 <a class="link" href="/alquiler/pisos/barcelones">Barcelonès</a>,
 <a class="link d-ellipsis" href="/alquiler/pisos/badalona">Badalona</a>,
 <a class="link d-ellipsis toogle-item__title--selected breadcrumb-selected" href="/alquiler/pisos/barcelona">Barcelona</a>,
 <a class="link d-ellipsis" href="/alquiler/pisos/barcelona/distrito-ciutat-vella">Ciutat Vella</a>,
 <a class="link d-ellipsis" href="/alquiler/pisos/barcelona/distrito-eixample">Eixample</a>,
 <a class="link d-ellipsis" href="/alquiler/pisos/barcelona/distrito-gracia">Gràcia</

Si nos fijamos podemos ver que lo que nos devuelve es una lista..

Qué podemos hacer con una lista?..

In [25]:
all_a = soup.find_all("a")
for a in all_a[:5]:
    print(a)
    print(type(a))

<a class="icon-logo" href="/"></a>
<class 'bs4.element.Tag'>
<a class="classPublishAdvise text-default-color" href="/poner-anuncio" target="_blank"><span>PUBLICAR</span> anuncio</a>
<class 'bs4.element.Tag'>
<a class="classPublishAdvise text-default-color d-none--tablet" href="https://localgest.yaencontre.com/" rel="nofollow" target="_blank">Profesionales</a>
<class 'bs4.element.Tag'>
<a class="d-none--tablet" href="/">yaencontre</a>
<class 'bs4.element.Tag'>
<a class="link" href="/alquiler/pisos/barcelona-provincia">Barcelona (provincia)</a>
<class 'bs4.element.Tag'>


Ok.. Pero como extraigo la data con BeautifilSoup?..

La página contiene 42 pisos con información relacionada con ellos. De los datos disponibles extraeremos los siguientes:

- Títulos
- Url
- habitaciones
- prices

Mientras trabajamos con BeautifulSoup, el flujo general de extracción de datos será un enfoque de dos pasos:

* Inspeccionar en el navegador los elementos HTML que queremos extraer 
* Luego encontrar los elementos HTML con BeautifulSoup.

In [38]:
soup.find_all('a',attrs={'rel' : 'noopener noreferrer'})

[<a class="icon-facebook" href="https://www.facebook.com/yaencontre.comvivienda/" rel="noopener noreferrer" target="_blank" title="Síguenos en Facebook"><span>Síguenos en Facebook</span></a>,
 <a class="icon-instagram" href="https://www.instagram.com/yaencontre/" rel="noopener noreferrer" target="_blank" title="Síguenos en Instagram"><span>Síguenos en Instagram</span></a>,
 <a class="icon-twitter" href="https://twitter.com/yaencontre" rel="noopener noreferrer" target="_blank" title="Noticias inmobiliarias en X"><span>Noticias inmobiliarias en X</span></a>,
 <a class="icon-youtube-round" href="https://www.youtube.com/user/yaencontre/" rel="noopener noreferrer" target="_blank" title="Noticias inmobiliarias en Youtube"><span>Noticias inmobiliarias en Youtube</span></a>,
 <a class="icon-linkedin" href="https://es.linkedin.com/company/grupo-yaencontre-com" rel="noopener noreferrer" target="_blank" title="Síguenos en Linkedin"><span>Síguenos en Linkedin</span></a>,
 <a class="icon-tiktok" hr

## Suficiente información...

Manos a la obra

## Obtener los títulos de los pisos (find_all + get_text)

Para ello vamos a inspeccionar en el navegador (click derecho sobre un titulo de un piso y elegimos inspeccionar)

In [30]:
all_h3 = soup.find_all("h3")
for h3 in all_h3[:5]:
    print(h3)
    print('Es un objeto',str(type(h3)), ', por tanto, tiene métodos de beautiful soup (find, find_all, get_text)')
    print()
    print('Todo el texto del h3')
    print(h3.get_text())
    print('--------------------------------------------------')
    

<h3 class="title logo-aside"><a class="d-ellipsis" href="/alquiler/piso/inmueble-29126-96822843" title="Piso en El Camp de l'Arpa del Clot, Barcelona">Piso en El Camp de l'Arpa del Clot, Barcelona</a><div class="price-wrapper inline-flex logo-aside"><span class="price">2.560 €</span></div></h3>
Es un objeto <class 'bs4.element.Tag'> , por tanto, tiene métodos de beautiful soup (find, find_all, get_text)

Todo el texto del h3
Piso en El Camp de l'Arpa del Clot, Barcelona2.560 €
--------------------------------------------------
<h3 class="title logo-aside"><a class="d-ellipsis" href="/alquiler/piso/inmueble-29126-96352122" title="Piso en Sant Pere, Santa Caterina i la Ribera, Barcelona">Piso en Sant Pere, Santa Caterina i la Ribera, Barcelona</a><div class="price-wrapper inline-flex logo-aside"><span class="price">2.190 €</span></div></h3>
Es un objeto <class 'bs4.element.Tag'> , por tanto, tiene métodos de beautiful soup (find, find_all, get_text)

Todo el texto del h3
Piso en Sant Per

Si queremos obtener solo los títulos

In [31]:
all_h3 = soup.find_all('h3', class_='title')
for h3 in all_h3:
    print('Solo el título')
    print(h3.a.get_text(strip = True))
    print('Es un objeto',str(type(h3.a)), ', por tanto, tiene métodos de beautiful soup (find, find_all, get_text)')
    print('---------------------------------------------------------------------')

Solo el título
Piso en El Camp de l'Arpa del Clot, Barcelona
Es un objeto <class 'bs4.element.Tag'> , por tanto, tiene métodos de beautiful soup (find, find_all, get_text)
---------------------------------------------------------------------
Solo el título
Piso en Sant Pere, Santa Caterina i la Ribera, Barcelona
Es un objeto <class 'bs4.element.Tag'> , por tanto, tiene métodos de beautiful soup (find, find_all, get_text)
---------------------------------------------------------------------
Solo el título
Piso en calle Formatgeria, El Gòtic, Barcelona
Es un objeto <class 'bs4.element.Tag'> , por tanto, tiene métodos de beautiful soup (find, find_all, get_text)
---------------------------------------------------------------------
Solo el título
Ático en El Gòtic, Barcelona
Es un objeto <class 'bs4.element.Tag'> , por tanto, tiene métodos de beautiful soup (find, find_all, get_text)
---------------------------------------------------------------------
Solo el título
Piso en Sant Pere, San

### Los añadimos a una lista

In [36]:
lista_pisos=[]
all_h3 = soup.find_all('h3', class_='title')
for h3 in all_h3:
    lista_pisos.append(h3.a.get_text(strip = True))
lista_pisos

["Piso en El Camp de l'Arpa del Clot, Barcelona",
 'Piso en Sant Pere, Santa Caterina i la Ribera, Barcelona',
 'Piso en calle Formatgeria, El Gòtic, Barcelona',
 'Ático en El Gòtic, Barcelona',
 'Piso en Sant Pere, Santa Caterina i la Ribera, Barcelona',
 'Piso en Sant Gervasi - La Bonanova, Barcelona',
 'Piso en Sant Gervasi - La Bonanova, Barcelona',
 "Piso en La Dreta de l'Eixample, Barcelona",
 'Piso en Sant Gervasi - Galvany, Barcelona',
 "Piso en El Camp de l'Arpa del Clot, Barcelona",
 'Ático en El Gòtic, Barcelona',
 "Piso en L'Antiga Esquerra de l'Eixample, Barcelona",
 "Piso en La Dreta de l'Eixample, Barcelona",
 "Piso en La Dreta de l'Eixample, Barcelona",
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',


##### Otra forma de hacerlo


In [40]:
lista_pisos=[]
all_h3 = soup.find_all('h3', attrs={'class':'title'})
for h3 in all_h3:
    lista_pisos.append(h3.a.get_text(strip = True))
lista_pisos

["Piso en El Camp de l'Arpa del Clot, Barcelona",
 'Piso en Sant Pere, Santa Caterina i la Ribera, Barcelona',
 'Piso en calle Formatgeria, El Gòtic, Barcelona',
 'Ático en El Gòtic, Barcelona',
 'Piso en Sant Pere, Santa Caterina i la Ribera, Barcelona',
 'Piso en Sant Gervasi - La Bonanova, Barcelona',
 'Piso en Sant Gervasi - La Bonanova, Barcelona',
 "Piso en La Dreta de l'Eixample, Barcelona",
 'Piso en Sant Gervasi - Galvany, Barcelona',
 "Piso en El Camp de l'Arpa del Clot, Barcelona",
 'Ático en El Gòtic, Barcelona',
 "Piso en L'Antiga Esquerra de l'Eixample, Barcelona",
 "Piso en La Dreta de l'Eixample, Barcelona",
 "Piso en La Dreta de l'Eixample, Barcelona",
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',


## Tips importantes

soup.find_all(“h3”) encuentra cada elemento h3 en la página web; con class_=”title” especificamos que buscamos específicamente etiquetas h3 que contengan el atributo class_=”title” (nota importante: el “_” en **class__=”title”** no es un error tipográfico, se requiere en Beautiful Soup cuando seleccionando atributos de clase).

Guardamos los elementos h3 en all_h3, que se comporta como una lista, por lo que podemos recorrerlos con un bucle for. En cada iteración extraemos solo el texto del elemento h3 con .get_text(), y con el parámetro strip=True nos aseguramos de eliminar cualquier espacio en blanco innecesario.

## Obtener los METROS CUADRADOS

In [74]:
m2 = soup.find_all("div", class_="icon-meter")
lista_m2 = []
for i in m2:
    lista_m2.append(i.get_text(strip=True))
lista_m2

['69 m²',
 '80 m²',
 '45 m²',
 '109 m²',
 '150 m²',
 '130 m²',
 '102 m²',
 '221 m²',
 '110 m²',
 '85 m²',
 '63 m²',
 '115 m²',
 '63 m²',
 '50 m²',
 '123 m²',
 '123 m²',
 '91 m²',
 '91 m²',
 '122 m²',
 '119 m²',
 '99 m²',
 '97 m²',
 '135 m²',
 '79 m²',
 '70 m²',
 '56 m²',
 '66 m²',
 '226 m²',
 '258 m²',
 '102 m²',
 '52 m²',
 '80 m²',
 '146 m²',
 '146 m²',
 '200 m²',
 '200 m²',
 '210 m²',
 '130 m²',
 '315 m²',
 '133 m²',
 '153 m²',
 '157 m²']

Otra forma de hacerlo

#### Las dos listas contienen el mismo número de valores. Lo comprobamos

42
42


#### Entonces, ya podríamos crear un DataFrame con títulos y metros cuadrados. Vamos a hacerlo

#### Primera forma de hacerlo

In [46]:
df_pisos = pd.DataFrame({"Titulo":lista_pisos,"m²":lista_m2})
df_pisos

Unnamed: 0,Titulo,m²
0,"Piso en El Camp de l'Arpa del Clot, Barcelona",69 m²
1,"Piso en Sant Pere, Santa Caterina i la Ribera,...",80 m²
2,"Piso en calle Formatgeria, El Gòtic, Barcelona",45 m²
3,"Ático en El Gòtic, Barcelona",109 m²
4,"Piso en Sant Pere, Santa Caterina i la Ribera,...",150 m²
5,"Piso en Sant Gervasi - La Bonanova, Barcelona",130 m²
6,"Piso en Sant Gervasi - La Bonanova, Barcelona",102 m²
7,"Piso en La Dreta de l'Eixample, Barcelona",221 m²
8,"Piso en Sant Gervasi - Galvany, Barcelona",110 m²
9,"Piso en El Camp de l'Arpa del Clot, Barcelona",85 m²


#### Segunda forma

Unnamed: 0,Titulo,M2
0,2,ochenta
1,3,60
2,6,60


Unnamed: 0,Título,Metros cuadrados
0,"Ático en El Poble Sec - Parc de Montjuïc, Barc...",60 m²
1,"Piso en Sant Gervasi - Galvany, Barcelona",85 m²
2,"Piso en Fort Pienc, Barcelona",110 m²
3,"Piso en L'Antiga Esquerra de l'Eixample, Barce...",131 m²
4,"Piso en Sant Pere, Santa Caterina i la Ribera,...",95 m²
5,"Estudio en El Raval, Barcelona",43 m²
6,"Piso en El Putxet i el Farró, Barcelona",45 m²
7,"Piso en El Raval, Barcelona",45 m²
8,Piso en Diagonal Mar i el Front Marítim del Po...,155 m²
9,"Piso en La Nova Esquerra de l'Eixample, Barcelona",82 m²


## Obtener el número de habitaciones de cada inmueble

In [48]:
habs = soup.find_all("div", class_="icon-room")
lista_habs = []
for i in habs:
    lista_habs.append(i.get_text(strip=True))
len(lista_habs)

42

### Puede darse el caso de que un alojamiento no muestre el número de habitaciones. Las longitudes de las listas de títulos y habitaciones no encajarían...¿Cómo solventamos el problema?

Primera forma

In [53]:
group = soup.find_all("div", class_="iconGroup")
lista_h = []
for i in group:
    if i.find('div', class_='icon-room'):
        lista_h.append(i.find('div', class_='icon-room').get_text(strip=True))
    else:
        lista_h.append("No veo habitaciones")
lista_h

['2 habs.',
 '1 hab.',
 '1 hab.',
 '1 hab.',
 '2 habs.',
 '3 habs.',
 '2 habs.',
 '3 habs.',
 '3 habs.',
 '2 habs.',
 '1 hab.',
 '4 habs.',
 '2 habs.',
 '1 hab.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '4 habs.',
 '5 habs.',
 '3 habs.',
 '1 hab.',
 '2 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '1 hab.',
 '3 habs.',
 '3 habs.']

Segunda forma

In [54]:
contenedor = soup.find_all('div', class_='iconGroup')
lista_h = []
for i in contenedor:
    try:
        lista_h.append(i.find('div', class_='icon-room').get_text())
    except:
        lista_h.append('No hay habitaciones')

lista_h

['2 habs.',
 '1 hab.',
 '1 hab.',
 '1 hab.',
 '2 habs.',
 '3 habs.',
 '2 habs.',
 '3 habs.',
 '3 habs.',
 '2 habs.',
 '1 hab.',
 '4 habs.',
 '2 habs.',
 '1 hab.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '4 habs.',
 '5 habs.',
 '3 habs.',
 '1 hab.',
 '2 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '1 hab.',
 '3 habs.',
 '3 habs.']

### Los añadimos a una lista

In [55]:
len(lista_h)

42

## Encontrar elementos por su selector CSS

In [56]:
rooms = soup.select('div.iconGroup div.icon-room span')
#Esto corresponde al selector CSS

In [57]:

for i in rooms:
    print(type(i))
    print(i.get_text())



<class 'bs4.element.Tag'>
2 habs.
<class 'bs4.element.Tag'>
1 hab.
<class 'bs4.element.Tag'>
1 hab.
<class 'bs4.element.Tag'>
1 hab.
<class 'bs4.element.Tag'>
2 habs.
<class 'bs4.element.Tag'>
3 habs.
<class 'bs4.element.Tag'>
2 habs.
<class 'bs4.element.Tag'>
3 habs.
<class 'bs4.element.Tag'>
3 habs.
<class 'bs4.element.Tag'>
2 habs.
<class 'bs4.element.Tag'>
1 hab.
<class 'bs4.element.Tag'>
4 habs.
<class 'bs4.element.Tag'>
2 habs.
<class 'bs4.element.Tag'>
1 hab.
<class 'bs4.element.Tag'>
3 habs.
<class 'bs4.element.Tag'>
3 habs.
<class 'bs4.element.Tag'>
3 habs.
<class 'bs4.element.Tag'>
3 habs.
<class 'bs4.element.Tag'>
3 habs.
<class 'bs4.element.Tag'>
3 habs.
<class 'bs4.element.Tag'>
3 habs.
<class 'bs4.element.Tag'>
3 habs.
<class 'bs4.element.Tag'>
3 habs.
<class 'bs4.element.Tag'>
2 habs.
<class 'bs4.element.Tag'>
2 habs.
<class 'bs4.element.Tag'>
2 habs.
<class 'bs4.element.Tag'>
2 habs.
<class 'bs4.element.Tag'>
4 habs.
<class 'bs4.element.Tag'>
5 habs.
<class 'bs4.element

## Obtener los precios (find_all + get_text)

In [60]:
precios = soup.find_all('span', class_='price')
lista_precios = []
for precio in precios:
    lista_precios.append(precio.get_text(strip=True))
lista_precios


['2.560 €',
 '2.190 €',
 '825 €',
 '2.200 €',
 '5.000 €',
 '3.341 €',
 '2.763 €',
 '7.500 €',
 '2.310 €',
 '2.250 €',
 '1.850 €',
 '2.300 €',
 '4.550 €',
 '3.000 €',
 '2.800 €',
 '2.850 €',
 '2.650 €',
 '2.500 €',
 '2.800 €',
 '2.750 €',
 '2.950 €',
 '2.550 €',
 '2.950 €',
 '1.850 €',
 '1.350 €',
 '1.800 €',
 '2.500 €',
 '4.500 €',
 '13.000 €',
 '2.950 €',
 '2.500 €',
 '2.000 €',
 '4.490 €',
 '4.000 €',
 '7.500 €',
 '10.000 €',
 '7.000 €',
 '3.800 €',
 '8.000 €',
 '5.000 €',
 '6.000 €',
 '6.000 €']

### Pero, en un DataFrame, te interesa tener el precio comprendido como un número int o float, para poder jugar con él. ¿Cómo lo haríamos?

In [61]:
precios = soup.find_all('span', class_='price')
for precio in precios:
    print(type(precio.get_text()))
    print(precio.get_text(strip=True).replace('.',''))
    print(precio.get_text(strip=True).replace('.','').split())
    print(precio.get_text(strip=True).replace('.','').split()[0])
    print('De momento es un string, así que lo pasamos a float')
    print(float(precio.get_text(strip=True).replace('.','').split()[0]))
    print('---------------------------------------------------------------')

<class 'str'>
2560 €
['2560', '€']
2560
De momento es un string, así que lo pasamos a float
2560.0
---------------------------------------------------------------
<class 'str'>
2190 €
['2190', '€']
2190
De momento es un string, así que lo pasamos a float
2190.0
---------------------------------------------------------------
<class 'str'>
825 €
['825', '€']
825
De momento es un string, así que lo pasamos a float
825.0
---------------------------------------------------------------
<class 'str'>
2200 €
['2200', '€']
2200
De momento es un string, así que lo pasamos a float
2200.0
---------------------------------------------------------------
<class 'str'>
5000 €
['5000', '€']
5000
De momento es un string, así que lo pasamos a float
5000.0
---------------------------------------------------------------
<class 'str'>
3341 €
['3341', '€']
3341
De momento es un string, así que lo pasamos a float
3341.0
---------------------------------------------------------------
<class 'str'>
2763 €
['276

#### Los añadimos a una lista

In [62]:
precios = soup.find_all('span', class_='price')
lista_precios = []
for precio in precios:
    lista_precios.append(float(precio.get_text(strip=True).replace('.','').split()[0]))
lista_precios

[2560.0,
 2190.0,
 825.0,
 2200.0,
 5000.0,
 3341.0,
 2763.0,
 7500.0,
 2310.0,
 2250.0,
 1850.0,
 2300.0,
 4550.0,
 3000.0,
 2800.0,
 2850.0,
 2650.0,
 2500.0,
 2800.0,
 2750.0,
 2950.0,
 2550.0,
 2950.0,
 1850.0,
 1350.0,
 1800.0,
 2500.0,
 4500.0,
 13000.0,
 2950.0,
 2500.0,
 2000.0,
 4490.0,
 4000.0,
 7500.0,
 10000.0,
 7000.0,
 3800.0,
 8000.0,
 5000.0,
 6000.0,
 6000.0]

### Forma un poco más pro de hacerlo: list comprehension

In [63]:
lista_precios = [float(precio.get_text(strip=True).replace('.','').split()[0]) for precio in precios]

### Podéis también meterlo en una serie o en un dataframe

42


### Podéis también meterlo en una serie o en un dataframe

In [75]:
lista_df = []
for i in range(len(lista_pisos)):
    data = {'Título': lista_pisos[i],
            'Metros cuadrados': lista_m2[i],
            'Habitaciones': lista_h[i],
            'Precios': lista_precios[i]}
    lista_df.append(data)
df = pd.DataFrame(lista_df)
df

Unnamed: 0,Título,Metros cuadrados,Habitaciones,Precios
0,"Piso en El Camp de l'Arpa del Clot, Barcelona",69 m²,2 habs.,2560.0
1,"Piso en Sant Pere, Santa Caterina i la Ribera,...",80 m²,1 hab.,2190.0
2,"Piso en calle Formatgeria, El Gòtic, Barcelona",45 m²,1 hab.,825.0
3,"Ático en El Gòtic, Barcelona",109 m²,1 hab.,2200.0
4,"Piso en Sant Pere, Santa Caterina i la Ribera,...",150 m²,2 habs.,5000.0
5,"Piso en Sant Gervasi - La Bonanova, Barcelona",130 m²,3 habs.,3341.0
6,"Piso en Sant Gervasi - La Bonanova, Barcelona",102 m²,2 habs.,2763.0
7,"Piso en La Dreta de l'Eixample, Barcelona",221 m²,3 habs.,7500.0
8,"Piso en Sant Gervasi - Galvany, Barcelona",110 m²,3 habs.,2310.0
9,"Piso en El Camp de l'Arpa del Clot, Barcelona",85 m²,2 habs.,2250.0


Unnamed: 0,Título,Metros cuadrados,Habitaciones,Precios
2,"Piso en Fort Pienc, Barcelona",110 m²,3 habs.,3250.0
3,"Piso en L'Antiga Esquerra de l'Eixample, Barce...",131 m²,3 habs.,3600.0
8,Piso en Diagonal Mar i el Front Marítim del Po...,155 m²,3 habs.,3700.0
9,"Piso en La Nova Esquerra de l'Eixample, Barcelona",82 m²,3 habs.,3000.0
11,"Ático en L'Antiga Esquerra de l'Eixample, Barc...",78 m²,1 hab.,3000.0
13,"Piso en L'Antiga Esquerra de l'Eixample, Barce...",76 m²,2 habs.,2800.0
14,"Ático en Vila de Gràcia, Barcelona",60 m²,2 habs.,3400.0
15,"Piso en Vila de Gràcia, Barcelona",95 m²,2 habs.,2650.0
17,"Piso en La Sagrada Família, Barcelona",70 m²,2 habs.,2650.0
18,"Piso en La Dreta de l'Eixample, Barcelona",80 m²,2 habs.,2650.0


### Conseguir los teléfonos de las inmobiliarias

In [78]:
tlf = soup.find_all('div', class_='icon-phone-2')
lista_tlf = []
for i in tlf:
    try:
        lista_tlf.append(int(i.span.get_text(strip=True).replace(' ','')))
    except:
        lista_tlf.append("No hay tlf")
lista_tlf

[936178845,
 936178845,
 'No hay tlf',
 936175122,
 936179214,
 936178487,
 936176098,
 936172495,
 936175082,
 936170336,
 936176241,
 936176020,
 936174047,
 936178046,
 936179793,
 936179793,
 936179793,
 936179793,
 936179793,
 936179793,
 936179793,
 936179793,
 936179793,
 936175459,
 936175459,
 936174964,
 936177625,
 936178609,
 936179931,
 936177625,
 936179914,
 936173581,
 936179737,
 936173040,
 936173040,
 936173040,
 936173040,
 936173040,
 936173040,
 936173040,
 936173040,
 936173040]

## Obtener URLs de alojamientos

In [95]:
url_principal = 'https://www.yaencontre.com'

lista_pisos = []

pisos = soup.find_all('h3', class_='title')
for piso in pisos:
    lista_pisos.append()
    

Entramos en cada url

In [96]:
for url in lista_pisos:
    response = requests.get(url)
    soup_piso = bs(response)
    

<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>


<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>


#### De cada alojamiento obtener:
* Ubicación
* Si tiene o no tiene Aire acondicionado
* Si está amueblado o no.

### Ubicación

El Poble Sec - Parc de Montjuïc, Sants - Montjuïc, Barcelona
Sant Gervasi - Galvany, Sarrià - Sant Gervasi, Barcelona
Fort Pienc, Eixample, Barcelona
L'Antiga Esquerra de l'Eixample, Eixample, Barcelona
Sant Pere, Santa Caterina i la Ribera, Ciutat Vella, Barcelona
El Raval, Ciutat Vella, Barcelona
El Putxet i el Farró, Sarrià - Sant Gervasi, Barcelona
El Raval, Ciutat Vella, Barcelona
Diagonal Mar i el Front Marítim del Poblenou, Sant Martí, Barcelona
La Nova Esquerra de l'Eixample, Eixample, Barcelona
El Poble Sec - Parc de Montjuïc, Sants - Montjuïc, Barcelona
L'Antiga Esquerra de l'Eixample, Eixample, Barcelona
Sant Pere, Santa Caterina i la Ribera, Ciutat Vella, Barcelona
L'Antiga Esquerra de l'Eixample, Eixample, Barcelona
Vila de Gràcia, Gràcia, Barcelona
Vila de Gràcia, Gràcia, Barcelona
La Salut, Gràcia, Barcelona
La Sagrada Família, Eixample, Barcelona
La Dreta de l'Eixample, Eixample, Barcelona
Diagonal Mar i el Front Marítim del Poblenou, Sant Martí, Barcelona
La Dreta de l

### Aire acondicionado

No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene air

### Amueblado

Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
No
Sí
Sí
Sí
Sí
Sí


---

## Ahora vamos a scrapear todos los pisos, yendo de página en página

In [100]:
url = "https://www.yaencontre.com/alquiler/pisos/barcelona"



Página 1
https://www.yaencontre.com/alquiler/pisos/barcelona/pag-1
/alquiler/piso/inmueble-55533-AT2106015-A
/alquiler/piso/inmueble-55533-AT2202021-A
/alquiler/piso/inmueble-56196-BINGIN-A
/alquiler/piso/inmueble-56196-AMAZZER-A
/alquiler/piso/inmueble-55533-AT1915012-A
/alquiler/piso/inmueble-55533-AT1912019-A
/alquiler/piso/inmueble-60247-6ae0e66293d017ac001d-A
/alquiler/piso/inmueble-55533-AT2103004-A
/alquiler/piso/inmueble-55652-BCNR33308-A
/alquiler/piso/inmueble-56196-KUFRA-A
/alquiler/piso/inmueble-55533-AT2006031-A
/alquiler/piso/inmueble-56196-ATACAMA-A
/alquiler/piso/inmueble-56196-THAR-A
/alquiler/piso/inmueble-56196-LEGE-A
/alquiler/piso/inmueble-56196-HASSI-A
/alquiler/piso/inmueble-56196-AMANDI-A
/alquiler/piso/inmueble-51707-Travessera_Views-A
/alquiler/piso/inmueble-56196-SIERRA-A
/alquiler/piso/inmueble-56196-DAMAR-A
/alquiler/piso/inmueble-54754-ARMGFM01-A
/alquiler/piso/inmueble-56196-SUMBAWA-A
/alquiler/piso/inmueble-55856-10783-A
/alquiler/piso/inmueble-59409-BAU

Página 1
Página 2
Página 3
Página 4
Página 5
Página 6
Página 7
Página 8
Página 9
Página 10
Página 11
Página 12
Página 13
Página 14
Página 15
Página 16
Página 17
Página 18
Página 19


['https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2106015-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2202021-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-BINGIN-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-AMAZZER-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT1915012-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT1912019-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-60247-6ae0e66293d017ac001d-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2103004-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55652-BCNR33308-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-KUFRA-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2006031-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-ATACAMA-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-THAR-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-LEGE-A',
 '

In [103]:
contador = 1

lista_titulos = []
lista_ubicaciones = []
lista_precios = []
lista_precios_antes = []
lista_habitaciones = []
lista_bathrooms = []
lista_m2 = [] 
lista_aire = [] #aire acondicionado
lista_amueblado =[] #si lo está o no
lista_armarios_empotrados = [] #sí o no
lista_ascensor = []
lista_balcon = []
lista_calefaccion =[]
lista_terraza = []
lista_caracteristicas = []
lista_descripcion = []

for url_alquiler in lista_urls:
    response = requests.get(url_alquiler)
    soup_url = bs(response.content, 'lxml')

    try:
        lista_titulos.append(soup_url.find('h1', class_='details-title').get_text(strip=True))
    except:
        lista_titulos.append('No veo el título')

    try:
        lista_ubicaciones.append(soup_url.find('div',class_= 'details-address').get_text(strip=True))
    except:
        lista_ubicaciones.append('No encuentro la ubicación')

    try:
        lista_precios.append(soup_url.find('span',class_='price').get_text(strip=True))
    except:
        lista_precios.append('No veo el precio')

    try:
        lista_precios_antes.append(soup_url.find('span', class_='icon-text previousPriceText').get_text(strip=True))
    except:
        try:
            lista_precios_antes.append(soup_url.find('span',class_='price').get_text(strip=True))
        except:
            lista_precios_antes.append('No veo el precio')
    
    try:
        lista_habitaciones.append(soup_url.find('div',class_='icon-room').get_text(strip=True))
    except:
        lista_habitaciones.append('No veo las habitaciones')

    try:
        lista_bathrooms.append(soup_url.find('div', class_='icon-bath').get_text(strip=True))
    except:
        lista_bathrooms.append('No encuentro los baños')
    
    try:
        lista_m2.append(soup_url.find('div', class_='icon-meter').get_text(strip=True))
    except:
        lista_m2.append('No encuentro los baños')
    
    try:
        if soup_url.find('div', class_='icon-airConditioning').get_text(strip=True) == '':
            lista_aire.append('Sí')
        else:
            lista_aire.append('No')
    except:
        lista_aire.append('No')
    
    try:
        if soup_url.find('div', class_='icon-furnished').get_text(strip=True) == '':
            lista_amueblado.append('Sí')
        else:
            lista_amueblado.append('No')
    except:
        lista_amueblado.append('No')

    try:
        if soup_url.find('div', class_='icon-builtInWardrobes').get_text(strip=True) == '':
            lista_armarios_empotrados.append('Sí')
        else:
            lista_armarios_empotrados.append('No')
    except:
        lista_armarios_empotrados.append('No')
    
    try:
        if soup_url.find('div', class_='icon-lift').get_text(strip=True) == '':
            lista_ascensor.append('Sí')
        else:
            lista_ascensor.append('No')
    except:
        lista_ascensor.append('No')

    try:
        if soup_url.find('div', class_='icon-balcony').get_text(strip=True) == '':
            lista_balcon.append('Sí')
        else:
            lista_balcon.append('No')
    except:
        lista_balcon.append('No')

    try:
        if soup_url.find('div', class_='icon-centralHeating').get_text(strip=True) == '':
            lista_calefaccion.append('Sí')
        else:
            lista_calefaccion.append('No')
    except:
        lista_calefaccion.append('No')

    try:
        if soup_url.find('div', class_='icon-terrace').get_text(strip=True) == '':
            lista_terraza.append('Sí')
        else:
            lista_terraza.append('No')
    except:
        lista_terraza.append('No')

    try:
        lista_caracteristicas.append([i.get_text(strip=True) for i in soup_url.find_all('li', class_='feature')])
    except:
        lista_caracteristicas.append('No veo más características')

    try:
        lista_descripcion.append(soup_url.find('div', class_='description').get_text(strip=True))
    except:
        lista_descripcion.append('No veo la descripción')

    print('Url: '+str(contador))

    contador +=1

Url: 1
Url: 2
Url: 3
Url: 4
Url: 5
Url: 6
Url: 7
Url: 8
Url: 9
Url: 10
Url: 11
Url: 12
Url: 13
Url: 14
Url: 15
Url: 16
Url: 17
Url: 18
Url: 19
Url: 20
Url: 21
Url: 22
Url: 23
Url: 24
Url: 25
Url: 26
Url: 27
Url: 28
Url: 29
Url: 30
Url: 31
Url: 32
Url: 33
Url: 34
Url: 35
Url: 36
Url: 37
Url: 38
Url: 39
Url: 40
Url: 41
Url: 42
Url: 43
Url: 44
Url: 45
Url: 46
Url: 47
Url: 48
Url: 49
Url: 50
Url: 51
Url: 52
Url: 53
Url: 54
Url: 55
Url: 56
Url: 57
Url: 58
Url: 59
Url: 60
Url: 61
Url: 62
Url: 63
Url: 64
Url: 65
Url: 66
Url: 67
Url: 68
Url: 69
Url: 70
Url: 71
Url: 72
Url: 73
Url: 74
Url: 75
Url: 76
Url: 77
Url: 78
Url: 79
Url: 80
Url: 81
Url: 82
Url: 83
Url: 84
Url: 85
Url: 86
Url: 87
Url: 88
Url: 89
Url: 90
Url: 91
Url: 92
Url: 93
Url: 94
Url: 95
Url: 96
Url: 97
Url: 98
Url: 99
Url: 100
Url: 101
Url: 102
Url: 103
Url: 104
Url: 105
Url: 106
Url: 107
Url: 108
Url: 109
Url: 110
Url: 111
Url: 112
Url: 113
Url: 114
Url: 115
Url: 116
Url: 117
Url: 118
Url: 119
Url: 120
Url: 121
Url: 122
Url: 123
U

### Creamos el DataFrame

In [106]:
lista_df = []

for i in range(len(lista_precios)):
    data = {'Url': lista_urls[i],
            'Título': lista_titulos[i],
            'Ubicación': lista_ubicaciones[i],
            'Precio': lista_precios[i],
            'Precio Antes': lista_precios_antes[i],
            'Habitaciones': lista_habitaciones[i],
            'Baños':lista_bathrooms[i],
            'Metros cuadrados': lista_m2[i],
            'Aire acondicionado': lista_aire[i],
            'Amueblado': lista_amueblado[i],
            'Armarios empotrados': lista_armarios_empotrados[i],
            'Ascensor': lista_ascensor[i],
            'Balcón': lista_balcon[i],
            'Calefacción': lista_calefaccion[i],
            'Terraza': lista_terraza[i],
            'Características': lista_caracteristicas[i],
            'Descripción': lista_descripcion[i]
            }
    
    lista_df.append(data)

df = pd.DataFrame(lista_df)


In [107]:
df

Unnamed: 0,Url,Título,Ubicación,Precio,Precio Antes,Habitaciones,Baños,Metros cuadrados,Aire acondicionado,Amueblado,Armarios empotrados,Ascensor,Balcón,Calefacción,Terraza,Características,Descripción
0,https://www.yaencontre.com/alquiler/piso/inmue...,Alquiler de ático en El Poble Sec - Parc de Mo...,"El Poble Sec - Parc de Montjuïc, Sants - Montj...",1.485 €,1.485 €,1,1,60 m²,No,Sí,No,Sí,No,Sí,Sí,"[Amueblado, Ascensor, Calefacción, Terraza, Es...",Apartamento de alquiler temporal (desde 32 día...
1,https://www.yaencontre.com/alquiler/piso/inmue...,Piso en alquiler en Sant Gervasi - Galvany de ...,"Sant Gervasi - Galvany, Sarrià - Sant Gervasi,...",1.995 €,2.095 €,2,2,85 m²,Sí,Sí,No,Sí,No,Sí,No,"[Aire acondicionado, Amueblado, Ascensor, Cale...",Apartamento de alquiler temporal (desde 32 día...
2,https://www.yaencontre.com/alquiler/piso/inmue...,Piso en alquiler en Fort Pienc de 3 habitacion...,"Fort Pienc, Eixample, Barcelona",3.250 €,3.250 €,3,2,110 m²,Sí,Sí,Sí,Sí,Sí,Sí,Sí,"[Aire acondicionado, Amueblado, Armarios empot...",*COMPLETAMENTE AMUEBLADO*\n*ALQUILERES MENSUAL...
3,https://www.yaencontre.com/alquiler/piso/inmue...,Piso en alquiler en L'Antiga Esquerra de l'Eix...,"L'Antiga Esquerra de l'Eixample, Eixample, Bar...",3.600 €,3.600 €,3,2,131 m²,Sí,Sí,Sí,Sí,Sí,Sí,No,"[Aire acondicionado, Amueblado, Armarios empot...",*COMPLETAMENTE AMUEBLADO*\n*ALQUILERES MENSUAL...
4,https://www.yaencontre.com/alquiler/piso/inmue...,"Alquiler de piso en Sant Pere, Santa Caterina ...","Sant Pere, Santa Caterina i la Ribera, Ciutat ...",2.350 €,2.350 €,3,2,95 m²,Sí,Sí,No,No,Sí,Sí,No,"[Aire acondicionado, Amueblado, Balcón, Calefa...",Apartamento de alquiler temporal (desde 32 día...
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
793,https://www.yaencontre.com/alquiler/piso/inmue...,Piso en alquiler en Sant Gervasi - Galvany de ...,"Sant Gervasi - Galvany, Sarrià - Sant Gervasi,...",3.400 €,3.400 €,4,3,287 m²,Sí,Sí,Sí,Sí,No,Sí,Sí,"[Aire acondicionado, Amueblado, Armarios empot...",DISPONIBLE AGOSTO. Piso alto muy luminoso tota...
794,https://www.yaencontre.com/alquiler/piso/inmue...,Piso en alquiler en L'Antiga Esquerra de l'Eix...,"L'Antiga Esquerra de l'Eixample, Eixample, Bar...",1.790 €,1.790 €,3,2,87 m²,Sí,Sí,Sí,Sí,Sí,Sí,Sí,"[Aire acondicionado, Amueblado, Armarios empot...",Alquiler VERANO JULIO. Contactanos por email. ...
795,https://www.yaencontre.com/alquiler/piso/inmue...,Ático en alquiler en Fort Pienc de 3 habitacio...,"Fort Pienc, Eixample, Barcelona",2.490 €,2.500 €,3,2,176 m²,Sí,Sí,Sí,Sí,No,Sí,Sí,"[Aire acondicionado, Amueblado, Armarios empot...",Exclusivo ático con espectacular terraza con v...
796,https://www.yaencontre.com/alquiler/piso/inmue...,Piso en alquiler en El Gòtic de 4 habitaciones...,"El Gòtic, Ciutat Vella, Barcelona",2.150 €,2.150 €,4,2,155 m²,Sí,No,No,Sí,No,Sí,Sí,"[Aire acondicionado, Ascensor, Calefacción, Te...",En una preciosa y emblemática finca en un tran...
