# Beautiful Soup Tutorial

Como científico de datos, tarde o temprano llegarás a un punto en el que tendrás que recopilar grandes cantidades de datos. Ya sea un proyecto o por pasatiempo y no siempre podremos contar con las API, pero tranquilo tenemos el web scraping... ¡Y una de las mejores herramientas de web scraping es Beautiful Soup!

## ¿Pero.... qué es el web scraping?

En pocas palabras, el web scraping es la recopilación automatizada de datos de sitios web (para ser más precisos, del contenido HTML de los sitios web).

En este Jupyter, aprenderás los conceptos básicos sobre cómo extraer datos de HTML. 

Lo harás extrayendo datos de la página en la cual se encuentran alquileres de pisos en Barcelona

### Conoce a tus nuevos mejores amigos: 

- Beautiful Soup
- Requests

In [5]:
!pip install beautifulsoup4



Para obtener la experiencia completa de Beautiful Soup, también deberás instalar un parser, dentro de ellos tenemos..

- html.parser
- lxml
- html5lib


Vamos a utilizar el lxml ya que es el mas rápido 

In [6]:
!pip install lxml



Se necesita una cosa más para que podamos comenzar a hacer web scraping, y es la biblioteca de ```requests```. Con ```requests``` podemos solicitar páginas web de sitios web.

In [7]:
!pip install requests



Ahora asi manos a la obra..

## Mi primer scraping

Como siempre lo primero es importar las librerías 

In [8]:
from bs4 import BeautifulSoup as bs
import requests
import pandas as pd
import numpy as np

Ahora, estamos listos para solicitar nuestra primera página web. No es nada complicado: guardamos la URL que queremos raspar en la variable URL, luego solicitamos la URL (requests.get (url)) y guardamos la respuesta en la variable de respuesta:

In [9]:
url = "https://www.yaencontre.com/alquiler/pisos/barcelona"
response = requests.get(url)

response


<Response [200]>

Cómo saber si se guardo correctamente el sitio web?

Posibles respuestas:

- [Respuestas informativas](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#information_responses) (100–199)
- [Respuestas exitosas](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#successful_responses) (200–299)
- [Mensajes de redirección](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#redirection_messages) (300–399)
- [Respuestas de error del cliente](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#client_error_responses) (400–499)
- [Respuestas de error del servidor](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#server_error_responses) (500–599)

Pero necesitamos el contenido HTML de la página web solicitada, así que como siguiente paso guardamos el contenido de la respuesta a html:

In [10]:
html= response.content



Lo podemos imprimir para ver su estructura

In [11]:
html

b'<!doctype html>\n    <html lang="es" class="notranslate page-results variantContainer withBreadcrumb" translate="no">\n      <head>\n        \n        <title data-rh="true">Pisos y viviendas en alquiler en Barcelona \xc2\xb7 6.080 pisos y viviendas disponibles - yaencontre</title>\n        <meta data-rh="true" name="title" content="Pisos y viviendas en alquiler en Barcelona \xc2\xb7 6.080 pisos y viviendas disponibles - yaencontre"/><meta data-rh="true" name="description" content="6.080 Pisos y viviendas en alquiler en Barcelona. Anuncios de pisos y viviendas de particulares y agencias inmobiliarias. \xc2\xa1Encontrar\xc3\xa1s lo que est\xc3\xa1s buscando!"/><meta data-rh="true" name="robots" content="index, follow"/><meta data-rh="true" name="language" content="es"/>\n        <meta name="viewport" content="width=device-width, height=device-height, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" /><meta name="theme-color" content="#e5005a" /><meta http-equiv="content-type" co

Este es el resultado obtenido en HTML de la página de los libros más vendidos, pero es realmente difícil de leer...

Pero para eso usamos BeautifulSoup y lxml

Cómo lo hacemos?..

Creamos un objeto BeautifulSoup llamado soup con la siguiente línea de código:

In [12]:
soup = bs(html, 'lxml')

bs?

> from bs4 import BeautifulSoup as bs

El primer parámetro del método bs() es html (que fue la variable en la que guardamos ese contenido HTML difícil de leer de la URL de los alquileres de Barcelona)

El segundo parámetro ('lxml'), es el parser que se usa en html 

Ahora vamos a ver el cambio

In [13]:
soup


<!DOCTYPE html>
<html class="notranslate page-results variantContainer withBreadcrumb" lang="es" translate="no">
<head>
<title data-rh="true">Pisos y viviendas en alquiler en Barcelona · 6.080 pisos y viviendas disponibles - yaencontre</title>
<meta content="Pisos y viviendas en alquiler en Barcelona · 6.080 pisos y viviendas disponibles - yaencontre" data-rh="true" name="title"/><meta content="6.080 Pisos y viviendas en alquiler en Barcelona. Anuncios de pisos y viviendas de particulares y agencias inmobiliarias. ¡Encontrarás lo que estás buscando!" data-rh="true" name="description"/><meta content="index, follow" data-rh="true" name="robots"/><meta content="es" data-rh="true" name="language"/>
<meta content="width=device-width, height=device-height, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" name="viewport"/><meta content="#e5005a" name="theme-color"/><meta content="text/html; charset=utf-8" http-equiv="content-type"/><meta content="IE=EDGE" http-equiv="x-ua-compatible"/>

## Cómo navegar por un objeto de Beautiful Soup

HTML consta de elementos como enlaces, párrafos, encabezados, bloques, etc. Estos elementos están envueltos entre etiquetas; dentro de la etiqueta de apertura y cierre se puede encontrar el contenido del elemento.

![image](img\html-content-web-scraping.png)

Los elementos HTML también pueden tener atributos que contienen información adicional sobre el elemento. Los atributos se definen en las etiquetas de apertura con la siguiente sintaxis: nombre del atributo = "valor del atributo".

![image](img\attribute-example-for-web-scraping-1536x386.png)

Ahora que hemos aprendido algo de HTML básico, finalmente podemos comenzar a extraer datos de soup. Simplemente escriba un nombre de etiqueta después de soup y un punto (como soup.title), y observe cómo se desarrolla la magia:

In [14]:
soup.title

<title data-rh="true">Pisos y viviendas en alquiler en Barcelona · 6.080 pisos y viviendas disponibles - yaencontre</title>

In [15]:
soup.h1

<h1 class="d-ellipsis title-results">6.080 Pisos y viviendas en alquiler en Barcelona</h1>

Eliminamos las etiquetas

In [16]:
soup.h1.get_text(strip=True)

'6.080 Pisos y viviendas en alquiler en Barcelona'

¿Qué sucede si solo necesita el atributo de un elemento? Tampoco hay problema:

In [17]:
#Si en inspeccionar, hacemos Ctrl+F y buscamos <a>, encontramos la primera etiqueta a
soup.a

<a class="icon-logo" href="/"></a>

In [18]:
soup.a['href']

soup.a.get('href')

'/'

También podemos..
> soup.a.get("href")

La sintaxis de soup.```cualquier_etiqueta``` devuelve solo el primer elemento con ese nombre de etiqueta. En lugar de soup.```cualquier_etiqueta```, también puedes usar el método .find() y obtendrás exactamente el mismo resultado:

In [19]:
print("Sin utilizar método .find()")
soup.h1
print("")
print("Utilizando método .find()")
soup.find('h1')


Sin utilizar método .find()

Utilizando método .find()


<h1 class="d-ellipsis title-results">6.080 Pisos y viviendas en alquiler en Barcelona</h1>

A menudo, no solo necesitas uno, sino todos los elementos (por ejemplo, cada enlace en una página). Para eso es bueno el método .find_all():

In [20]:
soup.find_all('a')

[<a class="icon-logo" href="/"></a>,
 <a class="classPublishAdvise text-default-color" href="/poner-anuncio" target="_blank"><span>PUBLICAR</span> anuncio</a>,
 <a class="classPublishAdvise text-default-color d-none--tablet" href="https://localgest.yaencontre.com/" rel="nofollow" target="_blank">Profesionales</a>,
 <a class="d-none--tablet" href="/">yaencontre</a>,
 <a class="link" href="/alquiler/pisos/barcelona-provincia">Barcelona (provincia)</a>,
 <a class="link" href="/alquiler/pisos/barcelones">Barcelonès</a>,
 <a class="link d-ellipsis" href="/alquiler/pisos/badalona">Badalona</a>,
 <a class="link d-ellipsis toogle-item__title--selected breadcrumb-selected" href="/alquiler/pisos/barcelona">Barcelona</a>,
 <a class="link d-ellipsis" href="/alquiler/pisos/barcelona/distrito-ciutat-vella">Ciutat Vella</a>,
 <a class="link d-ellipsis" href="/alquiler/pisos/barcelona/distrito-eixample">Eixample</a>,
 <a class="link d-ellipsis" href="/alquiler/pisos/barcelona/distrito-gracia">Gràcia</

Si nos fijamos podemos ver que lo que nos devuelve es una lista..

Qué podemos hacer con una lista?..

In [21]:
all_a=soup.find_all('a')
for a in all_a[:5]:
    print(a['href'])
    print(type(a))

/
<class 'bs4.element.Tag'>
/poner-anuncio
<class 'bs4.element.Tag'>
https://localgest.yaencontre.com/
<class 'bs4.element.Tag'>
/
<class 'bs4.element.Tag'>
/alquiler/pisos/barcelona-provincia
<class 'bs4.element.Tag'>


Ok.. Pero como extraigo la data con BeautifilSoup?..

La página contiene 42 pisos con información relacionada con ellos. De los datos disponibles extraeremos los siguientes:

- Títulos
- Url
- habitaciones
- prices

Mientras trabajamos con BeautifulSoup, el flujo general de extracción de datos será un enfoque de dos pasos:

* Inspeccionar en el navegador los elementos HTML que queremos extraer 
* Luego encontrar los elementos HTML con BeautifulSoup.

## Inciso


In [22]:
soup.find_all('a',attrs={'rel':'nofollow'})

[<a class="classPublishAdvise text-default-color d-none--tablet" href="https://localgest.yaencontre.com/" rel="nofollow" target="_blank">Profesionales</a>,
 <a class="link" href="/alquiler-vacacional/pisos/barcelona" rel="nofollow">Alquiler vacacional</a>,
 <a href="https://localgest.yaencontre.com/" rel="nofollow" target="_blank">Profesionales</a>]

## Suficiente información...

Manos a la obra

## Obtener los títulos de los pisos (find_all + get_text)

Para ello vamos a inspeccionar en el navegador (click derecho sobre un titulo de un piso y elegimos inspeccionar)

In [23]:
lista_precios=[]

precios=soup.find_all('span',attrs={'class':'price'})
for p in precios:
    lista_precios.append(p.get_text())
lista_precios

['1.795 €',
 '1.485 €',
 '1.995 €',
 '3.250 €',
 '3.600 €',
 '2.350 €',
 '990 €',
 '1.783 €',
 '1.815 €',
 '3.700 €',
 '3.000 €',
 '2.030 €',
 '3.000 €',
 '2.200 €',
 '2.800 €',
 '3.400 €',
 '2.650 €',
 '2.650 €',
 '2.650 €',
 '8.000 €',
 '4.100 €',
 '5.000 €',
 '1.850 €',
 '2.750 €',
 '1.700 €',
 '2.800 €',
 '3.200 €',
 '2.750 €',
 '2.950 €',
 '3.750 €',
 '3.200 €',
 '2.400 €',
 '1.490 €',
 '2.950 €',
 '2.900 €',
 '1.670 €',
 '1.900 €',
 '2.300 €',
 '3.850 €',
 '2.700 €',
 '2.450 €',
 '1.800 €']

In [63]:
lista_titulos = []

all_h3=soup.find_all('h3',class_='title')
for h3 in all_h3:
    lista_titulos.append(h3.a.get_text(strip=True))
lista_titulos


    

['Piso en Vila de Gràcia, Barcelona',
 'Ático en El Poble Sec - Parc de Montjuïc, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Fort Pienc, Barcelona',
 "Piso en L'Antiga Esquerra de l'Eixample, Barcelona",
 'Piso en Sant Pere, Santa Caterina i la Ribera, Barcelona',
 'Estudio en El Raval, Barcelona',
 'Piso en El Putxet i el Farró, Barcelona',
 'Piso en El Raval, Barcelona',
 'Piso en Diagonal Mar i el Front Marítim del Poblenou, Barcelona',
 "Piso en La Nova Esquerra de l'Eixample, Barcelona",
 'Piso en El Poble Sec - Parc de Montjuïc, Barcelona',
 "Ático en L'Antiga Esquerra de l'Eixample, Barcelona",
 'Dúplex en Sant Pere, Santa Caterina i la Ribera, Barcelona',
 "Piso en L'Antiga Esquerra de l'Eixample, Barcelona",
 'Ático en Vila de Gràcia, Barcelona',
 'Piso en Vila de Gràcia, Barcelona',
 'Piso en La Salut, Barcelona',
 'Piso en La Sagrada Família, Barcelona',
 "Piso en La Dreta de l'Eixample, Barcelona",
 'Piso en Diagonal Mar i el Front Marítim del Poble

Si queremos obtener solo los títulos

Solo el título
Ático en El Poble Sec - Parc de Montjuïc, Barcelona
Es un objeto <class 'bs4.element.Tag'> , por tanto, tiene métodos de beautiful soup (find, find_all, get_text)
---------------------------------------------------------------------
Solo el título
Piso en Sant Gervasi - Galvany, Barcelona
Es un objeto <class 'bs4.element.Tag'> , por tanto, tiene métodos de beautiful soup (find, find_all, get_text)
---------------------------------------------------------------------
Solo el título
Piso en Fort Pienc, Barcelona
Es un objeto <class 'bs4.element.Tag'> , por tanto, tiene métodos de beautiful soup (find, find_all, get_text)
---------------------------------------------------------------------
Solo el título
Piso en L'Antiga Esquerra de l'Eixample, Barcelona
Es un objeto <class 'bs4.element.Tag'> , por tanto, tiene métodos de beautiful soup (find, find_all, get_text)
---------------------------------------------------------------------
Solo el título
Piso en Sant Pere, Santa C

### Los añadimos a una lista

['Ático en El Poble Sec - Parc de Montjuïc, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Fort Pienc, Barcelona',
 "Piso en L'Antiga Esquerra de l'Eixample, Barcelona",
 'Piso en Sant Pere, Santa Caterina i la Ribera, Barcelona',
 'Estudio en El Raval, Barcelona',
 'Piso en El Putxet i el Farró, Barcelona',
 'Piso en El Raval, Barcelona',
 'Piso en Diagonal Mar i el Front Marítim del Poblenou, Barcelona',
 "Piso en La Nova Esquerra de l'Eixample, Barcelona",
 'Piso en El Poble Sec - Parc de Montjuïc, Barcelona',
 "Ático en L'Antiga Esquerra de l'Eixample, Barcelona",
 'Dúplex en Sant Pere, Santa Caterina i la Ribera, Barcelona',
 "Piso en L'Antiga Esquerra de l'Eixample, Barcelona",
 'Ático en Vila de Gràcia, Barcelona',
 'Piso en Vila de Gràcia, Barcelona',
 'Piso en La Salut, Barcelona',
 'Piso en La Sagrada Família, Barcelona',
 "Piso en La Dreta de l'Eixample, Barcelona",
 'Piso en Diagonal Mar i el Front Marítim del Poblenou, Barcelona',
 "Piso en La Dreta de

##### Otra forma de hacerlo


In [65]:
lista_titulos=[h3.a.get_text(strip=True) for h3 in all_h3]
lista_titulos

['Piso en Vila de Gràcia, Barcelona',
 'Ático en El Poble Sec - Parc de Montjuïc, Barcelona',
 'Piso en Sant Gervasi - Galvany, Barcelona',
 'Piso en Fort Pienc, Barcelona',
 "Piso en L'Antiga Esquerra de l'Eixample, Barcelona",
 'Piso en Sant Pere, Santa Caterina i la Ribera, Barcelona',
 'Estudio en El Raval, Barcelona',
 'Piso en El Putxet i el Farró, Barcelona',
 'Piso en El Raval, Barcelona',
 'Piso en Diagonal Mar i el Front Marítim del Poblenou, Barcelona',
 "Piso en La Nova Esquerra de l'Eixample, Barcelona",
 'Piso en El Poble Sec - Parc de Montjuïc, Barcelona',
 "Ático en L'Antiga Esquerra de l'Eixample, Barcelona",
 'Dúplex en Sant Pere, Santa Caterina i la Ribera, Barcelona',
 "Piso en L'Antiga Esquerra de l'Eixample, Barcelona",
 'Ático en Vila de Gràcia, Barcelona',
 'Piso en Vila de Gràcia, Barcelona',
 'Piso en La Salut, Barcelona',
 'Piso en La Sagrada Família, Barcelona',
 "Piso en La Dreta de l'Eixample, Barcelona",
 'Piso en Diagonal Mar i el Front Marítim del Poble

## Tips importantes

soup.find_all(“h3”) encuentra cada elemento h3 en la página web; con class_=”title” especificamos que buscamos específicamente etiquetas h3 que contengan el atributo class_=”title” (nota importante: el “_” en **class__=”title”** no es un error tipográfico, se requiere en Beautiful Soup cuando seleccionando atributos de clase).

Guardamos los elementos h3 en all_h3, que se comporta como una lista, por lo que podemos recorrerlos con un bucle for. En cada iteración extraemos solo el texto del elemento h3 con .get_text(), y con el parámetro strip=True nos aseguramos de eliminar cualquier espacio en blanco innecesario.

## Obtener los METROS CUADRADOS

In [66]:
div=soup.find_all('div',attrs={'class':'icon-meter'})

for x in div:
    print (x.get_text())

76 m²
60 m²
85 m²
110 m²
131 m²
95 m²
43 m²
45 m²
45 m²
155 m²
82 m²
54 m²
78 m²
70 m²
76 m²
60 m²
95 m²
67 m²
70 m²
80 m²
200 m²
106 m²
180 m²
77 m²
90 m²
52 m²
180 m²
66 m²
70 m²
120 m²
170 m²
80 m²
85 m²
94 m²
65 m²
70 m²
53 m²
71 m²
75 m²
114 m²
60 m²
42 m²


Otra forma de hacerlo

In [68]:
lista_metros=[x.get_text(strip=True) for x in soup.find_all('div',attrs={'class':'icon-meter'})]
lista_metros


['76 m²',
 '60 m²',
 '85 m²',
 '110 m²',
 '131 m²',
 '95 m²',
 '43 m²',
 '45 m²',
 '45 m²',
 '155 m²',
 '82 m²',
 '54 m²',
 '78 m²',
 '70 m²',
 '76 m²',
 '60 m²',
 '95 m²',
 '67 m²',
 '70 m²',
 '80 m²',
 '200 m²',
 '106 m²',
 '180 m²',
 '77 m²',
 '90 m²',
 '52 m²',
 '180 m²',
 '66 m²',
 '70 m²',
 '120 m²',
 '170 m²',
 '80 m²',
 '85 m²',
 '94 m²',
 '65 m²',
 '70 m²',
 '53 m²',
 '71 m²',
 '75 m²',
 '114 m²',
 '60 m²',
 '42 m²']

#### Las dos listas contienen el mismo número de valores. Lo comprobamos

42

#### Entonces, ya podríamos crear un DataFrame con títulos y metros cuadrados. Vamos a hacerlo

#### Primera forma de hacerlo

In [72]:
df=pd.DataFrame()
df['Titulos']=lista_titulos
df['Metros']=lista_metros
df['Precios']=lista_precios

df

Unnamed: 0,Titulos,Metros,Precios
0,"Piso en Vila de Gràcia, Barcelona",76 m²,1.700 €
1,"Ático en El Poble Sec - Parc de Montjuïc, Barc...",60 m²,1.485 €
2,"Piso en Sant Gervasi - Galvany, Barcelona",85 m²,1.995 €
3,"Piso en Fort Pienc, Barcelona",110 m²,3.250 €
4,"Piso en L'Antiga Esquerra de l'Eixample, Barce...",131 m²,3.600 €
5,"Piso en Sant Pere, Santa Caterina i la Ribera,...",95 m²,2.350 €
6,"Estudio en El Raval, Barcelona",43 m²,990 €
7,"Piso en El Putxet i el Farró, Barcelona",45 m²,1.783 €
8,"Piso en El Raval, Barcelona",45 m²,1.815 €
9,Piso en Diagonal Mar i el Front Marítim del Po...,155 m²,3.700 €


#### Segunda forma

In [73]:
df2=pd.DataFrame({'Titulo':lista_titulos,
              'Metros':lista_metros,
              'Precio':lista_precios})
df2

Unnamed: 0,Titulo,Metros,Precio
0,"Piso en Vila de Gràcia, Barcelona",76 m²,1.700 €
1,"Ático en El Poble Sec - Parc de Montjuïc, Barc...",60 m²,1.485 €
2,"Piso en Sant Gervasi - Galvany, Barcelona",85 m²,1.995 €
3,"Piso en Fort Pienc, Barcelona",110 m²,3.250 €
4,"Piso en L'Antiga Esquerra de l'Eixample, Barce...",131 m²,3.600 €
5,"Piso en Sant Pere, Santa Caterina i la Ribera,...",95 m²,2.350 €
6,"Estudio en El Raval, Barcelona",43 m²,990 €
7,"Piso en El Putxet i el Farró, Barcelona",45 m²,1.783 €
8,"Piso en El Raval, Barcelona",45 m²,1.815 €
9,Piso en Diagonal Mar i el Front Marítim del Po...,155 m²,3.700 €


In [80]:
lista_df=[]
for i in range(len(lista_titulos)):
    data={'Titulo':lista_titulos[i],
          'Metros':lista_metros[i],
          'Precios':lista_precios[i]}
    lista_df.append(data)
df=pd.DataFrame(lista_df)
df

Unnamed: 0,Titulo,Metros,Precios
0,"Piso en Vila de Gràcia, Barcelona",76 m²,1.700 €
1,"Ático en El Poble Sec - Parc de Montjuïc, Barc...",60 m²,1.485 €
2,"Piso en Sant Gervasi - Galvany, Barcelona",85 m²,1.995 €
3,"Piso en Fort Pienc, Barcelona",110 m²,3.250 €
4,"Piso en L'Antiga Esquerra de l'Eixample, Barce...",131 m²,3.600 €
5,"Piso en Sant Pere, Santa Caterina i la Ribera,...",95 m²,2.350 €
6,"Estudio en El Raval, Barcelona",43 m²,990 €
7,"Piso en El Putxet i el Farró, Barcelona",45 m²,1.783 €
8,"Piso en El Raval, Barcelona",45 m²,1.815 €
9,Piso en Diagonal Mar i el Front Marítim del Po...,155 m²,3.700 €


## Obtener el número de habitaciones de cada inmueble

41

### Puede darse el caso de que un alojamiento no muestre el número de habitaciones. Las longitudes de las listas de títulos y habitaciones no encajarían...¿Cómo solventamos el problema?

Primera forma

In [91]:
lista_hab=[]

contenedor=soup.find_all('div',class_='iconGroup')
for i in contenedor:
    if i.find('div',class_='icon-room'):
        lista_hab.append(i.find('div',class_='icon-room').get_text())
    else:
        lista_hab.append("0 habs.")

lista_hab

['3 habs.',
 '1 hab.',
 '2 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '0 habs.',
 '1 hab.',
 '2 habs.',
 '3 habs.',
 '3 habs.',
 '2 habs.',
 '1 hab.',
 '1 hab.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '3 habs.',
 '2 habs.',
 '5 habs.',
 '2 habs.',
 '2 habs.',
 '1 hab.',
 '5 habs.',
 '1 hab.',
 '1 hab.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '3 habs.',
 '2 habs.',
 '1 hab.']

Segunda forma

In [90]:
contenedor=soup.find_all('div',class_='iconGroup')

for i in contenedor:
    try:
        print(i.find('div',class_='icon-room').get_text())
    except:
        print('0 habs.')


3 habs.
1 hab.
2 habs.
3 habs.
3 habs.
3 habs.
0 habs.
1 hab.
2 habs.
3 habs.
3 habs.
2 habs.
1 hab.
1 hab.
2 habs.
2 habs.
2 habs.
2 habs.
2 habs.
2 habs.
3 habs.
2 habs.
5 habs.
2 habs.
2 habs.
1 hab.
5 habs.
1 hab.
1 hab.
2 habs.
2 habs.
2 habs.
2 habs.
2 habs.
2 habs.
2 habs.
2 habs.
2 habs.
2 habs.
3 habs.
2 habs.
1 hab.


### Los añadimos a una lista

In [92]:
lista_hab

['3 habs.',
 '1 hab.',
 '2 habs.',
 '3 habs.',
 '3 habs.',
 '3 habs.',
 '0 habs.',
 '1 hab.',
 '2 habs.',
 '3 habs.',
 '3 habs.',
 '2 habs.',
 '1 hab.',
 '1 hab.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '3 habs.',
 '2 habs.',
 '5 habs.',
 '2 habs.',
 '2 habs.',
 '1 hab.',
 '5 habs.',
 '1 hab.',
 '1 hab.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '2 habs.',
 '3 habs.',
 '2 habs.',
 '1 hab.']

## Encontrar elementos por su selector CSS

In [94]:
rooms=soup.select('div.iconGroup > div.icon-room > span')
#Esto corresponde al selector CSS
rooms

[<span class="">3 habs.</span>,
 <span class="">1 hab.</span>,
 <span class="">2 habs.</span>,
 <span class="">3 habs.</span>,
 <span class="">3 habs.</span>,
 <span class="">3 habs.</span>,
 <span class="">1 hab.</span>,
 <span class="">2 habs.</span>,
 <span class="">3 habs.</span>,
 <span class="">3 habs.</span>,
 <span class="">2 habs.</span>,
 <span class="">1 hab.</span>,
 <span class="">1 hab.</span>,
 <span class="">2 habs.</span>,
 <span class="">2 habs.</span>,
 <span class="">2 habs.</span>,
 <span class="">2 habs.</span>,
 <span class="">2 habs.</span>,
 <span class="">2 habs.</span>,
 <span class="">3 habs.</span>,
 <span class="">2 habs.</span>,
 <span class="">5 habs.</span>,
 <span class="">2 habs.</span>,
 <span class="">2 habs.</span>,
 <span class="">1 hab.</span>,
 <span class="">5 habs.</span>,
 <span class="">1 hab.</span>,
 <span class="">1 hab.</span>,
 <span class="">2 habs.</span>,
 <span class="">2 habs.</span>,
 <span class="">2 habs.</span>,
 <span class=""

In [86]:

# for i in rooms:
#     print(type(i))
#    print(i.get_text())



[2 habs.]    23
[1 hab.]      9
[3 habs.]     7
[5 habs.]     2
dtype: int64

## Obtener los precios (find_all + get_text)

1.485 €
1.995 €
3.250 €
3.600 €
2.350 €
990 €
1.783 €
1.815 €
3.700 €
3.000 €
2.030 €
3.000 €
2.200 €
2.800 €
3.400 €
2.650 €
1.500 €
2.650 €
2.650 €
8.000 €
4.100 €
5.000 €
1.850 €
2.750 €
1.700 €
2.800 €
3.200 €
2.750 €
2.950 €
3.750 €
3.200 €
2.400 €
2.950 €
2.650 €
1.870 €
1.900 €
2.300 €
3.850 €
2.700 €
2.450 €
1.800 €
3.000 €


### Pero, en un DataFrame, te interesa tener el precio comprendido como un número int o float, para poder jugar con él. ¿Cómo lo haríamos?

In [104]:
lista_precios=[]

precios=soup.find_all('span',attrs={'class':'price'})
for p in precios:
    lista_precios.append(int(p.get_text().replace('.','').split()[0]))
    
lista_precios





Unnamed: 0,Titulo,Metros,Precios,Habitaciones
0,"Piso en Vila de Gràcia, Barcelona",76 m²,1700,3 habs.
1,"Ático en El Poble Sec - Parc de Montjuïc, Barc...",60 m²,1485,1 hab.
2,"Piso en Sant Gervasi - Galvany, Barcelona",85 m²,1995,2 habs.
3,"Piso en Fort Pienc, Barcelona",110 m²,3250,3 habs.
4,"Piso en L'Antiga Esquerra de l'Eixample, Barce...",131 m²,3600,3 habs.
5,"Piso en Sant Pere, Santa Caterina i la Ribera,...",95 m²,2350,3 habs.
6,"Estudio en El Raval, Barcelona",43 m²,990,0 habs.
7,"Piso en El Putxet i el Farró, Barcelona",45 m²,1783,1 hab.
8,"Piso en El Raval, Barcelona",45 m²,1815,2 habs.
9,Piso en Diagonal Mar i el Front Marítim del Po...,155 m²,3700,3 habs.


#### Los añadimos a una lista

[1485.0,
 1995.0,
 3250.0,
 3600.0,
 2350.0,
 990.0,
 1783.0,
 1815.0,
 3700.0,
 3000.0,
 2030.0,
 3000.0,
 2200.0,
 2800.0,
 3400.0,
 2650.0,
 1500.0,
 2650.0,
 2650.0,
 8000.0,
 4100.0,
 5000.0,
 1850.0,
 2750.0,
 1700.0,
 2800.0,
 3200.0,
 2750.0,
 2950.0,
 3750.0,
 3200.0,
 2400.0,
 2950.0,
 2650.0,
 1870.0,
 1900.0,
 2300.0,
 3850.0,
 2700.0,
 2450.0,
 1800.0,
 3000.0]

### Forma un poco más pro de hacerlo: list comprehension

### Podéis también meterlo en una serie o en un dataframe

42


### Podéis también meterlo en una serie o en un dataframe

Unnamed: 0,Título,Metros cuadrados,Habitaciones,Precios
0,"Ático en El Poble Sec - Parc de Montjuïc, Barc...",60 m²,1 hab.,1485.0
1,"Piso en Sant Gervasi - Galvany, Barcelona",85 m²,2 habs.,1995.0
2,"Piso en Fort Pienc, Barcelona",110 m²,3 habs.,3250.0
3,"Piso en L'Antiga Esquerra de l'Eixample, Barce...",131 m²,3 habs.,3600.0
4,"Piso en Sant Pere, Santa Caterina i la Ribera,...",95 m²,3 habs.,2350.0
5,"Estudio en El Raval, Barcelona",43 m²,No hay habitaciones,990.0
6,"Piso en El Putxet i el Farró, Barcelona",45 m²,1 hab.,1783.0
7,"Piso en El Raval, Barcelona",45 m²,2 habs.,1815.0
8,Piso en Diagonal Mar i el Front Marítim del Po...,155 m²,3 habs.,3700.0
9,"Piso en La Nova Esquerra de l'Eixample, Barcelona",82 m²,3 habs.,3000.0


Unnamed: 0,Título,Metros cuadrados,Habitaciones,Precios
2,"Piso en Fort Pienc, Barcelona",110 m²,3 habs.,3250.0
3,"Piso en L'Antiga Esquerra de l'Eixample, Barce...",131 m²,3 habs.,3600.0
8,Piso en Diagonal Mar i el Front Marítim del Po...,155 m²,3 habs.,3700.0
9,"Piso en La Nova Esquerra de l'Eixample, Barcelona",82 m²,3 habs.,3000.0
11,"Ático en L'Antiga Esquerra de l'Eixample, Barc...",78 m²,1 hab.,3000.0
13,"Piso en L'Antiga Esquerra de l'Eixample, Barce...",76 m²,2 habs.,2800.0
14,"Ático en Vila de Gràcia, Barcelona",60 m²,2 habs.,3400.0
15,"Piso en Vila de Gràcia, Barcelona",95 m²,2 habs.,2650.0
17,"Piso en La Sagrada Família, Barcelona",70 m²,2 habs.,2650.0
18,"Piso en La Dreta de l'Eixample, Barcelona",80 m²,2 habs.,2650.0


### Conseguir los teléfonos de las inmobiliarias

In [105]:
lista_telefonos=[]

telefonos=soup.find_all('div',class_='icon-phone-2')
for i in telefonos:
    lista_telefonos.append(i.span.get_text())

lista_telefonos

['93 617 84 54',
 '93 617 84 54',
 '93 617 84 54',
 '93 617 97 37',
 '93 617 97 37',
 '93 617 84 54',
 '93 617 84 54',
 '93 617 23 00',
 '93 617 84 54',
 '93 617 55 78',
 '93 617 97 37',
 '93 617 84 54',
 '93 617 97 37',
 '93 617 97 37',
 '93 617 97 37',
 '93 617 97 37',
 '93 617 97 37',
 '93 617 88 48',
 '93 617 97 37',
 '93 617 97 37',
 '93 617 30 40',
 '93 617 97 37',
 '93 617 80 57',
 '93 617 31 06',
 '93 617 97 37',
 '93 617 97 93',
 '93 617 15 10',
 '93 617 97 37',
 '93 617 97 37',
 '93 617 97 37',
 '93 617 97 37',
 '93 617 97 37',
 '93 617 97 93',
 '93 617 84 54',
 '93 617 97 37',
 '93 617 97 37',
 '93 617 84 54',
 '93 617 31 06',
 '93 617 45 72',
 '93 617 97 37',
 '93 617 97 37',
 '93 617 97 37']

## Obtener URLs de alojamientos

In [114]:
url_principal = 'https://www.yaencontre.com'


lista_pisos=[]

pisos = soup.find_all('h3',class_='title')
pisos

for piso in pisos:
    lista_pisos.append(url_principal+piso.a['href'])
lista_pisos


['https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2203001-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2106015-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2202021-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-BINGIN-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-AMAZZER-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT1915012-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT1912019-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-60247-6ae0e66293d017ac001d-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2103004-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55652-BCNR33308-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-KUFRA-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2006031-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-ATACAMA-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-THAR-A

Entramos en cada url

In [115]:
for url in lista_pisos:
    response=requests.get(url)
    soup_piso=bs(response.content, 'lxml')
    print(response)

<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>
<Response [200]>


#### De cada alojamiento obtener:
* Ubicación
* Si tiene o no tiene Aire acondicionado
* Si está amueblado o no.

### Ubicación

In [121]:
lista_ubi=[]
lista_aire=[]

for url in lista_pisos:
    response=requests.get(url)
    soup_piso=bs(response.content, 'lxml')

    try:
        lista_ubi.append(soup_piso.find('div',class_='details-address').get_text())
    except:
        lista_ubi.append('No Ubicacion')

    try:
        if soup_piso.find('div', class_='icon-airConditioning'):
            print('Sí tiene aire acondicionado')
        else:
            print('No tiene')
    except:
        print('No tiene')
    
lista_ubi

No tiene
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondici

['Vila de Gràcia, Gràcia, Barcelona',
 'El Poble Sec - Parc de Montjuïc, Sants - Montjuïc, Barcelona',
 'Sant Gervasi - Galvany, Sarrià - Sant Gervasi, Barcelona',
 'Fort Pienc, Eixample, Barcelona',
 "L'Antiga Esquerra de l'Eixample, Eixample, Barcelona",
 'Sant Pere, Santa Caterina i la Ribera, Ciutat Vella, Barcelona',
 'El Raval, Ciutat Vella, Barcelona',
 'El Putxet i el Farró, Sarrià - Sant Gervasi, Barcelona',
 'El Raval, Ciutat Vella, Barcelona',
 'Diagonal Mar i el Front Marítim del Poblenou, Sant Martí, Barcelona',
 "La Nova Esquerra de l'Eixample, Eixample, Barcelona",
 'El Poble Sec - Parc de Montjuïc, Sants - Montjuïc, Barcelona',
 "L'Antiga Esquerra de l'Eixample, Eixample, Barcelona",
 'Sant Pere, Santa Caterina i la Ribera, Ciutat Vella, Barcelona',
 "L'Antiga Esquerra de l'Eixample, Eixample, Barcelona",
 'Vila de Gràcia, Gràcia, Barcelona',
 'Vila de Gràcia, Gràcia, Barcelona',
 'La Salut, Gràcia, Barcelona',
 'La Sagrada Família, Eixample, Barcelona',
 "La Dreta de l

### Aire acondicionado

In [122]:

for url in lista_pisos:
    response = requests.get(url)
    soup_piso = bs(response.content, 'lxml')
    try:
        if soup_piso.find('div', class_='icon-airConditioning').get_text(strip=True) == '':
            print('Sí tiene aire acondicionado')
        else:
            print('No tiene')
    except:
        print('No tiene')



No tiene
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondicionado
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
No tiene
Sí tiene aire acondicionado
Sí tiene aire acondicionado
Sí tiene aire acondici

### Amueblado

In [123]:
for url in lista_pisos:
    response = requests.get(url)
    soup_piso = bs(response.content, 'lxml')
    try:
        if soup_piso.find('div', class_='icon-furnished').get_text(strip=True) == '':
            print('Sí')
        else:
            print('No')
    except:
        print('No')

Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
Sí
No
Sí
Sí
Sí


---

## Ahora vamos a scrapear todos los pisos, yendo de página en página

In [129]:
url = "https://www.yaencontre.com/alquiler/pisos/barcelona"
lista_urls=[]
for pagina in range(1,20):
    try:
        print('Página: '+ str(pagina))
        response=requests.get(url+'/pag-'+str(pagina))
        soup_pagina = bs(response.content,'lxml')

        for i in soup_pagina.find_all('div',class_='content'):
            lista_urls.append(url_principal+i.h3.a['href'])
    except:
        break

Página: 1
Página: 2
Página: 3
Página: 4
Página: 5
Página: 6
Página: 7
Página: 8
Página: 9
Página: 10
Página: 11
Página: 12
Página: 13
Página: 14
Página: 15
Página: 16
Página: 17
Página: 18
Página: 19


In [131]:
len(lista_urls)

798

['https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2106015-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2202021-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-BINGIN-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-AMAZZER-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT1915012-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT1912019-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-60247-6ae0e66293d017ac001d-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2103004-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55652-BCNR33308-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-KUFRA-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-55533-AT2006031-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-ATACAMA-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-THAR-A',
 'https://www.yaencontre.com/alquiler/piso/inmueble-56196-LEGE-A',
 '

In [132]:
contador = 1

lista_titulos = []
lista_ubicaciones = []
lista_precios = []
lista_precios_antes = []
lista_habitaciones = []
lista_bathrooms = []
lista_m2 = [] 
lista_aire = [] #aire acondicionado
lista_amueblado =[] #si lo está o no
lista_armarios_empotrados = [] #sí o no
lista_ascensor = []
lista_balcon = []
lista_calefaccion =[]
lista_terraza = []
lista_caracteristicas = []
lista_descripcion = []

for url_alquiler in lista_urls:
    response = requests.get(url_alquiler)
    soup_url = bs(response.content, 'lxml')

    try:
        lista_titulos.append(soup_url.find('h1', class_='details-title').get_text(strip=True))
    except:
        lista_titulos.append('No veo el título')

    try:
        lista_ubicaciones.append(soup_url.find('div',class_= 'details-address').get_text(strip=True))
    except:
        lista_ubicaciones.append('No encuentro la ubicación')

    try:
        lista_precios.append(soup_url.find('span',class_='price').get_text(strip=True))
    except:
        lista_precios.append('No veo el precio')

    try:
        lista_precios_antes.append(soup_url.find('span', class_='icon-text previousPriceText').get_text(strip=True))
    except:
        try:
            lista_precios_antes.append(soup_url.find('span',class_='price').get_text(strip=True))
        except:
            lista_precios_antes.append('No veo el precio')
    
    try:
        lista_habitaciones.append(soup_url.find('div',class_='icon-room').get_text(strip=True))
    except:
        lista_habitaciones.append('No veo las habitaciones')

    try:
        lista_bathrooms.append(soup_url.find('div', class_='icon-bath').get_text(strip=True))
    except:
        lista_bathrooms.append('No encuentro los baños')
    
    try:
        lista_m2.append(soup_url.find('div', class_='icon-meter').get_text(strip=True))
    except:
        lista_m2.append('No encuentro los baños')
    
    try:
        if soup_url.find('div', class_='icon-airConditioning').get_text(strip=True) == '':
            lista_aire.append('Sí')
        else:
            lista_aire.append('No')
    except:
        lista_aire.append('No')
    
    try:
        if soup_url.find('div', class_='icon-furnished').get_text(strip=True) == '':
            lista_amueblado.append('Sí')
        else:
            lista_amueblado.append('No')
    except:
        lista_amueblado.append('No')

    try:
        if soup_url.find('div', class_='icon-builtInWardrobes').get_text(strip=True) == '':
            lista_armarios_empotrados.append('Sí')
        else:
            lista_armarios_empotrados.append('No')
    except:
        lista_armarios_empotrados.append('No')
    
    try:
        if soup_url.find('div', class_='icon-lift').get_text(strip=True) == '':
            lista_ascensor.append('Sí')
        else:
            lista_ascensor.append('No')
    except:
        lista_ascensor.append('No')

    try:
        if soup_url.find('div', class_='icon-balcony').get_text(strip=True) == '':
            lista_balcon.append('Sí')
        else:
            lista_balcon.append('No')
    except:
        lista_balcon.append('No')

    try:
        if soup_url.find('div', class_='icon-centralHeating').get_text(strip=True) == '':
            lista_calefaccion.append('Sí')
        else:
            lista_calefaccion.append('No')
    except:
        lista_calefaccion.append('No')

    try:
        if soup_url.find('div', class_='icon-terrace').get_text(strip=True) == '':
            lista_terraza.append('Sí')
        else:
            lista_terraza.append('No')
    except:
        lista_terraza.append('No')

    try:
        lista_caracteristicas.append([i.get_text(strip=True) for i in soup_url.find_all('li', class_='feature')])
    except:
        lista_caracteristicas.append('No veo más características')

    try:
        lista_descripcion.append(soup_url.find('div', class_='description').get_text(strip=True))
    except:
        lista_descripcion.append('No veo la descripción')

    print('Url: '+str(contador))

    contador +=1

Url: 1
Url: 2
Url: 3
Url: 4
Url: 5
Url: 6
Url: 7
Url: 8
Url: 9
Url: 10
Url: 11
Url: 12
Url: 13
Url: 14
Url: 15
Url: 16
Url: 17
Url: 18
Url: 19
Url: 20
Url: 21
Url: 22
Url: 23
Url: 24
Url: 25
Url: 26
Url: 27
Url: 28
Url: 29
Url: 30
Url: 31
Url: 32
Url: 33
Url: 34
Url: 35
Url: 36
Url: 37
Url: 38
Url: 39
Url: 40
Url: 41
Url: 42
Url: 43
Url: 44
Url: 45
Url: 46
Url: 47
Url: 48
Url: 49
Url: 50
Url: 51
Url: 52
Url: 53
Url: 54
Url: 55
Url: 56
Url: 57
Url: 58
Url: 59
Url: 60
Url: 61
Url: 62
Url: 63
Url: 64
Url: 65
Url: 66
Url: 67
Url: 68
Url: 69
Url: 70
Url: 71
Url: 72
Url: 73
Url: 74
Url: 75
Url: 76
Url: 77
Url: 78
Url: 79
Url: 80
Url: 81
Url: 82
Url: 83
Url: 84
Url: 85
Url: 86
Url: 87
Url: 88
Url: 89
Url: 90
Url: 91
Url: 92
Url: 93
Url: 94
Url: 95
Url: 96
Url: 97
Url: 98
Url: 99
Url: 100
Url: 101
Url: 102
Url: 103
Url: 104
Url: 105
Url: 106
Url: 107
Url: 108
Url: 109
Url: 110
Url: 111
Url: 112
Url: 113
Url: 114
Url: 115
Url: 116
Url: 117
Url: 118
Url: 119
Url: 120
Url: 121
Url: 122
Url: 123
U

### Creamos el DataFrame

In [133]:
lista_df = []

for i in range(len(lista_precios)):
    data = {'Url': lista_urls[i],
            'Título': lista_titulos[i],
            'Ubicación': lista_ubicaciones[i],
            'Precio': lista_precios[i],
            'Precio Antes': lista_precios_antes[i],
            'Habitaciones': lista_habitaciones[i],
            'Baños':lista_bathrooms[i],
            'Metros cuadrados': lista_m2[i],
            'Aire acondicionado': lista_aire[i],
            'Amueblado': lista_amueblado[i],
            'Armarios empotrados': lista_armarios_empotrados[i],
            'Ascensor': lista_ascensor[i],
            'Balcón': lista_balcon[i],
            'Calefacción': lista_calefaccion[i],
            'Terraza': lista_terraza[i],
            'Características': lista_caracteristicas[i],
            'Descripción': lista_descripcion[i]
            }
    
    lista_df.append(data)

df = pd.DataFrame(lista_df)


In [134]:
df

Unnamed: 0,Url,Título,Ubicación,Precio,Precio Antes,Habitaciones,Baños,Metros cuadrados,Aire acondicionado,Amueblado,Armarios empotrados,Ascensor,Balcón,Calefacción,Terraza,Características,Descripción
0,https://www.yaencontre.com/alquiler/piso/inmue...,Alquiler de piso en Vila de Gràcia de 3 habita...,"Vila de Gràcia, Gràcia, Barcelona",1.700 €,1.700 €,3,2,76 m²,No,Sí,No,Sí,No,Sí,Sí,"[Amueblado, Ascensor, Calefacción, Terraza, Co...",Apartamento de alquiler temporal (desde 32 día...
1,https://www.yaencontre.com/alquiler/piso/inmue...,Alquiler de ático en El Poble Sec - Parc de Mo...,"El Poble Sec - Parc de Montjuïc, Sants - Montj...",1.485 €,1.485 €,1,1,60 m²,No,Sí,No,Sí,No,Sí,Sí,"[Amueblado, Ascensor, Calefacción, Terraza, Es...",Apartamento de alquiler temporal (desde 32 día...
2,https://www.yaencontre.com/alquiler/piso/inmue...,Piso en alquiler en Sant Gervasi - Galvany de ...,"Sant Gervasi - Galvany, Sarrià - Sant Gervasi,...",1.995 €,2.095 €,2,2,85 m²,Sí,Sí,No,Sí,No,Sí,No,"[Aire acondicionado, Amueblado, Ascensor, Cale...",Apartamento de alquiler temporal (desde 32 día...
3,https://www.yaencontre.com/alquiler/piso/inmue...,Piso en alquiler en Fort Pienc de 3 habitacion...,"Fort Pienc, Eixample, Barcelona",3.250 €,3.250 €,3,2,110 m²,Sí,Sí,Sí,Sí,Sí,Sí,Sí,"[Aire acondicionado, Amueblado, Armarios empot...",*COMPLETAMENTE AMUEBLADO*\n*ALQUILERES MENSUAL...
4,https://www.yaencontre.com/alquiler/piso/inmue...,Piso en alquiler en L'Antiga Esquerra de l'Eix...,"L'Antiga Esquerra de l'Eixample, Eixample, Bar...",3.600 €,3.600 €,3,2,131 m²,Sí,Sí,Sí,Sí,Sí,Sí,No,"[Aire acondicionado, Amueblado, Armarios empot...",*COMPLETAMENTE AMUEBLADO*\n*ALQUILERES MENSUAL...
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
793,https://www.yaencontre.com/alquiler/piso/inmue...,Alquiler de piso en Sant Gervasi - La Bonanova...,"Sant Gervasi - La Bonanova, Sarrià - Sant Gerv...",2.250 €,2.250 €,4,2,104 m²,Sí,No,No,Sí,Sí,Sí,No,"[Aire acondicionado, Ascensor, Balcón, Calefac...",GEINBAR presenta en alquiler este precioso pis...
794,https://www.yaencontre.com/alquiler/piso/inmue...,Alquiler de piso en Vila de Gràcia de 2 habita...,"Vila de Gràcia, Gràcia, Barcelona",1.850 €,1.850 €,2,2,85 m²,Sí,Sí,No,Sí,Sí,Sí,Sí,"[Aire acondicionado, Amueblado, Ascensor, Balc...",Beres Group Barcelona presenta: \n\n** 2 HABIT...
795,https://www.yaencontre.com/alquiler/piso/inmue...,Piso en alquiler en El Camp d'en Grassot i Grà...,"El Camp d'en Grassot i Gràcia Nova, Gràcia, Ba...",2.000 €,2.000 €,3,1,90 m²,Sí,Sí,No,Sí,Sí,Sí,Sí,"[Aire acondicionado, Amueblado, Ascensor, Balc...",DISPONIBLE DESDE 17 de JULIO DE 2023\n\nBeres-...
796,https://www.yaencontre.com/alquiler/piso/inmue...,Alquiler de piso en El Poblenou de 3 habitacio...,"El Poblenou, Sant Martí, Barcelona",1.750 €,1.750 €,3,2,84 m²,Sí,No,Sí,Sí,Sí,Sí,Sí,"[Aire acondicionado, Armarios empotrados, Asce...",HOMES BCN - SERVICIOS INMOBILIARIOS - COMERCIA...
