# <center>Cómo funciona</center>

Ciertas páginas web intentan restringir la posibilidad de ser visitadas por robots creando el contenido que muestran en el cliente de forma dinámica (por medio de código Javascript), como es el caso de [milanuncios.com](https://www.milanuncios.com/).

### Scraping estático en Python


In [1]:
import requests
from bs4 import BeautifulSoup

url = "https://www.milanuncios.com/anuncios/masajes-relajantes-en-jerez.htm"

soup = BeautifulSoup(requests.get(url).content, "html.parser")
print(soup.find(class_="aditem-detail-title"))

None


Sin embargo, es muy fácil saltarse estas limitaciones...

### Scraping dinámico en Python

In [2]:
from pyvirtualdisplay import Display  # pip3 install pyvirtualdisplay
from selenium import webdriver        # pip3 install selenium
from bs4 import BeautifulSoup         # pip3 install bs4
import time

url = "https://www.milanuncios.com/anuncios/masajes-relajantes-en-jerez.htm"

display = Display(visible=0, size=(800, 600))
display.start()
browser = webdriver.Firefox()  # Necesitas geckodriver y Mozilla Firefox
browser.get(url)
time.sleep(.8)
soup = BeautifulSoup(browser.page_source, "html.parser")
print(soup.find(class_="aditem-detail-title"))
browser.quit()

<a class="aditem-detail-title" href="/masajistas/masajes-y-tratamientos-fisio-domicilio-246582919.htm" target="_blank"><b class="sub2">MASAJES</b> Y TRATAMIENTOS FISIO DOMICILIO</a>


________________________________________________

# <center>Documentación</center>

## Uso básico
Los 4 métodos principales para realizar la gran mayoría de consultas en la página de [milanuncios.com](https://www.milanuncios.com/) son los siguientes:

In [None]:
from milanuncios import MilAnuncios
ma = MilAnuncios()

# Obtener las familias de categorías de la página principal:
print(ma.categories) 

# Obtener las subcategorías de una categoría:
print(ma.subcategories("servicios"))

# Realizar una consulta (indicamos el número de páginas, por defecto 1 página):
print(ma.search("gatos", pages=3)) # Devuelve un DataFrame de pandas

# Realizar una búsqueda por categoría/subcategoría:
print(ma.search_category("juegos", subcategory="videoconsolas").tail())

## Uso avanzado
### Filtros

In [None]:
# Podemos filtrar por regiones en ambos métodos:
print(ma.search("guitarra flamenca", region="cadiz").head())
# Para consultar todas las regiones posibles (provincias y comunidades autónomas):
print(ma.regions)

# Si quieres buscar sólo por regiones (https://www.milanuncios.com/anuncios-en-sevilla/)
print(ma.search("", region="sevilla").head())  # Cadena vacía en el parámetro query

# Podemos filtrar por oferta y demanda. Por defecto, los parámetros offer y demand equivalen a True:
print(ma.search_category("inmobiliaria", subcategory="alquiler de casas", offer=False))

### Cache
Si vas a realizar muchas consultas en una sola sesión, es conveniente cachear todas las subcategorías al instanciar el scraper. Tardará un tiempo en guardar en memoria todas las subcategorías pero luego el rendimiento aumentará considerablemente:

In [None]:
from pprint import pprint

ma = MilAnuncios(init_cache=True)
pprint(ma.cache["categories"])
pprint(ma.cache["subcategories"])