# Web Scraping con Requests

**Relator: Felipe Mesa Abraham** 

Correo: femesa@udec.cl


En esta actividad se trabajará con la librería [Requests](https://docs.python-requests.org/en/latest/) para extraer codigo fuente de una pagina o información de API's. La actividad consiste en un ejemplo sobre el funcionamiento de la librería y un ejercicio guiado.

## Requests y codigo fuente

Usando Requests podemos extraer el codigo fuente de una página. Esto nos ayudará para hacer scraping complementando el trabajo de Requests con otras librerías.

In [2]:
import requests

In [None]:
# Hacemos la solicitud al sitio web y recibimos como respuesta el codigo fuente de la página
r = requests.get('https://www.mercadolibre.cl/')

# Esta respuesta la guardamos como texto
page_source = r.text

In [None]:
# Imprimimos la respuesta
page_source

## Resquests y API's

Con Requests tambien se puede llamar a API's para obtener información.

In [3]:
# Hacemos la llamada a la API y guardamos la respuesta como un diccionario tipo json
response = requests.get('https://api.mercadolibre.com/trends/MLC/MLC1051').json()

In [None]:
# Imprimimos la respuesta
response

In [None]:
# Recorremos el diccionario y mostramos cada una de las keywords
for i in range(len(response)):
  print(response[i]['keyword'])

## Práctica Requests

Tomando en cuenta el ejemplo anterior, elija una de las categorías desponibles y haga llamadas a la 
API de MercadoLibre usando Requests para extraer las palabras más utilizadas en las busquedas de los usuarios.
Puede consultar las categorías en el siguiente link:

https://api.mercadolibre.com/sites/MLC/categories

In [None]:
# Hacemos una llamada a la API para consultar todas las categorias disponibles

# Hacemos otra llamada a la API y guardamos la respuesta como un diccionario tipo json

# Recorremos el diccionario y mostramos cada una de las keywords


# Solución

In [None]:
# Hacemos una llamada a la API para consultar todas las categorias disponibles
categorias = requests.get('https://api.mercadolibre.com/sites/MLC/categories').json()
categorias

In [None]:
# Hacemos otra llamada a la API y guardamos la respuesta como un diccionario tipo json
response = requests.get('https://api.mercadolibre.com/trends/MLC/MLC1051').json()

# Recorremos el diccionario y mostramos cada una de las keywords
for i in range(len(response)):
  print(response[i]['keyword'])

# Ejercicio propuesto

Repita el ejercicio anterior para extraer las palabras clave de cada una de las categorías disponibles.
Puede consultar las categorías en el siguiente link:

https://api.mercadolibre.com/sites/MLC/categories


In [None]:
# Hacemos una llamada a la API para consultar todas las categorias disponibles

# Hacemos otra llamada para revisar el contenido de cada categoría

# Recorremos cada una de las categorías

# Para cada categoría, extraemos las palabras mas utilizadas o "keywords"

# Mostramos el resultado

## Solución

In [None]:
# Hacemos una llamada a la API para consultar las librerías
categorias = requests.get('https://api.mercadolibre.com/sites/MLC/categories').json()

In [None]:
categorias

[{'id': 'MLC1747', 'name': 'Accesorios para Vehículos'},
 {'id': 'MLC1512', 'name': 'Agro'},
 {'id': 'MLC1403', 'name': 'Alimentos y Bebidas'},
 {'id': 'MLC1071', 'name': 'Animales y Mascotas'},
 {'id': 'MLC1367', 'name': 'Antigüedades y Colecciones'},
 {'id': 'MLC1368', 'name': 'Arte, Librería y Cordonería'},
 {'id': 'MLC1743', 'name': 'Autos, Motos y Otros'},
 {'id': 'MLC1384', 'name': 'Bebés'},
 {'id': 'MLC1246', 'name': 'Belleza y Cuidado Personal'},
 {'id': 'MLC1039', 'name': 'Cámaras y Accesorios'},
 {'id': 'MLC1051', 'name': 'Celulares y Telefonía'},
 {'id': 'MLC1648', 'name': 'Computación'},
 {'id': 'MLC1144', 'name': 'Consolas y Videojuegos'},
 {'id': 'MLC1500', 'name': 'Construcción'},
 {'id': 'MLC1276', 'name': 'Deportes y Fitness'},
 {'id': 'MLC5726', 'name': 'Electrodomésticos'},
 {'id': 'MLC1000', 'name': 'Electrónica, Audio y Video'},
 {'id': 'MLC110931', 'name': 'Entradas para Eventos'},
 {'id': 'MLC178483', 'name': 'Herramientas'},
 {'id': 'MLC1574', 'name': 'Hogar y M

In [None]:
# Recorremos cada una de las categorías
for i in range(len(categorias)):

  # Hacemos otra llamada para revisar el contenido de cada categoría
  keywords = requests.get("https://api.mercadolibre.com/trends/MLC/{}".format(categorias[i]['id'])).json()

  # Recorremos cada una de las categorías
  for j in range(len(keywords)):
    # Para cada categoría, extraemos las palabras mas utilizadas o "keywords"
    # Mostramos el resultado
    print(keywords[j]['keyword'])