# Requests
Python Requests III: HTTP for Humans and Machines, alike.

La librería Requets permite realizar peticiones HTTP para obtener información de sitios web de manera y sencilla. Su funcionamiento es fácil e intuitivo. No es casualidad que el subtexto de la librería sea “HTTP for Humans and Machines, alike.”.

### Instalación

In [None]:
pip3 install requests

### Request web pages

Vamos a hacer uso de la siguiente URL para realizar los primeros ejemplos, en la que encontramos un comic de XKCD sobre Python. Para ello, sin acceder a la URL de forma manual, vamos a ver qué hace nuestro intérprete de Python cuando importamos el módulo antigravity.

In [None]:
import antigravity

Se recomienda al lector leer un poco sobre este easter egg a través del siguiente enlace:

* http://python-history.blogspot.com/2010/06/import-antigravity.html

Bien, una vez tengamos acceso a la URL, vamos a analizar su respuesta a través del método get().

In [None]:
import requests

r = requests.get('https://xkcd.com/353/')

print(r)

Para obtener el contenido, debemos analizar a qué atributos y métodos tenemos acceso a traves del objeto de respuesta r. Para ello, haremos uso del método dir().

In [None]:
print(dir(r))

Para obtener más información, podemos hacer uso de la función help().

In [None]:
print(help(r))

Si buceamos entre la respuesta ofrecida por el método help(), vemos que existen atributos como content, el cual devuelve el contenido de la respuesta en bytes, o text, el cual devuelve el contenido ede la respuesta en formato unicode. Por ejemplo, El primero de ellos será útil para obtener imágenes, y el segundo para obtener el contenido de páginas web.

Para obtener el contenido de la URL que hemos visto antes, hay que ejecutar el siguiente código fuente.

In [None]:
import requests

r = requests.get('https://xkcd.com/353/')

print(r.text)

Una vez ejecutado, puede comprobarse que se obtiene contenido en formato HTML, el cual es igualmente recibido cuando navegamos a través de nuestro navegador. Si se desea hacer uso de estos datos, recomendamos al lector hacer uso de algún parser de HTML.


### Download images
Por otro lado, si se desea obtener una imagen es conveniente hacer uso del atributo content, ya que devuelve el resultado en bytes. Si volvemos a la URL, vemos que existe una URL específica para la imagen:

* https://imgs.xkcd.com/comics/python.png 

Para descargar la imagen, hay que ejecutar el siguiente código fuente.

In [None]:
import requests

r = requests.get('https://imgs.xkcd.com/comics/python.png')

with open('comic.png', 'wb') as f:
    f.write(r.content)

Al no haber especificado una ruta absoluta, esta imagen se descargará en la misma ruta en la que se esté ejecutando el módulo de Python.


### Check HTTP status codes and headers
El protocolo HTTP posee una lista de estados de respuesta (https://en.wikipedia.org/wiki/List_of_HTTP_status_codes). Para conocer el estado, podemos hacer uso del atributo status_code.

In [None]:
import requests

r = requests.get('https://imgs.xkcd.com/comics/python.png')

print(r.status_code)

Si únicamente se desea conocer si el estado es correcto o no, el módulo Requests proporciona al objeto de respuesta el atributo ok, el cual puede ser muy útil a la hora de comprobar si una página web está activa o no.

In [None]:
import requests

r = requests.get('https://imgs.xkcd.com/comics/python.png')

print(r.ok)

Para ver las cabeceras que acompañan a la respuesta, podemos hacer uso del atributo headers. Gracias a esto, podremos conocer el servidor, el tipo de contenido, la última fecha de modificación, el tamaño en bytes, etc.

In [None]:
import requests

r = requests.get('https://imgs.xkcd.com/comics/python.png')

print(r.headers)

### httpbin.org 
De aquí en adelante, vamos a hacer uso del sitio web https://httpbin.org el cual es un servicio simple para hacer pruebas de peticiones y respuesta del protocolo HTTP. Se recomienda encarecidamente al lector navegar por este sitio web para ver todas las posibilidades que ofrece.

Mediante el siguiente código fuente podemos enviar una serie de parámetros en la petición get() y analizar la respuesta devuelta por el servicio httpbin.org.

In [None]:
import requests

r = requests.get('https://httpbin.org/get?page=5&count=50')

print(r.text)

Para evitar errores y para conseguir un código fuente más pythonic, vamos a hacer uso de un diccionario para enviar los parámetros.

In [None]:
import requests

parameters= {'page': 5, 'count': 50}
r = requests.get('https://httpbin.org/get', params=parameters)

print('Text:')
print(r.text)
print('Url:')
print(r.url)

Para hacer uso del método HTTP POST –para enviar datos al servidor--, el módulo Requests proporciona el método post(). Para ello, basta con cambiar el parámetro params por data. En este ejemplo, vamos a hacer uso del método de autenticación basado en formulario.

In [None]:
import requests

parameters= {'username': 'juan', 'password': 'testing'}
r = requests.post('https://httpbin.org/post', data=parameters)

print(r.text)

El servicio httpbin.org también puede proporcionar la respuesta en forma JSON, el cual puede ser muy útil a la hora de tratar respuestas de manera eficiente y de forma muy sencilla.

In [None]:
import requests

parameters= {'username': 'juan', 'password': 'testing'}
r = requests.post('https://httpbin.org/post', data=parameters)

print(r.json())

La respuesta viene en un diccionario de Python, por tanto, podemos capturar la respuesta y guardarla en una variable y acceder a los distintos atributos como si de un diccionario se tratase.

In [None]:
import requests

parameters= {'username': 'juan', 'password': 'testing'}
r = requests.post('https://httpbin.org/post', data=parameters)

# Python dictionary
r_dict = r.json()

print(r_dict['form'])

Por otro lado, si se desea hacer uso del método basic access authentication (https://en.wikipedia.org/wiki/Basic_access_authentication), el módulo Requests proporciona herramientas para ello.

Recomendamos al lector acceder a la página web del servicio httpbin.org para ver el soporte que proporciona para diferentes métodos de autenticación.

Primero, antes de revisar el código fuente, vamos a abrir en una pestaña de nuestro navegador la siguiente URL:

* https://httpbin.org/basic-auth/user1/rockandroll

In [None]:
import requests

r = requests.get('https://httpbin.org/basic-auth/user1/rockandroll', auth=('user1', 'rockandroll'))

print(r.text)
print(r)

¿Qué pasa si enviamos credenciales erróneas?

In [None]:
import requests

r = requests.get('https://httpbin.org/basic-auth/user1/rockandroll', auth=('user2', 'rockandroll'))

print(r.text)
print(r)

Una buena práctica es hacer uso del parámetro timeout para establecer un tiempo máximo de espera.

In [None]:
import requests

r = requests.get('https://httpbin.org/delay/1', timeout=3)
print(r)

r = requests.get('https://httpbin.org/delay/8', timeout=3)
print(r)