# Aula 08

[Requests](https://requests.readthedocs.io/en/latest/) é uma "biblioteca HTTP para Python, simples e elegante, feita para seres humanos".

A biblioteca permite o envio de requisições HTTP/1.1 de forma bastante fácil. Não há a necessidade de adicionar, manualmente, as strings de requisição à URL, ou formatar os dados enviados via `POST`.

## Tutorial rápido

Em primeiro lugar é preciso instalar a biblioteca:

```
>> python -m pip install requests
```

Recomendo a criação de um `ambiente virtual` antes, e instalar a biblioteca com o **ambiente ativado**.

O conteúdo a seguir é tradução e adaptação de [Requests Quickstart](https://requests.readthedocs.io/en/latest/user/quickstart/).

### Criando uma requisição

In [None]:
import requests

r = requests.get('https://ufpi.br')

A partir de agora temos um objeto `Response` chamado `r`. É nele que estarão guardadas todas as informações obtidas da requisição `GET`.

O uso dos outros métodos do HTTP é tão simples quanto:

In [None]:
r = requests.put('url', data={'chave': 'valor'})
r = requests.delete('url')
r = requests.head('url')
r = requests.options('url')

### Passando parâmetros na URL

Frequentemente existe a necessidade de se enviar alguns dados na URL de consulta. Esses dados são passados por um par chave/valor após um ponto de interrogação: `https://site.com/get?chave=valor`. O `Requests` permite o fornecimento desses argumentos como um dicionário de `strings`. Por exemplo:

```python
payload = {'chave1': 'valor1', 'chave2': 'valor2'}
r = requests.get('https://site.com/get', params=payload)

# Resultado
# https://site.com/get?chave1=valor1&chave2=valor2
```

### Conteúdo do `Response`

É possível ler o conteúdo da resposta do servidor, que estará no objeto `Reponse`. Exemplo:

In [1]:
import requests

r = requests.get('https://ufpi.br')
print(r.text)

<!DOCTYPE html>
<html lang="pt-br" dir="ltr">

<head>
        <meta charset="utf-8">
	<meta name="msapplication-config" content="media/templates/site/govbr-ds/favicons/browserconfig.xml">
	<meta name="theme-color" content="#00a300">
	<meta name="viewport" content="width=device-width, initial-scale=1">
	<meta name="generator" content="Joomla! - Open Source Content Management">
	<title>Página Inicial - UFPI</title>
	<link href="/?format=feed&amp;type=rss" rel="alternate" type="application/rss+xml" title="Página Inicial - UFPI">
	<link href="/?format=feed&amp;type=atom" rel="alternate" type="application/atom+xml" title="Página Inicial - UFPI">
	<link href="/media/templates/site/govbr-ds/favicons/apple-touch-icon.png" rel="apple-touch-icon" sizes="180x180">
	<link href="/media/templates/site/govbr-ds/favicons/favicon-32x32.png" rel="icon" type="image/png" sizes="32x32">
	<link href="/media/templates/site/govbr-ds/favicons/favicon-16x16.png" rel="icon" type="image/png" sizes="16x16">
	<link

O `Requests` vai decodificar o conteúdo do servidor automaticamente a partir do cabeçalho HTTP. Para verificar a codificação usada, basta escrever o seguinte:

In [2]:
print(r.encoding)

utf-8


É possível acessar o corpo da resposta HTTP com o método `content`:

In [3]:
r.content



E também é possível acessar como JSON, ou no formato "bruto":

```python
r.json() # muito provavelmente vai resultar em uma exceção
r.raw
```

### Modificando o cabeçalho

Para acrescentar um cabeçalho a uma requisição HTTP basta passar um dicionário para o parâmetro `headers`. Por exemplo:

```python
url = 'https://site.com/recurso'
cabecalho = {'user-agent': 'chrome'}

r = requests.get(url, headers=cabecalho)
```

### Requisições POST mais complexas

Quando se é necessário o envio de dados em formato de formulário, um dicionário pode ser passado para o parâmetro `data`:

```python
payload = {'chave1': 'valor1', 'chave2': 'valor2'}

r = requests.post('https://site.com/post', data=payload)
```

### Códigos de Status

Os famosos códigos de status do HTTP. Para se verificar o código, basta acessar o atributo `status_code`:

In [9]:
import requests

r = requests.get('https://ufpi.br')
r.status_code

200

O `Requests` também inclui um objeto de pesquisa de código de status integrado para facilitar a consulta:

In [10]:
r.status_code == requests.codes.ok

True

### Cabeçalho de resposta

É possível ver o cabeçalho da resposta HTTP como um dicionário:

In [11]:
r.headers

{'Server': 'openresty', 'Date': 'Mon, 17 Nov 2025 19:28:15 GMT', 'Content-Type': 'text/html; charset=utf-8', 'Content-Length': '31264', 'Connection': 'keep-alive', 'Set-Cookie': '21f5d1b58edfd94b1b8ff5c097a9b27e=ba24n1epcro0gs5jbglb5ne9re; path=/; HttpOnly', 'x-frame-options': 'SAMEORIGIN', 'referrer-policy': 'strict-origin-when-cross-origin', 'cross-origin-opener-policy': 'same-origin', 'strict-transport-security': 'max-age=31536000; includeSubDomains, max-age=63072000; preload', 'content-security-policy-report-only': "frame-ancestors 'self'", 'Expires': 'Wed, 17 Aug 2005 00:00:00 GMT', 'Last-Modified': 'Mon, 17 Nov 2025 19:28:15 GMT', 'Cache-Control': 'no-store, no-cache, must-revalidate, post-check=0, pre-check=0', 'Pragma': 'no-cache', 'Vary': 'Accept-Encoding', 'Content-Encoding': 'gzip', 'X-Served-By': 'ufpi.br'}

Esse dicionário foi implementado para seguir as especificações apresentadas no [RFC 7230](https://tools.ietf.org/html/rfc7230#section-3.2) o qual diz que os nomes dos campos do cabeçalho devem ser *case-insensitive*:

In [13]:
r.headers['Server']

'openresty'

In [14]:
r.headers['server']

'openresty'

### Cookies

Se um `Response` possui `cookies`, é fácil de acessá-los:

```python
url = 'http://site.com/algum/cookie/setting/url'
r = requests.get(url)

r.cookies['nome_cookie_de_exemplo']
# Saída
#   'valor_cookie_de_exemplo'
```

Para enviar seus cookies usa-se o parâmetro `cookies`:

```python
url = 'http://site.com/cookies'
cookies = {'cookies_estao': 'funcionando'}

r = requests.get(url, cookies=cookies)
r.text
# Saída
#   '{"cookies": {"cookies_estao": "funcionando"}}'
```

Os `cookies` são retornados em um `RequestCookieJar`, parecido com um dicionário, mas com uma interface mais complexa, adequada para o uso sobre múltiplos domínios ou `paths`:

```python
jar = requests.cookies.RequestsCookieJar()
jar.set('cookie_gostoso', 'delicioso', domain='site.com', path='/cookies')
jar.set('cookie_nojento', 'mehhh', domain='site.com', path='/outrolugar')

r = requests.get(url, cookies=jar)
r.text
# Saída
#   '{"cookies": {"cookie_gostoso": "delicioso"}}'
```

### Timeouts

É possível dizer ao `Requests` o tempo (em segundos) de espera por uma resposta com o parâtro `timeout`. É interessante usar sempre este parâmetro para evitar "espera infinita".

In [15]:
import requests

requests.get('https://ufpi.br', timeout=0.001)

ConnectTimeout: HTTPSConnectionPool(host='ufpi.br', port=443): Max retries exceeded with url: / (Caused by ConnectTimeoutError(<urllib3.connection.HTTPSConnection object at 0x7af755e5f110>, 'Connection to ufpi.br timed out. (connect timeout=0.001)'))