# Работа с HTTP из Python

HTTP - протокол для передачи гипертекста (работает поверх протокола TCP).     
Всё взаимодействие HTTP происходит между клиентом и сервером.      

Взаимодействие имеет следующую схему:        
1. Установить TCP-соединение с сервером;
2. Клиент формирует запрос и передаёт его на сервер; 
3. Сервер обрабатывает запрос, формирует ответ и передаёт этот ответ клиенту;
4. Клиент получает ответ и закрывает TCP-соединение.

Команды:
1. **get** - получить данные с сервера;
2. **head** - выполнить *get*-запрос, но не высылать тело этого запроса;
3. **post** - отправить данные на сервер;
4. **patch** - изменять отправленные данные на сервер;
5. **delete** - удалить отправленные данные.

Поля заголовка:
1. *Host* - доменное имя или IP-адрес, к которому обращается клиент;
2. *Referer* - ссылка, откуда пришел клиент;
3. *Accept* - тип данных, обрабатываемый клиентом;
4. *Accept-encoding* - кодировка;
5. *User-agent* - информация о клиенте (Safari/Chrome);
6. *Content-length* - число символов в теле запроса.

Структура HTTP-ответа:
<img src="images/web_1.png" width=400px height=400px>

Коды ответа говорят, что:
1. Сервер продолжает работу - **1xx**;
2. Обработка запроса клиента успешна - **2xx** (200=OK, 201=Created);
3. Перенаправляет запрос - **3xx**;
4. Ошибка клиента - **4xx** (403=Forbidden);
5. Ошибка сервера - **5xx**.

In [None]:
import requests

In [5]:
# Make a request

r = requests.get('http://httpbin.org/get')
print(r.text)

{
  "args": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Connection": "close", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.19.1"
  }, 
  "origin": "79.98.8.5", 
  "url": "http://httpbin.org/get"
}



Мы получили ответ со структурой выше.      
Сделаем теперь запрос (post-запрос)

In [7]:
r = requests.post('http://httpbin.org/post')
print(r.text)

{
  "args": {}, 
  "data": "", 
  "files": {}, 
  "form": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Connection": "close", 
    "Content-Length": "0", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.19.1"
  }, 
  "json": null, 
  "origin": "79.98.8.5", 
  "url": "http://httpbin.org/post"
}



Для того чтобы передать параметры, нам необходимо указать params:

In [11]:
payload = {'key1':'value1', 'key2':'value2'}
r = requests.get('http://httpbin.org/get', params=payload)
print(r.text)

{
  "args": {
    "key1": "value1", 
    "key2": "value2"
  }, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Connection": "close", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.19.1"
  }, 
  "origin": "79.98.8.5", 
  "url": "http://httpbin.org/get?key1=value1&key2=value2"
}



In [14]:
r = requests.put('http://httpbin.org/put', data={'key':'value'})
print(r.text)

{
  "args": {}, 
  "data": "", 
  "files": {}, 
  "form": {
    "key": "value"
  }, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Connection": "close", 
    "Content-Length": "9", 
    "Content-Type": "application/x-www-form-urlencoded", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.19.1"
  }, 
  "json": null, 
  "origin": "79.98.8.5", 
  "url": "http://httpbin.org/put"
}



# Как передать различные параметры в запрос
### Если хотим передать JSON:

In [15]:
import json
url = 'http://httpbin.org/post'
r = requests.post(url, data=json.dumps({'key':'value'}))
r = requests.post(url, json={'key':'value'})
print(r.text)

{
  "args": {}, 
  "data": "{\"key\": \"value\"}", 
  "files": {}, 
  "form": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Connection": "close", 
    "Content-Length": "16", 
    "Content-Type": "application/json", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.19.1"
  }, 
  "json": {
    "key": "value"
  }, 
  "origin": "79.98.8.5", 
  "url": "http://httpbin.org/post"
}



### Как передать файл на сервер

In [20]:
url = 'http://httpbin.org/post'

# эту переменную необходимо передать в поле files
files = {'file': ('test.txt', open('/Users/User/Desktop/images/test.txt', 'rb'))}   

r = requests.post(url, files=files)
print(r.text)

{
  "args": {}, 
  "data": "", 
  "files": {
    "file": "Hello, world!"
  }, 
  "form": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Connection": "close", 
    "Content-Length": "157", 
    "Content-Type": "multipart/form-data; boundary=5ca52d4ead5a479b9b04cda21ba81d0d", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.19.1"
  }, 
  "json": null, 
  "origin": "79.98.8.5", 
  "url": "http://httpbin.org/post"
}



### Чтобы передать заголовки

In [22]:
url = 'http://httpbin.org/get'
headers = {'user-agent':'my-app/0.0.1'}

r = requests.get(url, headers=headers)
print(r.text)   # видим, что в заголовках появился user-agent с нашим значением

{
  "args": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Connection": "close", 
    "Host": "httpbin.org", 
    "User-Agent": "my-app/0.0.1"
  }, 
  "origin": "79.98.8.5", 
  "url": "http://httpbin.org/get"
}



# Как получить ответ от сервера

Чтоб получить данные от сервера, есть несколько способов: text, content, json():

In [24]:
r = requests.get('http://httpbin.org/get')
print(type(r.text), r.text) # вернёт текст
print(type(r.content), r.content) # вернёт массив байт
print(type(r.json()), r.json()) # вернёт словарь

<class 'str'> {
  "args": {}, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Connection": "close", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.19.1"
  }, 
  "origin": "79.98.8.5", 
  "url": "http://httpbin.org/get"
}

<class 'bytes'> b'{\n  "args": {}, \n  "headers": {\n    "Accept": "*/*", \n    "Accept-Encoding": "gzip, deflate", \n    "Connection": "close", \n    "Host": "httpbin.org", \n    "User-Agent": "python-requests/2.19.1"\n  }, \n  "origin": "79.98.8.5", \n  "url": "http://httpbin.org/get"\n}\n'
<class 'dict'> {'args': {}, 'headers': {'Accept': '*/*', 'Accept-Encoding': 'gzip, deflate', 'Connection': 'close', 'Host': 'httpbin.org', 'User-Agent': 'python-requests/2.19.1'}, 'origin': '79.98.8.5', 'url': 'http://httpbin.org/get'}


Можно посмотреть статус, с которым вернулся наш HTTP-ответ:

In [26]:
print(r.status_code)

# если необходимо, можно сравнить ответ с каким-нибудь из ответов библиотеки requests
print(r.status_code == requests.codes.ok)

200
True


Иногда удобно, чтобы при некорректном http-ответе мы получали исключение:

In [27]:
bad_r = requests.get('http://httpbin.org/status/404')
print(bad_r.status_code)
bad_r.raise_for_status()

404


HTTPError: 404 Client Error: NOT FOUND for url: http://httpbin.org/status/404

In [29]:
# Можно посмотреть заголовки http-ответа
print(r.headers)

{'Connection': 'keep-alive', 'Server': 'gunicorn/19.9.0', 'Date': 'Tue, 11 Sep 2018 20:14:03 GMT', 'Content-Type': 'application/json', 'Content-Length': '262', 'Access-Control-Allow-Origin': '*', 'Access-Control-Allow-Credentials': 'true', 'Via': '1.1 vegur'}


In [31]:
# Если не хотим, чтобы происходил автоматический редирект при запросе информации о сайте
r = requests.get('http://github.com', allow_redirects=False)
print(r.status_code)

301
