# `Практикум по программированию на языке Python`
<br>

## `Занятие 10: Основы Web-разработки`
<br><br>

### `Роман Ищенко (roman.ischenko@gmail.com)`

#### `Москва, 2022`

In [1]:
import warnings
warnings.filterwarnings('ignore')

### `HTTP`

HTTP (HyperText Transfer Protocol) — это протокол, позволяющий получать различные ресурсы. Изначально, как следует из названия — для документов, но сейчас уже для передачи произвольных данных. Лежит в основе обмена данными в Web.

Это протокол клиент-серверного взаимодействия, что означает инициирование запросов к сереверу самим получателем. Итоговый документ может состоять из различных частей: текст, аудио/видео файлов, скриптов. Взаимодействие осущетвляется посредством обмена одиночными сообщенимями: запрос-ответ.

HTTP является протоколом прикладного уровня, который в качестве транспорта использует возможности другого протокола — TCP. Основное требование к транспортному протоколу — надёжность, то есть, гарантированная доставка сообщений. По этой причине не подходит другой распространённый протокол — UPD, который не гарантирует доставку сообщений.

#### Преимущества
- Прост и человекочитаем
- Расширяем
- Не имеет состояния (каждый запрос — в отрыве от остальных), следовательно, базово простой

#### Расширения
- Кэш — сервер может инструктировать клиента/прокси о том, что и как надолго можно кэшировать
- Ослабления ограничения источника — инструкции клиенту о том, что на загружаемой странице может содержаться информация с других доменов
- Аутентификация — для доступа к защищённой информации
- Прокси и туннелирование — сокрытие источника или получателя информации, кэширование для уменьшения нагрузки
- Сессии — расширение для сохранения состояния взаимодействия. Несколько механизмов, самый известный — cookies

#### HTML

Первая версия содержала пару десятков тэгов (разметка текста, списки, изображения и гиперссылки).

На текущий момент уже 5-я версия. От попыток создать глобальный стандарт отказались, потому что всё ещё динамично развивающаяся область. По сути — дополняемый набор мини-стандартов. Три составляющие веба: HTML5 (язык разметки документов), CSS3 (каскадные таблицы стилей) и JavaScript (язык сценариев)

### `Состав запроса`

- HTTP-метод: GET, POST, OPTIONS и т. д., определяющее операцию, которую клиент хочет выполнить
- Путь к ресурсу
- Версию HTTP-протокола
- Заголовки  (опционально)
- Тело (для некоторых методов, таких как POST)


```
GET / HTTP/1.1
Host: ya.ru
User-Agent: Python script
Accept: */*

```

### `Состав ответа`

- Версию HTTP-протокола
- HTTP код состояния, сообщающий об успешности запроса или причине неудачи
- Сообщение состояния -- краткое описание кода состояния
- HTTP заголовки
- Опционально: тело, содержащее пересылаемый ресурс


```
HTTP/1.1 200 Ok
Cache-Control: no-cache,no-store,max-age=0,must-revalidate
Content-Length: 59978
Content-Type: text/html; charset=UTF-8
Date: Thu, 29 Apr 2021 03:48:39 GMT
Set-Cookie: yp=1622260119.ygu.1; Expires=Sun, 27-Apr-2031 03:48:39 GMT; Domain=.ya.ru; Path=/
```

### `Типы запросов`

Типы запросов в какой-то степени просто договорённость о семантике. Никто не мешает пользоваться только одним типом. Но глобально типы призваны определить что именно требуется при обращении к одному и тому же ресурсу. Каждый конкретный ресурс может поддерживать только часть методов.

- GET — запрашивает представление ресурса. Запросы с использованием этого метода могут только извлекать данные
- HEAD — запрашивает ресурс так же, как и метод GET, но без тела ответа
- POST — используется для отправки сущностей к определённому ресурсу. Часто вызывает изменение состояния или какие-то побочные эффекты на сервере
- PUT — заменяет все текущие представления ресурса данными запроса
- DELETE — удаляет указанный ресурс
- CONNECT — устанавливает "туннель" к серверу, определённому по ресурсу
- OPTIONS — используется для описания параметров соединения с ресурсом
- TRACE — выполняет вызов возвращаемого тестового сообщения с ресурса (например, для отладки)
- PATCH — используется для частичного изменения ресурса

### `Заголовки`

- Authentication
- Caching
- Client hints
- Conditionals
- Connection management
- Cookies
- Message body information
- Request context
- Response context
- Security
- WebSockets


### `Коды`

- Информационные (100 - 199)
- Успешные (200 - 299)
- Перенаправления (300 - 399)
- Клиентские ошибки (400 - 499)
- Серверные ошибки (500 - 599)

```
200 OK
302 Found
400 Bad Request
401 Unauthorized
404 Not Found
500 Internal Server Error
503 Service Unavailable
```

### `HTTPS`

- HTTPS не является отдельным протоколом передачи данных, а представляет собой расширение протокола HTTP с надстройкой шифрования
- передаваемые по протоколу HTTP данные не защищены, HTTPS обеспечивает конфиденциальность информации путем ее шифрования
- HTTP использует порт 80, HTTPS — порт 443

#### Сетевое обеспечение защищённого протокола

SSL — Secure Sockets Layer: "надстройка" на несколькими слоями сетевой модели

TLS — Transport Layer Security: развитие SSL

Обеспечивают шифрование и поддержку сертификатов

Принцип работы:
- С помощью ассиметричного шифрования устанавливается ключ соединения и передаётся сессионный ключ
- Всё дальнейшее общение шифруется уже сессионным ключом

#### Асимметричное шифрование

Называется так, потому что передающая сторона может только зашифровать (но не расшифровать) данные.

Асимметричный ключ — ключ, имеющий две составляющие: публичную и частную (закрытую). Публичный ключ доступен любому. Частный (закрытый) известен только владельцу. Если браузер хочет отправить сообщение, то он находит публичный ключ сервера, шифрует сообщение и отправляет на сервер. Далее сервер расшифровывает полученное сообщение с помощью своего частного ключа. Чтобы ответить пользователю, сервер делает те же самые действия: поиск публичного ключа собеседника, шифрование, отправка

Следовательно, для двустороннего общения требуется 2 пары ключей.

Алгоритмы ассиметричного шифрования более ресурсоёмкие, поэтому обычно только первичная установка соединения производится с его помощью, далее стороны договариваются о симметричном сессионном ключе и дальшейшее общение ведётся с помощью симметричного шифрованиия

#### Симметричное шифрование

В этом случае у обеих сторон есть один ключ, с помощью которого они и передают данные. Основная проблема — как договориться об этом ключе, чтобы знали только две стороны. И один из способов (не единственный) — с помощью ассиметричных алгоритмов

### `Python Web-clients`

Стандартная библиотека `urllib`

Реализует все необходимые методы и примитивы, но требует много вспомогательной работы

In [2]:
import json
import urllib.request
ur = urllib.request.urlopen('https://postman-echo.com/get?foo=bar')
print(ur.code)
content = json.loads(ur.read())
print(json.dumps(content, indent=4, sort_keys=True))

200
{
    "args": {
        "foo": "bar"
    },
    "headers": {
        "accept-encoding": "identity",
        "host": "postman-echo.com",
        "user-agent": "Python-urllib/3.8",
        "x-amzn-trace-id": "Root=1-6273c520-429f838707b7e3ff3f7295aa",
        "x-forwarded-port": "443",
        "x-forwarded-proto": "https"
    },
    "url": "https://postman-echo.com/get?foo=bar"
}


In [2]:
import json
from urllib import request, parse
data = parse.urlencode({ 'foo': 'bar' }).encode()
req = request.Request('https://postman-echo.com/post', method="POST", data=data)
ur = request.urlopen(req)
print(ur.code)

content = json.loads(ur.read())
print(json.dumps(content, indent=4, sort_keys=True))

200
{
    "args": {},
    "data": "",
    "files": {},
    "form": {
        "foo": "bar"
    },
    "headers": {
        "accept-encoding": "identity",
        "content-length": "7",
        "content-type": "application/x-www-form-urlencoded",
        "host": "postman-echo.com",
        "user-agent": "Python-urllib/3.8",
        "x-amzn-trace-id": "Root=1-62754c6e-3eb82084750864ef7f1d64ba",
        "x-forwarded-port": "443",
        "x-forwarded-proto": "https"
    },
    "json": {
        "foo": "bar"
    },
    "url": "https://postman-echo.com/post"
}


Библиотека `requests`

Инкапсулирует значительную часть вспомогательной обработки, позволяя сосредоточиться непосредственно на логике

Установка:
`pipenv install requests`

Запрос GET

In [9]:
import requests

r = requests.get('https://postman-echo.com/get', params={'foo': 'bar'}, headers={'user-agent': 'Python Script'})
print(r.status_code)
content = json.loads(r.content)
print(json.dumps(content, indent=4, sort_keys=True))


200
{
    "args": {
        "foo": "bar"
    },
    "headers": {
        "accept": "*/*",
        "accept-encoding": "gzip, deflate",
        "host": "postman-echo.com",
        "user-agent": "Python Script",
        "x-amzn-trace-id": "Root=1-6273c750-1b8967c6622e10de3f96795d",
        "x-forwarded-port": "443",
        "x-forwarded-proto": "https"
    },
    "url": "https://postman-echo.com/get?foo=bar"
}


Запрос POST

In [3]:
import requests

r = requests.post('https://postman-echo.com/post', json={'foo': 'bar'},headers = {'user-agent': 'Python Script'})
print(r.status_code)
content = json.loads(r.content)
print(json.dumps(content, indent=4, sort_keys=True))

200
{
    "args": {},
    "data": {
        "foo": "bar"
    },
    "files": {},
    "form": {},
    "headers": {
        "accept": "*/*",
        "accept-encoding": "gzip, deflate",
        "content-length": "14",
        "content-type": "application/json",
        "host": "postman-echo.com",
        "user-agent": "Python Script",
        "x-amzn-trace-id": "Root=1-62754cd5-2eb8ed7e4876d00e1bcc08b8",
        "x-forwarded-port": "443",
        "x-forwarded-proto": "https"
    },
    "json": {
        "foo": "bar"
    },
    "url": "https://postman-echo.com/post"
}
