# `Практикум по программированию на языке Python`
<br>

## `Занятие 10: Основы Web-разработки`
<br><br>

### `Роман Ищенко (roman.ischenko@gmail.com)`

#### `Москва, 2023`

In [None]:
import warnings
warnings.filterwarnings('ignore')

### `Ещё немного об import`

#### `Модуль`
Объект, который служит организационной единицей кода в Python. Модули имеют пространство имён, в котором содержатся произвольные объекты Python. Модули загружаются в Python посредством импортирования.

Как правило это один файл с расширением `.py`

In [None]:
import math
dir(math)

Типы модулей
- Встроенные (built-in)
- Frozen
- C расширения
- Файлы с исходными кодами Python (.py)
- Файлы с Python байткодом (.pyc).
- Каталоги

In [None]:
import sys
sys.builtin_module_names

#### `Пакеты`
Следующий после модуля уровень в организационной иерархии кода. Это модуль Python, который может содержать подмодули или (рекурсивно) подпакеты. Строго говоря, пакет — это модуль Python с атрибутом `__path__`

Как правило пакет — это каталог файлов, внутри которого находятся файлы Python и другие каталоги. Чтобы создать пакет Python, создаём каталог, а внутри него — файл с именем `__init__.py`. В `__init__.py` файле находится содержимое этого пакета-модуля. И он может быть пустым. Это так называемый regular пакет. При его импорте выполнится `__init__.py`

Если в каталоге файл `__init__.py` отсутствует, начиная с версии 3.3 Python всё равно считает этот каталого пакетом. Но это уже будет не обычный (regular) пакет, а пакетами пространства имён (Namespace packages)

In [None]:
import sys
sys.modules

#### `Порядок импорта`
- Среди уже загруженных `sys.modules`
- Среди builtins и frozen
- Ищет в каталогах, указанных в `sys.path` (текущий + PYTHONPATH + системные)

In [None]:
import sys
sys.path

При импорте имена остаются в пространстве имён модуля. Если мы хотим добавить их непосредственно в текущий, можно воспользоваться специальной формой импорта: `from <модуль> import <список имён>`

Если мы импортируем из подпакета/подмодуля, то выполнится инициализация всех объемлющих пакетов (при наличии файлов `__init__.py`)

#### `Относительный импорт`

`from .<имя> import <names>`

Количество точек определяет на сколько каталогов мы поднимаемся наверх (но не выше каталога, откуда запускается сам скрипт)

#### `Установка локального пакета`

`pip install -e .`

Ключ `-e` означает **editable** (то есть, возможны изменения внутри пакета)

### `HTTP`

HTTP (HyperText Transfer Protocol) — это протокол, позволяющий получать различные ресурсы. Изначально, как следует из названия — для документов, но сейчас уже для передачи произвольных данных. Лежит в основе обмена данными в Web.

Это протокол клиент-серверного взаимодействия, что означает инициирование запросов к сереверу самим получателем. Итоговый документ может состоять из различных частей: текст, аудио/видео файлов, скриптов. Взаимодействие осущетвляется посредством обмена одиночными сообщенимями: запрос-ответ.

HTTP является протоколом прикладного уровня, который в качестве транспорта использует возможности другого протокола — TCP. Основное требование к транспортному протоколу — надёжность, то есть, гарантированная доставка сообщений. По этой причине не подходит другой распространённый протокол — UPD, который не гарантирует доставку сообщений.

#### Преимущества
- Прост и человекочитаем
- Расширяем
- Не имеет состояния (каждый запрос — в отрыве от остальных), следовательно, базово простой

#### Расширения
- Кэш — сервер может инструктировать клиента/прокси о том, что и как надолго можно кэшировать
- Ослабления ограничения источника — инструкции клиенту о том, что на загружаемой странице может содержаться информация с других доменов
- Аутентификация — для доступа к защищённой информации
- Прокси и туннелирование — сокрытие источника или получателя информации, кэширование для уменьшения нагрузки
- Сессии — расширение для сохранения состояния взаимодействия. Несколько механизмов, самый известный — cookies

#### HTML

Первая версия содержала пару десятков тэгов (разметка текста, списки, изображения и гиперссылки).

На текущий момент уже 5-я версия. От попыток создать глобальный стандарт отказались, потому что всё ещё динамично развивающаяся область. По сути — дополняемый набор мини-стандартов. Три составляющие веба: HTML5 (язык разметки документов), CSS3 (каскадные таблицы стилей) и JavaScript (язык сценариев)

### `Состав запроса`

- HTTP-метод: GET, POST, OPTIONS и т. д., определяющее операцию, которую клиент хочет выполнить
- Путь к ресурсу
- Версию HTTP-протокола
- Заголовки  (опционально)
- Тело (для некоторых методов, таких как POST)


```
GET / HTTP/1.1
Host: ya.ru
User-Agent: Python script
Accept: */*

```

### `Состав ответа`

- Версию HTTP-протокола
- HTTP код состояния, сообщающий об успешности запроса или причине неудачи
- Сообщение состояния -- краткое описание кода состояния
- HTTP заголовки
- Опционально: тело, содержащее пересылаемый ресурс


```
HTTP/1.1 200 Ok
Cache-Control: no-cache,no-store,max-age=0,must-revalidate
Content-Length: 59978
Content-Type: text/html; charset=UTF-8
Date: Thu, 29 Apr 2021 03:48:39 GMT
Set-Cookie: yp=1622260119.ygu.1; Expires=Sun, 27-Apr-2031 03:48:39 GMT; Domain=.ya.ru; Path=/
```

### `Типы запросов`

Типы запросов в какой-то степени просто договорённость о семантике. Никто не мешает пользоваться только одним типом. Но глобально типы призваны определить что именно требуется при обращении к одному и тому же ресурсу. Каждый конкретный ресурс может поддерживать только часть методов.

- GET — запрашивает представление ресурса. Запросы с использованием этого метода могут только извлекать данные
- HEAD — запрашивает ресурс так же, как и метод GET, но без тела ответа
- POST — используется для отправки сущностей к определённому ресурсу. Часто вызывает изменение состояния или какие-то побочные эффекты на сервере
- PUT — заменяет все текущие представления ресурса данными запроса
- DELETE — удаляет указанный ресурс
- CONNECT — устанавливает "туннель" к серверу, определённому по ресурсу
- OPTIONS — используется для описания параметров соединения с ресурсом
- TRACE — выполняет вызов возвращаемого тестового сообщения с ресурса (например, для отладки)
- PATCH — используется для частичного изменения ресурса

### `Заголовки`

- Authentication
- Caching
- Client hints
- Conditionals
- Connection management
- Cookies
- Message body information
- Request context
- Response context
- Security
- WebSockets


### `Коды`

- Информационные (100 - 199)
- Успешные (200 - 299)
- Перенаправления (300 - 399)
- Клиентские ошибки (400 - 499)
- Серверные ошибки (500 - 599)

```
200 OK
302 Found
400 Bad Request
401 Unauthorized
404 Not Found
500 Internal Server Error
503 Service Unavailable
```

### `HTTPS`

- HTTPS не является отдельным протоколом передачи данных, а представляет собой расширение протокола HTTP с надстройкой шифрования
- передаваемые по протоколу HTTP данные не защищены, HTTPS обеспечивает конфиденциальность информации путем ее шифрования
- HTTP использует порт 80, HTTPS — порт 443

#### Сетевое обеспечение защищённого протокола

SSL — Secure Sockets Layer: "надстройка" на несколькими слоями сетевой модели

TLS — Transport Layer Security: развитие SSL

Обеспечивают шифрование и поддержку сертификатов

Принцип работы:
- С помощью ассиметричного шифрования устанавливается ключ соединения и передаётся сессионный ключ
- Всё дальнейшее общение шифруется уже сессионным ключом

#### Асимметричное шифрование

Называется так, потому что передающая сторона может только зашифровать (но не расшифровать) данные.

Асимметричный ключ — ключ, имеющий две составляющие: публичную и частную (закрытую). Публичный ключ доступен любому. Частный (закрытый) известен только владельцу. Если браузер хочет отправить сообщение, то он находит публичный ключ сервера, шифрует сообщение и отправляет на сервер. Далее сервер расшифровывает полученное сообщение с помощью своего частного ключа. Чтобы ответить пользователю, сервер делает те же самые действия: поиск публичного ключа собеседника, шифрование, отправка

Следовательно, для двустороннего общения требуется 2 пары ключей.

Алгоритмы ассиметричного шифрования более ресурсоёмкие, поэтому обычно только первичная установка соединения производится с его помощью, далее стороны договариваются о симметричном сессионном ключе и дальшейшее общение ведётся с помощью симметричного шифрованиия

#### Симметричное шифрование

В этом случае у обеих сторон есть один ключ, с помощью которого они и передают данные. Основная проблема — как договориться об этом ключе, чтобы знали только две стороны. И один из способов (не единственный) — с помощью ассиметричных алгоритмов

### `Python Web-clients`

Стандартная библиотека `urllib`

Реализует все необходимые методы и примитивы, но требует много вспомогательной работы

In [None]:
import json
import urllib.request
ur = urllib.request.urlopen('https://postman-echo.com/get?foo=bar&foo1=bar1')
print(ur.code)
content = json.loads(ur.read())
print(json.dumps(content, indent=4, sort_keys=True))

In [None]:
import json
from urllib import request, parse
data = parse.urlencode({ 'foo': 'bar' })
print(data)
data = data.encode()
print(data)
req = request.Request('https://postman-echo.com/post', method="POST", data=data)
ur = request.urlopen(req)
print(ur.code)

content = json.loads(ur.read())
print(json.dumps(content, indent=4, sort_keys=True))

Библиотека `requests`

Инкапсулирует значительную часть вспомогательной обработки, позволяя сосредоточиться непосредственно на логике

Установка:
`pipenv install requests`

Запрос GET

In [None]:
import requests

r = requests.get('https://postman-echo.com/get', params={'foo': 'bar'}, headers={'user-agent': 'Python Script'})
print(r.status_code)
content = json.loads(r.content)
print(json.dumps(content, indent=4, sort_keys=True))


Запрос POST

In [None]:
import requests

r = requests.post('https://postman-echo.com/post', data={'foo': 'bar'}, headers = {'user-agent': 'Python Script'})
print(r.status_code)
content = json.loads(r.content)
print(json.dumps(content, indent=4, sort_keys=True))