#  Модули и пакеты

Как мы уже видели, Python является вполне  модульным языком, и  его
функциональность не  ограничивается основными принципами программирования (т. е. встроенными методами и структурами данных, с которыми мы
имели дело до сих пор). В  любой программе доступны также расширенные
функциональные свойства, включаемые с помощью команды ```import```. Эта команда создает ссылку на модули, представляющие собой обычные Pytho nфайлы, содержащие определения и инструкции. Встретив строку

```python
import <module>
```
интерпретатор Python выполняет инструкции в файле ```<module>.py``` и включает
имя модуля ```<module>``` в текущее пространство имен, после чего атрибуты, определяемые этим модулем, становятся доступными с применением синтаксиса
точки: ```<module>.<attribute>```.

Определить собственный модуль так же просто, как поместить исходный
код в  файл ```<module>.py```, расположенный в  локации, в  которой интерпретатор Python может найти его (для небольших проектов это обычно тот же каталог, в котором расположена программа, импортирующая модуль). С учетом
синтаксиса команды ```import``` необходимо избегать такого именования модуля, которое не  соответствует корректному идентификатору Python. Например, имя файла ```<module>.py``` не должно содержать символ дефиса и не должно начинаться с цифры. Не рекомендуется давать модулю имя, совпадающее с именем какого-либо встроенного модуля (такого как ```math``` или
```random```), поскольку встроенные модули имеют более высокий приоритет при
импорте Python.

**Пакет (package)** языка Python – это просто структурированный комплект
модулей, размещенный в  некотором каталоге файловой системы. Пакеты
представляют собой естественный способ организации и распространения
крупных проектов на языке Python. Для создания пакета файлы модулей
помещаются в один каталог вместе с файлом ```__init__.py```. Этот файл запускается при импорте пакета и может выполнять некоторые операции инициализации и собственные команды импорта. Если особенная инициализация
не требуется, то этот файл может быть пустым (длиной ноль байтов), но он
обязательно должен существовать, чтобы Python распознавал такой каталог
как пакет.
Например, пакет ```NumPy``` (см. главу Numpy) существует как показанный ниже каталог (некоторые файлы и подкаталоги не показаны для экономии места):

```
numpy/
 __init__.py
 core/
 fft/
 __init__.py
 fftpack.py
 info.py
 ...
 linalg/
 __init__.py
 linalg.py
 info.py
 ...
 polynomial/
 __init__.py
 chebyshev.py
 hermite.py
 legendre.py
 ...
 random/
 version.py
 ...
```
Здесь, например, ```polynomial```  – это вложенный пакет в  структуре пакета
numpy, содержащий несколько модулей, в том числе модуль ```legendre```, который
можно импортировать:

```python
import numpy.polynomial.legendre
```
Чтобы избежать использования развернутого синтаксиса с точкой при обращении к атрибутам этого модуля, удобнее воспользоваться такой командой:

```python
from numpy.polynomial import legendre
```

В табл. 6 перечислены некоторые основные бесплатные модули и пакеты
Python для программных приложений общего назначения, а также для вычислительной и научной работы. Некоторые из них устанавливаются вместе с основным дистрибутивом Python (стандартная библиотека Standard Library),
другие можно загрузить и  установить отдельно. Перед тем как приступить
к реализации какого-либо собственного алгоритма, проверьте, не включена ли
такая реализация в один из существующих пакетов Python.




**Таблица 6**. Модули и пакеты Python. Помеченные звездочкой (\*) компоненты не являются
частью Python Standard Library, поэтому должны устанавливаться отдельно, например с помощью утилиты pip

|Модуль/пакет    |Описание    |
|:---|:---|
|os, sys|Сервисы операционной системы|
|math, cmath|Математические функции|
|random|Генератор случайных чисел |
|collections|Типы данных для контейнеров, расширяющие функциональность словарей, кортежей и т. п.|
|itertools|Инструменты для эффективных итераторов, расширяющие функциональность простых циклов Python|
|glob|Расширение шаблона путевого имени в стиле Unix|
|datetime|Парсинг и обработка дат и времени |
|fractions|Арифметика рациональных чисел (правильных дробей)|
|re|Регулярные выражения|
|argparse|Парсер для ключей и аргументов командной строки|
|urllib |Открытие, чтение и парсинг URL (включая веб-страницы) (см. раздел 4.5.2)|
|* Django (django)|Широко известная рабочая среда для веб-приложений|
|* pyparsing|Лексический парсер для простых грамматик|
|pdb |Отладчик языка Python|
|logging|Встроенный в Python модуль ведения журналов|
|xml, lxml|Парсеры языка разметки XML|
|* VPython (visual)|Трехмерная визуализация|
|unittest |Рабочая среда модульного тестирования для систематического проведения тестирования и валидации отдельных единиц (модулей) кода|
|NumPy (numpy) |Научные вычисления и численные методы|
|SciPy (scipy)|Научные вычислительные алгоритмы|
|Matplotlib (matplotlib)|Графическое отображение данных (см. главы 3 и 7)|
|SymPy (sympy)|Символические вычисления (компьютерная алгебра)|
|pandas|Обработка и анализ данных с использованием табличных структур данных|
|scikit-learn|Машинное обучение|
|Beautiful Soup 4 (beautifulsoup4)|Парсер языка разметки HTML с возможностями обработки некорректно сформированных документов|



Несмотря на существование других менеджеров пакетов, приложение pip
стало фактическим стандартом. Приложение pip обычно устанавливается по
умолчанию вместе с большинством дистрибутивов Python и великолепно выполняет работу по управлению версиями и зависимостями пакетов. Для установки пакета package из командной строки используется показанный ниже синтаксис:

```
pip install package # Установка самой последней версии пакета.
pip install package==X.Y.Z # Установка версии X.Y.Z.
pip install 'package>=X.Y.Z' # Установка версии не ниже X.Y.Z.
```
Для корректного удаления (деинсталляции) пакета применяется следующая
команда:

```
pip uninstall package
```

## Модуль random

Для имитаций, моделирования и  некоторых вычислительных алгоритмов
часто требуется генерация случайных чисел из некоторого распределения.
Тема генерации случайных чисел весьма сложна и  интересна, но в  данном
случае для нас важен тот факт, что в Python, как и в большинстве других языков программирования, имеется реализация генератора псевдослучайных
чисел (ГПСЧ). Этот алгоритм генерирует последовательность чисел, свойства
которых приближенно соответствуют свойствам «истинных» случайных чисел. Такие последовательности определяются с  помощью исходного состояния seed (семя, посев) и при одном и том же значении seed всегда одинаковы: в этом смысле последовательности являются детерминированными. Это может быть положительным свойством (можно повторно воспроизвести вычисление с  использованием определенной последовательности случайных чисел) или отрицательным свойством (например, в криптографии, когда последовательность случайных чисел должна храниться в секрете). Любой ГПСЧ будет генерировать последовательность, которая в конце концов повторяется, но у качественного генератора весьма длительный период неповторяющихся чисел. Реализованный в Python ГПСЧ – это вихрь Мерсенна (Mersenne Twister),
надежный, хорошо изученный алгоритм с периодом 219937 − 1 (это число, содержащее более 6000 знаков по основанию 10).

### Генерация случайных чисел

Исходный посев (seed) для генератора случайных чисел можно выполнить с помощьюлюбого хешируемого объекта (например,неизменяемого объекта,такого
как целое число). Сразу после импорта модуля выполняется посев с использованием представления текущего системного времени (если операционная система
не предоставляет более эффективный источник случайного посева). Посев для
ГПСЧ можно в любой момент изменить с помощью вызова ```random.seed```.
Основным методом генерации случайных чисел является random.random.Этот
метод генерирует случайное число, выбранное из равномерного распределения
в полуоткрытом интервале ```[0,1)```, т. е. включающем 0, но не включающем 1.

In [1]:
import random
random.random() # "Случайный" посев для ГПСЧ.

0.6323708898476204

In [3]:
random.seed(42) # Посев для ГПСЧ с использованием конкретного числового значения.
random.random()

0.6394267984578837

In [4]:
random.random()

0.025010755222666936

In [6]:
random.seed(42) # Повторный посев с тем же значением, что и ранее.
random.random() # Поэтому последовательность случайных чисел повторяется.

0.6394267984578837

In [7]:
random.random()

0.025010755222666936

При вызове ```random.seed()``` без аргумента выполняется повторный посев для
ГПСЧ со «случайным» значением, которое использовалось модулем ```random``` сразу после импорта.
Для выбора случайного числа с плавающей точкой ```N``` из заданного интервала
```a ≤ N ≤ b``` используется метод ```random.uniform(a,b)```:

In [8]:
random.uniform(-2., 2.)

-0.899882726523523

In [9]:
random.uniform(-2., 2.)

-1.107157047404709

В модуле ```random``` есть несколько методов для произвольного выбора случайных чисел из неравномерных распределений (см. документацию здесь: https://
docs.python.org/3/library/random.html) – это очень важно для случаев, описанных
ниже.
Чтобы вернуть число из нормального распределения со средним значением mu и  стандартным отклонением ```sigma```, используется метод ```random.normalvariate(mu, sigma)```:

In [10]:
random.normalvariate(100, 15)

118.82178896586194

In [11]:
random.normalvariate(100, 15)

97.92911405885782

Для выбора случайного целого числа ```N``` из заданного интервала ```a ≤ N ≤ b``` применяется метод ```random.randint(a,b)```:

In [15]:
random.randint(5, 10)

9

In [17]:
random.randint(5, 10)

5

## Последовательности случайных чисел

Иногда может потребоваться выбор случайного элемента из некоторой последовательности, например из списка. Это можно сделать с помощью метода
```random.choice```:

In [18]:
 seq = [10, 5, 2, 'ni', -3.4]

In [19]:
 random.choice(seq)

-3.4

In [20]:
random.choice(seq)

5

Другой метод ```random.shuffle``` в  случайном порядке перемешивает (переставляет) элементы в последовательности (изменяя саму последовательность):

In [22]:
random.shuffle(seq)
seq

[5, 'ni', 2, 10, -3.4]

Обратите внимание: поскольку случайная перестановка выполняется в самой последовательности, эта последовательность непременно должна быть
изменяемой: например, нельзя перемешивать содержимое кортежей.
Наконец, для произвольного выбора списка с ```k``` неповторяющимися элементами из последовательности или множества (без замены) ```population``` существует метод ```random.sample(population, k)```:

In [23]:
raffle_numbers = range(1, 100001)
winners = random.sample(raffle_numbers , 5)
winners

[91507, 55393, 44598, 36422, 20380]

Итоговый список содержит элементы в порядке их выбора (первый по индексу элемент  – выбранный первым), поэтому можно, например, без предвзятости объявить билет с номером 89 734 выигравшим джекпот, а остальные
четыре номера – «победителями второй категории».

---

**Пример 17**. Парадокс (задача) Монти Холла (Monty Hall problem) – широко известная задача теории вероятностей, излагаемая в форме воображаемого игрового
шоу. Участнику предлагается выбрать одну из трех дверей: за одной находится автомобиль, за двумя другими – козы. Участник выбирает дверь, после чего ведущий
открывает другую дверь, за которой обнаруживается коза. Ведущий заранее знает,
за какой дверью скрыт автомобиль. Затем участнику предлагается изменить выбор,
чтобы открыть другую дверь, или оставить в силе свой первоначальный выбор.
Вопреки здравому смыслу наилучшей стратегией для выигрыша машины
является изменение выбора, как показано в  приведенной ниже имитации
в листинге 5.

**Листинг 5**. Задача Монти Холла

In [31]:
# eg4-montyhall.py
import random
def run_trial(switch_doors, ndoors=3):
    """
    Run a single trial of the Monty Hall problem, with or without switching
    after the game show host reveals a goat behind one of the unchosen doors.
    (switch_doors is True or False). The car is behind door number 1 and the
    game show host knows that. Returns True for a win, otherwise returns False.
    """
    # """
    # Запуск одиночного испытания парадокса (задачи) Монти Холла с изменением или без
    # изменения варианта выбора, после того как ведущий предъявил козу, открыв одну из
    # невыбранных дверей. (Смена выбора двери обозначена как True или False.) Автомобиль
    # находится за дверью номер 1, и ведущий знает это. При выигрыше возвращается значение
    # True,
    # """
    # Выбор случайной двери из доступных ndoors.
    chosen_door = random.randint(1, ndoors)
    if switch_doors:
        # Обнаружена коза.
        revealed_door = 3 if chosen_door==2 else 2
        # Изменение варианта выбора на любую другую дверь, отличную от выбранной
        # изначально, при одной открытой двери, за которой обнаружилась коза.
        available_doors = [dnum for dnum in range(1, ndoors+1) if dnum not in (chosen_door, revealed_door)]
        chosen_door = random.choice(available_doors)
        # Выигрыш, если выбрана дверь номер 1.
    return chosen_door == 1

def run_trials(ntrials , switch_doors , ndoors=3):
    """
    Run ntrials iterations of the Monty Hall problem with ndoors doors, with
    and without switching (switch_doors = True or False). Returns the number
    of trials which resulted in winning the car by picking door number 1.
    """
    # """
    # Запуск ntrials итераций задачи Монти Холла с ndoors дверьми с изменением или без
    # изменения варианта выбора (switch_doors = True или False). Возвращает количество
    # испытаний, завершившихся выигрышем автомобиля при выборе двери номер 1.
    # """
    nwins = 0
    for i in range(ntrials):
        if run_trial(switch_doors, ndoors):
            nwins += 1
    return nwins

ndoors, ntrials = 3, 10000
nwins_without_switch = run_trials(ntrials, False, ndoors)
nwins_with_switch = run_trials(ntrials, True, ndoors)
print('Monty Hall Problem with {} doors'.format(ndoors))
print('Proportion of wins without switching: {:.4f}'.format(nwins_without_switch/ntrials))
print('Proportion of wins with switching: {:.4f}'.format(nwins_with_switch/ntrials))

Monty Hall Problem with 3 doors
Proportion of wins without switching: 0.3242
Proportion of wins with switching: 0.6561


Без нарушения общности условий задачи можно поместить автомобиль
за дверью номер  1, оставив для участника возможность выбора любой
двери случайным образом.
Чтобы сделать код чуть более интересным, было введено переменное количество дверей в имитации этой задачи (но при этом остается только один
автомобиль).

## Пакет urllib

Пакет ```urllib``` в Python 3 – это набор модулей для открытия и извлечения содержимого (контента), на который указывают URL (Uniform Resource Locators),
обычно в форме веб-адресов, доступных по протоколу HTTP (HyperText Transfer Protocol), HTTPS или FTP (File Transfer Protocol). В этом разделе предлагается краткая вводная инструкция по использованию пакета ```urllib```.

### Открытие и чтение URL

Для получения содержимого по URL с использованием протокола HTTP сначала необходимо подготовить HTTP-запрос (HTTP request), создав объект Request. Например:

In [32]:
import urllib.request
req = urllib.request.Request('https://www.wikipedia.org')

Объект ```Request``` позволяет передавать данные (используя команду GET или
POST) и другую информацию о запросе (метаданные, передаваемые в заголовках HTTP, – см. ниже). Но для простого запроса можно просто открыть URL напрямую как объект, подобный файлу, с помощью метода ```urlopen()```:

Правильной практической методикой является перехват двух основных типов исключений, которые генерируются при выполнении этой инструкции.
Первый тип ```URLError``` генерируется, если сервер не  существует или если отсутствует сетевое соединение. Второй тип ```HTTPError``` генерируется, если сервер
возвращает код ошибки (например, 404: Page Not Found).Эти исключения определяются в модуле ```urllib.error```.

Предполагая, что метод ```urlopen()``` отработал успешно, часто не требуются
какие-либо дополнительные действия, кроме простого чтения контента из
объекта ответа:

Контент будет возвращен как строка байтов (bytestring). Для перекодировки
ее в строку Python (Unicode) необходимо знать, как именно закодирована исходная строка. Правильный ресурс включает определение используемого набора символов в атрибут Content-Type HTTP-заголовка. Его можно применять
следующим образом:

Здесь html становится декодированной Unicode-строкой Python. Если в возвращаемых заголовках не  указан используемый набор символов, то можно попытаться сделать вероятное предположение (например, установить charset='utf-8').

## Запросы GET и POST

Часто необходимо вместе с URL передавать данные для извлечения контента
с сервера. Например, при заполнении HTML-формы на веб-странице значения
для соответствующих полей должны быть переведены в требуемую кодировку
и переданы на сервер в соответствии с протоколами GET или POST.
Модуль ```urllib.parse``` позволяет кодировать данные из словаря Python в форму, пригодную для передачи на веб-сервер. Ниже приведен пример из «Википедии» для API с использованием запроса GET:

Для выполнения запроса POST вместо добавления перекодированных данных в строку ```<url>?``` эти данные напрямую передаются в конструктор ```Request```:

## Модуль datetime

Модуль ```datetime``` предоставляет классы для работы с датамии временем.Существует множество тонкостей, связанных с обработкой таких данных (временные́
пояса и зоны, различные календари, переход на летнее и зимнее время и т. д.),
поэтому полная документация по модулю datetime доступна в онлайн-режиме
(https://docs.python.org/3/library/datetime.html). В этом разделе представлен краткий обзор наиболее часто встречающихся вариантов использования.

**Даты**
Объект ```datetime.date``` представляет конкретный день, месяц и  год в  идеализированном календаре (предполагается, что используемый в  настоящее
время григорианский календарь применяется для всех дат в  прошлом и  в
будущем). Для создания объекта ```date``` необходимо передать в  явной форме
числовые значения, соответствующие году, месяцу и дню, или вызвать конструктор ```date.today```:

In [37]:
from datetime import date
birthday = date(2004, 11, 5) # OK
notadate = date(2005, 2, 29) # Ошибка: 2005 год не был високосным.

ValueError: day is out of range for month

In [38]:
today = date.today()
today

datetime.date(2022, 9, 24)

Допустимыми являются даты в интервале от 1/1/1 до 31/12/9999. Парсинг дат
с преобразованием в строки и наоборот также поддерживается (см. strptime
и strftime).

Ниже показано применение некоторых полезных методов объекта ```date```:

In [39]:
birthday.isoformat() # Формат даты по стандарту ISO 8601: YYYY -MM-DD.

'2004-11-05'

In [40]:
 birthday.weekday() # Понедельник = 0, Вторник = 1, ..., Воскресенье = 6.

4

In [41]:
birthday.isoweekday() # Понедельник = 1, Вторник = 2, ..., Воскресенье = 7.

5

In [42]:
birthday.ctime() # Вывод времени по стандарту C.

'Fri Nov  5 00:00:00 2004'

Кроме того, объекты ```date``` можно сравнивать (в хронологическом порядке):

In [43]:
birthday < today

True

In [44]:
today == birthday

False

## Время

Объект ```datetime.time``` представляет (местное) время суток с  округлением до
ближайшей микросекунды. Для создания объекта ```time``` необходимо передать
числовые значения часов, минут, секунд и  микросекунд (в  указанном здесь
порядке, для пропущенных значений по умолчанию устанавливается нулевое
значение).

In [45]:
from datetime import time
lunchtime = time(hour=13, minute=30)
lunchtime

datetime.time(13, 30)

In [46]:
lunchtime.isoformat() # Формат времени по стандарту ISO 8601: HH:MM:SS, если нет мс.

'13:30:00'

In [48]:
precise_time = time(4,46,36,501982)
precise_time.isoformat() # Формат времени по стандарту ISO 8601: HH:MM:SS.mmmmmm

'04:46:36.501982'

In [49]:
witching_hour = time(24) # Ошибка: значение часа должно находиться в интервале 0 <=

ValueError: hour must be in 0..23

### Объект datetime

Объект ```datetime.datetime``` содержит информацию из обоих объектов ```date```
и  ```time```: year, month, day, hour, minute, second, microsecond. Для этого объекта
возможна передача значений для всех перечисленных выше атрибутов в конструктор ```datetime```, а также доступны методы ```today``` (возвращает текущую дату)
и ```now``` (возвращает текущую дату и время):

In [50]:
from datetime import datetime # Весьма опасная операция импорта.
now = datetime.now()
now

datetime.datetime(2022, 9, 24, 10, 7, 22, 527462)

In [51]:
now.isoformat()

'2022-09-24T10:07:22.527462'

In [52]:
now.ctime()

'Sat Sep 24 10:07:22 2022'

## Форматирование даты и времени

Объекты ```date```, ```time``` и ```datetime``` поддерживают метод ```strftime``` для вывода своих значений в виде строки, отформатированной в соответствии с настройками синтаксиса с  использованием спецификаторов формата, перечисленных
в табл. 7.

**Таблица 7**. Спецификаторы формата для методов ```strftime``` и ```strptime```. Обратите внимание:
многие спецификаторы зависят от локали (например, в системе с немецким языком %A будет
генерировать дни недели Sonntag, Montag и т. д.)

|Спецификатор|Описание|
|:-----------|:-------|
|%a|Сокращенное название дня недели (Sun, Mon и т. д.)|
|%A|Полное название дня недели (Sunday, Monday и т. д.)|
|%w|Номер дня недели (0 = воскресенье, 1 = понедельник, …, 6 = суббота)|
|%d|Дополненное нулем число месяца: 01, 02, 03, …, 31|
|%b|Сокращенное название месяца (Jan, Feb и т. д.)|
|%B|Полное название месяца (January, February и т. д.)|
|%m|Дополненный нулем номер месяца: 01, 02, …, 12|
|%y|Год без века (из двух цифр, с дополнением нулем): 01, 02, …, 99|
|%Y|Год с веком (из четырех цифр, с дополнением нулями): 0001, 0002, …, 9999|
|%H|Часы в 24-часовом формате с дополнением нулем: 00, 01, …, 23|
|%I|Часы в 12-часовом формате с дополнением нулем: 00, 01, …, 12|
|%p|AM или PM (или равнозначные обозначения в конкретной локали)|
|%M|Минуты (из двух цифр, с дополнением нулем): 00, 01, …, 59|
|%S|Секунды (из двух цифр, с дополнением нулем): 00, 01, …, 59|
|%f |Микросекунды (из шести цифр, с дополнением нулем): 000000, 000001, …, 999999|
|%%|Знак % как литерал|

In [53]:
birthday.strftime('%A, %d %B %Y')

'Friday, 05 November 2004'

In [54]:
 now.strftime('%I:%M:%S on %d/%m/%y')

'10:07:22 on 24/09/22'

Для выполнения обратного процесса, т. е. для преобразования строки в объект ```datetime```, применяется метод ```strptime```:

In [55]:
launch_time = datetime.strptime('09:32:00 July 16, 1969', '%H:%M:%S %B %d, %Y')
print(launch_time)    

1969-07-16 09:32:00


In [56]:
print(launch_time.strftime('%I:%M %p on %A, %d %b %Y'))

09:32 AM on Wednesday, 16 Jul 1969
