# Стандартная библиотека

Стандартная библиотека Python представляет собой множество пакетов и модулей, доступных для использования любой программе на языке Python. Эта библиотека является такой же неотъемлимой частью языка Python, как и его интерпретатор, о чем свидетельствует тот факт, что она полностью описана в самом стандарте языка.

В этой лекции мы рассмотрим несколько важнейших модулей стандартной библиотеки, однако это будет лишь небольшая ее часть. Практически любую задачу на языке Python можно легко решить средствами, предоставляемыми стандартной библиотекой, поэтому когда вам понадобится какая-то функция (или класс), не спешите самостоятельно ее реализовывать - для начала лучше поищите аналог в документации [стандартной библиотеки](https://docs.python.org/3/library/index.html).

Стоит также отметить, что в сети можно найти огромное количество других библиотек, не включенных в состав стандартной, которые можно легко добавить к своей конфигурации Python и использовать в программах.

## Содержание лекции

* [Введение](#Введение)
* [Модуль builtins](#Модуль-builtins)
* [Модули math и random](#Модули-math-и-random)
* [Модуль datetime](#Модуль-datetime)
* [Модуль threading](#Модуль-threading)
* [Задание](#Задание)

## Введение

Перед тем, как начать изучение стандратной библиотеки, хотелось бы рассказать о двух функциях, которые очень помогут в этом деле. С одной мы уже встречались - речь идет о функции `dir`, возвращающей все имена из указанного пространства имен (например, из модуля или класса). Вторая называется `help`, и используется для того, чтобы получить справочную информацию, связанную с некоторым именем.

Вместе эти функции неплохо заменяют традиционную документацию: достаточно с помощью `dir` узнать, какие функции и классы есть в модуле, а затем с помощью `help` получить информацию о том, как их использовать. Пусть, например, нам нужна функция, которая вычисляет логарифм. Логично предположить, что она может быть в модуле `math` (подробнее о нем чуть ниже). Выяснить это можно с помощью функции `dir`:

In [1]:
import math
print(dir(math))

['__doc__', '__loader__', '__name__', '__package__', '__spec__', 'acos', 'acosh', 'asin', 'asinh', 'atan', 'atan2', 'atanh', 'ceil', 'copysign', 'cos', 'cosh', 'degrees', 'e', 'erf', 'erfc', 'exp', 'expm1', 'fabs', 'factorial', 'floor', 'fmod', 'frexp', 'fsum', 'gamma', 'gcd', 'hypot', 'inf', 'isclose', 'isfinite', 'isinf', 'isnan', 'ldexp', 'lgamma', 'log', 'log10', 'log1p', 'log2', 'modf', 'nan', 'pi', 'pow', 'radians', 'sin', 'sinh', 'sqrt', 'tan', 'tanh', 'tau', 'trunc']


Судя по имени, функция, которая нам нужна - это `log`. Теперь осталось прочитать о том, как ее правильно использовать:

In [4]:
help(math.log)

Help on built-in function log in module math:

log(...)
    log(x[, base])
    
    Return the logarithm of x to the given base.
    If the base not specified, returns the natural logarithm (base e) of x.



В этой лекции при описании функций и методов мы используем следующее соглашение:

1. Все обязательные параметры функций и методов указываются всегда.
2. Необязательные параметры выделяются курсивом и для них указывается значение по умолчанию.
3. Некоторые необязательные параметры могут быть опущены, чтобы описание функции оставалось коротким. Об этом сигнализирует последовательность "..." в списке параметров. Для получения полной информации обращайтесь к справочному руководству или функции `help`.

## Модуль builtins

Этот модуль предоставляет базовую функциональность всем программам на языке Python. Он отличается от всех остальных тем, что импортируется автоматически самим интерпретатором при старте программы, при этом все имена из него попадают во встроенное пространство имен, а значит к ним можно обращаться без указания имени модуля.

В следующей таблице собраны функции для различных преобразований значение одного типа к значениям другого:

| <div align="left">Функция</div> | Описание |
|---------------------------------|----------|
| <div align="left"><samp>bool(<i>x</i>)</samp></div>                                                                            | Создает из <samp>x</samp> значение с типом <samp>bool</samp>; если <samp>x</samp> не задан, возвращает <samp>False</samp>    |
| <div align="left"><samp>int(<i>x</i>)</samp></div>                                                                            | Создает из числа или строки <samp>x</samp> значение с типом <samp>int</samp>; если <samp>x</samp> не задан, возвращает 0     |
| <div align="left"><samp>float(<i>x</i>)</samp></div>                                                                            | Создает из числа или строки <samp>x</samp> значение с типом <samp>float</samp>; если <samp>x</samp> не задан, возвращает 0.0 |
| <div align="left"><samp>str(<i>x</i>)</samp></div>                                                                            | Возвращает строковую версию объекта <samp>x</samp>; если <samp>x</samp> не задан, возвращает пустую строку                   |
| <div align="left"><samp>bin(x)</samp></div>                                                                                   | Преобразует целое числое <samp>x</samp> в строку, содержащую его двоичное представление                                      |
| <div align="left"><samp>oct(x)</samp></div>                                                                                   | Преобразует целое числое <samp>x</samp> в строку, содержащую его восьмеричное представление                                  |
| <div align="left"><samp>hex(x)</samp></div>                                                                                   | Преобразует целое числое <samp>x</samp> в строку, содержащую его шестнадцатеричное представление                             |
| <div align="left"><samp>chr(x)</samp></div>                                                                                   | Возвращает строку с символом, имеющим позицию <samp>x</samp> в таблице Unicode                                               |
| <div align="left"><samp>ord(x)</samp></div>                                                                                   | Возвращает позицию в таблице Unicode для символа <samp>x</samp>                                                              |

In [17]:
num = 10
s = '100'

print(str(num))
print(int(s))
print(bin(num))
print(chr(65))

10
100
0b1010
A


В модуле `builtins` существует специальная функция, с помощью которой можно попросить пользователя ввести какие-нибудь данные:

| <div align="left">Функция</div> | Описание |
|---------------------------------|----------|
| <div align="left"><samp>input(<i>prompt=''</i>, ...)</samp></div>                                                             | Возвращает строку c данными, введенными пользователем (если <samp>prompt</samp> не пустой, оторбражает его рядом с полем для ввода)|

In [1]:
name = input('Enter you name: ')
print('Hello, {}'.format(name))

Enter you name: Bob
Hello, Bob


Функции для работы с коллекциями мы уже рассматривали, но для полноты перечислим их здесь еще раз:

| <div align="left">Функция</div> | Описание |
|---------------------------------|----------|
| <div align="left"><samp>len(col)</samp></div>                                                                                 | Возвращает количество элементов в коллекции                                                                                  |
| <div align="left"><samp>all(col)</samp></div>                                                                                 | Возвращает <samp>True</samp>, если все элементы коллекции в логическом контексте оцениваются как <samp>True</samp>           |
| <div align="left"><samp>any(col)</samp></div>                                                                                 | Возвращает <samp>True</samp>, если хотя бы один элемент коллекции в логическом контексте оцениваeтся как <samp>True</samp>   | 
| <div align="left"><samp>max(col, ...)</samp></div>                                                                            | Возвращает наибольший элемент в коллекции                                                                                    |
| <div align="left"><samp>min(col, ...)</samp></div>                                                                            | Возвращает наименьший элемент в коллекции                                                                                    |
| <div align="left"><samp>sum(col, <i>start=0</i>)</samp></div>                                                                  | Возвращает сумму элементов коллекции плюс элемент <samp>start</samp>                                                         |
| <div align="left"><samp>sorted(col, <i>key</i>=None, <i>reverse=False</i>)</samp></div>                                       | Возвращает список отсортированных в прямом или обратном (<samp>reverse=True</samp>) порядке элементов коллекции              |
| <div align="left"><samp>range(<i>start=0</i>, stop, <i>step=1</i>)</samp></div>                                               | Возвращает итератор на последовательность целых числе от <samp>start</samp> до <samp>stop</samp> с шагом <samp>step</samp>   |

То же самое касается и функций для работы с иерархией наследования:

| <div align="left">Функция</div> | Описание |
|---------------------------------|----------|
| <div align="left"><samp>isinstance(object, class)</samp></div>                                                                  | Возвращает <samp>True</samp>, если <samp>object</samp> является экземпляром <samp>class</samp>                               |
| <div align="left"><samp>issubclass(subclass, class)</samp></div>                                                                | Возвращает <samp>True</samp>, если <samp>subclass</samp> является подклассом <samp>class</samp>                              |
| <div align="left"><samp>super(...)</samp></div>                                                                               | Возвращает специальный объект, с помощью которого можно вызывать в наследнике методы базового класса                         |

Следующие функции могут использоваться для выполнения кода на языке Python:

| <div align="left">Функция</div> | Описание |
|---------------------------------|----------|
| <div align="left"><samp>eval(expression, ...)</samp></div>                                                                     | Выполняет выражение Python, записанное в строке <samp>expression</samp>                                                      |
| <div align="left"><samp>exec(code_block, ...)</samp></div>                                                                    | Выполняет произвольный блок кода Python, записанный в строке <samp>code_block</samp>                                         |

Функция `eval` позволяет выполнить простые выражение языка Python, записанные как обычная строка:

In [23]:
x = 7
y = 5
eval('print((x + y) * (x - y))')

24


Функция `exec` обладает гораздо большими возможностями. По сути, с ее помощью можно выполнить текст любой корректной программы на языке Python:

In [27]:
program = '''
def get_roots(a, b, c):
       d = b**2 - 4*a*c 
       x1 = (-b + d**0.5) / (2*a)
       x2 = (-b - d**0.5) / (2*a)
       return x1, x2
    
print(get_roots(1, -5, 6))
'''

exec(program)

(3.0, 2.0)


В рассмотренном примере программа, записанная в строке, создает функцию `get_roots` для вычисление корней квадратного уравнения и затем для вызывает ее. В функции `exec` это программа выполняется так, словно была написана в нашем исходном коде обычным образом, а это значит, что теперь в пространстве имен основной программы есть функция `get_roots` и можно писать:

In [29]:
print(get_roots(1, -3, -10))

(5.0, -2.0)


В заключение расскажем еще о нескольих полезных функциях стандартной библиотеки:о том, как происходит работа с файлами в Python. Для этого в модуле `builtins` есть следующая функция:

| <div align="left">Функция</div> | Описание |
|---------------------------------|----------|
| <div align="left"><samp>open(filename, <i>mode='r'</i>, ...)</samp></div>                                                      | Открывает файл с именем <samp>filename</samp> в режиме <samp>mode</samp> ('r, w, a' - чтение, запись, добавление в конец).       <br/> Возвращает объект, который будет использоваться для работы с файлом | 

1. В режиме чтения **r** информацию можно только прочитать из файла, записать в него ничего нельзя. Если указанный файл не существует, интерпретатор генерирует исключение `FileNotFoundError`.
2. В режиме записи **w** в файл можно только записать данные. Если указанный файл не существует, то он создается. Если же существует, то немедленно полностью очищается
3. Режим добавления **a** отличается от режима записи только то, что в случае добавления, файл не очищается при открытии, а все записываемые данные вставляются в его конец.

В первом примере попробуем открыть файл и вывести информацию из него на экран. Для начала создадим в нашей операционной системе простой текстовый файл *text.txt*, в который поместим несоколько строк.

Следующим этапом является открытие его в режиме чтения. Чтобы не возникло ошибки `FileNotFoundError`, внимательно вводить путь к файлу `text.txt` (если этот файл лежит в той же папке, что и ваш ноутбук файл, то полный путь в нему писать не нужно).

In [21]:
file = open('test.txt')
print(type(file))

<class '_io.TextIOWrapper'>


Объект, который возвращает функция `open` в нашем случае, имеет тип `TextIOBase` (определен в модуле `io`, который мы не будем рассматривать) и является итерируемым. Это означает, что его можно использовать в цикле `for ... in`, причем итерация будет проходить по строкам файла:

In [22]:
for line in file:
    print(line)

My uncle — high ideals inspire him;

but when past joking he fell sick,

he really forced one to admire him —

and never played a shrewder trick.


После того, как работа с файлом завершена, его нужно закрыть. Строго говоря, вручную это делать не обязательно, потому что перед тем, как быть удаленным сборщиком мусора, объект `file` сам закроет файл. Мы однако рекомендуем явно вызывать метод `close`, потому что сборщик мусора может достаточно долго не удалять объект, следовательно все это время файл будет оставаться открытым, а это потребляет системные ресурсы и мешает использовать файл другим программам:

In [26]:
file.close()
# после того, как файл закрыт, к нему больше нельзя обращаться
# или будет сгенерировано исключение!

Записать информацию в файл еще проще:

In [27]:
file = open('test2.txt', 'w')      # открываем в режиме записи
file.write('this is first line\n') # '\n' означает перевод строки
file.write('this is second line')
file.close()

В классе `TextIOBase` существует еще много других методов, которые позволяют решать разный задачи, однако мы предлагаем вам самим познакомиться с ними.

## Модули math и random

Модуль `math` предоставляет различные математические функции и константы.

| <div align="left">Функция</div> | Описание |
|---------------------------------|----------|
| <div align="left"><samp>ceil(x)</samp></div>                                                                                  | Возвращает наименьшее целое число большее или равное числу <samp>x</samp>                                                    |
| <div align="left"><samp>floor(x)</samp></div>                                                                                  | Возвращает наибольшее целое число меньшее или равное числу <samp>x</samp>                                                    |
| <div align="left"><samp>gcd(x, y)</samp></div>                                                                                  | Возвращает наибольший общий делитель целых чисел <samp>x</samp> и <samp>y</samp>                                             |
| <div align="left"><samp>exp(x)</samp></div>                                                                                   | Возвращает экспоненту в степени <samp>x</samp>                                                                               |
| <div align="left"><samp>log(x, <i>base=e</i>)</samp></div>                                                                     | Возвращает логарифм числа <samp>x</samp> по основанию <samp>base</samp>                                                      |
| <div align="left"><samp>pow(x, y)</samp></div>                                                                                | Возвращает число <samp>x</samp>, возведенное в степень <samp>y</samp>                                                        |
| <div align="left"><samp>sqrt(x)</samp></div>                                                                                   | Возвращает квадратный корень из <samp>x</samp>                                                                               |
| <div align="left"><samp>cos(x)</samp></div>                                                                                   | Возвращает косинус для угла в <samp>x</samp> радиан                                                                          |
| <div align="left"><samp>sin(x)</samp></div>                                                                                   | Возвращает синус для угла в <samp>x</samp> радиан                                                                            |
| <div align="left"><samp>tan(x)</samp></div>                                                                                   | Возвращает тангенс для угла в <samp>x</samp> радиан                                                                          |
| <div align="left"><samp>acos(x)</samp></div>                                                                                   | Возвращает арккосинус числа <samp>x</samp> в радианах                                                                        |
| <div align="left"><samp>asin(x)</samp></div>                                                                                   | Возвращает арксинус числа <samp>x</samp> в радианах                                                                          |
| <div align="left"><samp>atan(x)</samp></div>                                                                                   | Возвращает арктангенс числа <samp>x</samp> в радианах                                                                        |
| <div align="left"><samp>degrees(x)</samp></div>                                                                                | Преобразует угол <samp>x</samp> из радиан в градусы                                                                          |
| <div align="left"><samp>radians(x)</samp></div>                                                                                | Преобразует угол <samp>x</samp> из градусов в радианы                                                                        |

Среди констант, определенных в модуле `math` есть $\pi$ (`math.pi`) и $e$ (`math.e`).

Рассмотрим небольшой пример использования функций из модуля `math`:

In [36]:
import math
x = 3.77

# исторически сложилось, что функция, которая выполняет обычное округление
# в соответствии с правилами арифметики определена в модуле builtins
print(math.ceil(x), math.floor(x), round(x))

angle = 45 # в градусах
print(math.cos(math.radians(45)))

print(math.pow(3.5, 1.23))
print(math.log(100, 10))

4 3 4
0.7071067811865476
4.668783061171329
2.0


Модуль `random` предоставляет функции для генерации псевдослучайных величин с различными распределениями. Пседослучайность означает, что на самом деле внутри функций модуля используется некоторая очень сложная, но тем не менее, вполне детерменированная математическая формула для получения следующего "случайного" значения. По этой причине, функции из модуля `random` не подходят для решения задач, связанных с шифрованием данных, но вполне могут быть использованы для моделирование каких-либо случайных событий или процессов.

| <div align="left">Функция</div> | Описание |
|---------------------------------|----------|
| <div align="left"><samp>seed(<i>data=None</i>, ...)</samp></div>                                                                | Инициализирует с помощью <samp>data</samp> начальное значение, с которого начнется генерация случайных чисел                 |
| <div align="left"><samp>choice(seq)</samp></div>                                                                              | Возвращает случайный элемент из последовательности                                                                           |
| <div align="left"><samp>shuffle(seq, ...)</samp></div>                                                                          | Перемешивает случайным образом элементы последовательности                                                                   |
| <div align="left"><samp>random()</samp></div>                                                                                 | Возвращает следующее случайное число из диапазона &#91;0.0, 1.0)                                                             |
| <div align="left"><samp>uniform(a, b)</samp></div>                                                                              | Возвращает случайное число, распределенное равномерно в интервале &#91;a, b]                                                 |
| <div align="left"><samp>expovariate(lambda)</samp></div>                                                                        | Возвращает случайное число, распределенное по экспоненциальному закону с параметром <samp>lambda</samp>                      |
| <div align="left"><samp>normalvariate(mu, sigma)</samp></div>                                                                  | Возвращает случайное число, распределенное по нормальному закону с параметрами <samp>mu</samp> и <samp>sigma</samp>          |
| <div align="left"><samp>randint(a, b)</samp></div>                                                                              | Возвращает целое случайное число из диапазона &#91;a, b]                                                                     |

Немного поясним функцию `seed`. Как уже было сказано, все функции модуля `random` генерируют псевдослучайные числа, высчитывая каждое следующее из предыдущего по сложной формуле. Функция `seed` задает начальное значение, из которого потом будут получаться все "случайные" числа. Это означает, что для одного и того же аргумента `seed` будет возвращаться одна и та же последовательность чисел:

In [42]:
import random

random.seed('test')
print(random.random(), random.random(), random.random())

random.seed('test')
print(random.random(), random.random(), random.random())

0.6555960613392863 0.7346312914910028 0.25037423249421464
0.6555960613392863 0.7346312914910028 0.25037423249421464


По этой причине функцию `seed` как правило вызывают без аргументов - в этом случае используется текущее время, которое постоянно меняется, и следовательно с каждым запуском программы последовательность "случайных" числе будет другая.

## Модуль datetime

Этот модуль содержит реализацию нескольких типов для работы с датой и временем:

1. Класс `date` представляет дату и имеет такие атрибуты, как `year`, `month` и `day`.
2. Класс `time` представляет время и имеет такие атрибуты, как `hour`, `minute`, `second`, `microsecond`.
3. Класс `datetime` представляет дату и время, объединяя предыдущие два типа и их атрибуты.
4. Класс `timedelta` представляют разницу между двумя моментами времени и имеет такие атрибуты, как `days`, `seconds` и `microseconds`.

В классе `datetime` существует несколько методов, которые можно вызывать без объекта (они определены с помощью декоратора [`classmethod`](08_Classes_And_Exceptions.ipynb#classmethod). Они реализуют разные способы создания объекта класса `datetime`:

| <div align="left">Метод</div>   | Описание |
|---------------------------------|----------|
| <div align="left"><samp>today()</samp></div>                                                                                  | Возвращает объект класс <samp>datetime</samp> для текущего времени                                                           |
| <div align="left"><samp>combine(date, time)</samp></div>                                                                        | Возвращает объекта класса <samp>datetime</samp>, созданный из объектов классов <samp>date</samp> и <samp>time</samp>         |
| <div align="left"><samp>fromtimestamp(timestamp, ...)</samp></div>                                                              | Возвращает объект класса <samp>datetime</samp>, созданный из <samp>timestamp</samp> (см. далее)                              |
| <div align="left"><samp>strptime(datetime_str, format_spec)</samp></div>                                                        | Возвращает объект класса <samp>datetime</samp>, созданный из строки <samp>datetime_str</samp>                                |

Метод `fromtimestamp` создает объект `datetime` из таймстэмпа (этот термин в русском языке употребляется именно так, если вы скажете "временная отметка", вас не поймут), представляющего собой количество секунд, прошедших с начала времен. Это начало времен может отличаться для разных операционных систем, но в большинстве случаев в качестве него используется 01/01/1970 00:00:00 по Гринвичу. Таймстампы являются удобным вариантом хранения информации о дате и времени, и часто используеются в операционных системах, базах данных и т.д.

Метод `strptime` принимает в качестве параметра строку `format_spec`, которая описывает, как именно компоненты даты и времени записаны в `datetime_str`. Для этого в `format_spec` можно использовать следующие заполнители: *%Y* (год, 4 знака), *%y* (год, 2 знака), *%m* (месяц), *%A* (день недели), *%d* (день), *%H* (час),  *%M* (минута), *%S* (секунда) и другие.

In [20]:
from datetime import datetime
datetime_str = '01.02.17 23:59:59'
dt = datetime.strptime(datetime_str, '%d.%m.%y %H:%M:%S')
print('{}.{}.{} {}:{}:{}'.format(\
      dt.year, dt.month, dt.day, dt.hour, dt.minute, dt.second))

2017.2.1 23:59:59


Перечислим некоторые методы экземпляров класса `datetime`:

| <div align="left">Метод</div>   | Описание |
|---------------------------------|----------|
| <div align="left"><samp>date()</samp></div>                                                                                   | Возвращает объекта класса <samp>date</samp> для представления даты                                                           |
| <div align="left"><samp>time()</samp></div>                                                                                   | Возвращает объекта класса <samp>time</samp> для представления времени                                                        |
| <div align="left"><samp>timestamp()</samp></div>                                                                              | Возвращает таймстэмп, соотвествующий объекту                                                                                 |
| <div align="left"><samp>weekday()</samp></div>                                                                                | Возвращает число, обозначающее день недели (0 - понедельник, 1 - вторник, ...)                                               |
| <div align="left"><samp>strftime(format_spec)</samp></div>                                                                    | Возвращает строковое представление даты, сформированное в соотвествии с <samp>format_spec</samp>                             |

In [21]:
from datetime import date
dt = datetime.today()
print(dt.strftime('Today is %A, %d. Current time is %H:%M:%S'))

Today is Monday, 02. Current time is 15:15:39


Класс `timedelta` дополняет функциональность `datetime`, предоставляя возможность удобно изменять объекты последнего, а также вычислять разницу между произвольными моментами времени. Объекты класса `timedelta` имеют атрибуты `days`, `seconds` и `microseconds`. Его конструктор может принимать любой набор из следующих именованных аргументов:  `days`, `seconds`, `microseconds`, `milliseconds`, `minutes`, `hours` и `weeks`.

In [33]:
from datetime import datetime, timedelta
delta = timedelta(days=35, minutes=51)
dt = datetime.today()

# какое время будет через 35 дней и 51 минуту?

dt += delta 
print(dt)

# сколько секунд между 21-05-1984 и сегодняшним днем?

dt1 = datetime.strptime('21-05-1984','%d-%m-%Y')
dt2 = datetime.today()

delta = dt2 - dt1
seconds_in_day = 86400
print(delta.days * 86400 + delta.seconds)

2018-08-06 16:33:21.986437
1076600541


В заключение этого раздела скажем, что мы не стали рассматривать методы классов `date` и `time`, потому что они повторяют те, которые есть в классе `datetime`.

## Модуль threading

Этот модуль позволяет создавать программы, способные в один момент времени параллельно выполнять несколько задач. Перед тем, как мы приступим к изучению функции и типов, предоставляемых им, нам нужно дать несколько определений.

Операционной системой называют совокупность множества программ, предназначенных для управления ресурсами компьютера и выполняющимися пользовательскими программами, которые называются **процессами**. Пока процесс выполняется, ОС следит за ним и отслеживает все его обращения к общим ресурсам компьютера (таким как оперативная памяти, жесткий диск, сетевая карта и т.д.). Цели, которые достигаются благодаря этому, следующие:

* Изоляция одного процесса от всех остальных. Нужно для того, чтобы процессы не могли случайно или намеренно повредить работе друг друга (например, изменив участок памяти, используемый другим процессом).
* Контроль ресурсов позволяет ОС точно знать, какие из них используются каждым процессом. Это позволяет обнаруживать "подозрительные" процессы (потребляющие слишком много ресурсов), а также гарантировать освобождение занятых ресурсов, когда процесс завершается (обычным образом или же из-за возникшего исключения)

Каждый процесс имеет один или несколько **потоков** (англ. *thread*), которые явлются наименьшей единицей обработки, выполнение которой ОС может поручить центральному процессору. Возможно у вас возникнет вопрос, как операционная система позволяет одновременно работать нескольким программам, многие из которых (особенно браузеры), создают массу потоков. Даже если считать, что у нас в компьютере установлен процессор с несколькими ядрами, каждое из которых работает параллельно, этого все равно не хватит - потоков будет намного больше.

![Потоки](./images/10/threads.png)

Ответ заключается в том, что в параллельность в современных операционных системах (Windows, Linux, MacOS) достигается с помощью алгоритма **вытесняющей многозадачности**. Суть его в том, что ОС предоставляет каждому потоку небольшой квант времени (несколько миллисекунд), в течение которого он выполняется процессором. Когда это время заканчивается, ОС заменяет выполняющийся поток на другой.

Современные процессоры уже вплотную приблизились к максимально возможной производительности, поэтому все большее значение для быстродействия программ приобретает грамотное использование параллельных вычислений. Когда запускается программа Python, для нее создается процесс и один поток, в котором будет выполняться ее исходный код. С помощью модуля `threading` можно запустить дополнительные потоки, и выполнить некоторые части исходного кода параллельно с основной программой.

Самым важным типом данных, предоставляемым модулем `threading` является класс `Thread`, имеющий следующие методы:

| <div align="left">Метод</div>   | Описание |
|---------------------------------|----------|
| <div align="left"><samp>&#95;&#95;init&#95;&#95;(<i>group=None</i>, <i>target=None</i>, ...)</samp></div>                      | Конструктор класса, в параметре <samp>target</samp> нужно передать <a                                                           href='08_Classes_And_Exceptions.ipynb#callable'>вызываемый</a> объект                                                        |
| <div align="left"><samp>start()</samp></div>                                                                                   | Запускает поток, а затем начинает выполнять в нем метод &#95;&#95;call&#95;&#95; вызываемого объекта <samp>target</samp>     |
| <div align="left"><samp>join()</samp></div>                                                                                   | Ждет завершения потока, которое происходит тогда, когда метод &#95;&#95;call&#95;&#95;<br/> вызываемого объекта                 <samp>target</samp>  выполняет инструкцию <samp>return</samp>                                                                |

В следующем пример мы используем функцию `sleep` из модуля `time`, которая заставляет поток "уснуть" на указанное время. Поскольку в этом модуле больше нет особо интересных функций, мы его не будем рассматривать отдельно.

In [52]:
import time
import datetime
import threading

class ThreadOperation:
    def __call__(self): # этот метод будет выполняться в отдельном потоке!
        for i in range(5):
            current_time = datetime.datetime.today().time()
            
            print('')
            print('second thread: {} -- {}'.format(\
                  current_time.strftime('%H:%M:%S'), i))
            
            time.sleep(5) # спим 5 секунд


# основной поток

second_thread = threading.Thread(target=ThreadOperation())
second_thread.start()

for i in range(5):
    current_time = datetime.datetime.today().time()
    
    print('')
    print('main thread: {} -- {}'.format(\
          current_time.strftime('%H:%M:%S'), i))
    
    time.sleep(3) # спим 3 секунды

# нужно ОБЯЗАТЕЛЬНО дожидаться завершения дополнительных потоков,
# иначе при завершении основной программы они будут остановлены
# операционной системой, и могут не успеть выполнить свою работу
second_thread.join()

# на эту строку кода мы перейдем после того, как завершится second_thread
print('')
print('all done')


second thread: 20:44:25 -- 0

main thread: 20:44:25 -- 0

main thread: 20:44:28 -- 1

second thread: 20:44:30 -- 1

main thread: 20:44:31 -- 2

main thread: 20:44:34 -- 3

second thread: 20:44:35 -- 2

main thread: 20:44:37 -- 4

second thread: 20:44:40 -- 3

second thread: 20:44:45 -- 4

all done


При разработке многопоточных программ особое внимание нужно уделять защите общих для нескольких потоков данных. Если ни один из потоков не изменяет эти общие данные, то проблем никаких нет. Но если хотя бы один из них производит модификацию, то может произойти очень неприятная ошибка. Рассмотрим пример:

In [59]:
import threading

# это общая переменная для двух потоков
common_variable = 0

class ThreadOperation:
    def __call__(self):
        global common_variable
        for i in range(1000000):
            common_variable = common_variable + 1


# основной поток

second_thread = threading.Thread(target=ThreadOperation())
second_thread.start()

for i in range(1000000):
    common_variable = common_variable + 1

second_thread.join()

print(common_variable)

1326726


Давайте проанализируем результат. Казалось бы, оба потока должны были увеличить значение `common_variable` на миллион, значит в результате значением переменной должно было стать два миллиона, но это не так. Более того, если вы несколько раз запустите программу, то увидите, что результаты будут разными. Почему это происходит?

Для ответа на этот вопрос нужно вспомнить, как работает вытесняющая многозадачность. Основной ее принцип в том, что каждый поток работает немного, а потом операционная система вместо него запускает другой, причем происходит это без согласия вытесняемого потока и в произвольный момент его работы. Например, вот так может выглядеть последовательность инструкций, которые выполнялись на процессоре:

1. `common_variable` = 0
2. основной поток прочитал значение `common_variable` (0)
3. основной поток прибавил 1 к прочитанному значению, получил 1
4. ОС вытеснила основной поток с процессора и поместила туда второй
5. второй поток прочитал значение `common_variable` (оно по-прежнему 0, ведь основной поток не успел записать 1 в память!)
6. второй поток прибавил 1 к прочитанному значению, получил 1
7. второй поток записал 1 в `common_variable`
8. ОС вытеснила второй поток с процессора и поместила туда основной
9. основной продолжил свое выполнение с того места, где его прервали и записал 1 в `common_variable`

Как видите, оба потока по разу прибавили 1 к `common_variable`, но его значение стало 1, а не 2!

Подобные ошибки случаются сплошь и рядом в многопоточных программах. Обнаруживать их очень сложно, потому что они воспроизводятся случайным образом и обычно приводят к аварийному завершению программы. Для того, чтобы предыдущий пример работал правильно, нам нужно **синхронизировать** доступ потоков к общим данным таким образом, чтобы когда один поток изменяет их, другой не мог к ним обратиться.

Простейший способ добиться этого - использовать **блокировку** (англ. *lock*), представляющий собой специальный объект для синхронизации доступа к общим данным. Типом блокировки является класс `Lock`, который предоставляет два метода:

1. `acquire(...)` - захватить блокировку. Если блокировка уже захвачена, то поток, который пытается ее захватить будет ждать, пока она не освободится.
2. `release()` - освободить блокировку. После этого она может быть захвачена другим потоком.

Покажем, как переписать наш пример, чтобы не было ошибки:

In [60]:
import threading

# это общая переменная для двух потоков
common_variable = 0

# это блокировка для синхронизации доступа к общей переменной
common_lock = threading.Lock()

class ThreadOperation:
    def __call__(self):
        global common_variable
        global common_lock
        
        for i in range(1000000):
            common_lock.acquire()
            common_variable = common_variable + 1
            common_lock.release()


# основной поток

second_thread = threading.Thread(target=ThreadOperation())
second_thread.start()

for i in range(1000000):
    common_lock.acquire()
    common_variable = common_variable + 1
    common_lock.release()

second_thread.join()

print(common_variable)

2000000


Как видите, теперь доступ к переменной `common_variable` полностью синхронизирован - любое обращение к ней происходит только тогда, когда поток захватил блокировку, а значит другой поток не сможет это сделать. Из этого вытекают следующие правила работы с блокировками:

1. Захват блокировки должен происходит **до** любого обращения к общим данным, а освобождение **после**.
2. Нужно стремиться к тому, чтобы размер области, охраняемой блокировкой, был небольшой и не содержал долго выполняемых инструкций. Если один поток долго не осовобождает блокировку, то другие просто ждут и ничего не делают. По сути, многопоточная программа превращается в однопоточную.
3. Если хотя бы один из потоков нарушает правила использования блокировок при доступе к общим данным, то вся системна неэффективна.

## Задание

- - -
[Предыдущая: Коллекции](09_Collections.ipynb) |
[Содержание](00_Overview.ipynb#Содержание) |
[Следующая: Стандартная библиотека](10_Standard_Library.ipynb)