# Что такое многопоточность?

**Поток** - это наименьшая единица выполнения с независимым набором инструкций, которая является частью процесса.

Он имеет указатель инструкций, который хранит текущее состояние потока и контролирует, что будет выполнено в следующем порядке.

Способность процесса выполнять несколько потоков параллельно называется **многопоточностью**. В идеале многопоточность может значительно улучшить производительность любой программы.

**Плюсы многопоточности:**
*   Многопоточность может значительно повысить скорость вычислений в многопроцессорных или многоядерных системах, поскольку каждый процессор или ядро обрабатывает отдельный поток одновременно.

*   Многопоточность позволяет программе оставаться отзывчивой, пока один поток ожидает ввода, а другой одновременно запускает графический интерфейс. 



**Минусы многопоточности:**
*   Необходима синхронизация, чтобы избежать взаимного исключения при доступе к общим ресурсам процесса. Это напрямую ведет к увеличению использования памяти и процессора.

*   Многопоточность увеличивает сложность программы, что также затрудняет отладку, что повышает вероятность потенциальных ошибок.




In [None]:
import threading
 
def print_cube(num):
    #функция для подсчета куба заданного числа

    print("Cube: {}".format(pow(num, 3)))
 
def print_square(num):
    #функция для подсчета квадрата заданного числа

    print("Square: {}".format(pow(num, 2)))
 
if __name__ == "__main__":
    # создание потоков
    t1 = threading.Thread(target=print_square, args=(10,))
    t2 = threading.Thread(target=print_cube, args=(10,))

    # запуск потока 1
    t1.start()
    # запуск потока 2
    t2.start()
 
    # ждем полное выполнение потока 1
    t1.join()
    #ждем полное выполнение потока 2
    t2.join()
 
    # оба потока выполнены полностью
    print("Done!")

Square: 100
Cube: 1000
Done!


# Что такое параллелизм и конкурентность?

*   Систему называют **конкурентной**, если она может поддерживать наличие двух или большего количества действий, *находящихся в процессе выполнения* в одно и то же время.

*   Систему называют **параллельной**, если она может поддерживать наличие двух или большего количества действий, *выполняемых в точности* в одно и то же время.



**Цель конкурентности** – предотвратить взаимоблокировки задач путем переключения между ними, когда одна из задач вынуждена ждать внешнего ресурса. 

Вариант реализации конкурентности – запуск запросов по очереди, пока запросы не обработаются.

**Цель параллелизма** -  разделить работу между аппаратными ресурсами так, чтобы работа выполнялась быстрее.

Речь идет о максимальном использовании этих ресурсов путем запуска процессов или потоков, использующих все ядра процессора, которыми располагает компьютер.

*Конкурентность подходит для задач, которые сильно зависят от внешних ресурсов, а параллелизм – для задач интенсивно использующих ЦП.*

***Проведём аналогию:*** *шеф-повар нарезает лук и иногда проверяет духовку. Ему нужно прекратить нарезать лук, чтобы подойти к духовке, а затем снова начать нарезать и повторять этот процесс до конца приготовления блюда.*

*Как вы заметили, конкурентность связана в большей степени с логистикой. Если бы её не было, то повар ждал бы пока приготовится мясо в духовке, чтобы начать нарезать лук.*

*Мы можем добавить второго повара на кухню - теперь один следит за духовкой, а второй нарезает лук. Работа разделена, так как теперь на кухне трудятся два повара. И теперь работа будет выполняться параллельно.*

# Что такое асинхронность?

**Асинхронность** — это возможность выполнения программой задач и процессов без ожидания их завершения.

То есть если предыдущий процесс все еще находится на этапе выполнения, асинхронная программа может легко перейти к обработке следующих задач.

**Для чего нужна асинхронность?** Программы, которые выполняются последовательно, просты для понимания. В них все процессы выполняются шаг за шагом. Но для решения некоторых практических задач в современном программировании такой подход не всегда себя оправдывает, а потому приходится применять другие методы разработки.


Асинхронное программирование усложняет программы, но с его помощью можно их оптимизировать и повысить эффективность. Оно позволяет всем задачам в вашем коде выполняться одновременно (этого синхронные процессы обеспечить не могут). 

Асинхронное программирование может быть полезным, если:

* программе требуется слишком много времени на выполнение всех задач;
* имеются операции ввода-вывода, требующие одновременного выполнения;
* есть задержка операций ввода и вывода.

# Асинхронность на примере простых функций.  Событийный цикл и Задачи

**Циклы событий (Event loops)** являются ядром каждого асинхронного приложения. Циклы запускают сопрограммы еще до их завершения. Для удобства отслеживания процесса одновременно может выполняться только один цикл обработки событий.

Разработчики приложений обычно должны использовать высокоуровневые асинхронные функции, такие как `asyncio.run()`, и редко должны ссылаться на объект цикла или вызывать его методы.

**Задачи (Tasks)**. При запуске сопрограммы в цикле событий, есть возможность вернуть объект Task. Он управляет поведением сопрограммы вне цикла событий. Хотите отменить запущенную задачу? Вызовите метод `.cancel()`.

Для определения сопрограммы асинхронная функция использует ключевое слово `await`. При его использовании сопрограмма передает поток управления обратно в цикл событий (также известный как event loop).

Для запуска сопрограммы нужно запланировать его в цикле событий. После этого такие сопрограммы оборачиваются в задачи (`Tasks`) как объекты `Future`.

In [None]:
import asyncio

async def async_func():
    print('Запуск ...')
    #ожидание 1 секунда
    await asyncio.sleep(1)
    print('... Готово!')


async def main():
    await async_func()


asyncio.run(main())


Запуск ...
... Готово!


В коде выше функция `async_func` вызывается из основной функции. Нужно добавить ключевое слово `await` при вызове синхронной функции. Функция `async_func` не будет делать ничего без `await`.

**Задачи**
Задачи используются для планирования параллельного выполнения сопрограмм.

При передаче сопрограммы в цикл событий для обработки можно получить объект Task, который предоставляет способ управления поведением сопрограммы извне цикла событий.

В коде ниже создается `create_task` (встроенная функция библиотеки asyncio), после чего она запускается.

In [None]:
import asyncio


async def async_func():
    print('Запуск ...')
    #ожидание 1 секунда
    await asyncio.sleep(1)
    print('... Готово!')


async def main():
    task = asyncio.create_task (async_func())
    #ожидание выполнения задачи
    await task

asyncio.run(main())

Запуск ...
... Готово!


**Цикл событий**

Этот механизм выполняет сопрограммы до тех пор, пока те не завершатся. Это можно представить как цикл `while True`, который отслеживает сопрограммы, узнавая, когда те находятся в режиме ожидания, чтобы в этот момент выполнить что-нибудь другое.

Он может разбудить спящую сопрограмму в тот момент, когда она ожидает своего времени, чтобы выполниться. В одно время может выполняться лишь один цикл событий в *Python*.

В следующем фрагменте создаются три задачи, которые добавляются в список. Они выполняются асинхронно с помощью `get_event_loop`, `create_task` и `await` библиотеки *asyncio*.

In [None]:
import nest_asyncio
nest_asyncio.apply()


async def async_func(task_no):
    print(f'{task_no}: Запуск ...')
    await asyncio.sleep(1)
    print(f'{task_no}: ... Готово!')


async def main():
    taskA = loop.create_task (async_func('Задача A'))
    taskB = loop.create_task(async_func('Задача B'))
    taskC = loop.create_task(async_func('Задача C'))
    #ожидание выолнения трех задач
    await asyncio.wait([taskA,taskB,taskC])


if __name__ == "__main__":
    try:
        loop = asyncio.get_event_loop()
        loop.run_until_complete(main())
    except :
        pass

Задача A: Запуск ...
Задача B: Запуск ...
Задача C: Запуск ...
Задача A: ... Готово!
Задача B: ... Готово!
Задача C: ... Готово!


**Future**

`Future` — это специальный низкоуровневый объект, который представляет окончательный результат выполнения асинхронной операции.

Если этот объект подождать (`await`), то сопрограмма дождется, пока `Future` не будет выполнен в другом месте.

В следующих разделах посмотрим, на то, как `Future` используется.

# Корутины(сопрограммы) и yield

**Сопрограммы** – это особый тип функции, которая намеренно передает управление вызывающему объекту, но не завершает его контекст в процессе, вместо этого поддерживая его в состоянии ожидания.

Они извлекают выгоду из возможности хранить свои данные в течение всего срока службы и, в отличие от функций, могут иметь несколько точек входа для приостановки и возобновления выполнения.


Сопрограммы в Python работают очень похоже на генераторы . Оба работают над данными, поэтому давайте сохраним основные различия простыми:

*   Генераторы производят данные
*   Сопрограммы потребляют данные

In [None]:
def bare_bones():
    print("Начало сопрограммы")
    try:
        while True:
            value = (yield) #yeild - используется для сбора значений
            print(value)
    except GeneratorExit: 
        print("Выход из сопрограммы") #

coroutine = bare_bones()

next(coroutine) #next() - запуск выполнения сопрограммы
coroutine.send("Первая строка")  #send() - отправление нового ввода
coroutine.send("Вторая строка")
coroutine.close() #close() - выход из сопрограммы


Начало сопрограммы
Первая строка
Вторая строка
Выход из сопрограммы


`next()` - запускает выполнение сопрограммы до тех пор, пока она не достигнет своей первой точки останова – `value = (yield)`. Сопрограмма останавливается, возвращая выполнение к основному, и простаивает в ожидании нового ввода. Новый ввод может быть отправлен с помощью `send()`

Затем наша переменная `value` получит строку `Первая строка`, распечатает ее, и новая итерация цикла `while True `заставит сопрограмму снова ждать доставки новых значений. Вы можете делать это столько раз, сколько захотите.

Наконец, как только вы закончите с сопрограммой и больше не захотите ее использовать, вы можете освободить эти ресурсы, вызвав `close()`. Это вызывает исключение `GeneratorExit`.

Подобно функциям, сопрограммы также способны принимать аргументы:

In [None]:
def filter_line(num):
    while True:
        line = (yield)
        if num in line:
            print(line)

cor = filter_line("33") #определяем сопрограмму
next(cor)
cor.send("Джессика, возраст: 24")
cor.send("Марко, возраст: 33")
cor.send("Том, возраст: 55")
cor.close()

Марко, возраст: 33


Несколько операторов `yield` могут быть упорядочены вместе в одной и той же отдельной сопрограмме:

In [None]:
def joint_print():
    while True:
        part_1 = (yield)
        part_2 = (yield)
        print("{} {}".format(part_1, part_2))

#первая сопрограмма
cor = joint_print()
next(cor)
cor.send("Немного текста")
#ожидание part_2 
cor.close()
#part_2 не поступила, поэтому сопрограмма ничего не вывела
print('')

#вторая сопрограмма
cor1 = joint_print()
next(cor1)
cor1.send("Чуть больше")
cor1.send("Текста")
cor1.close()



Чуть больше Текста


# Зеленые потоки

**Зеленые потоки** позволяют очень быстро писать асинхронный код. Особенность их использования заключается в том, что переключения между `greenlets` происходит не в процессоре, а в приложении.

Зеленые потоки имеют простую структуру и позволяют применять в Python совместную многопоточность. Довольно часто для применения зеленых потоков используется Python-библиотека Gevent. Она способна изменить поведение стандартных библиотек для выполнения неблокирующих операций ввода-вывода.

Особенность библиотеки `Gevent` заключается в том, что API-интерфейс использует не потоки, а сопрограммы (подробнее о них, дальше): 

* Сопрограммы запускаются в цикле событий (event loop).
* Цикл событий выполняется в потоке, и происходит получение задач из очереди.
* Каждая из задач вызывает следующий шаг сопрограммы.
* Если сопрограмма вызывает другую сопрограмму, текущая сопрограмма приостанавливается и происходит переключение контекста.
* Если сопрограмма встречает код блокировки, текущая сопрограмма приостанавливается.
* Цикл событий получает следующие задачи из очереди.
* Затем цикл событий возвращается к первой задаче с того места, где она была приостановлена.
* Сопрограммы содержат в себе команды для возвращения событий в очередь при необходимости.

In [None]:
from greenlet import greenlet

def test1():
    print(12)
    #переключение на вторую ветку
    gr2.switch()
    print(34)


def test2():
    print(56)
    #переключение на первую ветку
    gr1.switch()
    print(78)

#инициализация веток
gr1 = greenlet(test1)
gr2 = greenlet(test2)

print("Начало с ветки gr1:")
gr1.switch()


Start with gr1:
12
56
34


В некоторых ситуациях green threads гораздо выгоднее, чем native threads. Система может поддерживать гораздо большее количество green threads, чем потоков OС.

Однако есть и недостатки. Самый большой заключается в том, что вы не можете исполнять два потока одновременно. Поскольку существует только один native thread, только он и вызывается планировщиком ОС. Даже если у вас несколько процессоров и несколько green threads, только один процессор может вызывать green thread. И всё потому, что с точки зрения планировщика заданий ОС всё это выглядит одним потоком.

# Асинхронность на callback

**Callback** — это функция, которая передаётся на вход другой функции (или другому участку кода), чтобы её запустили в ответ на какое-то событие. С помощью этого приёма работают чатботы и интерактивные веб-странички: пользователь нажимает на кнопку, его действие генерирует событие и на событие реагирует callback(функция-обработчик). Рассмотрим пример:

In [None]:
from time import time_ns

def timeit(function):
    start_time = time_ns()
    function() #вызов функции
    end_time = time_ns()
    return end_time - start_time
    
timeit(print) #вывод в наносекундах




3093317

Функция `timeit()` принимает на вход любую другую функцию и засекает время её выполнения. Функция `time_ns()` засекает текущее время.

Обратный вызов чаще всего используется для синхронного ввода/вывода (далее — I/O). Так что, для организации какого угодно I/O или для отсрочки любого действия можно выбрать такую стратегию: код, который требуется выполнить асинхронно, передается в функцию с отложенным выполнением, которая запускается где-нибудь ниже в цикле событий.

In [None]:
import nest_asyncio
nest_asyncio.apply()

async def asyncfunction():
    print('Привет')
    await asyncio.sleep(5)
    print('Мир')
    return 5

def callback(n):
    print(f'Асинхронная функция вернула: {n}')

async def myfunc():
  callback(await asyncfunction())


loop = asyncio.get_event_loop()

loop.run_until_complete(myfunc())

Привет
Мир
Асинхронная функция вернула: 5


Один обратный вызов не так уж и плох, но код растет, а обратные вызовы обычно порождают все новые обратные вызовы. 

Основная проблема с использованиеи обратных вызовов заключается в том, что в асинхронном мире единственный способ избежать блокировки — это обратный вызов. Это может привести к очень длинной цепочке обратных вызовов за обратным вызовом после обратного вызова.

Почему не стоит использовать обратные вызовы в асинхронном программировании:
* Потоки/сопрограммы невидимы для программиста
* Обратные вызовы поглощают исключения
* Обратные вызовы не могут быть собраны
* Обратный вызов после обратного вызова становится запутанным и трудным для отладки

# Асинхронность на генераторах



*   **Генератор** — это объект, который сразу при создании не вычисляет значения всех своих элементов.
*   Он хранит в памяти только последний вычисленный элемент, правило перехода к следующему и условие, при котором выполнение прерывается.
*   Вычисление следующего значения происходит лишь при выполнении метода `next()`. Предыдущее значение при этом теряется.



In [None]:
import nest_asyncio
nest_asyncio.apply()

async def numbers(numbers):
#генератор чисел
    for i in range(numbers):
        yield i

        await asyncio.sleep(0.5)

async def main():
    #вызов генератора
    odd_numbers = [i async for i in numbers(10) if i % 2]
    print(odd_numbers)

if __name__ == '__main__':
    event_loop = asyncio.get_event_loop()
    try:
        event_loop.run_until_complete(main())
    except:
        event_loop.close()

[1, 3, 5, 7, 9]


Наличие выражения `yield` в функции или методе, определенном с использованием `async def`, дополнительно определяет функцию как функцию асинхронного генератора.

По сути, поведение асинхронных генераторов предназначено для воспроизведения поведения обычных генераторов, с той лишь разницей, что API(программный интерфейс приложения) является асинхронным.

Когда вызывается асинхронный генератор, то он возвращает асинхронный итератор, известный как объект асинхронного генератора. Затем этот объект управляет выполнением функции генератора. Объект асинхронного генератора обычно используется в операторе `async for` внутри функции сопрограммы аналогично тому, как объект генератора будет использоваться в операторе `for`.

Вызов одного из методов асинхронного генератора возвращает объект сопрограммы и начинается ожидание ее выполнения. В это время выполнение переходит к первому выражению `yield`, где он снова приостанавливается, возвращая список выражений ожидающей сопрограммы.

# Asyncio, async/await

Пример счетчика в синхронном стиле:

In [None]:
import time



def count():
    print("Один")
    time.sleep(1)
    print("Два")

def main():
    for _ in range(3):
        count()

if __name__ == "__main__":
    s = time.perf_counter()
    main()
    elapsed = time.perf_counter() - s
    print(f"Программа выполнена за {elapsed:0.2f} сек.")

Один
Два
Один
Два
Один
Два
Программа выполнена за 3.00 сек.


Попробуем написать похожий счетчик в асинхронном стиле.

Библиотека Asyncio довольно мощная, поэтому Python решил сделать ее стандартной библиотекой. В синтаксис также добавили ключевое слово `async`. Ключевые слова предназначены для более четкого обозначения асинхронного кода. Поэтому теперь методы не путаются с генераторами. Ключевое слово `async` идет до `def`, чтобы показать, что метод является асинхронным. Ключевое слово await показывает, что вы ожидаете завершения сопрограммы. Вот тот же пример, но с ключевыми словами `async/await`:

In [None]:
import nest_asyncio
nest_asyncio.apply()

async def count():
    print("Один")
    await asyncio.sleep(1)
    print("Два")

async def main():
    await asyncio.gather(count(), count(), count())

if __name__ == "__main__":
    import time
    s = time.perf_counter()
    asyncio.run(main())
    elapsed = time.perf_counter() - s
    print(f"Программа выполнена за {elapsed:0.2f} сек.")

Один
Один
Один
Два
Два
Два
Программа выполнена за 1.00 сек.


Программа состоит из методов `async`. Во время выполнения он возвращает сопрограмму, которая затем находится в ожидании.

На данный момент уместно более формальное определение `async`, `await` и функций сопрограммы, которые они создают. 

* Синтаксис `async def` вводит либо собственную сопрограмму , либо асинхронный генератор . Выражения `async with` и `async for` также допустимы

* Ключевое слово `await` передает управление функцией обратно в цикл обработки событий (`await` приостанавливает выполнение окружающей сопрограммы.) Если Python встречает `await` `f()` выражение в области видимости `g()`, то `await` сообщает циклу обработки событий: «Приостановить выполнение `g()` до тех пор, пока не будет возвращено то, чего я жду — результат `f()`. А пока пусть работает что-то еще».

Когда мы используете `await f()`, требуется, чтобы `f()` был ожидаемым объектом. Ожидаемый объект — это либо другая сопрограмма(1), либо объект(2), определяющий` .__await__()` метод `dunder`, который возвращает итератор.

# Заключение

В Python встроена отличная асинхронная библиотека. Давайте еще раз вспомним проблемы потоков и посмотрим, решены ли они теперь:

* процессорное переключение контекста: Asyncio является асинхронным и использует цикл событий. Он позволяет переключать контекст программно;
* состояние гонки: поскольку Asyncio запускает только одну сопрограмму и переключается только в точках, которые вы определяете, ваш код не подвержен проблеме гонки потоков;
* взаимная/активная блокировка: поскольку теперь нет гонки потоков, то не нужно беспокоиться о блокировках. Хотя взаимная блокировка все еще может возникнуть в ситуации, когда две сопрограммы вызывают друг друга, это настолько маловероятно, что вам придется постараться, чтобы такое случилось;
* исчерпание ресурсов: поскольку сопрограммы запускаются в одном потоке и не требуют дополнительной памяти, становится намного сложнее исчерпать ресурсы. Однако в Asyncio есть пул «исполнителей» (executors), который по сути является пулом потоков. Если запускать слишком много процессов в пуле исполнителей, вы все равно можете столкнуться с нехваткой ресурсов.



Несмотря на то, что Asyncio довольно хорош, у него есть и проблемы. Во-первых, Asyncio был добавлен в Python недавно. Есть некоторые недоработки, которые еще не исправлены. Во-вторых, когда вы используете асинхронность, это значит, что весь ваш код должен быть асинхронным. Это связано с тем, что выполнение асинхронных функций может занимать слишком много времени, тем самым блокируя цикл событий.

Существует несколько вариантов асинхронного программирования в Python. Вы можете использовать зеленые потоки, обратные вызовы или сопрограммы. Хотя вариантов много, лучший из них — Asyncio. Если используете Python 3.5, то вам лучше использовать эту библиотеку, так как она встроена в ядро ​​python.