# Многопоточность в python

Процесс – это часть виртуальной памяти и ресурсов, которую ОС выделяет для выполнения программы

Мы хотим, чтобы в единицу времени процессор успевал выполнить больше команд и  обработать больше данных. То есть нам надо уместить в каждом кванте времени больше выполненного кода. Представьте единицу выполнения кода в виде объекта  —  это и есть поток.

## Разница между потоками и процессами
* Потоки используют память, выделенную под процесс, а процессы требуют себе отдельное место в памяти. Поэтому потоки создаются и завершаются быстрее: системе не нужно каждый раз выделять им новое адресное пространство, а потом высвобождать его.

* Процессы работают каждый со своими данными  —  обмениваться чем-то они могут только через механизм межпроцессного взаимодействия. Потоки обращаются к данным и ресурсам друг друга напрямую: что изменил один  —  сразу доступно всем. Поток может контролировать «собратьев» по процессу, в то время как процесс контролирует исключительно своих «дочек». Поэтому переключаться между потоками быстрее и коммуникация между ними организована проще.


В категориях объектно-ориентированного программирования сигналы  —  это объекты синхронизации. У каждого из них  —  своя роль во взаимодействии.

![flinn](img/flinn.jpg)

## Основные средства синхронизации
* Взаимоисключение (mutual exclusion, сокращённо  —  mutex)  — «флажок», переходящий к потоку, который в данный момент имеет право работать с общими ресурсами. Исключает доступ остальных потоков к занятому участку памяти. Мьютексов в приложении может быть несколько, и они могут разделяться между процессами. Есть подвох: mutex заставляет приложение каждый раз обращаться к ядру операционной системы, что накладно.

* Семафор  —  позволяет вам ограничить число потоков, имеющих доступ к ресурсу в конкретный момент. Так вы снизите нагрузку на процессор при выполнении кода, где есть узкие места. Проблема в том, что оптимальное число потоков зависит от машины пользователя.

* Событие  —  вы определяете условие, при наступлении которого управление передаётся нужному потоку. Данными о событиях потоки обмениваются, чтобы развивать и логически продолжать действия друг друга. Один получил данные, другой проверил их корректность, третий  —  сохранил на жёсткий диск. События различаются по способу отмены сигнала о них. Если нужно уведомить о событии несколько потоков, для остановки сигнала придётся вручную ставить функцию отмены. Если же целевой поток только один, можно создать событие с автоматическим сбросом. Оно само остановит сигнал, после того как он дойдёт до потока. Для гибкого управления потоками события можно выстраивать в очередь.

* Критическая секция  — более сложный механизм, который объединяет в себе счётчик цикла и семафор. Счётчик позволяет отложить запуск семафора на нужное время. Преимущество в том, что ядро задействуется лишь в случае, если секция занята и нужно включать семафор. В остальное время поток выполняется в пользовательском режиме. Увы, секцию можно использовать только внутри одного процесса.

In [14]:
from threading import Thread
import functools
import time
import numpy as np
import numba as nb


def timer(func):
    @functools.wraps(func)
    def wrapper_timer(*args, **kwargs):
        tic = time.perf_counter()
        value = func(*args, **kwargs)
        toc = time.perf_counter()
        elapsed_time = toc - tic
        print(f"Func {func.__name__} elapsed time: {elapsed_time:0.4f} seconds")
        return value
    return wrapper_timer



In [19]:
num_threads = 8
threads = [None] * num_threads
results = [0] * (num_threads + 1)
step_num = 10 ** 9
from_val, to_val = 0, 5

@nb.njit()
def integrate(index, results, a, b, step_num = 100000):
    global acc
    step_size = (b - a) / step_num
    f = lambda x: x ** 2 + 7
    asum = 0
    for i in np.linspace(a, b, step_num):
        asum += f(i) * (step_size)
    results[index] = asum
    return asum

@timer
def calc_threaded():
    global num_threads, results, from_val, to_val, step_num, acc
    step_size = (to_val - from_val) / num_threads
    for i in range(num_threads):
        a = from_val + i * step_size
        b = a + step_size
        threads[i] = Thread(target=integrate, args=(i, results, a, b, int(step_num / num_threads)))
        threads[i].start()

    for i in range(num_threads):
        threads[i].join()

    print('threaded result: ', np.sum(results))
    
@timer
def calc_non_threaded():
    global num_threads, results, from_val, to_val, step_num, acc
    print('non threaded result: ', integrate(num_threads, results, 0, 5, step_num))
    
calc_threaded()
calc_non_threaded()



Encountered the use of a type that is scheduled for deprecation: type 'reflected list' found for argument 'results' of function 'integrate'.

For more information visit https://numba.pydata.org/numba-doc/latest/reference/deprecation.html#deprecation-of-reflection-for-list-and-set-types

File "<ipython-input-19-947167179260>", line 8:
@nb.njit()
def integrate(index, results, a, b, step_num = 100000):
^



threaded result:  72
Func calc_threaded elapsed time: 4.2223 seconds


Encountered the use of a type that is scheduled for deprecation: type 'reflected list' found for argument 'results' of function 'integrate'.

For more information visit https://numba.pydata.org/numba-doc/latest/reference/deprecation.html#deprecation-of-reflection-for-list-and-set-types

File "<ipython-input-19-947167179260>", line 8:
@nb.njit()
def integrate(index, results, a, b, step_num = 100000):
^



non threaded result:  76.66666668748759
Func calc_non_threaded elapsed time: 9.7255 seconds


# Закон Амдала

$ S_p = \frac{1}{\alpha + \frac{1 - \alpha}{p}} $