## Содержание:
- Основные оценки сложности алгоритмов
- Библиотеки и модули

# Основные оценки сложности алгоритмов

Основные категории алгоритмической сложности в О-нотации:

* Постоянное время: 0(1) — время выполнения не зависит от количества элементов во входном наборе данных

* Линейное время: О(N) — время выполнения пропорционально количеству элементов в коллекции

* Логарифмическое время: О(log(N)) — время выполнения пропорционально логарифму от количества элементов в коллекции

* Квазилинейное время: О(N*log(N)) — время выполнения больше чем, линейное, но меньше квадратичного

* Полиномиальное время: О(N^2) — время выполнения пропорционально квадрату количества элементов в коллекции


## Константа $O(1)$
Самый простой в оценке вариант алгоритма — алгоритм, который не зависит от размера входных данных. 
Посчитаем сумму первых пяти натуральных чисел. Для этого сравним два алгоритма.

In [None]:
# Алгоритм 1

a = [1, 2, 3, 4, 5, 6]

summ = 0
for element in a:
    summ += element

print(summ)

Первый алгоритм будет перебирать все элементы списка и добавлять их к общей сумме. \
*Количество операций*: 1 (создание переменной) + n (проходимся по всему списку) + n (операция суммы).

In [None]:
# Алгоритм 2

a = [1, 2, 3, 4, 5, 6]

summ = (a[0] + a[len(a) - 1]) / 2 * len(a)

print(summ)

Второй алгоритм не будет проходиться по всему массиву, а сразу сложит нужные элементы. \
*Количество операций*: 3.

В этой задаче нам нужно сделать три действия, независимо от того, какое количество натуральных чисел мы передали. То есть мы говорим, что данный алгоритм имеет сложность $О(1)$.

# Линейная $О(n)$

Линейная оценка, или сложность $О(n)$, будет у алгоритма, который проходит один или несколько раз по всем переданным объектам. Например, алгоритм поиска числа в неупорядоченном списке.

In [None]:
lst = [1, 26, 3, 24, 16, 17, 30, 17, 27, 28]
s = 17
n = len(lst)
i = 0
while i < n and lst[i] != s:
    i += 1
if i == n:
    print("Число не найдено")
else:
    print(i)

In [None]:
def element_search(ar, element):
    for i in range(len(ar)):
        if ar[i] == element:
            return i
    return "Число не найдено"
s = 17
print(element_search(lst, s))

In [None]:
lst = [1, 26, 3, 24, 16, 17, 30, 17, 27, 28]
element = 30
for i in range(len(lst)):
    if lst[i] == element:
        print(i)
        break
else:
    print("Число не найдено")

В этом примере в худшем случае (а нам интересен именно худший случай) мы пройдемся по всему списку, сравнивая каждый элемент с искомым, пока не найдем подходящий. Это и есть линейная сложность алгоритма. 

## Экспоненциальное время: O(2^n)

Если сложность алгоритма описывается формулой O(2^n), значит, время его работы удваивается с каждым дополнением к набору данных. Кривая роста функции O(2^n) экспоненциальная: сначала она очень пологая, а затем стремительно поднимается вверх. Примером алгоритма с экспоненциальной сложностью может послужить рекурсивный расчет чисел Фибоначчи:

In [None]:
def fibonacci(n):
    # Первое и второе числа Фибоначчи равны 1
    if n <= 2:
        return 1
    return fibonacci(n - 1) + fibonacci(n - 2)

fibonacci(10)

## Квадратичная $О(n^2)$

Оценка алгоритма в $О(n^2)$ будет у алгоритма, который для каждого элемента множества перебирает все остальные элементы множества. Таковым, например, является **пузырьковая сортировка**.

![Изображение не найдено](https://habrastorage.org/getpro/habr/upload_files/132/1a8/c2d/1321a8c2d653c5b4fdca906baff445a5.gif)

In [None]:
def bubble_sort(nums):

    # Устанавливаем swapped в True, чтобы цикл запустился хотя бы один раз
    swapped = True

    while swapped:
        swapped = False

        # Идем циклом по индексам наших элементов
        for i in range(len(nums) - 1):

            # Если текущий элемент слева больше своего элемента справа
            if nums[i] > nums[i + 1]:

                # Меняем элементы местами
                nums[i], nums[i + 1] = nums[i + 1], nums[i]

                # Устанавливаем swapped в True для следующей итерации
                swapped = True

                # По окончании первого прогона цикла for, самый большой элемент "всплывет" наверх

# Проверяем, что оно работает
random_list_of_nums = [9, 5, 2, 1, 8, 4, 3, 7, 6]
bubble_sort(random_list_of_nums)
print(random_list_of_nums)

Алгоритм сортировки списка вставкой

In [None]:
lst = [1, 26, 3, 24, 16, 17, 30, 18, 27, 28]
n = len(lst)
for i in range(1, n):
    x = lst[i]
    j = i - 1
    while j > -1 and lst[j] > x:
        lst[j + 1] = lst[j]
        j -= 1

    lst[j + 1] = x

print(lst)

## Логарифмическая $О(log(n))$

Оценку $О(log(n))$ чаще всего имеют алгоритмы, которые на каждом шаге работы с данными уменьшают размер этих данных в разы. 

Классический пример логарифмического алгоритма — **бинарный поиск**


In [None]:
lst = [1, 3, 16, 17, 24, 26, 27, 28, 30]

s = 17
i = 0
j = len(lst) - 1
while i <= j:
    k = (i + j) // 2
    if lst[k] > s:
        j = k - 1
    elif lst[k] < s:
        i = k + 1
    else:
        break
if i <= j:
    print(k)
else:
    print("Число не найдено")

Получается, что в алгоритме бинарного поиска мы каждый раз будем делить наше множество пополам, пока не останется один элемент. Значит, функция, которая будет описывать оценку нашего алгоритма, должна показывать, сколько раз число $n$, которое описывает размер наших данных, можно поделить на 2, или наоборот — в какую степень надо возвести 2, чтобы получилось наше число. Это и есть определение логарифма $log(n)$. 

## Линейно-логарифмическая $О(n * log(n))$

Яркий пример такого алгоритма — **быстрая сортировка**. В этом алгоритме мы сначала разбиваем все элементы на пары (логарифмическая часть), а затем отсортированные пары последовательно соединяем (линейная часть). 

**Алгоритм с оценкой $О(n * log(n))$ считается самым быстрым решением задачи сортировки в общем случае.**

![Изображение не найдено](https://habrastorage.org/getpro/habr/upload_files/0a9/afd/372/0a9afd372156de5806bd87f93c875834.gif)


In [None]:
import random
def quicksort(nums):

    if len(nums) <= 1:
        return nums
    else:

        q = random.choice(nums)  # Генерирует случайную выборку из заданного одномерного списка.
        s_nums = []
        m_nums = []
        e_nums = []

    for n in nums:
        if n < q:
            s_nums.append(n)
        elif n > q:
            m_nums.append(n)
        else:
            e_nums.append(n)

    return quicksort(s_nums) + e_nums + quicksort(m_nums)

lst = [1, 26, 3, 24, 16, 17, 30, 18, 27, 28]
print(quicksort(lst))

Сортировка слиянием
![Изображение не найдено](https://habrastorage.org/getpro/habr/upload_files/21f/1a3/ec0/21f1a3ec016004112fbb9180f76067dd.gif)

In [None]:
def merge(le, ri):
    i, j = 0, 0
    res = []
    while i < len(le) and j < len(ri):
        if le[i] <= ri[i]:
            res.append(le[i])
            i += 1
        else:
            res.append(ri[j])
            j += 1
    res += le[i:] + ri[j:]
    return res

def merge_sort(s):
    if len(s) < 2: return s
    else:
        ln = len(s) // 2
        left = merge_sort(s[:ln])
        right = merge_sort(s[ln:])
        return merge(left, right)

lst = [1, 26, 3, 24, 16, 17, 30, 18, 27, 28]
print(merge_sort(lst))

Сложность алгоритма `сортировки подсчетом` оценивается как **O(n + k)**, где n - это количество элементов в списке, а k - это количество уникальных элементов в списке.

In [None]:
lst = [1, 3, 16, 17, 24, 24, 26, 27, 28, 30]
lst_ancillary = [0] * (max(lst) + 1)
for i in range(len(lst)):
    lst_ancillary[lst[i]] += 1

lst_new = []
for i in range(max(lst) + 1):
    for j in range(lst_ancillary[i]):
        lst_new.append(i)

print(lst_new)
print(lst_ancillary)

# Библиотеки и модули

Если несколько функций позволяют решать схожие задачи, то их объединяют в **модули**.  Например, модуль `math` объединяет в себе математические функции , модуль `string` предназначен для работы со строками, модуль `random` предлагает функции для генерации псевдослучайных чисел.  

Эти модули и многие другие объединены в **Стандартную библиотеку Python**. Эта библиотека поставляется в составе Python, ее не нужно отдельно скачивать и устанавливать. Библиотека и входящие в нее модули описана в документации: https://docs.python.org/3/library/.


Рассмотрим модули Стандартной библиотеки Python. 

## Пример использования модуля Стандартной библиотеки Python

Воспользуемся функцией `sqrt()` из модуля  `math`. Эта функция как раз вычисляет квадратный корень, попробуем ее вызвать.

In [None]:
sqrt(16)  # Вызвов функцию sqrt() из модуля math

Не получилось. Необходимо импортировать модуль

In [None]:
import math  # Импортируем модуль math

In [None]:
sqrt(16)  # Снова пытаемся вызвать функцию sqrt() из модуля math, предварительно его импортировав

 Необходимо выполнить следующее: `<модуль>.<функция()>`.

In [None]:
math.sqrt(16)  # снова пытаемся вызвать функцию sqrt(), указав, что это функция из модуля math

In [None]:
math.__dict__

# Импорт отдельных компонент модуля

Писать каждый раз название модуля, точку, название функции не всегда удобно. Можно явно указать, что именно необходимо импортировать из модуля.

In [None]:
from random import randint, uniform  # Импортируем две функции из модуля random

Чтобы узнать, что делают эти функции и какие аргументы им нужно подавать, можно посмотреть документацию или воспользоваться функцией `help()`:

In [None]:
help(randint)

In [None]:
?randint

In [None]:
help(uniform)

In [None]:
# Вызываем функции по 5 раз
for i in range(5):
    print(randint(100, 200))
    print(uniform(100, 200))

In [None]:
import random
help(random)

Получили по 5 разных псевдослучайных чисел для каждой функции в указанном диапазоне — все получилось без указания модуля через точку.


Если необходимо импортировать много функций и переменных из одного модуля, то можно импортировать всё сразу, используя звездочку. Тогда указывать модуль через точку тоже не нужно.

In [None]:
# Импортируем всё из модуля math
from math import *

In [None]:
sqrt(16)

Получили число с высокой точностью, так как в модуле `math` содержится переменная `pi` с большим количеством знаков после запятой (точки):

In [None]:
print(pi)

Допустим, потом мы проводим еще какие-то вычисления, где не нужна такая точность. Мы создаем свою переменную `pi`:

In [None]:
pi = 3.14

Переприсвоили значение переменной pi

In [None]:
print(pi)

Если бы мы импортировали `math` и записывали бы через точку, значение `math.pi` не изменилось бы:

In [None]:
import math

pi = 3.14
print(pi, math.pi)

# Импорт под псевдонимом

Чтобы избежать таких сложностей, лучше писать название модуля. Но можно воспользоваться следующим упрощением: дать модулю псевдоним. Посмотрим на примере модуля `string`, предназначенного для работы со строками. Допустим, мы решили, что целиком слово `string` писать слишком долго, и хотим писать просто `s`. Посмотрим, как это можно сделать.

In [None]:
import string as s    # Даем псевдоним модулю string
print(s.punctuation)  # Печатаем строку со знаками препинания, хранящуюся в модуле

Теперь мы вместо `string.punctuation` будем писать `s.punctuation`, а `string.punctuation` не сработает.

In [None]:
print(string.punctuation)

In [None]:
s = 10

In [None]:
s.punctuation

Наконец, если вы совсем не готовы писать название модуля и даже слово `punctuation` кажется вам тоже слишком длинным, можно и ему дать псевдоним:

In [None]:
from string import punctuation as punc

In [None]:
print(punc)

## math

In [None]:
# Наибольший общий делитель
math.gcd(34,17)

In [None]:
# Факториал
math.factorial(5)

In [None]:
# Округление вверх
math.ceil(23.013)

In [None]:
# Округление вниз
math.floor(23.013)

Интересный факт - округление "ломается", при работе с некоторыми числами, у которых много значений после запятой. Нагляднее на примерах: 

In [None]:
from math import ceil, floor

print(ceil(10.0000000000000009))
print(ceil(10.0000000000000008))

print(floor(10.9999999999999992))
print(floor(10.9999999999999991))

In [None]:
# Возведение в степень
math.pow(2,5)

## random

In [None]:
# Случайное число от 0 до 1
random.random()

In [None]:
# Случайное число из заданного диапазона
random.randint(1, 100)

In [None]:
# Случайное число с плавающей точкой
random.uniform(1, 100)

In [None]:
# Случайный элемент из непустой последовательности, например, из списка
lst = [1, 26, 3, 24, 16, 17, 30, 17, 27, 28]
random.choice(lst)

In [None]:
# Перемешать последовательность
random.shuffle(lst)
lst

In [None]:
# Список заданной длины из последовательности
random.sample(lst, 5)

## datetime

In [None]:
import datetime

In [None]:
today = datetime.date.today()  # Текущая дата
print(today)
today = datetime.datetime.now()
print(today)

In [None]:
day = datetime.date(2024, 1, 16)
print(day)

In [None]:
import time

sec = time.time()
print(sec)
print(datetime.datetime.fromtimestamp(sec))

In [None]:
# Задать время
time = datetime.time()
print(time)

In [None]:
time = datetime.time(13)
print(time)

In [None]:
time = datetime.time(13, 24)
print(time)

In [None]:
time = datetime.time(13, 24, 57)
print(time)

In [None]:
# Получение текущего времени
date_time = datetime.datetime.today()
print(date_time)

date_time = datetime.datetime.now()
print(date_time)

In [None]:
date_str = "16 February 2024"
date_format = "%d %B %Y"

print(datetime.datetime.strptime(date_str, date_format))

date_str = "16 Feb 2024"
date_format = "%d %b %Y"

print(datetime.datetime.strptime(date_str, date_format))

In [None]:
d1 = datetime.datetime.strptime("01.01.2024 13:16", "%d.%m.%Y %H:%M")
print(d1)
d2 = datetime.datetime.strptime("2024/03/03 17:18", "%Y/%m/%d %H:%M")
print(d2)

In [None]:
d2 - d1

In [None]:
(d2 - d1).days

In [None]:
(d2 - d1).seconds

In [None]:
now = datetime.datetime.now()
date_str = now.strftime("%m/%d/%y %H:%M:%S")
print(date_str)

In [None]:
datetime.datetime.now() - datetime.timedelta(days=5)

In [None]:
datetime.datetime.now() + datetime.timedelta(weeks=5)

In [None]:
# День недели
date_time = datetime.datetime.today()
date_time.weekday()

## pprint

In [None]:
import pprint
data = {
    "name": "John",
    "age": 30,
    "city": "New York",
    "hobbies": ["reading", "playing guitar", "travelling"],
}

pprint.pprint(data)
print(data)

Функция pprint предоставляет несколько параметров для настройки вывода данных. Например, можно установить ширину строки вывода и количество отступов для вложенных структур данных.

In [None]:
pprint.pprint(data, width=50, indent=4)

In [None]:
pprint.pprint(data, depth=1)  # Указать глубину

In [None]:
file = ["file_00.csv", "file_01.csv", "file_02.csv",
        "file_03.csv", "file_04.csv", "file_05.csv",
        "file_06.csv", "file_07.csv", "file_08.csv",
        "file_09.csv", "file_10.csv", "file_11.csv",
        "file_12.csv", "file_13.csv", "file_14.csv",
        "file_15.csv", "file_16.csv", "file_17.csv",]

In [None]:
file

In [None]:
print(file)

In [None]:
pprint.pprint(file)

## timeit

Этот модуль предназначен для оценки производительности небольших фрагментов кода. 

Для этого необходимо импортировать саму библиотеку `timeit` и вызвать из нее метод `.timeit()`, передав ему название нашей функции и количество необходимых повторений.

Рассмотрим следующую задачу конкатенации строк: Составить строку из чисел от 1 до 100, отделив числа друг от друга запятой.

In [None]:
import timeit

# Алгоритм 1
def concat():
    s = ""
    for i in range(100):
        s += str(i) + ","
    s += "100"

# Алгоритм 2
def join():
    s = ",".join(map(str, range(101)))

print(timeit.timeit(concat, number=1000))
print(timeit.timeit(join, number=1000))