# Асимптотический анализ

Эффективность алгоритма зависит от следующих параметров: время выполнения, объем памяти и других ресурсов, необходимых для его выполнения. Эффективность измеряется с помощью асимптотических нотаций.

Производительность алгоритма может отличаться при работе с различными типами данных. С увеличением количества входных данных она также изменяется.

**Асимптотический анализ** – метод изучения производительности алгоритмов при различных объемах и типах входных данных.

В основном используются три нотации:

- Большое «О» (Big-O Notation (O-notation))
- Омега нотация (Omega Notation (Ω-notation))
- Тета нотация (Theta Notation (Θ-notation))

`O-нотация` или `Большое «О»` – используется для описания производительности алгоритмов в зависимости от размера входных данных. Она показывает, как изменяется время выполнения или использование памяти, по мере роста объёма данных. Так как эта нотация дает нам представления о верхней границе, т.е. худшей скорости выполнения алгоритма, то ее анализ обязателен – нам всегда интересна эта характеристика.

`Омега нотация` – противоположность большому «О». Она показывает нижнюю границу скорости выполнения алгоритма. Она описывает лучший случай выполнения алгоритма.

`Тета нотация` объединяет в себе сразу две функции – верхнюю и нижнюю. Эта нотация отражает и верхнюю, и нижнюю границу скорости выполнения алгоритма. Именно поэтому она используется для анализа средней скорости выполнения алгоритма.

Нас интересует, в большей степени, именно O-нотация, поэтому разбираться будем с ней.

`Линейный поиск` обозначается как O(n) – время выполнения зависит от количества элементов в списке. Если список увеличивается в два раза, время выполнения также увеличится в два раза.

`Бинарный поиск` обозначается как O(log n) – время выполнения зависит от логарифма количества элементов. Если список увеличивается в два раза, время выполнения увеличится незначительно.

### Виды О-нотаций

![Ошибка загрузки](https://github.com/akazachkov/ML_lesson_material/blob/main/_add_material_lesson_ML/O-notation.png?raw=true)

# Сравнение структур данных

![Ошибка загрузки](https://github.com/akazachkov/ML_lesson_material/blob/main/_add_material_lesson_ML/Compare_data_structures.png?raw=true)

Списки (Lists) – подходят для хранения упорядоченных коллекций элементов с быстрым доступом по индексу, но операции поиска и удаления могут быть медленными.

Кортежи (Tuples) – имеют те же преимущества и недостатки, что и списки, но неизменяемы.

Множества (Sets) – отлично подходят для хранения уникальных элементов и выполнения быстрых операций поиска, добавления и удаления.

Словари (Dictionaries) – идеальны для хранения пар ключ-значение с быстрым доступом, поиском, добавлением и удалением элементов.

Посмотрим на примере скорость поиска информации в списке и словаре. Для этого сгенерируем данные и запустим поиск с расчётом затраченного времени.

In [None]:
import time
import random
import string

# Создание тестовых данных

def generate_contacts_list(n):
    contacts = []
    for _ in range(n):
        name = ''.join(random.choices(string.ascii_letters, k=10))
        phone = ''.join(random.choices(string.digits, k=10))
        email = f"{name.lower()}@example.com"
        contacts.append([name, phone, email])
    return contacts

def generate_contacts_dict(n):
    contacts = {}
    for _ in range(n):
        name = ''.join(random.choices(string.ascii_letters, k=10))
        phone = ''.join(random.choices(string.digits, k=10))
        email = f"{name.lower()}@example.com"
        contacts[name] = {"phone": phone, "email": email}
    return contacts

In [None]:
# Генерация данных

n = 1000000
contacts_list = generate_contacts_list(n)
contacts_dict = generate_contacts_dict(n)

In [None]:
# Выбор случайного имени, которое мы будем искать с помощью дальнейших функции

random_name = contacts_list[random.randint(0, n-1)][0]
random_name

In [None]:
%%time

# Время поиска в списке

def find_contact_list(contacts, name):
  for contact in contacts:
    if contact[0] == name:
      return contact
  return None

start_time = time.time()
find_contact_list(contacts_list, random_name)
list_search_time = time.time() - start_time
list_search_time

In [None]:
%%time

# Время поиска в словаре

def find_contact_dict(contacts, name):
    return contacts.get(name, None)

start_time = time.time()
find_contact_dict(contacts_dict, random_name)
dict_search_time = time.time() - start_time
dict_search_time

На моём компьютере, поиск по листу занимает 20-50 ms, в то время как по словарю поиск проходит так быстро, что выводится 0 ns (лишь раз, за десятки итераций, выдал 998 µs).