# 🧠 Урок 31: O-нотация и оптимизация кода
**Цель урока:** Понять концепцию O-нотации (Big O), научиться анализировать сложность алгоритмов и оптимизировать код для повышения эффективности. Подходит для новичков.

## 📌 Зачем нужна O-нотация?
- **O-нотация (Big O)** — это способ оценить, как время выполнения или использование памяти программы зависит от размера входных данных.
- **Зачем?** Чтобы сравнивать алгоритмы и выбирать наиболее эффективные для конкретных задач.
- **Аналогия:** Представьте, что вы покупаете машину. O-нотация — это как расход топлива: O(1) — как электромобиль (постоянный расход), O(n) — как машина, которая ест тем больше, чем длиннее дорога [[2]](https://example.com).

## 📉 Что такое O(1)?
- **O(1):** Время выполнения не зависит от размера данных.
- **Пример:** Получение элемента по индексу.
  ```python
  arr = [1, 2, 3]
  print(arr[0])  # O(1)
  ```
- **Аналогия:** Взять книгу с полки — неважно, сколько книг на полке, это всегда один шаг.

## 📊 Что такое O(n)?
- **O(n):** Время растет линейно с размером данных.
- **Пример:** Поиск элемента в неотсортированном списке.
  ```python
  def find_max(arr):
      max_val = arr[0]
      for num in arr[1:]:
          if num > max_val:
              max_val = num
      return max_val
  ```
- **Аналогия:** Перебирать все книги на полке, пока не найдете нужную.

## 📈 Что такое O(n²)?
- **O(n²):** Время растет квадратично (например, вложенные циклы).
- **Пример:** Сортировка пузырьком.
  ```python
  def bubble_sort(arr):
      n = len(arr)
      for i in range(n):
          for j in range(0, n-i-1):
              if arr[j] > arr[j+1]:
                  arr[j], arr[j+1] = arr[j+1], arr[j]
      return arr
  ```
- **Аналогия:** Сравнивать каждую книгу с каждой — это очень долго!

## 🧮 Что такое O(log n)?
- **O(log n):** Время растет логарифмически (например, бинарный поиск).
- **Пример:** Поиск в отсортированном списке.
  ```python
  def binary_search(arr, target):
      low, high = 0, len(arr) - 1
      while low <= high:
          mid = (low + high) // 2
          if arr[mid] == target:
              return mid
          elif arr[mid] < target:
              low = mid + 1
          else:
              high = mid - 1
      return -1
  ```
- **Аналогия:** Искать слово в словаре, открывая середину и двигаясь в нужную половину.

## 🧱 Как анализировать сложность?
### Шаг 1: Подсчет операций
- **Правило 1:** Игнорируйте константы. O(2n) → O(n).
- **Правило 2:** Учитывайте только самую быстрорастущую часть. O(n² + n) → O(n²).
- **Пример:**
  ```python
  def example_func(n):
      for i in range(n):
          print(i)  # O(n)
      for j in range(n):
          print(j)  # O(n)
  # Итого: O(n + n) = O(n)
  ```
- **Аналогия:** Если вы делаете 2 круга вокруг дома, это всё равно 2n, а не n².

### Шаг 2: Рекурсия и вложенные циклы
- **Рекурсия:** Каждый рекурсивный вызов может увеличить сложность.
- **Вложенные циклы:** Умножаются. O(n) * O(n) = O(n²).
- **Пример:**
  ```python
  def nested_loop(n):
      for i in range(n):
          for j in range(n):
              print(i, j)  # O(n²)
  ```
- **Аналогия:** Если вы проверяете каждую пару друзей на совместимость, это O(n²).

## 🧪 Практика: Измерение времени выполнения
### Шаг 1: Используем timeit для измерения

In [None]:
import timeit

# Пример O(n)
def linear(n):
    for i in range(n):
        pass

# Пример O(n²)
def quadratic(n):
    for i in range(n):
        for j in range(n):
            pass

# Измерение
print("O(n):", timeit.timeit('linear(1000)', globals=globals(), number=1000))
print("O(n²):", timeit.timeit('quadratic(1000)', globals=globals(), number=1000))

### Шаг 2: Сравнение алгоритмов

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# Генерация данных
sizes = [10, 100, 1000, 10000]
times_linear = [timeit.timeit(f'linear({n})', globals=globals(), number=1000) for n in sizes]
times_quadratic = [timeit.timeit(f'quadratic({n})', globals=globals(), number=1000) for n in sizes]

# График
plt.plot(sizes, times_linear, label='O(n)')
plt.plot(sizes, times_quadratic, label='O(n²)')
plt.xlabel('Размер данных')
plt.ylabel('Время выполнения')
plt.legend()
plt.title('Сравнение O(n) и O(n²)')
plt.grid(True)
plt.show()

## 📈 Как оптимизировать код?
### 1. Используйте встроенные функции
- **Почему?** Встроенные функции Python (например, `map`, `filter`, `set`) оптимизированы на низком уровне.
- **Пример:**
  ```python
  # Вместо:
  result = []
  for x in range(10):
      result.append(x**2)
  # Лучше:
  result = list(map(lambda x: x**2, range(10)))
  ```
- **Аналогия:** Использовать молоток вместо того, чтобы строить его каждый раз с нуля.

### 2. Используйте хэш-таблицы (словари)
- **Почему?** Поиск в словаре — O(1), в списке — O(n).
- **Пример:**
  ```python
  # O(n) для списка
  if 'apple' in ['banana', 'apple', 'cherry']:
      pass
  # O(1) для словаря
  if 'apple' in {'banana': 1, 'apple': 2, 'cherry': 3}:
      pass
  ```
- **Аналогия:** Поиск ключа в списке — как искать в куче вещей, в словаре — как знать, где что лежит [[1]](https://example.com).

## 🧩 Практика: Оптимизация алгоритмов
### Шаг 1: Поиск дубликатов

In [None]:
def find_duplicates_slow(arr):
    # O(n²)
    duplicates = []
    for i in range(len(arr)):
        for j in range(i+1, len(arr)):
            if arr[i] == arr[j]:
                duplicates.append(arr[i])
    return duplicates

def find_duplicates_fast(arr):
    # O(n)
    seen = set()
    duplicates = []
    for num in arr:
        if num in seen:
            duplicates.append(num)
        else:
            seen.add(num)
    return duplicates

arr = [1, 2, 3, 2, 4, 5, 6, 7, 8, 9, 10, 2]
print("Медленный поиск:", find_duplicates_slow(arr))
print("Быстрый поиск:", find_duplicates_fast(arr))

### Шаг 2: Сравнение времени

In [None]:
import timeit

# Измерение времени
slow_time = timeit.timeit('find_duplicates_slow([1, 2, 3, 2, 4, 5, 6, 7, 8, 9, 10, 2])', 
                    globals=globals(), number=1000)
fast_time = timeit.timeit('find_duplicates_fast([1, 2, 3, 2, 4, 5, 6, 7, 8, 9, 10, 2])', 
                    globals=globals(), number=1000)

print(f'Медленный поиск: {slow_time:.4f} секунд')
print(f'Быстрый поиск: {fast_time:.4f} секунд')

## 📊 Как выбрать лучший алгоритм?
- **O(1):** Для фиксированного времени.
- **O(log n):** Для поиска в отсортированных структурах.
- **O(n):** Для однократного прохода по данным.
- **O(n log n):** Для эффективных сортировок (merge sort, quicksort).
- **O(n²):** Только для малых данных.
- **O(2ⁿ):** Экспоненциальный рост — избегайте при больших n.
- **Примеры:**
  - **Сортировка пузырьком:** O(n²).
  - **Сортировка слиянием:** O(n log n).
  - **Поиск в хэше:** O(1).
- **Аналогия:** Выбирайте алгоритм, как обувь для марафона: O(n log n) — кроссовки, O(n²) — тапочки.

## 📝 Домашнее задание
**Задача 1:** Реализуйте алгоритм поиска дубликатов с помощью словаря и сравните с предыдущими версиями.
**Задача 2:** Напишите функцию, которая находит пересечение двух списков через множества (O(n)) и через вложенные циклы (O(n²)). Сравните время выполнения.
**Задача 3:** Напишите отчет (200–300 слов), где:
- Объясните, как работает O-нотация.
- Сравните O(n) и O(n²) на примере своих функций.
- Объясните, почему встроенные функции работают быстрее.
- Приведите примеры, где оптимизация важна (например, обработка больших данных, веб-запросы).

In [None]:
# Ваш код здесь
def find_duplicates_dict(arr):
    # Реализация через словарь
    count = {}
    duplicates = []
    for num in arr:
        count[num] = count.get(num, 0) + 1
    for key, value in count.items():
        if value > 1:
            duplicates.append(key)
    return duplicates

dict_time = timeit.timeit('find_duplicates_dict([1, 2, 3, 2, 4, 5, 6, 7, 8, 9, 10, 2])', 
                     globals=globals(), number=1000)
print(f'Поиск через словарь: {dict_time:.4f} секунд')

In [None]:
# Сравнение времени
list_time = timeit.timeit('find_duplicates_slow([1, 2, 3, 2, 4, 5, 6, 7, 8, 9, 10, 2])', 
                   globals=globals(), number=1000)
set_time = timeit.timeit('find_duplicates_fast([1, 2, 3, 2, 4, 5, 6, 7, 8, 9, 10, 2])', 
                   globals=globals(), number=1000)

print(f'Через списки: {list_time:.4f} секунд')
print(f'Через множества: {set_time:.4f} секунд')

In [None]:
# Визуализация времени
import matplotlib.pyplot as plt

labels = ['O(n²)', 'O(n) через множество', 'O(n) через словарь']
times = [list_time, set_time, dict_time]

plt.bar(labels, times, color=['red', 'green', 'blue'])
plt.ylabel('Время (секунды)')
plt.title('Сравнение алгоритмов поиска дубликатов')
plt.show()

## ✅ Рекомендации по выполнению
- **Задача 1:** Используйте `dict` для подсчета количества.
- **Задача 2:** Для сравнения используйте `timeit`.
- **Подсказка:** Всегда ищите способы уменьшить сложность (например, хэши, сортировка, двоичный поиск).