## Занятие 4:
## Сложность алгоритмов


### Списки (lists)

#### $O(1)$ - класс сложности имеют операции, которые выполняются за константное время, например, создание переменной или сложение небольших чисел.

Название                           | Операция
-----------------------------------|---
Получение элемента                 | `l[i]`
Сохранение элемента                | `l[i] = 0`
Размер списка                      | `len(l)`
Добавление элемента в конец списка | `l.append(5)`
Удаление последнего элемента (pop) | `l.pop()`
Очищение списка                    | `l.clear()`

#### $O(b-a)$, где $a$ и $b$ - границы среза.

Название   | Операция
-----------|----------
Получение среза | `l[a:b]`

#### $O(len(...))$

Название   | Операция
-----------|----------
Расширение | `l.extend(...)`
Создание   | `list(...)`

#### $O(N)$

Название   | Операция
-----------|----------
Сравнение списков (==, !=) | `l_1 == l_2`
Вставка | `l[a:b] = ... `
Удаление элемента (del) | `del l[i]`
Проверка наличия | `x in/not in l`
Копирование | `l.copy()`
Удаление значения (remove) | `l.remove(...)`
Удаление элемента (pop) | `l.pop(i)`
Получение минимального/максимального значения | `min(l)/max(l)`
Разворачивание списка | `l.reverse()`
Перебор |  `for v in l:`

#### $O(N\log N)$

Название   | Операция
-----------|----------
Сортировка | `l.sort()`

#### $O(k N)$

Название   | Операция
-----------|----------
Умножение  | `k*l`

### Множества (sets)

#### $O(1)$ - класс сложности имеют операции, которые выполняются за константное время, например, создание переменной или сложение небольших чисел.

Название   | Операция
-----------|----------
Размер множества | `len(s)`
Добавление элемента | `s.add(5)`
Проверка наличия значения | `x in/not in s`
Удаление значения (remove) | `s.remove(..)`
Удаление значения (discard) | `s.discard(..)`
Удаление значения (pop) | `s.pop()`
Очищение множества | `s.clear()`

#### $O(len(...))$

Название   | Операция | Сложность
-----------|----------|----
Создание | `set(...)` | 
Сравнение множеств (==, !=) |  `s != t` | $O(len(s))$
Сравнение множеств (<=/<) | `s <= t` | $O(len(s))$
Сравнение множеств (>=/>) | `s >= t` | $O(len(t))$

#### $O(len(s)+len(t))$

Название   | Операция
-----------|----------
Объединение (union) | `s | t`
Пересечение (intersection) | `s & t`
Разность (difference) | `s - t`
Симметричная разность | `s ^ t`

#### $O(N)$

Название   | Операция
-----------|----------
Перебор множества | `for v in s:`
Копирование | `s.copy()`

### Словари (dict и defaultdict)

#### $O(1)$

Название   | Операция
-----------|----------
Получение элемента | `d[k]`
Сохранение элемента | `d[k] = v`
Размер словаря | `len(d)`
Удаление элемента (del) | `del d[k]`
get/setdefault | `d.get(k)`
Удаление (pop) | `d.pop(k)`
Удаление (popitem) | `d.popitem()`
Очищение словаря | `d.clear()`
Получение ключей | `d.keys()`

####  $O(len(...))$

Название   | Операция
-----------|----------
Создание словаря | `dict(...)`

#### $O(N)$

Название   | Операция
-----------|----------
Перебор элементов | `for k in d:`

Операция `for i in range(...)` имеет сложность $O(len(...))$. Для `for i in range(1, 10)` она равна $O(1)$.

In [1]:
def f_1():
    for i in range(10000000000):
        pass
    
%time f_1()

KeyboardInterrupt: 

In [3]:
def f_2():
    for i in range(0,10000000000):
        pass
    
%time f_2()

KeyboardInterrupt: 

Как Вы думаете какоя алгоритмическая сложность будет у операций

1. `for i in range(len(alist)/2)` и 
2. `for i in range(len(alist)/1000000)`?

1. $O(len(alist)/2)$
2. $O(len(alist)/1000000)$

При сравнении двух списков на равенство, класс сложности должен быть $O(N)$, как указано в таблице выше.
Однако в реальности это значение нужно умножить на $O==(...)$, 
где $O==(...)$ это класс сложности для операции сравнения (==) двух значений в списке.
Если мы работаем с целыми числами (int), то сложность сравнения будет равна $O(1)$, если со строками (string),
то в худшем случае мы получим $O(len(string))$.

### Закон сложения для O-нотации

$$O(f(n)) + O(g(n)) = O(f(n) + g(n))$$

При сложении двух классов сложности складываются функции этих классов. 

$$O(N) + O(\log N) = O(N + \log N) = O(N)$$

Вызов функции $f(...)$ имеет сложность $O(N)$, а вызов $g(...)$ – $O (N ⋅ \log N)$. Давайте вызовим эти функции друг за другом. В итоге сложность действия будет равна:

$$O(N) + O(N\log N) = O(N + N\log N) = O(N\log N)$$

```python
if test:
  block 1
else:
  block 2
```

* test – $O(N)$,
* block 1 – $O(N^2)$,
* block 2 – $O(N)$.

$O(N) + \max(O(N^2),O(N)) = O(N) + O(N^2) = O(N + N^2) = O(N^2)$

### Закон умножения для $O$-нотации

$$O(f(N)) ⋅ O(g(N)) = O(f(N) ⋅ g(N))$$

Предположим, некоторая функция $f(...)$ имеет класс сложности $O(N^2)$. Выполним ее в цикле $N$ раз:

```python
for i in range(N):
    f(...)
```

$$O(N) ⋅ O(N^2) = O(N ⋅ N^2) = O(N^3)$$

Таким образом, это правило позволяет вычислять класс сложности для выполнения некоторого повторяющегося несколько раз выражения. Необходимо умножить класс сложности количества повторений на класс сложности самого выражения.

### Пример 1

In [32]:
def is_unique1 (alist):
    for i in range(len(alist)):             # 1
        if alist[i] in alist[i+1:]:           # 2
            return False                        # 3
    return True                             # 4

$O(N)$ – для каждого индекса. 

1. Создание объекта `range` требует выполнения трех последовательных операций: вычисления аргументов, передачу их в `__init__` и выполнение тела `__init__`. Две последние имеют класс сложности $O(1)$. Сложность $len(alist)$ также $O(1)$, поэтому общая сложность выражения `range(len(alist))` – $O(1) + O(1) + O(1) = O(1)$.
2. $O(N)$ – получение индекса + сложение + создание среза + проверка in: $O(1) + O(1) + O(N) + O(N) = O(N)$
3. $O(1)$ – в худшем случае никогда не выполняется, можно проигнорировать.
4. $O(1)$ – в худшем случае всегда выполняется.

$O(N) ⋅ O(N) + O(1) = O(N^2)$

Т. е. если размер списка увеличится вдвое, то выполнение функции займет в 4 раза больше времени.

In [34]:
def is_unique1 (alist : [int]) ->bool:
    for i in range(len(alist)):          # O(N)
        for j in range(i+1, len(alist)):   # O(N)
            if alist[i] == alist[j]:          # O(1)
                return False                   # O(1)
    return True                           # O(1)

### Пример 2

In [35]:
def is_unique2 (alist : [int]) -> bool:
    copy = list(alist)             # 1
    copy.sort()                    # 2
    for i in range(len(alist)-1):  # 3
        if copy[i] == copy[i+1]:     # 4
            return False               # 5
    return True                    # 6

1. $O(N)$.
2. $O(N \log N)$ – для быстрой сортировки.
3. $O(N)$ – на самом деле $N-1$, но это то же самое. Операции получения размера списка и вычитания имеют сложность $O(1)$.
4. $O(1)$ – сложение, две операции получения элемента по индексу и сравнение – все со сложностью $O(1)$.
5. $O(1)$ – в худшем случае никогда не выполняется.
6. $O(1)$ – в худшем случае всегда выполняется.

Определим класс сложности функции `is_unique2`:

$$O(N) + O(N\log(N)) + O(N) ⋅ O(1) + O(1) = O(N + N\log(N) + O(N ⋅ 1) + 1) = O(N + N\log(N) + N + 1) = O(N\log(N) + 2N + 1) = O(N\log(N))$$

In [38]:
data = [1,2,3,4,2,2,4,6,5,7,5,8,8,9]

# вариант 1
copy = list(data)    # O(N)
copy.sort()           # O(N log N)

# вариант 2
copy = sorted(data)  # O(N log N)

### Пример 3

In [39]:
def is_unique3 (alist : [int]) -> bool:
    aset = set(alist)               # O(N)
    return len(aset) == len(alist)  # O(1)

In [40]:
def is_unique3 (alist : [int]) -> bool:
    return len(set(alist)) == len(alist)

Класс сложности для всей функции:

$O(N) + O(1) = O(N + 1) = O(N)$