## Notacja big-O (część II)

<div style="border:solid 1px;padding:20px;">
Asymptotyczne tempo wzrostu (aka Notacja asymtotyczna, Notacja duże-O, Notacja Landaua, Notacja Bachmann–Landau) to  miara określająca zachowanie wartości funkcji wraz ze wzrostem jej argumentów.
</div>

W teorii obliczeń wykorzystywana jest do opisu **złożoności obliczeniowej**, czyli zależności ilości potrzebnych zasobów (np. czasu lub pamięci) od rozmiaru danych wejściowych algorytmu.

Spójrzmy na kilka przykładów

### Stała złożoność obliczeniowa $O(1)$

In [1]:
def func_constant(values: list) -> None:
    '''
    Prints first item in a list of values.
    '''
    print(values[0])  # 1

In [2]:
func_constant([1,2,3])

1


Niezależnie od rozmiaru danych wejściowej funkcja wykona zawsze tą samą liczbę operacji (w naszym przypadku 1). Dla listy o długości 10, dla listy o długość 1 000 000 i dla listy o długości $n$, wykona tą samą liczbę operacji.

### Liniowa złożoność obliczeniowa $O(n)$

In [13]:
def func_lin(lst: list) -> None:
    '''
    Takes in list and prints out all values
    '''
    # n razy
    for val in lst:  # 1 (val = ...)
        print(val)

In [14]:
func_lin([1,2,3])

1
2
3


Ta funkcja wykonuje się w czasie $O(n)$ (liniowym). Oznacza to, żę liczba operacji, które musi wykonać algorytm jest proporcjonalna jest proporcjonalna do rozmiaru danych wejściowych $n$.

### Kwadratowa złożoność obliczeniowa $O(n^2)$

In [4]:
def func_quad(lst):
    '''
    Prints pairs for every item in list.
    '''
    # n razy
    for item_1 in lst:  # 1 (item_1 = ...)
        # n razy
        for item_2 in lst:  # 1 (item_2 = ...)
            print(item_1,item_2)

$$T(n) = n\cdot (1 + n\cdot 1) = n^2 + n$$

$$O(n^2)$$

In [5]:
lst = [0, 1, 2, 3]
func_quad(lst)

0 0
0 1
0 2
0 3
1 0
1 1
1 2
1 3
2 0
2 1
2 2
2 3
3 0
3 1
3 2
3 3


W tym przykładzie mamy zagnieżdżoną pętle. Oznacza to, że listy o długości $n$ algorytm będzie musiał wykonać $n$ operacji dla każdego elementu listy. Czyli, $n\cdot n = n^{2}$ operacji.

#### Reguła najsłabszego ogniwa

Złożoność obliczeniowa całego algorytmu determinuje nam złożoność obliczeniowa najwolniejszego ze składników tego algorytmu.

Przykład \
Jeżeli zobaczymy w naszym algorytmie podwójną pętle (zależną od rozmiaru parametrów wejściowych) oznaczać to będzie, że złożoność obliczeniowa algorytmu będzie conajmniej kwadratowa (a może jeszcze gorsza). 

In [17]:
def comp(lst: list):
    '''
    This function prints the first item O(1)
    Then is prints the first 1/2 of the list O(n/2)
    Then prints a string 10 times O(10)
    '''
    print(lst[0])  # 1
    
    midpoint = len(lst) // 2  # 3 (1 na len, 1 na dzielenie, 1 na przypisanie)

    mid_list = lst[:midpoint] # n/2 (bo wycinek długości n/2)
    
    # n/2 razy (bo, mid_list ma długości n/2)
    for val in mid_list:  # 1 (bo przypisanie do val)
        print(val)

    # n razy
    for x in range(10):  # 2 (1 na generacje i 1 na przyisanie do x) 
        print('number')

In [18]:
lst = [1,2,3,4,5,6,7,8,9,10]
comp(lst)

1
1
2
3
4
5
number
number
number
number
number
number
number
number
number
number


$$T(n) = 1 + 2 + \frac{n}{2} + \frac{n}{2} \cdot 1 + n \cdot 2 = 3\cdot n + 3$$

$$f(n) = n$$

$$O(n)$$

### Najgorszy vs najlepszy przypadek

Najczęściej interesuje nas tylko analiza najgorszego przypadku (tzn. najdłuższy możliwy scenariusz). Należy być jednak świadomym, że najgorszy i najlepszy przypadek mogą się znacznie różnić w złożoności obliczeniowej i umieć przeanalizować obie złożoności. Do ich analizy używamy różnych notacji.

In [35]:
x = 5

x = "Ala"

'Ala'

In [39]:
from typing import Any


def matcher(lst: list[Any], match: Any) -> bool:
    '''
    Given a list lst, return a boolean indicating if match item is in the list
    '''
    # n razy
    for item in lst:  # 1
        if item == match:  # 1
            return True
    return False

In [41]:
lst = list(range(10))
lst

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

#### Najlepszy przypadek (notacja dużego omega)

Najlepszy możliwy przypadek w naszym algorytmie to sytuacja, w której poszukiwany element znajdować się będzie na pierwszej pozycji listy.

In [42]:
matcher(lst, 0)

True

$$T(n) = 2$$
$$f(n) = 2$$
$$\Omega(n) = 1$$

#### Najgorszy przypadek (notacja dużego O)

Najgorszy możliwy przypadek w naszym algorytmie to sytuacja, w której poszukiwanego elementu w ogóle nie ma na liście. Wtedy algorytm musi przejść przez wszystkie elementy listy.

In [43]:
matcher(lst, 10)

False

$$T(n) = 2\cdot n$$
$$f(n) = n$$
$$O(n)$$

### Średni przypadek (notacja dużego Theta)

Średni przypadek zdefiniowany jest jako stosunek wszystkich możliwych przypadków, do liczby tych przypadków. W naszym przykładzie będzie to:

$$T(n) = \frac{1+2+3+...+n}{n}$$

Znając wzór na sumę ciągu arytmetycznego 

$$ \sum_{i=0}^{n} {i} = \frac{n(n+1)}{2} $$

możemy zapisać:

$$T(n) = \frac{\frac{n\cdot(n+1)}{2}}{n} = \frac{n+1}{2}$$
$$\Theta(n)=n$$

Jak wynika z definicji znalezienie przypadku średniego często wymaga wykonania złożonych obliczeń. W przyybliżeniu możemy utożsamiać przypadek średni z przypadkiem najgorszym i w ponad 90% przypadków będziemy mieli rację. 

Podsumowując:
- przypadek najgorszy $O(n)$
- przypadek najlepszy $\Omega(1)$
- przypadek średni $\Theta(n)$

**Dopisek.** Przyjęło się używać oznaczeń: $O()$ na przypadek najgorszy, $\Omega()$ na przypadek najlepszy i $\Theta(n)$ na przypadek średni, ale jeżeli chcielibyśmy używać tych notacji precyzyjnie, to oznaczają one coś zupełnie innego (opisują asymptotyczne zachowania funkcji). Nie jest to jednak na tym etapie istotne. Osoby zainteresowane mogą poznać więcej szczegółów na przykład tutaj: https://youtu.be/lj3E24nnPjI?si=SqcBrOnq-IyYh_71&t=533

### Złożoność pamięciowa

Często interesuje nas też ile pamięci w funkcji rozmiaru danych wejściowych potrzebuje algorytm. Taką złożoność nazywamy złożonością pamięciową (ang. space complexity).

Zróbmy przykład

In [28]:
def printer(n=10):
    '''
    Prints "hello world!" n times
    '''
    for x in range(n):  # potrzeba 1 komórki na wartość x
        print('Hello World!')

In [29]:
printer()

Hello World!
Hello World!
Hello World!
Hello World!
Hello World!
Hello World!
Hello World!
Hello World!
Hello World!
Hello World!


Ile python musi zaalokować pamięci na potrzeby realizacji tego algorytmu?

Jedną komórkę (potrzebuje przechowywać wartość zmiennej x). Stąd złożoność pamięciowa algorytmu to:

$$O(1)$$

A złożoność obliczeniowa ?

Wykonuje n operacji, czyli:
$$O(n)$$

Zróbmy drugi przykład.

In [31]:
def create_list(n: int) -> list:
    new_list = []  # 1 komórkę na listę
    
    for num in range(n):  # 1 komórkę na num
        new_list.append('new')  # n komórek w liście new_list
    
    return new_list

In [32]:
print(create_list(5))

['new', 'new', 'new', 'new', 'new']


Ile python będzie musiał zaalokować pamięci na potrzeby tego algorytmu?

$n$ komórek, ponieważ wypełnia listę $n$ elementami (tworzy $n$-elementową listę). Dlatego złożoność pamięciowa tego algorytmu to:
$$O(n)$$

A złożoność obliczeniowa? 

Też
$$O(n)$$

### Zastosowanie złożoności obliczeniowej w codziennej pracy programisty

W jaki sposób później wykorzystujemy tą wiedzę w programowaniu?

https://wiki.python.org/moin/TimeComplexity