
<div id="capcalera">
<p><a href="https://colab.research.google.com/github/algorismica2019/problemes/blob/master/Complexitat.ipynb"><img style="margin:-10px 10px 20px 0" width="150px" align="right" src="https://raw.githubusercontent.com/algorismica2019/problemes/master/assets/colab-badge.png?raw=1" alt="Obrir a Colab" title="Obrir i executar a Google Colaboratory"></a></p>
<p style="clear:both"><img align='left' width="300px" style="padding-right:10px;float=left" src="https://raw.githubusercontent.com/algorismica2019/problemes/master/assets/al-khwarizmi.png">Aquest notebook forma part dels continguts teòrics dels problemes de l'assignatura d'<strong>Algorísmica</strong> del Grau d'Enginyeria Informàtica a la <a href="https://mat.ub.edu">Facultat de Matemàtiques i Informàtica</a> de la <a href="https://www.ub.edu">Universitat de Barcelona</a> </p>

<p>Els problemes s'ofereixen sota llicència <a href="https://creativecommons.org/licenses/by-nc-nd/3.0/us/legalcode">CC-BY-NC-ND license</a>, i el codi sota <a href="https://opensource.org/licenses/MIT">Llicència MIT</a>.</p>

</div>

# <span class="tema">( Continguts teòrics)</span> Complexitat

## Documentació relacionada

- CS Dojo "Introduction to Big O Notation and Time Complexity" [video]: https://www.youtube.com/watch?v=D6xkbGLQesk 

## Complexitat de les operacions

### Mesura empírica del cost computacional.

`timeit` és un mòdul python que ens permet mesurar de forma aproximada el temps de procés d'unes linies de codi:

```pyton
import timeit

start_time = timeit.default_timer()
func1()
print(timeit.default_timer() - start_time)

start_time = timeit.default_timer()
func2()
print(timeit.default_timer() - start_time)
``` 

Si treballem en un notebook de Jupyter podem fer servir la instrucció `%timeit` per calcular el temps de càlcul d'un línia de codi:

```python
def f(x):
    return x * x

%timeit for x in range(100): f(x)

> 100000 loops, best of 3: 20.3 µs per loop
```

Si poseu `%%timeit` al principi d'una cel·la calculareu el temps de càlcul de tota la cel·la.

```python
%%timeit 
l = []
for i in range(1000):
    l.append(i ** 2)

> 1000 loops, best of 3: 340 µs per loop
```


In [None]:
# Tambe podem usar time.clock abans i després del codi que volem mesurar. 
# Atenció però, time.clock no té un funcionament idèntic en els diferents sisemes operatius (https://docs.python.org/2/library/time.html)

# Observa els dos codis següents i la diferència de temps
import time

t1 = time.clock()

llista = []
for i in range(5000000):
    llista.append(i)

t2 = time.clock()

print(f"El temps de proces ha estat de {(t2-t1)/1000} s")

  import sys


El temps de proces ha estat de 0.0006029330000000002 s


  del sys.path[0]


In [None]:
import time

t1 = time.clock()

llista2 = [i for i in range(5000000)]

t2 = time.clock()

print(t2 - t1)

# En fer servir una comprensió de llistes el temps d'execució es redueix a la meitat!

  This is separate from the ipykernel package so we can avoid doing imports until


0.37919390000000064


  import sys


In [None]:
%%timeit 
l = []
for i in range(1000):
    l.append(i ** 2)

1000 loops, best of 5: 278 µs per loop


### <span class="exercici">Exercici 1. Fes una funció que mostri els numeros senars entre 13 i 13000. Quin temps triga? compara els teus resultats amb els dels teus companys</span>

# Complexitat


## Càlcul

Estimem la complexitat d'un algorisme comptant el nombre de funcions elementals que fa l'algorisme. Usualment calcularem el temps del pitjor cas, i usarem la notació gran O.

Anem a veure uns casos simples de càlcul de complexitats:

### Complexitat d'una operació

*operació simple*

En general la complexitat d'aquest cas és d'ordre Constant, ja que no depèn de la mida de l'entrada. Però atenció, quan treballem amb llistes algunes operacions aparentment simples, tenen una complexitat d'ordre **n**. Recordeu que en anteriors sessions hem especificat l'ordre de complexitat de les operacions més habituals amb col.leccions. Altres complexitats les podeu consultar a <a href="https://wiki.python.org/moin/TimeComplexity">TimeComplexity </a>

- LLista.append('a')                    # complexitat O(1)
- Llista.insert(2,'a')                  # complexitat O(n)

### Complexitat d'un bloc condicional
+ if condicio:
    + operacio1
+ else:
    + operacio2

Quan ens trobem amb un bloc condicional (if, elif, else) la complexitat serà la màxima de les complexitats de les diferents opcions. Per ex. si complexitat(operacio1)=O(n) i complexitat(operacio2)=O(1), la complexitat del bloc if serà de O(n), que és l'opció amb més complexitat.

### Complexitat d'un conjunt d'instruccions

    def: funcio(): 
        operacio1 
        operacio2 
        operacio3 
        operacio4 
        operacio5 
        if condicio: 
            operacio6 
        else: 
            operacio7 


Quan s'agrupen diverses operacions simples la complexitat és la suma de totes elles, tenint en compte que quan treballem amb ordres de magnitud i sumem diverses quantitats, només ens quedem amb la cota superior, que és la que mana. 

Així si 
- complexitat(operacio1) == complexitat(operacio2) == complexitat(operacio3) és O(1), 
- i la complexitat(operacio4) és O(n^2), i la complexitat(operacio5) és O(log n), 
- la complexitat de totes aquestes serà d'ordre O(n^2), que és la complexitat major. 
- I sumant la complexitat del bloc condicional (operacio6 és O(n) i operacio7 és O(1)), 
- seguim tenint O(n^2), ja que aquest ordre predomina sobre O(n).

La complexitat final d'aquest bloc és O(n^2).

### Complexitat dels blocs iteratius (bucles)

    for i in range(1, n): 
        operacio1 
    
    for j in range(1, n): 
        operacio1

En el cas dels bucles iteratius, primer cal calcular la complexitat de les operacions dins el bucle, i després multiplicar-les pel nombre de vegades que iterem.
En els exemples, si complexitat(operacio1) és O(1), la complexitat dels blocs és O(n), ja que tots -- en el pitjor cas -- iteren n vegades sobre aquesta operació.

### Complexitat dels blocs iteratius imbricats

    for i in range(1, n):
        for j in range(1, n): 
            operacio1

En el cas dels bucles imbricats cal multiplicar tantes vegades com bucles hi hagi. A l'exemple, la complexitat del bloc de la j és O(n) però la complexitat del bloc de la i és O(n^2). És a dir, aquest tros de codi té una complexitat quadràtica.

### <span class="exercici">Exercici 2. Quin ordre de complexitat segons la notació  𝑂()  tenen els algorismes que fan el següent nombre d'operacions?</span>

+ $n + 2n$
+ $3 n^2 + log n$
+ $2^n + n^5$
+ 3 sumes + 2 multiplicacions (amb nombres llargs)

### <span class="exercici">Exercici 3. Amb $n=50$ té sentit un algorisme d'$O(n!)$? Per què?</span>

### Complexitat de les operacions més habituals de Python

L'assignació d'un valor a una variable (que s'implementa mitjançant la còpia d'una referència) és `O(1)`. 

Els operadors simples (`+`, `*`, etc.) sobre enters petits (menors de 12 dígits) són `O(1)`.

Els operadors sobre col·leccions de dades de longitud `N`, `N = len(data-type)` són:

#### Lists:
                               
Operació      | Exemple      | Complexitat     | Notes
--------------|--------------|---------------|-------------------------------
Index         | l[i]         | O(1)	     |
Store         | l[i] = 0     | O(1)	     |
Length        | len(l)       | O(1)	     |
Append        | l.append(5)  | O(1)	     |
Pop	          | l.pop()      | O(1)	     | equivalent a l.pop(-1)
Clear         | l.clear()    | O(1)	     | equivalent a l = []
Slice         | l[a:b]       | O(b-a)	 | O(len(l)-0)=O(N)
check ==, !=  | l1 == l2     | O(N)      |
Insert        | l[a:b] = ... | O(N)	     |
Delete        | del l[i]     | O(N)	     | 
Containment   | x in/not in l| O(N)	     | cerca a la llista
Copy          | l.copy()     | O(N)	     | equivalent a l[:] que és O(N)
Remove        | l.remove(...)| O(N)	     | 
Pop	          | l.pop(i)     | O(N)	     | 
Extreme value | min(l)/max(l)| O(N)	     | cerca a la llista
Reverse	      | l.reverse()  | O(N)	     |
Iteration     | for v in l:  | O(N)          |
Sort          | l.sort()     | O(N Log N)    | 

#### Sets (encara que no els estudiarem explícitament, afegim aquí les complexitats)

Operació      | Exemple      | Complexitat     | Notes
--------------|--------------|---------------|-------------------------------
Length        | len(s)       | O(1)	     |
Add           | s.add(5)     | O(1)	     |
Containment   | x in/not in s| O(1)	     | 
Remove        | s.remove(..) | O(1)	     | 
Discard       | s.discard(..)| O(1)	     | 
Pop           | s.pop()      | O(1)	     |
Clear         | s.clear()    | O(1)	     | equivalent a s = set()
check ==, !=  | s != t       | O(len(s))     | 
<=/<          | s <= t       | O(len(s))     | issubset
\>=/>         | s >= t       | O(len(t))     | issuperset 
Union         | s l t        | O(len(s)+len(t)) |
Intersection  | s & t        | O(len(s)+len(t)) |
Difference    | s - t        | O(len(s)+len(t)) |
Symmetric Diff| s ^ t        | O(len(s)+len(t)) |
Iteration     | for v in s:  | O(N)          |
Copy          | s.copy()     | O(N)	     |

#### Dictionaries
                             
Operació      | Exemple      | Complexitat     | Notes
--------------|--------------|---------------|-------------------------------
Index         | d[k]         | O(1)      |
Store         | d[k] = v     | O(1)      |
Length        | len(d)       | O(1)      |
Delete        | del d[k]     | O(1)      |
get/setdefault| d.method     | O(1)      |
Pop           | d.pop(k)     | O(1)      |
Pop item      | d.popitem()  | O(1)      |
Clear         | d.clear()    | O(1)      | equivalent a s = {} o = dict()
View          | d.keys()     | O(1)      | el mateix que d.values()
Iteration     | for k in d:  | O(N)      | totes les formes: keys, values, items

In [None]:
# Exemple 1 de càlcul de complexitat

def funcio1(n):
    for i in range(n): # Executem un cop aquest for
        print(i)       # Executem n vegades aquesta instrucció

funcio1:  $O(n)$

In [None]:
# Exemple 2 de càlcul de complexitat

def funcio2(n,m):
    for i in range(1,n*n,2): # Aquest for s'executa de 1 fins a n*n amb passos de 2 en 2
        for j in range(m*m, 0, -1): # Aquest s'executa m*m vegades
                                    # Com que un depèn de l'altre, per a cada valor 'i' executem m*m operacions
                                    # i, per tant, el total serà la multiplicació dels dos valors
                    
            print ("("+str(i)+","+str(j)+")", end=" ")
        print()
        
funcio2(4,3)  

(1,9) (1,8) (1,7) (1,6) (1,5) (1,4) (1,3) (1,2) (1,1) 
(3,9) (3,8) (3,7) (3,6) (3,5) (3,4) (3,3) (3,2) (3,1) 
(5,9) (5,8) (5,7) (5,6) (5,5) (5,4) (5,3) (5,2) (5,1) 
(7,9) (7,8) (7,7) (7,6) (7,5) (7,4) (7,3) (7,2) (7,1) 
(9,9) (9,8) (9,7) (9,6) (9,5) (9,4) (9,3) (9,2) (9,1) 
(11,9) (11,8) (11,7) (11,6) (11,5) (11,4) (11,3) (11,2) (11,1) 
(13,9) (13,8) (13,7) (13,6) (13,5) (13,4) (13,3) (13,2) (13,1) 
(15,9) (15,8) (15,7) (15,6) (15,5) (15,4) (15,3) (15,2) (15,1) 


funcio2: $ O(\dfrac{n^2}{2}m^2)=O(n^2m^2) $

In [None]:
# Exemple 3 de càlcul de complexitat

# Aquest programa substitueix per True si hi ha coincidència amb el número donat o False en els atres casos

def funcio3(llista, numero): # suposem n=len(llista)
    
    if numero in llista:              # n operacions
        for it in range(len(llista)): # n operacions
            if llista[it]==numero:    # Els accessos i assignacions són 1 sola operació
                llista[it] = True
            else:
                llista[it] = False
        return llista
        
    else:
        return [False]*len(llista)    # n operacions

# En aquest cas fem n+n operacions ja que, tot i estar una posició identat cap a la dreta, la comprovació
# inicial només es fa un cop.

# Tan si entra a la condició 'numero in llista' com si no hi entra, es faran n operacions més.
    
llista = [1,2,5,-6,3,-8,7,-9,5,8,5]
funcio3(llista, 5)

[False, False, True, False, False, False, False, False, True, False, True]

funcio3: $ O(n+n)=O(2n)=O(n) $

In [None]:
# Exemple 4 de càlcul de complexitat

def funcio4(num):                     # Per abreujar, n=num
    llista = [0] * num                  # inicialitzar val n
    suma = 0 
    for i in range(1, len(llista)+1):  # Aquest for executarà la part interna n vegades 
        llista.insert(i, i)            # Insertar val n (veure collections.ipynb)
        suma += llista[i - 1] + llista[i]  # 2 accessos i una suma = 3 operacions
    
    print(llista, suma)               # Imprimir una llista val n i imprimir un enter, 1
        
        
# Notem que per a cada valor de 'i' fem un insert. Per tant es multiplicarà n*(n+3) 
# ja que n+3 és la part de dins del 'for'

funcio4(10)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 0, 0, 0, 0, 0, 0, 0, 0, 0] 100


funcio3: $ O\Big(n + n(n+3)+(n+1)\Big)=O(n+n^2 +n)=O(n^2 +2n) = O(n^2 +n) $ o també $O(n^2)$

### <span class="exercici">Exercici 5. Calcula la complexitat d'aquestes dues funcions:</span>

```python
def nums1a5():
    a = 1            
    while (a < 5):
        print(a)
        a += 1 
```
 
```python
def nums1a10():
    for i in range(0, 10): # valor inicial:0 
                       # valor final: 10 [quan hi arriba surt, no itera]
                       # increment: no s'indica, per defecte és 1
    print(i)
```    
Tens alguna observació?

## Algorismes ordenació i cerca
Incloem també en aquest notebook els principals algorismes d'ordenació i cerca vistos a teoria amb indicació de la seva complexitat

### Mergesort, de complexitat O(n log n)

In [None]:
def merge(left, right):
    """
    Aquesta funció fusiona dues llistes ordenades amb una de nova, també ordenada
    """
    result = []
    i, j = 0, 0
    while(i < len(left) and j < len(right)):
        if (left[i] <= right[j]):
            result.append(left[i])
            i = i + 1
        else:
            result.append(right[j])
            j = j + 1

    result += left[i:]
    result += right[j:]
    return result

In [None]:
def mergesort(list):
    """
    Aquesta funció va partint la llista en una banda dreta i una esquerra
    fins que aquestes bandes tenen un element
    quan ho aconsegueix, crida merge per fusionar ambdues bandes de 
    manera ordenada
    fins arribar a fusionar la llista completa original.
    """
    if len(list) < 2:
        return list
    else:
        middle = len(list) // 2
        left = mergesort(list[:middle])
        right = mergesort(list[middle:])
        return merge(left, right)

In [None]:
mergesort([9,8,4,2,7,-4,3])

[-4, 2, 3, 4, 7, 8, 9]

### Quicksort, de complexitat O(n log n)

In [None]:
def partition(A, first, last):
    """
    Aquesta funció tria el valor mig entre l'element inicial, final i mig 
    d'una llista i l'ubica al lloc que li correspondrà quan la llista està 
    ordenada, alhora deixa a la seva esquerra valors menors i a la dreta
    valors majors. Per tant altera A
    A més retorna la posició de la partició
    """
    mid = (first + last) // 2  #ordenem A[first],A[mid],A[last]
    if A[first] > A [mid]: A[first], A[mid] = A[mid], A[first]
    if A[first] > A [last]: A[first], A[last] = A[last], A[first]
    if A[mid] > A[last]:   A[mid], A[last] = A[last], A[mid]  
    A[mid], A[first] = A[first], A[mid] #valor mig a l’inici
    pivot = first
    i = first + 1
    j = last
  
    while True:
        while i <= last and A[i] <= A[pivot]: i += 1
        while j >= first and A[j] > A[pivot]: j -= 1
        if i >= j: break
        else:
            A[i], A[j] = A[j], A[i] #intercanviem, fem avançar i j
    A[j], A[pivot] = A[pivot], A[j] #vector partit, pivot=j
    return j

In [None]:
def quick_sort(A):
    quick_sort_r(A, 0, len(A) - 1)

def quick_sort_r(A , first, last):
    if last > first:
        pivot = partition(A, first, last)
        quick_sort_r(A, first, pivot - 1)
        quick_sort_r(A, pivot + 1, last)

In [None]:
A = [9, 8, 4, 2, 7, -4, 3]
quick_sort(A)
print(A)

[-4, 2, 3, 4, 7, 8, 9]


### Cerca lineal, de complexitat O(n)

In [None]:
def search(x,nums):
    nums.append(x)
    i = 0
    while nums[i] != x:
        i += 1
    if i < len(nums) - 1: 
        return i
    else: 
        return -1

In [None]:
search(10, [9, 8, 4, 2, 7, -4, 3])

-1

### Cerca binària, de complexitat O(logn)

In [None]:
def binsearch(x,nums):
    recbinsearch(x,nums,0,len(nums)-1)
    
    
def recbinsearch(x, nums, low, high):
    # low, high defineixen els limits de la llista
    # on buscar, així no cal crear noves llistes
    if low>high: 
        return -1
    mid = (low + high) // 2    
    items = nums[mid]   
    if items == x:
        print(mid)
    elif x < items:
        return recbinsearch(x, nums, low, mid-1)
    else: 
        return recbinsearch(x, nums, mid+1, high)

In [None]:
binsearch(5, [1, 2, 3, 4, 5, 6, 7])

4
