<span style="font-size:2em; color:blue">
    Tema 26: Análisis de la complejidad de los algoritmos
</span>  

----------

[José A. Alonso](https://www.cs.us.es/~jalonso)  
[Departamento de Ciencias de la Computación e I.A.](https://www.cs.us.es)  
[Universidad de Sevilla](http://www.us.es)  
Sevilla, 22 de agosto de 2019

> __Notas:__ 
+ La versión interactiva de este tema se encuentra en [Binder](https://mybinder.org/v2/gh/jaalonso/Temas_interactivos_de_PF_con_Haskell/master?urlpath=lab/tree/temas/Tema-26.ipynb).
+ Se desactiva el [corrector estilo de Haskell](https://github.com/gibiansky/IHaskell/wiki#opt-no-lint).

In [1]:
:opt no-lint

# La notación de Landau

## Definición de O(g)

+ La función f pertenece a la clase de complejidad de g (en símbolos, 
  f ∈ O(g)) si existe un c y un n₀ tales que para todo n ≥ nₒ se tiene que
  |f(n)| ≤ c|g(n)|
+ f ∈ O(g) syss ∃c∃nₒ∀n(n ≥ n₀ → |f(n)| ≤ c|g(n)|)
+ f ∈ O(g) syss

```sesion
limsup   |f(x)/g(x)| < ∞
x → ∞
```

+ Intuitivamente, sólo se considera el término más importante y se ignoran los
  factores constantes.

+ Ejemplos:
    + 3n²+5n-7 ∈ O(n²).
    + O(2g(n)) = O(g(n))
    + O(log n) = O(ln n)
    + O(3n²+5n-7) = O(n²)
    + O(n²) ⊂ O(n³)
    + O(2ⁿ) ⊂ O(3ⁿ)

## Propiedades

+ Si g ∈ O(f) y h ∈ O(f), entonces g+h ∈ O(f)

+ Si f ∈ O(g) y g ∈ O(h), entonces f ∈ O(h)

+ f+g ∈ O(max(f,g))

+ O(f+g) = O(max(f,g))

+ Si f ∈ O(f') y g ∈ O(g'), entonces f+g ∈ O(f'+g')

+ Si f ∈ O(f') y g ∈ O(g'), entonces f.g ∈ O(f'.g')

+ Si f ∈ O(g) y a ∈ ℜ⁺-{0}, entonces a.f ∈ O(g)

+ Si f ∈ O(g) y n ≥ 1, entonces fⁿ ∈ O(gⁿ)

# Órdenes de complejidad

## Principales órdenes de complejidad

> | Orden      | Nombre      |
> |------------|-------------|
> | O(1)       | constante   |
> | O(log n)   | logarítmica |
> | O(n)       | lineal      |
> | O(n log n) | casi lineal |
> | O(n²)      | cuadrática  |
> | O(n³)      | cúbica      |
> | O(a^n)     | exponencial |

## Tasas de crecimiento

![](fig/ordenes.png)

## Jerarquía de complejidad

+ O(1) ⊂ O(log n) ⊂ O(n) ⊂ O(n log n) ⊂ O(n²) ⊂ O(n³) ⊂ O(2ⁿ)

## Efectos de duplicaciones

+ Efecto de duplicar el dato de entrada

> | T(n)    | n = 100 | n = 200          |
> |---------|---------|------------------|
> | log(n)  | 1 h.    | 1.15 h.          |
> | n       | 1 h.    | 2 h.             |
> | nlog(n) | 1 h.    | 2.30 h.          |
> | n²      | 1 h.    | 4 h.             |
> | n³      | 1 h.    | 8 h.             |
> | 2ⁿ      | 1 h.    | 1.27*10³⁰ h.     |

+ Efecto de duplicar el tiempo disponible

> | T(n)    | t = 1h  | t = 2h    |
> |---------|---------|-----------|
> | log(n)  | n = 100 | n = 10000 |
> | n       | n = 100 | n = 200   |
> | nlog(n) | n = 100 | n = 178   |
> | n²      | n = 100 | n = 141   |
> | n³      | n = 100 | n = 126   |
> | 2ⁿ      | n = 100 | n = 101   |

# Ejemplo de función con complejidad lineal O(n)

## Especificación de la función suma

+ (suma n) es la suma de los números de 1 hasta n. Por ejemplo,

```sesion
suma 5  ==  15
```

## Definición recursiva de la función suma

In [2]:
suma :: Integer -> Integer
suma 0 = 0
suma n = n + suma (n-1) 

## Estadísticas de la función suma

+ El tiempo necesario para calcular (suma n) para n se recoge en la siguiente tabla

~~~
+--------+------+
| n      | segs |
|--------|------|
| 100000 | 0.06 |
| 200000 | 0.12 |
| 300000 | 0.17 |
| 400000 | 0.24 |
| 500000 | 0.29 |
| 600000 | 0.38 |
| 700000 | 0.40 |
| 800000 | 0.52 |
+--------+------+
~~~

+ En la tabla se observa que hay una relación lineal entre n y el tiempo
  necesario para calcular (suma n).

Se puede medir el tiempo de evaluación con la función`tiempo` definida como sigue

In [3]:
import System.TimeIt (timeIt)
import Control.Exception (evaluate)

tiempo :: a -> IO a
tiempo = timeIt . evaluate

El tiempo necesario para calcular (suma n) se puede medir como sigue

In [4]:
sequence_ [tiempo (suma (100000 * n)) | n <- [1..8]]

CPU time:   0.06s
CPU time:   0.13s
CPU time:   0.33s
CPU time:   0.22s
CPU time:   0.28s
CPU time:   0.49s
CPU time:   0.38s
CPU time:   0.61s

## Ecuaciones de coste de la función suma

+ El tiempo necesario para calcular (suma n) es proporcional al número T(n) de
  operaciones elementales necesarias para evaluar la expresión.

+ Las ecuaciones para calcular T(n) son

```sesion
T(1)   = 1
T(n+1) = 1 + T(n)
```

+ Nota: Las ecuaciones de coste son ecuaciones en recurrencia que se pueden
  resolver con [Wolfram Alpha](http://bit.ly/1aFsIjl). 

## Demostración de que suma ∈ O(n) (es decir, es de coste lineal)

+ Basta comprobar que T(n) = n cumple las ecuaciones del coste de la función
  suma. 

```sesion
T(1)   = 1       [por definición de T]
T(n+1) = 1+T(n)  [por definición de T]
       = 1+n     [por hipótesis de inducción]
       = n+1     [por álgebra]
```

# Ejemplo de función con complejidad constante O(1)

## Definición de la función suma mediante la fórmula

In [5]:
suma2 :: Integer -> Integer
suma2 n = n*(n+1) `div` 2

## Estadísticas de la función suma2

+ El tiempo necesario para calcular (suma2 n) se recoge en la siguiente tabla

~~~
+--------+-------+
| n      | segs. |
|--------|-------|
| 100000 | 0.01  |
| 200000 | 0.01  |
| 300000 | 0.01  |
| 400000 | 0.01  |
| 500000 | 0.01  |
| 600000 | 0.01  |
| 700000 | 0.01  |
| 800000 | 0.01  |
+--------+-------+
~~~

+ En la tabla se observa que hay una relación conatante entre n y el tiempo
  necesario para calcular (suma2 n):

```sesion
tiempo(suma n) ≈ 0.01
```

El tiempo necesario para calcular (suma2 n) se puede medir como sigue

In [6]:
sequence_ [tiempo (suma2 (100000 * n)) | n <- [1..8]]

CPU time:   0.00s
CPU time:   0.00s
CPU time:   0.00s
CPU time:   0.00s
CPU time:   0.00s
CPU time:   0.00s
CPU time:   0.00s
CPU time:   0.00s

## Ecuaciones de coste de la función suma2

+ Si T(n) es el tiempo necesario para calcular (suma2 n), entonces

```sesion
T(1) = 1
```

## Demostración de que suma2 ∈ O(1) (es decir, es de coste constante).

+ Es inmediato, a partir de su ecuación de coste.

# Ejemplo de función con complejidad cuadrática O(n²)

## Especificación de la función sumaDeSumas

+ (sumaDeSumas n) es la suma de las sumas de 0 a n; es decir,

```sesion
sumaDeSumas n = (suma 0) + (suma 1) + ... + (suma n)
```

## Definición recursiva de la función sumaDeSumas

In [7]:
sumaDeSumas :: Integer -> Integer
sumaDeSumas 0 = 0
sumaDeSumas n = suma n + sumaDeSumas (n-1)

## Estadísticas de la función sumaDeSumas

+ El tiempo necesario para calcular (sumaDeSumas n) para n en [100,200..600] se 
recoge en la siguiente tabla

~~~
+------+------+
| n    | segs |
|------|------|
| 1000 | 0.20 |
| 1100 | 0.24 |
| 1200 | 0.30 |
| 1300 | 0.35 |
| 1400 | 0.40 |
| 1500 | 0.46 |
| 1600 | 0.52 |
+------+------+
~~~

El tiempo necesario para calcular (sumaDesuma n) se puede medir como sigue

In [8]:
sequence_ [tiempo (sumaDeSumas (1000 + 100 * n)) | n <- [0..5]]

CPU time:   0.18s
CPU time:   0.21s
CPU time:   0.25s
CPU time:   0.30s
CPU time:   0.34s
CPU time:   0.39s

## Gráfica de coste de sumaDeSumas

> ![](fig/sumaDeSumas.png)

## Ecuaciones de coste de la función sumaDeSumas

+ Si T(n) es el tiempo necesario para calcular (sumaDeSumas n), entonces

```sesion
 T(1)   = 1
 T(n+1) = T(suma(n+1))+T(n)
        = n+1+T(n)
```

+ Nota: Las ecuaciones de coste se pueden resolver con
  [Wolfram Alpha](http://bit.ly/18blHoH). 

## Demostración de que sumaDeSumas ∈ O(n²) (es decir, es de coste cuadrático)

+ Basta demostrar que para la función sumaDeSumas, T(n) ≤ n².
+ Se demuestra por inducción.
+ Caso base:

```sesion
T(1) = 1 ≤ 1²
```

+ Caso inductivo:
    + Suponemos la hipótesis de inducción: T(n) ≤ n².
    + Hay que demostrar que T(n+1) ≤ (n+1)².
    + Demostración:

```sesion
T(n+1) 
= n+1+T(n)     [por coste de sumaDeSumas.2]
≤ n+1+n²       [por hip. de inducción]
≤ n²+2n+1      [por álgebra]
= (n+1)²       [por álgebra]
```

# Ejemplo de función con complejidad exponencial O(2ⁿ)

## Especificación de la función raiz

+ (raiz x n) es el n-ésimo término de la sucesión x(n) que calcula la raíz
  cuadrada de x por el método de Herón; es decir, 

```sesion
x(0)   = 1
x(n+1) = (x/x(n) + x(n))/2
```

Por ejemplo,

```sesion
ghci> raiz 9 5
3.0
ghci> raiz 16 5
4.0000005
ghci> raiz 16 10
4.0
```

## Definición recursiva de la función raiz

In [9]:
raiz :: Float -> Int -> Float
raiz x 0 = 1 
raiz x n = (x / (raiz x (n-1)) + (raiz x (n-1))) / 2.0

## Estadísticas de la función raiz

+ El tiempo necesario para calcular (raiz 100 n) se recoge en la siguiente tabla

~~~
+----+------+
| n  | segs |
|----|------|
| 15 | 0.03 |
| 16 | 0.06 |
| 17 | 0.12 |
| 18 | 0.23 |
| 19 | 0.46 |
| 20 | 0.90 |
| 21 | 1.79 |
+----+------+
~~~

+ En la tabla se observa que por cada número que aumenta n se duplica el tiempo. 
  Por tanto la relación entre n y el tiempo necesario para
  calcular (raiz 100 n) es del orden 2ⁿ

El tiempo necesario para calcular (raiz 100 n) se puede medir como sigue

In [10]:
sequence_ [tiempo (raiz 100 n) | n <- [15..21]]

CPU time:   0.03s
CPU time:   0.06s
CPU time:   0.12s
CPU time:   0.24s
CPU time:   0.48s
CPU time:   0.95s
CPU time:   1.89s

## Ecuaciones de coste de la función raiz

+ Si T(n) es el tiempo necesario para calcular (raiz a x n), entonces

```sesion
T(0)   = 1
T(n+1) = 2*T(n)
```

+ Nota: Las ecuaciones de coste se pueden resolver con
  [Wolfram Alpha](http://bit.ly/18blSQM). 

## Demostración de que raiz ∈ O(2ⁿ) (es decir, es de coste exponencial)

+ Basta demostrar que para la función raiz, T(n) = 2ⁿ.
+ Se demuestra por inducción.
+ Caso base:

```sesion
T(0) = 1 = 2^0
```
+ Caso inductivo:
    + Suponemos la hipótesis de inducción: T(n) = 2ⁿ
    + Hay que demostrar que T(n+1) = 2^(n+1).
    + Demostración

```sesion
T(n+1) 
= 2*T(n)   [por coste de raiz]
= 2*2ⁿ     [por hip. de inducción]
= 2^(n+1)  [por álgebra]
```

# Ejemplo de función con complejidad logarítmica O(log n)

## Especificación de la función potencia

+ (potencia x n) es x^n, calculada usando las propiedades

```sesion
x^n = (x*x)^(n/2),   si n es par
x^n = x*(x*x)^(n/2), si n es impar
```

## Definición recursiva de la función potencia

In [11]:
potencia :: Integer -> Integer -> Integer
potencia x 0 = 1
potencia x n | even n    = potencia (x*x) (div n 2)
             | otherwise = x * potencia (x*x) (div n 2)

## Estadísticas de la función potencia

+ El tiempo necesario para calcular (potencia 2 n) se recoge en la siguiente tabla

~~~
+------+------+
|  n   | segs |
|------|------|
| 2^18 | 0.02 |
| 2^19 | 0.03 |
| 2^20 | 0.05 |
| 2^21 | 0.12 |
| 2^22 | 0.30 |
+------+------+
~~~

El tiempo necesario para calcular (potencia 2 n) se puede medir como sigue

In [12]:
sequence_ [tiempo (length (show (potencia 2 (2^n)))) | n <- [18..22]]

CPU time:   0.01s
CPU time:   0.02s
CPU time:   0.04s
CPU time:   0.11s
CPU time:   0.31s

## Ecuaciones de coste de la función potencia

+ Si T(n) es el tiempo necesario para calcular (potencia a n), entonces

```sesion
T(1) = 1
T(n) = 1 + T(n/2)
```

## Demostración de que potencia ∈ O(log n) (es decir, es de coste logarítmico)

+ Basta demostrar que para la función potencia, T(n) = 1 + log n (logaritmo en
  base 2).
+ Se demuestra por inducción.
+ Caso base:

```sesion
T(1) = 1 = 1 + log 1
```

+ Caso inductivo:

```sesion
T(n) 
= 1 + T(n/2)           [por coste de potencia]
= 1 + (1 + log(n/2))   [por hipótesis de inducción]
= 1 + (1 + log n - 1)  [por álgebra]
= 1 + log n            [por álgebra]
```

# Complejidad de la función inversa

## Especificación de la función inversa

+ (inversa xs) es la lista obtenida escribiendo los elementos de xs en orden
  inverso. Por ejemplo,

```sesion
inversa [3,2,5,7] ==  [7,5,2,3]
```

## Primera definición de inversa: inversa1

In [13]:
inversa1 :: [a] -> [a]
inversa1 []     = []
inversa1 (x:xs) = inversa1 xs ++ [x]

## Coste de inversa1

+ Las ecuaciones del coste de inversa1 son

```sesion
T(0)   = 1
T(n+1) = T(n) + n + 1
```

+ Por tanto, inversa1 ∈ O(n²)

+ Nota: Las ecuaciones de coste se pueden resolver con
  [Wolfram Alpha](http://bit.ly/1FIIqDy). 

## Segunda definición de inversa: inversa2

In [14]:
inversa2 :: [a] -> [a]
inversa2 xs = aux [] xs
    where aux ys []     = ys
          aux ys (x:xs) = aux (x:ys) xs

## Coste de inversa2

+ Las ecuaciones del coste de inversa2 son

```sesion
T(0)   = 1
T(n+1) = 1 + T(n) 
```

+ Por tanto, inversa1 ∈ O(n)

+ Nota: Las ecuaciones de coste se pueden resolver con
  [Wolfram Alpha](http://bit.ly/18bkQ7x). 

## Comparación gráfica de costes de inversa1 e inversa2

> ![](fig/inversa.png)

# Apéndices

## Algunas recurrencias simples para el cálculo de coste

    +--------------------+------------+-------------+
    | Ecuaciones         | Orden      | Ejemplo     |
    |--------------------|------------|-------------|
    | T(1) = k           | O(1)       | suma2       |
    |--------------------|------------|-------------|
    | T(1)   = k         | O(n)       | suma        |
    | T(n+1) = T(n)+k'   |            |             |
    |--------------------|------------|-------------|
    | T(1)   = k         | O(n²)      | sumaDeSumas |
    | T(n+1) = T(n)+n    |            |             |
    |--------------------|------------|-------------|
    | T(1)   = k         | O(log(n))  | potencia    |
    | T(n)   = T(n/2)+k' |            |             |
    |--------------------|------------|-------------|
    | T(0)   = k         | O(2ⁿ)      | raiz        |
    | T(n+1) = 2T(n)+k'  |            |             |
    |--------------------|------------|-------------|
    | T(1)   = k         | O(nlog(n)) | ordenación  |
    | T(n)   = 2T(n/2)+n |            | por mezcla  |
    +--------------------+------------+-------------+

## Teorema maestro para el cálculo de coste

> ![](fig/teorema_fundamental.png)

+ Demostración en la página 16 de los
  [Apuntes sobre el cálculo de la eficiencia de los algoritmos](http://bit.ly/1DFiHw6)
  de J.L. Balcázar.

## Complejidades de los algoritmos habituales

+ En [esta página](http://bigocheatsheet.com) se muestra las complejidades de
  los algoritmos habituales.

# Bibliografía

+ J.L. Balcázar
  [Apuntes sobre el cálculo de la eficiencia de los algoritmos](http://bit.ly/1DFiHw6). 

+ R. Bird [Thinking functionally with Haskell](http://bit.ly/18Ao9X1).
    + Cap. 7: Efficiency.

+ M. Clarkson [Data structures and functional programming](http://bit.ly/1aHT6Jv)
    + Reasoning about performance:
      [Efficiency](http://bit.ly/1aHTo31),
      [recurrences](http://bit.ly/1aHTA2g),
      [amortized analysis](http://bit.ly/1aHTEPt) y
      [recurrences, part 2](http://bit.ly/1aHTOX2). 

+ R. Peña
  [Diseño de programas (formalismo y abstracción)](http://bit.ly/17JU4Dj)
    + Cap. 1: La eficiencia de los algoritmos. 

+ F. Rabhi y G. Lapalme
  [Algorithms: A functional programming approach](http://bit.ly/1G5Zh6Y).
    + Cap. 3: The efficiency of functional programs.

+ S. Thompson
  [Haskell: the craft of functional programming](http://bit.ly/1zPhSgj).
    + Cap. 20: Time and space behaviour.

+ Wikipedia:
    + [Análisis de algoritmos](http://bit.ly/1BsCsYF).
    + [Big O notation](http://bit.ly/1DFleWZ).
    + [Notación de Landau](http://bit.ly/1DFl3uX).
    + [Teorema maestro](http://bit.ly/1BsCkbv).

+ R. Pattis
  [Complexity of Python operations](http://bit.ly/1NHJTy3)