# Unidad 2. Bases para el análisis de algoritmos


## 2.1. Tratabilidad computacional

### Eficiencia y eficacia

* Eficiencia 
    * la relación entre los recursos utilizados en un proyecto y los logros conseguidos con el mismo
    * da cuando se utilizan menos recursos para lograr un mismo objetivo
    * o cuando se logran más objetivos con los mismos o menos recursos.


* Eficacia
    * el nivel de consecución de metas y objetivos
    * hace referencia a nuestra capacidad para lograr lo que nos proponemos.


### Tiempo de ejecución

* Es la estimación de cuánto tiempo será necesario para que un algoritmo encuentre la solución a un problema
    * Este tiempo está dado en términos del tamaño de la entrada

* Se considera que todos los algoritmos son de búsqueda
    * Búsqueda de la solución
    * Búsqueda de una propiedad


### Análisis del peor caso

* Se utiliza para obtener una cota superior del tiempo de ejecución más largo posible para un algoritmo que tiene una entrada de tamaño $N$


    - Esto captura, en la práctica, la eficiencia


### Análisis del caso intermedio

* Se busca tener una cota del tiempo de ejecución de un algoritmo con una entrada aleatoria de tamaño N

* Es muy difícil (si no imposible) modelar con exactitud instancias reales  con distribuciones aleatorias

* Además, un algoritmo puede tener buenos resultados con ciertas distribuciones y muy malos resultados con otras


### Fuerza bruta

* Para muchos de los problemas existe un algoritmo natural de búsqueda por fuerza bruta que examina cada posible solución
    * Tipicamente toma un tiempo de $2^N$ o más para entradas de tamaño $N$ 
    * Por ejemplo, para el caso del emparejamiento estable toma $N!$ para conjuntos de $N$ hombres y $N$ mujeres
    * No es aceptable en la práctica


### Tiempo polinomial

* Un algoritmo funciona en tiempo polinomial si se puede caracterizar su tiempo de ejecición como una función polinomial de la entrada $N$
    * Por ejemplo, en el algoritmo PR dicha función es $N^2$

* Un **polinomio** es una expresión matemática constituida por un conjunto finito de variables y constantes (números fijos llamados *coeficientes*), utilizando únicamente las operaciones aritméticas de suma, resta y multiplicación, así como también exponentes enteros positivos


### Tiempo polinomial

* Se dice que por definición que un algoritmo es eficiente si corre en tiempo polinomial
    * Aunque, por ejemplo, $6.02×10^{23}×N^{20}$ es tecnicamente un tiempo polinomial, sería impráctico
    * En la práctica, los algoritmos que corren en tiempo polinomial casi siempre tienen bajos coeficientes y exponentes
    * El deshacerse de la barrera exponencial de la fuerza bruta normalmente expone alguna estructura crucial del problema
* Excepciones
    * Algoritmos de tiempo polinomial que tienen exponentes y/o coeficientes muy grandes son inútiles en la práctica
    * Algoritmos de tiempo exponencial, o peor, se utilizan cuando en la práctica las instancias del peor caso son raras


### ¿Por qué es importante?

In [25]:
from math import log, factorial

def fact(n):
    try:
        return factorial(n) 
    except:
        return float('inf')

In [41]:
div = 1000000 * 60 * 60 * 24 * 365  # 1 año en microsegundos

print("n\tO(n)\tnlog(n)\tn^2\tn^3\t1.5^n\t2^n\tn!")
for n in [10, 20, 50, 100, 1000, 10000, 100000, 1000000]:
    print(n, end="\t")
    for f in [lambda x: x/div, lambda x: x*log(x)/div, 
              lambda x: x**2/div, lambda x: x**3/div, 
              lambda x: 1.5**x/div, lambda x: 2**x/div, 
              lambda x: fact(x)/div]:
        try:
            print('%6.0g' % f(n), end="\t")
        except:
            print('%6s'%'inf', end="\t")
    print()

n	O(n)	nlog(n)	n^2	n^3	1.5^n	2^n	n!
10	 3e-13	 7e-13	 3e-12	 3e-11	 2e-12	 3e-11	 1e-07	
20	 6e-13	 2e-12	 1e-11	 3e-10	 1e-10	 3e-08	 8e+04	
50	 2e-12	 6e-12	 8e-11	 4e-09	 2e-05	 4e+01	 1e+51	
100	 3e-12	 1e-11	 3e-10	 3e-08	 1e+04	 4e+16	3e+144	
1000	 3e-11	 2e-10	 3e-08	 3e-05	4e+162	3e+287	   inf	
10000	 3e-10	 3e-09	 3e-06	  0.03	   inf	   inf	   inf	
100000	 3e-09	 4e-08	0.0003	 3e+01	   inf	   inf	   inf	
1000000	 3e-08	 4e-07	  0.03	 3e+04	   inf	   inf	   inf	


## 2.2 Orden de crecimiento asintótico


Se busca caracterizar el comportamiento del tiempo de ejecución como una función $f(n)$, donde $n$ es el tamaño de la entrada 

Para facilitar esta búsqueda, se establece que es suficiente con caracterizar $f(n)$ con un órden de crecimiento asintótico, es decir una función $g(n)$ que describe un límite en el comportamiento de $f(n)$

* Si $g(n)$ es un límite superior para el comportamiento de $f(n)$ se dice que $f(n)$ pertenece a $O (g(n))$ – ($f(n)$ es $O(g(n))$ )

* Si $g(n)$ es un límite inferior para el comportamiento de $f(n)$ se dice que $f(n)$ pertenece a $\Omega(g(n))$ – ($f(n)$ es $\Omega(g(n))$) )

* Si $g(n)$ es un límite estrecho para el comportamiemto de $f(n)$ se dice que $f(n)$ pertenece a $\Theta(g(n))$ – ($f(n)$ es $\Theta(g(n))$ )


### Límite superior ($O$)

$f(n)$ pertence a $O(g(n))$ si existen las constantes positivas $n_0$ y $c$ tal que para toda $n \geq n_0$ tenemos que $cg(n) \geq f(n)$

<center>
<img src='fig/omicron.png' height=400>


### Límite inferior ($\Omega$)

$f(n)$ pertence a $\Omega(g(n))$ si existen las constantes positivas $n_0$ y $c$ tal que para toda $n \geq n_0$ tenemos que $cg(n) \leq f(n)$

<center>
<img src='fig/omega.png' height=400>

### Límite inferior ($\Theta$)

$f(n)$ pertence a $\Theta(g(n))$ si existen las constantes positivas $n_0$, $c_1$ y $c_2$ tal que para toda $n \geq n_0$ tenemos que $c_1g(n) \leq f(n) \leq c_2g(n)$

<center>
<img src='fig/omega.png' height=400>

### Algunas propiedades

* $f(n)$ pertence a $\Theta(g(n))$ si y solo si es $O(g(n))$ y es $\Omega(g(n))$

* Por ejemplo:

    * Si $g(n)=32n2+17n+50$
    * Entonces $g(n)$ es 
        * $O(n^2)$, $O(n^3)$
        * $\Omega(n^2)$, $\Omega(n)$ 
        * $\Theta(n^2)$
    * Además $g(n)$ no es
        * $O(n)$
        * $\Omega(n^3)$
        * $\Theta(n)$, $\Theta(n^3)$


### Más propiedades

* Transitividad
    * Si $f(n)$ es $O(g(n))$ y $g(n)$ es $O(h(n))$ entonces $f(n)$ es $ O(h(n)) $
    * Si $f(n)$ es $\Omega(g(n))$ y $g(n)$ es $\Omega(h(n))$ entonces $f(n)$ es $ \Omega(h(n)) $
    * Si $f(n)$ es $\Theta(g(n))$ y $g(n)$ es $\Theta(h(n))$ entonces $f(n)$ es $ \Theta(h(n)) $

* Demostración
    * $f(n)$ es $O(g(n)) \Rightarrow$  existen $n_f$ y $c_f$ tal que para toda $n \geq n_f$, $c_fg(n) \geq f(n)$
    * $g(n)$ es $O(h(n)) \Rightarrow$  existen $n_g$ y $c_g$ tal que para toda $n \geq n_g$, $c_gh(n) \geq g(n)$
    * Entonces, $c_fc_gh(n) \geq f(n)$ para toda $n \geq max\{n_f,n_g\}$
    * Por lo tanto, $f(n)$ es $O(h(n))$
    

* Reflexividad
    * $f(n)$ es $O(f(n))$
    * Lo mismo para $\Omega$ y $\Theta$

* Simetría
    * $f(n)$ es  $\Theta(g(n))$ si y sólo si $g(n)$ es $\Theta(f(n))$

* Simetría transpuesta
    * $f(n)$ es $O(g(n))$ si y sólo si $g(n)$ es $\Omega(f(n))$

* Aditividad
    * Si $f(n)$ es $\Theta(h(n))$ y $g(n)$ es $\Theta(h(n))$, entonces $f(n)+g(n)$ es $\Theta(h(n))$
    * Lo mismo para las demás


## 2.3 Compilación de tiempos de ejecución comunes

### Tiempo constante – $O(1)$

* El tiempo de ejecución no depende del tamaño de la entrada

* Ejemplos
    * Dado un arreglo ordenado de N elementos devolver el elemento más grande
    * Dado un arreglo de N elementos devolver los primeros K elementos


### Tiempo sublineal – $O(\log n)$

* El tiempo de ejecución es muy eficiente ya que crece muy poco con respecto al tamaño de la entrada

* Ejemplo: búsqueda binaria
    * Dado un arreglo ordenado de elementos, realizar la búsqueda de un elemento en particular


In [19]:
def busquedaBinaria(arr, x):
    l = 0
    r = len(arr) - 1
    while l <= r:
        mid = l + (r - l) // 2
        if arr[mid] == x:
            return mid
        elif arr[mid] < x:
            l = mid + 1
        else:
            r = mid - 1
    return -1

arreglo = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
x = 7
resultado = busquedaBinaria(arreglo, x)
if resultado != -1:
    print("El elemento está en la posición", str(resultado))
else:
    print("El elemento no está en el arreglo")

El elemento está en la posición 6


### Tiempo lineal – $O(n)$

* El tiempo de ejecución es a lo más un factor de tiempo constante por el tamaño de la entrada

* Ejemplo 1: calcular el máximo de un conjunto de números $A={a_1, a_2, \dots , a_n}$


In [20]:
def maximo(arr):
    max = arr[0]
    for i in range(1, len(arr)):
        if arr[i] > max:
            max = arr[i]
    return max

arreglo = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
resultado = maximo(arreglo)
print("El número máximo es", resultado)

El número máximo es 10


* Ejemplo 2: Combinar dos conjuntos de números ordenados $A={a_1, a_2, \dots, a_n}$ y $B={b_1, b_2, \dots, b_n}$ en un solo conjunto ordenado

<center>
<img src='fig/merge.png' width=600>



In [23]:
def merge(A, B):
    arr3 = []
    sizeA = len(A)
    sizeB = len(B)
    i, j = 0, 0
    while i < sizeA and j < sizeB:
        if A[i] < B[j]:
            arr3.append(A[i])
            i += 1
        else:
            arr3.append(B[j])
            j += 1

    while i < sizeA:
        arr3.append(A[i])
        i += 1

    while j < sizeB:
        arr3.append(B[j])
        j += 1

    return arr3

A = [1, 3, 5, 7, 9]
B = [2, 4, 6, 8, 10, 12, 14]
C = merge(A, B)
print("El arreglo mezclado es", C)

El arreglo mezclado es [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14]


* La combinación de los conjuntos de números de tamaño n toma un tiempo de $O(n)$

* Demostración
    * El conjunto $A$ se vacía
        * Mejor caso: después de $n$ iteraciones
            * todos los números en el conjunto $A$ son menores que el primer número en el conjunto $B$
        * Peor caso: después de $2n$ iteraciones
            * el primer número en el conjunto $A$ es mayor a todos los números del conjunto $B$
    * El conjunto $B$ se vacía
        * Mejor caso: después de $2n$ iteraciones
            * todos los números en el conjunto $A$ son menores que el primer número en el conjunto $B$
        * Peor caso: después de $n$ iteraciones
            * el primer número en el conjunto $A$ es mayor a todos los números del conjunto $B$


### Tiempo logarítmico $O(n \log n)$

* Surge en los algoritmos de dividir y vencer
    * Para ordenar un conjunto de n números se realizan n log n comparaciones
        * Mergesort
        * Heapsort

* Encontrar el camino en un grafo más corto desde un nodo hacia todos los demás nodos


<center>
<img src='fig/merge_sort.png' height=400>

In [26]:
def merge_sort(A):
    l = len(A)

    if l == 1:
        return A
    
    mid = l // 2
    left = A[:mid]
    right = A[mid:]

    left = merge_sort(left)
    right = merge_sort(right)

    return merge(left, right)

A = [12, 11, 13, 5, 6, 7, 1, 15, 14]
resultado = merge_sort(A)
print("El arreglo ordenado es", resultado)

El arreglo ordenado es [1, 5, 6, 7, 11, 12, 13, 14, 15]


### Tiempo cuadrático $O(n^2)$

* Enumeración de todos los pares de elementos
    * Emparejamiento estable
    * Simulación gravitatoria

* Encontrar el par de puntos más cercanos
    * Dada una lista de puntos, encontrar los dos que se encuentran más cerca


In [27]:
def min_dist(A):
    min = (A[1][0] - A[0][0]) ** 2 + (A[1][1] - A[0][1]) ** 2
    for i in range(len(A)):
        for j in range(i + 1, len(A)):
            dist = (A[j][0] - A[i][0]) ** 2 + (A[j][1] - A[i][1]) ** 2
            if dist < min:
                min = dist

    return min

A = [(1, 2), (3, 4), (5, 6), (7, 8), (9, 10)]
resultado = min_dist(A)
print("La distancia mínima es", resultado)

La distancia mínima es 8


### Tiempo cúbico $O(n^3)$

* Enumeración de todos los tríos de elementos

* Determinar si $n$ conjuntos son disjuntos
    * Dados $n$ conjuntos $S_1, S_2, \dots, S_n$ cada cual es subconjunto de $\{1, 2, \dots, n\}$, determinar si existe algún par de conjuntos que sean disjuntos


In [28]:
def disjoin_sets(L):
    for i in range(len(L)):
        for j in range(i + 1, len(L)):
            if len(L[i].intersection(L[j])) > 0:
                return False
    return True

L = [{1, 2, 3}, {4, 5, 6}, {7, 8, 9}, {10, 11, 12}]
resultado = disjoin_sets(L)
if resultado:
    print("Los conjuntos son disjuntos")
else:
    print("Los conjuntos no son disjuntos")

Los conjuntos son disjuntos


### Tiempo polinomial $O(n^k)$

* Conjunto independiente
    * Dado un grafo, existen k nodos tales que no están unidos por una arista?
    * Solución de tiempo de $O(n^k)$


In [34]:
def combinations(arr, n,k): 
    ret = []
    for i in range(n):
        for j in range(i+k-1,n):
            temp = arr[i:i+k-1]
            temp.append(arr[j])
            ret.append(temp)

    return ret

arr = [1,2,3,4,5,6]
print(combinations(arr,len(arr),3))

[[1, 2, 3], [1, 2, 4], [1, 2, 5], [1, 2, 6], [2, 3, 4], [2, 3, 5], [2, 3, 6], [3, 4, 5], [3, 4, 6], [4, 5, 6]]


* Dado un conjunto de n elementos, calcular los subconjuntos de $k$ elementos

$$
\left(\begin{array}{l}
n \\
k
\end{array}\right)=\frac{n(n-1)(n-2) \cdots(n-k+1)}{k(k-1)(k-2) \cdots(2)(1)} \leq \frac{n^k}{k !} \in O(n^k)
$$



## 2.4 Clasificación de los algoritmos

* Se suele decir que el orden de complejidad de un problema es el del mejor algoritmo que se conozca para resolverlo
* Estudios han llevado a la constatación de que existen problemas muy difíciles, problemas que desafían la utilización de los computadoras para resolverlos

    * Clase P

    * Clase NP
        * Clase NP-completos
        * Clase NP-difícil

### Clase P

* Los algoritmos de complejidad polinómica se dice que son tratables en el sentido de que suelen ser abordables en la práctica

* Los problemas para los que se conocen algoritmos con esta complejidad se dice que forman la clase P

* Aquellos problemas para los que la mejor solución que se conoce es de complejidad superior a la polinómica, se dice que son problemas intratables. Sería muy interesante encontrar alguna solución polinómica (o mejor) que permitiera abordarlos


### Clase NP

* Algunos de estos problemas intratables pueden caracterizarse por el curioso hecho de que puede aplicarse un algoritmo polinómico para comprobar si una posible solución es válida o no

* Esta característica lleva a un método de resolución no determinista consistente en aplicar heurísticos para obtener soluciones hipotéticas que se van desestimando (o aceptando) a ritmo polinómico

* Los problemas de esta clase se denominan NP (la N de no-deterministas y la P de polinómicos)


### Clase NP-completo

* Es el subconjunto de los problemas de decisión en NP tal que todo problema en NP se puede reducir en cada uno de los problemas de NP-completo

* Se suele decir que son los peores problemas posibles de clase NP. Estos problemas se caracterizan por ser todos "iguales" en el sentido de que si se descubriera una solución P para alguno de ellos, esta solución sería fácilmente aplicable a todos ellos

* Si se descubriera una solución para los problemas NP-completos, esta sería aplicable a todos los problemas NP y, por tanto, la clase NP desaparecería

* *The Clay Mathematics Institute* ofrece un millón de dólares a quien sea capaz de responder a esa pregunta.


#### Satisfacibilidad booleana (SAT)

El problema SAT es el problema de saber si, dada una expresión booleana con variables y sin cuantificadores, hay alguna asignación de valores para sus variables que hace que la expresión sea verdadera. Por ejemplo, una instancia de SAT sería el saber si existen valores para $x_1, x_2, x_3, x_4$ tales que la expresión 

$$ \left(x_1 \vee \neg x_3\right) \wedge\left(\neg x_2 \vee x_3 \vee \neg x_4\right) $$ 

sea cierta.




#### Problema de la mochila (knapsack)

Supongamos que tenemos $n$ distintos tipos de ítems, que van del 1 al $n$. De cada tipo de ítem se tienen $q_i$ ítems disponibles. Cada tipo de ítem $i$ tiene un beneficio asociado dado por $v_i$ y un peso (o volumen) $w_i$. 

Por otro lado se tiene una mochila, donde se pueden introducir los ítems, que soporta un peso máximo (o volumen máximo) $W$.

El problema consiste en meter en la mochila ítems de tal forma que se maximice el valor de los ítems que contiene y siempre que no se supere el peso (o volumen) máximo que puede soportar la misma. 


#### Problema del ciclo hamiltoniano

En teoría de grafos, un camino hamiltoniano en un grafo es un camino (es decir, una sucesión de aristas adyacentes), que visita todos los vértices del grafo una sola vez. Si además el primer y último vértice visitado coincide, el camino es un ciclo hamiltoniano.

<center>
<img src='fig/Hamiltonian_path.png' width=400>

#### Problema del vendedor viajero

TSP por sus siglas en inglés, Travelling Salesman Problem, responde a la siguiente pregunta: dada una lista de ciudades y las distancias entre cada par de ellas, ¿cuál es la ruta más corta posible que visita cada ciudad exactamente una vez y al finalizar regresa a la ciudad origen? 

#### Problema del conjunto independiente

En teoría de grafos, un conjunto independiente o estable es un conjunto de vértices en un grafo tal que ninguno de sus vértices es adyacente a otro. Es decir, es un conjunto V de vértices tal que para ningún par de ellos existe alguna arista que los conecten. 

<center>
<img src='fig/Independent_set_graph.png' width=400>

### Clase NP-difícil

* Intuitivamente estos son los problemas que son más difíciles que los NP-completos

* Existen problemas NP-hard que no son NP-completos, por ejemplo 
    * El problema de parada
        * Consiste en lo siguiente: dada una Máquina de Turing $M$ y una palabra $w$, determinar si $M$ terminará en un número finito de pasos cuando es ejecutada usando $w$ como dato de entrada.
    * La suma de subconjuntos
        * Dado un conjunto de enteros, ¿existe algún subconjunto cuya suma sea exactamente cero? Por ejemplo, dado el conjunto $\{-7,-3,-2,5,8\}$, la respuesta es SI, porque el subconjunto $\{-3,-2,5\}$ suma cero. 
        * Un problema equivalente es: dado un conjunto de enteros y un entero $s$, ¿existe algún subconjunto cuya suma sea $s$ ? 
        * La suma de subconjuntos también puede verse como un caso especial del problema de la mochila.


<center>
<img src='fig/p_vs_np.png' height=600>