<img src="img/viu_logo.png" width="200"><img src="img/python_logo.png" width="250"> *Mario Cervera*

# Algoritmos

## ¿Qué es un algoritmo?

* Un procedimiento bien definido que recibe un valor, o conjunto de valores, como *entrada* y produce un resultado como *salida*.
* Un conjunto de pasos que permiten resolver un *problema* definido en términos de una relación entrada-salida deseada.

## Ejemplos

#### El problema de la ordenación

* Uno de los problemas más ampliamente utilizado para estudiar análisis y diseño de algoritmos.

* Características:

  * *Entrada*: una secuencia de *n* números <a<sub>1</sub> , a<sub>2</sub> , ... , a<sub>n</sub>>.
        
  * *Salida*: permutación (reordenación) <a'<sub>1</sub> , a'<sub>2</sub> , ... , a'<sub>n</sub>> tal que a'<sub>1</sub> <= a'<sub>2</sub> <= a'<sub>n</sub>

  * *Algoritmos*: [Mergesort](https://es.wikipedia.org/wiki/Ordenamiento_por_mezcla), [Quicksort](https://es.wikipedia.org/wiki/Quicksort), [Heapsort](https://es.wikipedia.org/wiki/Heapsort).

#### El problema de la búsqueda

* Características:

   * *Entrada*: una colección *A* de *n* elementos, y un elemento *q* a buscar.

   * *Salida*: índice de *q* en *A*.

* Soluciones:

   * Búsqueda lineal (no eficiente).

   * Búsqueda binaria (eficiente, pero sólo posible si la colección está ordenada).

In [None]:
# Búsqueda binaria

def binary_search(A, low, high, q):
    if high >= low:
        mid = (high + low) // 2

        if A[mid] == q:
            return mid
        elif A[mid] > q:
            return binary_search(A, low, mid - 1, q)
        else:
            return binary_search(A, mid + 1, high, q)
 
    else:
        return -1
 
A = [2, 3, 4, 7, 10, 12, 14, 21, 40, 42, 67]
q = 4
result = binary_search(A, 0, len(A)-1, q)
print(result)

## Diseño de algoritmos

Técnicas de diseño de algoritmos.

#### Recursión

* Un algoritmo es recursivo cuando se invoca a sí mismo.
* Debe especificar un caso base para evitar la recursión infinita.

Formato general:

```
funcion_recursiva(<entrada>):
   
   if <caso_base>:
      return <solución_caso_base>
   
   return funcion_recursiva(<entrada_reducida>)
```

In [None]:
def factorial(n):
    if n == 1:
        return n
    else:
        return n * factorial(n-1)
    
print(factorial(5))

#### Divide y vencerás

* Es una técnica recursiva.

* En cada nivel de la recursión, se realizan 3 pasos:

   1. **Dividir** el problem en subproblemas que son instancias más pequeñas del mismo problema.
   
   2. **Vencer** los problemas, resolviéndolos de manera recursiva (*caso recursivo*), salvo si son lo suficientemente pequeños como para resolverlos de manera directa (*caso base*).
   
   3. **Combinar** las soluciones a los subproblemas para formar una solución al problema original.

**Ejemplo: Mergesort**

In [None]:
def mergesort(array, left, right):
    if left < right:
        mid = (left + right) // 2
        
        mergesort(array, left, mid)
        mergesort(array, mid + 1, right)
        merge(array, left, mid, right)

Implementación completa de [Mergesort en Python](https://www.geeksforgeeks.org/python-program-for-merge-sort/).

<img src="img/Algoritmos/Mergesort.png" width="600">

#### Algoritmos voraces (greedy)

* Algoritmos que resuelven problemas de optimización: de muchas posibles soluciones, buscan la mejor.
* Llevan a cabo una serie de pasos, tomando una decisión en cada paso.
* Toman la decisión que mejor parece en el momento, de manera *local*, con la esperanza de que esta decisión permita llegar a una solución *global*.
* Muchos problemas no tienen una solución *greedy*, pero los que sí la tienen, este tipo de algoritmos resultan muy eficientes.

**Ejemplo: Algoritmo de Prim**

Permite resolver el problema del Árbol de Recubrimiento Mínimo (Minimum Spanning Tree).

[Descripción completa](https://es.wikipedia.org/wiki/Algoritmo_de_Prim)

<img src="img/Algoritmos/MST.png" width="450">*Imagen extraída de [1]*

<img src="img/Algoritmos/Prim.png" width="900">*Imagen extraída de [1]*

## Análisis de algoritmos

* Análisis de la eficiencia de los algoritmos a nivel teórico, pero que resulta una excelente herramienta a nivel práctico.
* Eficiencia: tiempo de ejecución, aunque también memoria consumida.
* Permite comparar algoritmos y ver cuál es mejor para un mismo problema.
* Nos interesa la eficiencia para entradas grandes.
    * Ordenar una lista de 10 elementos tiene un coste insignificante, incluso usando algoritmos ineficientes.
    * Ordenar una lista de 2<sup>32</sup> elementos es muy distinto. Si el algoritmo no es eficiente, el coste puede ser prohibitivo.

#### Notación O (Big O)

* Análisis *asintótico* de al eficiencia de algoritmos.
  * Análisis de como el tiempo de ejecución aumenta conforme va aumentando sin límites el tamaño de la entrada.
* Representación del tiempo de ejecución de un algoritmo como una función del tamaño de la entrada.

<img src="img/Algoritmos/O_Notation.png" width="650">*Imagen extraída de [2]*

* La notación O define una serie de funciones, u *órdenes de crecimiento*, que ignoran las constantes y los términos menos relevantes.
   * Ejemplo: la función *3n<sup>2</sup> + 4n - 1* sería *O(n<sup>2</sup>)* en notación O.
* Esto es porque se realiza un análisis asintótico, y el término más alto es el que realmente impacta en el tiempo de ejecución.

<img src="img/Algoritmos/OrdersOfGrowth.png" width="600">

* Estos órdenes de crecimiento representan límites superiores (*upper bounds*), normalmente sobre la función que representa el *peor caso*, ya que es la que más interesa.
   * Esto se conoce como **worst-case analysis**.

Ejemplos numéricos que ilustran los órdenes de crecimiento del tiempo de ejecución de los algoritmos:

<img src="img/Algoritmos/RunningTimes.png" width="900">*Tabla extraída de [2]*

Conclusiones relevantes:

* Para *n = 10* todos los algoritmos tuvieron aproximadamente el mismo coste.
* Los algoritmos *O(n!)* (factoriales) son completamente inservibles para tamaños relativamente pequeños (n > 20).
* Los algoritmos *O(2<sup>n</sup>)* (exponenciales) tienen un rango de operación mayor, pero también se vuelven inservibles relativamente pronto (n > 40).
* Los algoritmos *O(n<sup>2</sup>)* (cuadráticos) mantienen su utilidad hasta tamaños de aproximadamente n < 1.000.000.
* Los algoritmos *O(n)* (lineales) y *O(n log n)* mantienen su utilidad en el orden de billones de items.
* Los algoritmos *O(log n)* (logarítmicos) funcionan de manera prácticamente instantánea para cualquier tamaño de entrada imaginable. 

Estos datos muestran que, aunque se ignoren constantes y factores de orden inferior, estas categorías nos dan una idea excelente de cómo los algoritmos funcionan en la práctica.

#### ¿Cómo podemos saber a qué categoría pertenece nuestro algoritmo?

* De manera muy informal: contando los pasos que ejecuta el algoritmo.
* Si asumimos que nuestra máquina puede ejecutar una cantidad concreta de pasos por segundo, este cálculo se traduce de manera natural a *tiempo de ejecución*.

**Ejemplo: detección de elementos duplicados en O(n<sup>2</sup>)**

In [None]:
numeros = [5, 1, 27, 3, 8, 12, 2, 8]

def contiene_duplicados(lista):
    for i in range(len(lista)-1):
        for j in range(i+1, len(lista)):
            if lista[i] == lista[j]:
                return True
    return False

print(contiene_duplicados(numeros))

<img src="img/Algoritmos/QuadraticRunningTime.png" width="800"><img src="img/Algoritmos/SerieAritmetica.png" width="500">*Imagen extraída de [1]*

**Ejemplo: búsqueda en O(log n)**

In [None]:
# Búsqueda binaria

def binary_search(A, low, high, q):
    if high >= low:
        mid = (high + low) // 2

        if A[mid] == q:
            return mid
        elif A[mid] > q:
            return binary_search(A, low, mid - 1, q)
        else:
            return binary_search(A, mid + 1, high, q)
 
    else:
        return -1
 
A = [2, 3, 4, 7, 10, 12, 14, 21, 40, 42, 67]
q = 4
result = binary_search(A, 0, len(A)-1, q)
print(result)

## Referencias

[1] Cormen, T. H.; Leiserson, C. E.; Rivest, R. L.; Stein, C.: *Introduction to algorithms*. Third Edition. MIT press (2009)

[2] Skiena, S. S.: *The algorithm design manual.* Second edition. Springer (2008)

## Ejercicios

1. Completa el algoritmo de *Mergesort* implementando la función *merge*.

2. Implementa el algoritmo de [Insertion Sort](https://en.wikipedia.org/wiki/Insertion_sort) en Python.

3. Implementa una función recursiva que calcule el valor del *n*-ésimo número de la *Sucesión de Fibonacci*. ¿Hasta que valor de *n* puedes calcular? ¿Por qué?