<h1 align="center">ANÁLISIS DE ALGORITMOS</h1>

<h2 align="center">Sesión 03: Análisis de Algoritmos

<h2 align="center">ESCUELA DE CIENCIAS</h2>

<h2 align="center">DOCTORADO EN INGENIERÍA MATEMÁTICA</h2>

<h2 align="center">UNIVERSIDAD EAFIT</h2>

<h3 align="center">MEDELLÍN - COLOMBIA </h3>

<h3 align="center">2019 </h3>

### Docente: Carlos Alberto Álvarez Henao, I.C. Ph.D.

4. Análisis de algoritmos (Sesión 03)

    4.1 Por qué analizar un algoritmo?

    4.2 Estructuras de control: Secuencias, ciclos para, mientras y repetir, recursividad.
    
    4.3 Análisis de caso medio y amortizado
    
    4.4 Ejemplos y desafíos

Como vimos en un apartado anterior, el objetivo del *análisis* es el de determinar cuál, entre diferentes posibles algoritmos, sería el más eficiente para resolver un problema dado. 

## 4.1 Por qué analizar un algoritmo?


- Clasificar problemas y algoritmos por dificultad


- Predecir el desempeño, comparar algoritmos, sintonizar parámetros


- Mejorar la comprensión y la implementación de los algoritmos


La razón por la que muchas personas analizan algoritmos es debido al desafío intelectual.


- Analizar un algoritmos es más interesante y divertido que programarlo

***Analytic Engine***

*"As soon as an Analytical Engine exists, it will necessarily guide the future course of the science. Whenever any result is sought by its aid, the question will then arise — **by what course of calculation can these results be arrived at by the machine in the shortest time?**"*

— Charles Babbage, Passages from the Life of a Philosopher (1864)

![Imagen](https://github.com/carlosalvarezh/Analisis_de_Algoritmos/blob/master/images/AnalyticEngine.JPG?raw=true "")

Resulta una pregunta de vital importancia: ***Cuántas veces hay qué mover la manivela hasta encontrar un resultado "aceptable"?***

- La anterior pregunta no es muy diferente a la pregunta que se hace hoy en día acerca de cómo optimizar el recurso disponible para desempeñar una tarea específica.


- *Turing* (que era considerado un teórico) en un artículo de 1947, vió conveniente medir la cantidad de trabajo involucrado en un proceso de cómputo, incluso así sea muy burdo.

In [1]:
from IPython.display import IFrame
display(IFrame('https://academic.oup.com/qjmam/article-pdf/1/1/287/5323145/1-1-287.pdf', '100%', '600px'))

El análisis de algoritmos realmente entró a la "*escena científica*" a partir de los años $60's$ luego de la publicación por parte de *[Donald E. Knuth](https://www-cs-faculty.stanford.edu/~knuth/ "Donald E. Knuth's home page")* de su serie de siete volúmenes de *El Arte de la Programación de Computadores ([The Art of Programming Computers - TAOCP](https://www-cs-faculty.stanford.edu/~knuth/taocp.html "The Art of Programming Computers home page"))*.


![Imagen](https://github.com/carlosalvarezh/Analisis_de_Algoritmos/blob/master/images/taocp.jpg?raw=true "")

Recuperado de: https://www-cs-faculty.stanford.edu/~knuth/taocp.html

- **Puso las bases científicas del tema:** Antes se pensaba que iba a ser demasiado complicado averiguar realmente qué tipo de recursos consumían los programas.

Para analizar un algoritmo, ***Knuth*** presentó una serie de pasos bastante simples acerca de lo que hay que hacer:

- Desarrolle una buena implementación.


- Identifique cantidades desconocidas que representan las operaciones básicas.


- Determine el costo de cada operación básica.


- Desarrollar un modelo realista para la entrada.


- Analice la frecuencia de ejecución de las cantidades desconocidas.


- Calcular el tiempo total de ejecución: $\sum \limits_q Frecuencia(q) \times costo(q)$.

***Pros:***

- **Fundamentación científica del *AofA*:** Nos brinda un proceso mediante el cual podemos desarrollar modelos matemáticos, desarrollar hipótesis sobre el rendimiento y comparar algoritmos, y luego probar esas hipótesis científicamente.

***Cons:***

- El modelo puede ser poco realista y necesitar de demasiados detalles para su análisis.

Para hacerle frente a los inconvenientes de las ideas de *Knuth*, desde los $70's \ldots$ hasta hoy, el estudio de los algoritmos ha girado en torno a los libros de *Aho, Hopcroft y Ullman*; *Cormen, Leiserson, Rivest y Stein*, y otros. 

- Analizan el peor de los casos. Lo que hace es "*sacarle una foto"* al modelo y tener garantía sobre el peor tiempo de ejecución de un algoritmo.


- Usa la notación $\mathcal{O}(n)$ y se intenta obtener un límite superior en el peor de los casos. Esta es una idea para obtener muchos de los detalles del análisis.

***Pros:***

- Enfoque exitoso que desencadenó una era de *Diseño de Algoritmos*, donde se probaron todo tipo de nuevas ideas para reducir costos garantizados por el *peor caso*, con el objetivo final de poder desarrollar algoritmos óptimo donde el peor de los costos es igual al mejor posible.


***Cons:***

- Por lo general, no se puede usar para predecir el rendimiento o comparar algoritmos. 

## 4.2 Estructuras de control

Las estructuras de control son empleadas en la formulación de algoritmos para determinar el flujo de la información, o instrucciones, de un problema dado.

El análisis del tiempo de ejecución de cada estructura se efectúa de adentro hacia afuera: 

- Primero, se determina el tiempo requerido por las instrucciones de forma individual (por lo general acotada por una constante).


- Luego se combinan estos tiempos de acuerdo a la estructura de control que enlaza las instrucciones del programa.


- En algoritmos se tienen principalmente tres estructuras: 
    - Secuencia
    - Ciclos *Para* (`for`) y *Mientras* (`while`)
    - Condicionales (`if`)

### 4.2.1. Secuencia

En esta estructura cada instrucción se ejecuta una detrás de la otra.

Sean $P_1$ y $P_2$ dos fragmentos de un algoritmo. Sean $t_1$ y $t_2$ los tiempos requeridos respectivamente. La ***regla de composición secuencial*** indica que el tiempo necesario para calcular $"P_1;P_2"$ (primero $P_1$ y luego $P_2$) es simplemente $t_1 + t_2$. por la ***regla del máximo*** este tiempo está en $\mathcal{O}(max(t_1,t_2))$


- No siempre el análisis "$P_1;P_2$" se puede considerar con $P_1$ y $P_2$ independientes, ya que alguno de los parámetros que controla el tiempo de $t_2$ puede depender del resultado de $P_1$.

### 4.2.2 Ciclos *"Para"*  (`for`)

Son ciclos del tipo

- Se asumirá que el ciclo hace parte de un algoritmo más extenso que trabaja para un ejemplar de tamaño $n$


- $m$ no necesariamente es igual a $n$, es solo la cantidad de veces que hay qué repetir las instrucciones $P(i)$.


- Si $P(i)$ no depende de $i$, se tendría el caso más sencillo, ya que se efectuará $m$ veces con un costo de tiempo de $t$, para un total de $l=mt$ (cota inferior)

Se debe tener mucho cuidado al realizar un análisis para un ciclo `for`, pues en este breve análisis no se contabilizó el tiempo necesario para el control del ciclo. Para evitar esto, se debe considerar el ciclo `for` como si fuera una abreviación de un ciclo ***mientras*** (`while`) de la siguiente forma:

Una estructura `for` se compone de una asignación, una comparación y un incremento, cada una de ellas consume un determinado tiempo.


- Se puede asignar un costo unitario a la comprobación $i \leq m$, a las instrucciones $i=1$ e $i=i+1$ y a las instrucciones de salto (implícitas) en el ciclo `while`.

- Sea $c$ una cota superior del tiempo requerido por cada una de las operaciones. 


- El tiempo $l$ requerido por el ciclo es acotado superiormente por:

$$l \leq \underbrace{c}_{i \leftarrow 1} + \underbrace{(m+1)c}_{i \leq m} + \underbrace{mt}_{P(i)} + \underbrace{mc}_{i \leftarrow i+1} + \underbrace{mc}_{instruccion \hspace{0.1cm} salto} \leq (t+3c)m+2c$$

Si $c$ es despreciable en comparación con $t$, entonces la estimación inicial del tiempo $l=mt$ era adecuada, salvo una situación crucial:

- $l\approx mt$ es incorrecto si $m=0$. Esta es la situación cuando el ciclo no se ejecutaría ni una sola vez. (se ampliará sobre esta idea más adelante)

### Reglas de la estructura *Para (`for`)*


***Regla 1:*** 

- El tiempo de ejecución de un ciclo `for` es a lo sumo el tiempo de ejecución de las instrucciones que están en el interior del ciclo más el tiempo del control, multiplicado todo por el número total de iteraciones, $n$.

$$T=(T_{interior} + T_{for})\times n$$

***Ej.***

Del algoritmo mostrado, se tiene:

- ***Asignación:*** 1

- ***Comparaciones:*** $\sum \limits_{i=1}^n 1 + 1 = n + 1$

- ***Incrementos:*** $n$

con esto: $1 + n+1 +1 = 2n+2$ es la complejidad de un ciclo `for` básico sin modificaciones.

In [5]:
n = 10
for i in range(2,n):
    i += 1
    print("incremento",i)
print("total",i)

incremento 3
incremento 4
incremento 5
incremento 6
incremento 7
incremento 8
incremento 9
incremento 10
total 10


Cuál sería la complejidad del siguiente algoritmo?

***Regla 2:*** 

- El tiempo de un grupo de ciclos `for`es a lo más el tiempo de ejecución de las instrucciones que están en el interior del ciclo multiplicado por el producto de los tamaños de todos los ciclos `for`.

***Ej.***

$$1 + \sum \limits_{i=1}^n \sum \limits_{j=1}^n k = 1+(2n+2)+(2n+2)n + n\times n = 3+2n+2n^2+2n+n^2 = 3n^2+4 n+3 = n^2+n = n^2$$

### 4.2.3 Ciclos *"Mientras"*  (`while`)

El tiempo en una estructura *Mientras* (`while`) es la multiplicación del tiempo de la estructura interior por el número de ciclos de esta estructura `while`, $n$.

$$T = (T_{interior} + T_{while}) \times n$$

Por el tipo de estructura, no hay forma de conocer, a priori, cuántas veces se pasará por el ciclo. El procedimiento de cálculo sería entonces:

- Hallar una función de las variables implicadas en el control del ciclo.


- Determinar el valor para el cual los ciclos de la estructura llegan a su final.


- Determinar la forma en que disminuyen las variables de control del ciclo.


***Ej.***

Resolviendo el ciclo para llevar las cuentas

$$T = n - j + 1$$
$$j > n$$
$$j \leftarrow 1, B, B^2, B^3, \ldots, B^k$$

por lo tanto, $mod(A)$ se repite $k$ veces

$$B^k>n \rightarrow log_B(B^k)>log_B(n) \rightarrow k > log_B(n) \rightarrow k = log_B(n) + c$$

con esto,


$$T_{while} = (m+4)\times (log_B(n)+c) + 3$$

### 4.2.4 Estructura condicional *Si* (`if`)

***Regla 1:***

- El tiempo de ejecución del condicional es la suma del tiempo de ejecucion del condicional y el mayor de los tiempos de ejecución de las alternativas (dos ejecuciones simples o una compuesta y una simple)

$$T = T_{if} + max(T_{then}, T_{else})$$

***Regla 2:***

- El tiempo nunca es mayor que el tiempo de ejecución del condicional más el mayor de los tiempos de ejecución de las alternativas (dos instrucciones compuestas)


***Ej.***

$$T(n) = 1 + max(2 , 3) = 4$$

$$T(n) = max(\mathcal{O}(Trat_1),\mathcal{O}(Trat_2), \ldots, \mathcal{O}(Trat_n))$$

Resumiendo, de forma general, las reglas que permiten obtener el orden de complejidad de un algoritmo serían (entre otras menos comunes):

- ***Operaciones aritméticas elementales sobre números:*** suma, resta, producto y división, se considerará que cada una tiene un costo constante, por lo que se dice que todas ellas están en $\Theta(1)$.


- **Comparaciones entre datos:** *p.ej.* decidir si un número es mayor que otro, cada test de esta forma tiene costo constante también.


- ***Asignaciones de la forma $x \leftarrow f(a)$:*** Suponiendo que las operaciones que pueden aparecer en $f(a)$ tienen costo constante, el costo de toda la asignación también será constante. Si no, el costo de la asignación será el costo de la evaluación de $f(a)$. Igual sucede en el caso de asignaciones múltiples.


- ***Instrucciones condicionales (`if` $A$ `then` $I_1$ `else` $I_2$):*** El costo total es la suma del costo de evaluar las condiciones booleanas $A$ (generalmente constante) más el costo de evaluar $I_1$ o $I_2$.


- ***Ciclos `while`***: Se calcula primero el costo de cada pasada y después sumar el costo de todas las pasadas que hagan parte del ciclo. El número de estas dependerá de lo que tarde en hacerse falso $A$, teniendo en cuenta los datos concretos sobre los que se ejecute el programa y lo grandes que sean.

### 4.2.5 Llamadas recursivas

Un algoritmo recursivo es aquel que se llama así mismo para ejecutarse. El análisis de un algoritmo recursivo suele dar lugar a una ecuación de recurrencia que imita el flujo de control dentro del algoritmo. Una vez obtenida la ecuación de recurrencia, se pueden aplicar algunas técnicas generales para transformar la ecuación en una ecuación asintótica no recursiva, que es más sencilla.

Tomemos como ejemplo el algoritmo clásico de la serie de *Fibonacci*

- recordemos que la forma general de la sucesión de *Fibonacci*

$$F_{i}=F_{i-1}+F_{i-2}$$

- es decir, el valor de la sucesión en $i$ se obtiene sumando los valores de la sucesión en los dos pasos anteriores, $i-1$ y $i-2$.

El algoritmo para el cálculo del valor $n$ de la sucesión de *Fibonacci* sería entonces:

In [1]:
def Fibrec(n):
    if n < 2:
        return n
    else:
        return Fibrec(n-1) + Fibrec(n-2)

In [None]:
print(Fibrec(5))

Sea $T(n)$ el tiempo requerido por una llamada a `Fibrec(n)`. Si $n<2$, el algoritmo devuevuelve el valor de $n$, que lo realiza en un tiempo constante $a$.

El resto del trabajo se realiza en las dos llamadas recursivas que requieren de un tiempo $T(n-1)$ y $T(n-2)$, más el tiempo de realizar las sumas de $f_{n-1}$ y $f_{n-2}$, más el control de la recursividad y la comprobación del $si$ $n<2$.

Sea $h(n)$ el trabajo implicado en esta suma y en el control, esto es, el tiempo requerido para una llamada a `Fibrec(n)` ignorando los tiempos invertidos dentro de las dos llamadas recursivas. 

Por definición de $T(n)$ y de $h(n)$, se obtiene la siguiente recurrencia:


$$T(n)=\left\{ \begin{array}{ccc}
a,                        & \text{si } n=0 \text{ o } n = 1, \\
T(n-1) + T(n-2) + h(n) ,  & \text{en caso contrario}  
\end{array}
\right. $$

Si se cuentan las sumas con costo unitario, $h(n)$ está acotado por una constante y la ecuación de recurrencia para $T(n)$ es muy similar