<p>
<font size='5' face='Georgia, Arial'>IIC2115 - Programación como herramienta para la ingeniería</font><br>
</p>

# Recursión

En esta sección describiremos distintas formas de **recursión** para construir algoritmos. La recursión es uno de los elementos fundamentales de la computación y nos permite encontrar, generalmente, soluciones compactas y elegantes a los problemas. Escribir algoritmos recursivos requiere práctica y muchas veces la solución es menos eficiente que las de un simple algoritmo iterativo, pero como veremos al final de esta sección, existen problemas para los cuales escribir un algoritmo iterativo es complejo, donde la recursión, a pesar de ser menos eficiente en cuanto al uso de recursos, permite definir una solución natural y entendible.

## Recursión e iteración lineal

Comencemos el análisis considerando la función **factorial** definida de la siguiente manera:

\begin{equation*}
    n! = n\cdot (n-1) \cdot (n-2) \cdots \ 3 \cdot 2 \cdot 1
\end{equation*}

Existen muchas maneras de calcular el valor de esta función. Una posible es usar el hecho que 

\begin{equation*}
    n! = \left[(n-1) \cdot (n-2) \cdots \ 3 \cdot 2 \cdot 1 \right] = n\cdot (n-1)!,
\end{equation*}

para cualquier entero positivo $n$. Si a esta última definición le agregamos la condición que $1! = 1$, podemos traspasar todo directamente a una función:

In [1]:
def factorial_recursivo(n):
    if n == 1:
        return 1
    return n*factorial_recursivo(n-1)

factorial_recursivo(5)

120

Enfrentemos ahora de una manera distinta el cálculo del factorial de un número. Podríamos describir una regla para calcular $n!$, especidficando que primero multiplicamos $1$ por $2$, luego el resultado por $3$, después por $4$, y así sucesivamente hasta llegar a $n$. Formalmente, mantendríamos como variables un producto acumulado, junto con un contador que va de $1$ a $n$. El algoritmo podría describirse diciendo que tanto el contador como el producto son simultaneamente actualizados de un paso al siguiente, de acuerdo a la siguiente regla:

\begin{align*}
    producto &= contador \cdot producto \\
    contador &= contador + 1
\end{align*}

y especificando que el resultado, $n!$ es el valor de la variable $producto$, cuando el contador excede el valor de $n$.

Nuevamente, podemos escribir código en Python siguiendo la regla recién descrita:

In [2]:
def factorial_iterativo(n):
    contador = 1
    producto = 1
    while contador <= n:
        producto *= contador
        contador += 1
    return producto

factorial_iterativo(5)

120

Al comparar ambos modos de solucionar el problema, podemos notar que desde el punto de la secuencia de resultados parciales que generan, ambos son idénticos. Más aún, ambos utilizan la misma operación (producto), y además toman la misma cantidad de pasos para obtener el resultados. Sólo al analizar el modo en que se *gestan* las operaciones, notamos las diferencias fundamentales entre ambas maneras de resolver el problema.

Consideremos inicialmente el caso de la recursión. El algoritmo funciona generando una serie de llamadas a la función *factorial_recursivo*, con la particularidad que sólo una de ellas (la última) retorna inmediatamente el resultado. Una vez que esta retorna el resultado, la penúltima llamada es también capaz de retornar un resultado, y así sucesivamente. Esto es análogo a apilar llamadas sucesivas a la misma función en un *stack*, donde sólo podemos obtener el retorno de una, si conocemos el retorno de la que está inmediatamente encima de ella. Así, basta con obtener el valor de retorno de la llamada que está en el tope el stack (caso base donde n==1), para obtener el valor de retorno de todas. Este tipo de recursión es conocida como **recursión lineal**, donde la *cadena* de llamadas a funciones que esperan para generar su valor de retorno (funciones en el stack), tiene un tamaño proporcional al valor del parámetro entregado a la primera llamada a la función, en este caso, $n$.

Por el contrario, en el caso del factorial calculado de forma iterativa, no existe nada parecido a una cadena de llamadas a funciones en espera. Sólo se tiene un conjunto de variables, donde se mantienen y actualizan los valores relevantes para la solución. Este tipo de procedimiento se conoce como proceso **iterativo_lineal**, la cantidad de pasos (iteraciones) necesaria para solucionar el problema es proporcional al valor del parámetro de entrada a la función $n$, pero a diferencia de la **recursión lineal**, el estado actual se puede resumir en un conjunto fijo de variables y una cantidad fija de reglas que definen como cambia el estado de las variables durante la ejecución.

Otra manera de contrastar las diferencias entre ambos esquemas es notar que, en el caso del proceso iterativo, la variables contienen una descripción completa de la solución parcial. Esto significa que si el programa es detenido luego de una iteración,  todo lo que se necesita para volver a ejecutar son los valores almacenados en las variables. Por el contrario, para la recursión, si el procedimiento es detenido antes de ejecutar un nuevo paso (llamado recursivo a una función), la información no está contenido en ninguna variable. Para este caso, la información se encuentra *escondida*, y es manejada por el interprete del lenguaje, en este caso, Python. Mientras más larga sea la cadena de llamados a funciones, mayor es la cantidad de información *escondida*.

Para terminar con la recursión lineal, consideremos el problema de decidir si un número es primo o no. Recordemos que un número entero $n$ es primo si y sólo si $n\geq 2$ y los únicos factores de $n$ son el 1 y $n$. Una manera de solucionar este problema por medio de fuerza bruta, es probar cada entero en el rango $[2,n-1]$ y verificar si alguno de estos divide a $n$ sin generar resto. Podemos implementar esto recursivamente en Python, de la siguiente manera:

In [3]:
def factor_en_rango(k, n):
   if k >= n:   
      return False                   
   elif (n % k) == 0:             
      return True                  
   else:                        
      return factor_en_rango(k+1, n)
      
def es_primo(n):
   return (n > 1) and not factor_en_rango(2, n)

es_primo(917)

False

Tal como en el caso del factorial, es posible notar que no se utilizan variables y que el número de llamadas recursivas en espera de poder retornar, es una cantidad proporcional al valor de entrada.

## Recursión de árbol

Otro patrón de cómputo muy común es el de **recursión de árbol**. Como ejemplo, consideremos el cálculo de la secuencia de números de Fibonacci, donde cada número está dado por la suma de los dos anteriores: 0,1,1,2,3,5,8,13,...

En general, los números de Fibonacci pueden definirse mediante la siguiente regla:

$$fib(n) = 
\begin{cases} 
    0 & n = 0 \\
    1 & n = 1 \\
    fib(n-1) + fib(n-2) & en~otro~caso
\end{cases}$$

Tal como antes, podemos transformar esto inmediatamente en una función recursiva para calcular los números de Fibonacci:

In [6]:
def fib(n):
    if n == 0:
        return 0
    elif n == 1:
        return 1
    else:
        return fib(n-2) + fib(n-1)

fib(5)

5

Consideremos a continuación de manera visual el patrón de cálculo de la función, representado en la siguiente figura:

<img src="img/fibonacci.gif">

Para calcular $fib(5)$, primero se calcula $fib(4)$ y $fib(3)$. Para $fib(4)$, calculamos $fib(3)$ y $fib(2)$. En general, como se puede apreciar en la figura, la evolución de las llamadas es similar a un árbol. Notemos que los nodos se dividen en 2 en cada nivel (excepto el final), lo que refleja el hecho que $fib$ se llama a si mismo dos veces cada vez que es llamada.

Este procedimiento es un ejemplo prototípico de recursión de árbol, pero lamentablemente es una pésima manera de calcular los números de Fibonacci, ya que realiza una gran cantidad de trabajo redundante. Notemos en la figura que el cálculo de $fib(3)$, casi la mitad del trabajo, está duplicado.

Thus, the process uses a number of steps that grows exponentially with the input. On the other hand, the space required grows only linearly with the input, because we need keep track only of which nodes are above us in the tree at any point in the computation. In general, the number of steps required by a tree-recursive process will be proportional to the number of nodes in the tree, while the space required will be proportional to the maximum depth of the tree.

We can also formulate an iterative process for computing the Fibonacci numbers. The idea is to use a pair of integers a and b, initialized to Fib(1) = 1 and Fib(0) = 0, and to repeatedly apply the simultaneous transformations

\begin{align*}
    producto &= contador \cdot producto \\
    contador &= contador + 1
\end{align*}

It is not hard to show that, after applying this transformation n times, a and b will be equal, respectively, to Fib(n + 1) and Fib(n). Thus, we can compute Fibonacci numbers iteratively using the procedure

(define (fib n)
  (fib-iter 1 0 n))

(define (fib-iter a b count)
  (if (= count 0)
      b
      (fib-iter (+ a b) a (- count 1))))

This second method for computing Fib(n) is a linear iteration. The difference in number of steps required by the two methods -- one linear in n, one growing as fast as Fib(n) itself -- is enormous, even for small inputs.

One should not conclude from this that tree-recursive processes are useless. When we consider processes that operate on hierarchically structured data rather than numbers, we will find that tree recursion is a natural and powerful tool.32 But even in numerical operations, tree-recursive processes can be useful in helping us to understand and design programs. For instance, although the first fib procedure is much less efficient than the second one, it is more straightforward, being little more than a translation into Lisp of the definition of the Fibonacci sequence. To formulate the iterative algorithm required noticing that the computation could be recast as an iteration with three state variables.

It takes only a bit of cleverness to come up with the iterative Fibonacci algorithm. In contrast, consider the following problem: How many different ways can we make change of $ 1.00, given half-dollars, quarters, dimes, nickels, and pennies? More generally, can we write a procedure to compute the number of ways to change any given amount of money?

This problem has a simple solution as a recursive procedure. Suppose we think of the types of coins available as arranged in some order. Then the following relation holds:

The number of ways to change amount a using n kinds of coins equals

the number of ways to change amount a using all but the first kind of coin, plus
the number of ways to change amount a - d using all n kinds of coins, where d is the denomination of the first kind of coin.
To see why this is true, observe that the ways to make change can be divided into two groups: those that do not use any of the first kind of coin, and those that do. Therefore, the total number of ways to make change for some amount is equal to the number of ways to make change for the amount without using any of the first kind of coin, plus the number of ways to make change assuming that we do use the first kind of coin. But the latter number is equal to the number of ways to make change for the amount that remains after using a coin of the first kind.

Thus, we can recursively reduce the problem of changing a given amount to the problem of changing smaller amounts using fewer kinds of coins. Consider this reduction rule carefully, and convince yourself that we can use it to describe an algorithm if we specify the following degenerate cases:33

If a is exactly 0, we should count that as 1 way to make change.
If a is less than 0, we should count that as 0 ways to make change.
If n is 0, we should count that as 0 ways to make change.
We can easily translate this description into a recursive procedure:

(define (count-change amount)
  (cc amount 5))
(define (cc amount kinds-of-coins)
  (cond ((= amount 0) 1)
        ((or (< amount 0) (= kinds-of-coins 0)) 0)
        (else (+ (cc amount
                     (- kinds-of-coins 1))
                 (cc (- amount
                        (first-denomination kinds-of-coins))
                     kinds-of-coins)))))
(define (first-denomination kinds-of-coins)
  (cond ((= kinds-of-coins 1) 1)
        ((= kinds-of-coins 2) 5)
        ((= kinds-of-coins 3) 10)
        ((= kinds-of-coins 4) 25)
        ((= kinds-of-coins 5) 50)))

(The first-denomination procedure takes as input the number of kinds of coins available and returns the denomination of the first kind. Here we are thinking of the coins as arranged in order from largest to smallest, but any order would do as well.) We can now answer our original question about changing a dollar:

(count-change 100)
292

Count-change generates a tree-recursive process with redundancies similar to those in our first implementation of fib. (It will take quite a while for that 292 to be computed.) On the other hand, it is not obvious how to design a better algorithm for computing the result, and we leave this problem as a challenge. The observation that a tree-recursive process may be highly inefficient but often easy to specify and understand has led people to propose that one could get the best of both worlds by designing a ``smart compiler'' that could transform tree-recursive procedures into more efficient procedures that compute the same result.