<a href="https://colab.research.google.com/github/martinmaturana777/AED-Apuntes/blob/main/Pauta_Auxiliar_3_2025_1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import numpy as np

# Pauta Auxiliar 3: Dividir y Reinar, Ecuaciones de Recurrencia y Teorema Maestro

**Auxiliares: Valentina Alarcón Yañez, Antonia G. Calvo, Cristián Llull, Raimundo Lorca Correa, Samuel Chavéz Fierro<br>
Profesores: Nelson Baloian, Iván Sipirán, Patricio Poblete<br>
Curso: CC3001 Algoritmos y Estructuras de Datos**



# Resumen Teorema Maestro

El teorema maestro dice lo siguiente.
Dada una ecuación de recurrencia del tipo $T(n) = pT(\frac{n}{q}) + Cn^r$, la solución es:

\begin{align*}
T(n) &= \Theta(n^r) & \text{ si } p < q^r \\
T(n) &= \Theta(n^rlog(n)) & \text{ si } p = q^r \\
T(n) &= \Theta(n^{\log_q{p}}) & \text{ si } p > q^r \\
\end{align*}




# Pregunta 1: Merge Sort

  Una forma de ordenar arreglos, que puede ser de las primeras que se les ocurran una vez comprendido el poder de la recursión, es dividir el problema en partes atómicas e ir ordenando estos sub-arreglos después de su llamada recursiva. En especifico:

  + Dividimos los arreglos en mitades y hacemos una llamada recursiva ordenando  los sub-arreglos
  + Hacemos una combinación (merge) de los sub-arreglos ordenados, tomando una lista pivote, iteramos sobre la otra lista
  + Una vez ordenado, podemos retornar nuestra llamada recursiva

  ![image](https://upload.wikimedia.org/wikipedia/commons/c/cc/Merge-sort-example-300px.gif)

  a) Dibuje con un diagrama el cómo podría verse el desarrollo del problema partiendo con el arreglo [6,5,3,1,8,7,2,4]

  b) Asuma que existe una función que realiza merge entre dos arreglos, y programe `mergeSort(arr, left, right)`.  
  


b) Código de Merge Sort

In [None]:
def merge(arr, left, mid, right):
    n1 = mid - left + 1
    n2 = right - mid

    # Create temp arrays
    L = [0] * n1
    R = [0] * n2

    # Copy data to temp arrays L[] and R[]
    for i in range(n1):
        L[i] = arr[left + i]
    for j in range(n2):
        R[j] = arr[mid + 1 + j]

    i = 0  # Initial index of first subarray
    j = 0  # Initial index of second subarray
    k = left  # Initial index of merged subarray

    # Merge the temp arrays back
    # into arr[left..right]
    while i < n1 and j < n2:
        if L[i] <= R[j]:
            arr[k] = L[i]
            i += 1
        else:
            arr[k] = R[j]
            j += 1
        k += 1

    # Copy the remaining elements of L[],
    # if there are any
    while i < n1:
        arr[k] = L[i]
        i += 1
        k += 1

    # Copy the remaining elements of R[],
    # if there are any
    while j < n2:
        arr[k] = R[j]
        j += 1
        k += 1

def merge_sort(arr, left, right):
    if left < right:
        mid = (left + right) // 2

        merge_sort(arr, left, mid)
        merge_sort(arr, mid + 1, right)
        merge(arr, left, mid, right)


In [None]:
def test_mergesort(arr, expected_arr):
  print(f"Testing array: {arr}...")
  merge_sort(arr, 0, len(arr)-1)
  for i in range(len(arr)):
    assert(arr[i] == expected_arr[i])
  print("OK")
  print()

arr = np.array([6, 5, 3, 1, 8, 7, 2, 4])
test_mergesort(arr, np.arange(1, 9))



Testing array: [6 5 3 1 8 7 2 4]...
OK



# Pregunta 2: Ecuaciones de Recurrencia



**Resuelva** las siguientes ecuaciones lineales homogéneas con coeficientes constantes:

1.  - T(n) = 5T(n − 1) − 4T(n − 2)
    - T(1) = 3
    - T(2) = 15

Tenemos la siguiente ecuación lineal homogénea

\begin{align*}
T(n) &=5T(n-1)-4T(n-2) \\
T(1) &=3 \\
T(2) &=15
\end{align*}

Este tipo de ecuaciones tiene soluciones del tipo $T(n) = \lambda^{n}$. El polinomio característico de la ecuación es:

\begin{align*}
\lambda^{n} &=5 \lambda^{n-1} - 4\lambda^{n-2}
\end{align*}

Descartando la solución trivial $\lambda = 0$ y dividiendo ambos lados por $\lambda^{n-2}$ se obtiene

\begin{align*}
\lambda^{2} &= 5\lambda - 4 \\
0 &= \lambda^{2} - 5\lambda + 4 \\
0 &= (\lambda - 4)(\lambda - 1) \\
1 = \lambda_{1} &\quad 4 = \lambda_{2}
\end{align*}

La solución general a la ecuación de recurrencia es una combinación lineal de las soluciones del polinomio característico:

\begin{equation*}
T(n) = A \cdot 4^{n} + B \cdot 1^{n} = A \cdot 4^{n} + B
\end{equation*}

Ahora, usamos las condiciones iniciales para encontrar $A$ y $B$:

\begin{equation}
T(1) = 3 = A \cdot 4 + B
\end{equation}
\begin{equation}
T(2) = 15 = A \cdot 16 + B
\end{equation}

Restando la segunda ecuación con la primera nos deja

\begin{align*}
12A &= 12 \\
A &= 1
\end{align*}

Y en (1), $A = 1$ nos dice inmediatamente que $B = -1$, por lo que la solución final es:

\begin{equation*}
T(n)=4^n-1
\end{equation*}

2.  - T(n) = 4T(n − 1) − 4T(n − 2)
    - T(0) = 1
    - T(1) = 2

Se tiene otra ecuación con coeficientes constantes

\begin{align*}
T(n)&=4T(n-1)-4T(n-2) \\
T(0)&=1 \\
T(1)&=2
\end{align*}

Nuevamente podemos considerar $T(n) = \lambda^{n}$. El polinomio característico de la ecuación es:

\begin{equation*}
\lambda^{n} = 4\lambda^{n-1} - 4\lambda^{n-2}
\end{equation*}

Descartando la solución trivial $\lambda = 0$ y dividiendo ambos lados por $\lambda^{n-2}$ se obtiene

\begin{align*}
&\lambda^{2} = 4\lambda - 4 \\
&\lambda^{2} - 4\lambda + 4 = 0 \\
&(\lambda - 2)(\lambda - 2) = 0 \\
&\lambda_{1} = 2, \lambda_{2} = 2
\end{align*}

Dado que $r=2$ es raíz doble, la solución tiene la forma:
\begin{align*}
T(n)&=(A + B\cdot n)\cdot r^{n} = (A + B\cdot n)\cdot 2^{n}
\end{align*}

Luego, usando las condiciones iniciales:

a) T(0) = 1
\begin{align*}
1 &= (A + B \cdot 0) \cdot 2^{0} \\
1 &= (A + 0) \cdot 1 \\
1 &= A
\end{align*}

b) T(1) = 2
\begin{align*}
2 &= (A + B \cdot 1) \cdot 2^{1} \\
2 &= (1 + B) \cdot 2 \\
2 &= 2 + 2\cdot B \\
0 &= 2\cdot B \\
0 &= B
\end{align*}

Finalmente, reemplazando A = 1 y B = 0, la solución es:
\begin{equation*}
T(n) = 2^{n}
\end{equation*}

# Pregunta 3: Más Recurrencias

Suponga que para resolver un determinado problema se le presentan las siguientes tres alternativas de algoritmo:
  + El algoritmo A resuelve el problema de tamaño n dividiéndolo en cinco subproblemas de tamaño $n/2$, resolviendo recursivamente cada subproblema y luego combinando las soluciones en tiempo lineal.
  + El algoritmo B resuelve el problema de tamaño n resolviendo recursivamente dos subproblemas de tamaño n − 1 y realizando trabajo adicional a tiempo constante.
  + El algoritmo C resuelve el problema de tamaño n dividiéndolo en nueve subproblemas de tamaño $n/3$, resolviendo recursivamente cada subproblema y luego combinando las soluciones en tiempo O($n^2$).
¿Qué algoritmo escogería usted si el objetivo es minimizar el tiempo de ejecución?

Como los tres mencionan recursión, podemos obtener las ecuaciones de recurrencia que siguen los costos de los algoritmos.

#### Algoritmo A
La descripción menciona que el algoritmo resuelve recursivamente 5 subproblemas de tamaño $\frac{n}{2}$, por lo que el término $5T_A(\frac{n}{2})$ estará presente en la ecuación. Además, se menciona que luego combinan las soluciones en tiempo lineal, es decir, en $O(n)$ que equivale a $kn$, siendo k una constante, entonces el término $kn$ también estará en la ecuación. Teniendo en cuenta todo lo anterior, llegamos a que la ecuación de recurrencia del costo de este algoritmos es:
$$T_A(n) = 5T_A(\frac{n}{2}) + kn$$
Podemos ver que $p=5 > 2^1 = q^r$, por lo que por Teorema Maestro $T_A(n) = Θ(n^{log_2(5)})$.

### Algoritmo B

La descripción menciona que el algoritmo resuelve recursivamente 2 subproblemas de tamaño $n-1$, por lo que el término $2T_B(n-1)$ estará presente en la ecuación. Además, se menciona que luego combinan las soluciones en tiempo constante, es decir, en $O(1)$ que equivale a $k$, siendo $k$ una constante, entonces el término $k$ también estará en la ecuación. Teniendo encuenta todo lo anterior, llegamos a que la ecuación de recurrencia del costo de este algoritmos es:
$$T_B(n) = 2T_B(n-1) + k$$

Podemos ver que en este caso no es posible aplicar el teorema maestro, pues no podemos identificar el valor de $q$. Sin embargo, observando el problema que se plantea este es bastante similar al ejemplo del número de movidas en las Torres de Hanoi ($a_n=2a_{n-1}+1$).

Resolveremos este caso utilizando la Resolución de Ecuaciones Lineales de Primer Orden.
$$ a_n = ba_{n-1}+c_n$$
La que nos da cómo resultado:
$$ a_n = a_0b^n+\sum_{1\leq k\leq n}c_kb^{n-k}$$
En nuestro caso $c_k=constante$, $b=2$, $a_0=constante$, por lo que se tendrá:
$$ a_n = a_02^n+\sum_{1\leq k\leq n}c\:2^{n-k}$$

$$ a_n = a_02^n+c\:\sum_{1\leq k\leq n-1}2^{k}$$

$$ a_n = a_02^n+c\:(2^n-1)$$

Finalmente se tendría que el tiempo es: $\Theta(a_02^n+c\:(2^n-1))$ como $a_0$ y $c$ son constantes:

$$\Theta(a_02^n+c\:(2^n-1)) \in \Theta(2^n)$$

### Algoritmo C

La descripción menciona que el algoritmo resuelve recursivamente 9 subproblemas de tamaño $\frac{n}{3}$, por lo que el término $9T_C(\frac{n}{3})$ estará presente en la ecuación. Además, se menciona que luego combinan las soluciones en tiempo cuadrático, es decir, en $O(n^2)$ que equivale a $kn^2$, siendo k una constante, entonces el término $kn^2$ también estará en la ecuación. Teniendo en cuenta todo lo anterior, llegamos a que la ecuación de recurrencia del costo de este algoritmos es:
$$T_C(n) = 9T_C(\frac{n}{3}) + kn^2$$
Podemos ver que $p=9 = 3^2 = q^r$, por lo que por Teorema Maestro $T_C(n) = Θ(n^2 {log(n)})$.

# Pregunta Propuesta : Stooge Sort (Ejercicio 2.3)

### Ejercicio 2.3

El método del ordenación **Stooge Sort** es un método recursivo que puede describirse de la siguiente manera:

* Si el primer elemento es mayor que el último, los intercambiamos
* Si hay 3 o más elementos en la lista, entonces:
    * Ordenar los primeros 2/3 de la lista recursivamente
    * Ordenar los últimos 2/3 de la lista, recursivamente, y
    * Ordenar (¡de nuevo!) los primeros 2/3 de la lista.

Escriba una ecuación que modele el tiempo de ejecución de Stooge Sort y resuélvala usando el Teorema Maestro.

Para resolver este ejercicio con Teorema Maestro debemos considerar que queremos una ecuación del estilo:

$T(n)= p \cdot T(\frac{n}{q}) + C \cdot n^r$

Donde $p$ es la cantidad de subproblemas que se tienen, $\frac{n}{q}$ es el tamaño de los subproblemas, y $C*n^r$ es el término que representa el orden de combinar las soluciones (pasos extra).

En el enunciado se comenta que, si hay 3 o más elementos en la lista, se realizan 3 pasos. Esto implica que $p$ es 3.

Luego, dado que los subproblemas tienen tamaño $2/3$, q debe ser $3/2$ (tal que $\frac{n}{q}$ sea $\frac{2n}{3}$)

Finalmente, dado que los pasos extra son constantes, y combinar la solución también lo es, entonces $C \cdot n^r$ debe ser un término O(1). Esto es análogo a decir que $r$ debe ser 0, para cumplir que $C \cdot n^r$ no dependa de n.

Resumen:

$p = 3$ \\
$q = 3/2$ \\
$r = 0$ \\

Luego, revisamos la relación entre $p$ y $q^r$, donde $q^r = (\frac{3}{2})^0 = 1$.

En efecto, $p > q^r$ pues $3 > 1$. Esto hace que caiga en el caso de Teorema Maestro $T(n) = \Theta(n^{\log_q{p}}) \text{ si } p > q^r$.

Reemplazando los valores, quedaría que

$T(n) = \Theta(n^{\log_{3/2}{3}})$
$T(n) = \Theta(n^{2,71})$