# Clase 07

Para una mejor visualización entrar al siguiente [link](https://nbviewer.jupyter.org/github/racsosabe/Miscelanea/blob/master/UPC/Beginner%20II/Clase%2007%20-%20Divide%20and%20Conquer%.ipynb)

# Requisitos Previos

* Lógica Proposicional
* Matemática Básica

# Divide and Conquer

## Definición

El paradigma de *Divide and Conquer* se basa en intentar resolver un problema partiéndolo en subproblemas de menor tamaño, resolviendo dichos subproblemas y luego combinar información adecuada de cada uno de ellos.

Podríamos resumir la técnica en 3 pasos:

1) *Divide*: Dividir el conjunto de datos inicial de manera conveniente.

2) *Conquer*: Obtener toda la información relevante y posible de cada elemento de la partición de los datos

3) *Merge*: Usar la información de los elementos de la partición de los datos para obtener una respuesta del total

Este tipo de algoritmos pueden ayudarnos a resolver diversos problemas de manera muy sencilla siempre y cuando cumplan con cada uno de los 3 pasos.

Un ejemplo de problema que se puede resolver con Divide and Conquer de manera sencilla es el ordenamiento de datos, mientras que uno que no se acomoda tan fácilmente es el de hallar la distancia más corta entre dos nodos de un grafo.

## Ordenamiento de datos

Como señalamos en el punto anterior, el ordenamiento de datos puede ser resuelto usando Divide and Conquer, los dos algoritmos más conocidos son el *Merge Sort* y *Quick Sort*.

### Merge Sort

El algoritmo Merge Sort parte de la posibilidad de unir dos arreglos ordenados en otro arreglo ordenado de manera lineal. Sus pasos usando la plantilla serían:

Entrada: Arreglo $a$ de tamaño $n$.

1) Divide: Dividir el arreglo $a$ en dos subarreglos $L$ y $R$, tales que $L = a[0,\ldots,\frac{n}{2}]$ y $R = a[\frac{n}{2}+1,\ldots,n-1]$.

2) Conquer: Ordenar los arreglos $L$ y $R$

3) Merge: Unir los dos arreglos $L$ y $R$ de manera ordenada en el arreglo $a'$ y realizar la asignación $a = a'$.

Entonces, podemos definir nuestras funciones a usar:

1) `mergeSort(a)`: Devuelve el arreglo $a'$, que contiene los elementos de $a$ ordenados de manera ascendente.

2) `merge(L,R)`: Recibe los arreglos ordenados ascendentemente $L$ y $R$ para devolver la unión de ambos en un nuevo arreglo ordenado ascendentemente

Usando los pasos del Divide and Conquer, así como las definiciones de las funciones, podemos plantear la estructura de la función `mergeSort(a)`

```Python
mergeSort(a):
    if a.length <= 1: return a // Un solo elemento está ordenado por defecto
    mi = a.length / 2 // Elemento del medio
    L = a[0,mi] // Asignamos L como la primera mitad del arreglo a
    R = a[mi+1,a.length-1] // Asignamos R como la segunda mitad del arreglo a
    L = mergeSort(L) // Ordenamos L
    R = mergeSort(R) // Ordenamos R
    return merge(L,R) // Devolvemos la combinacion de ambos
```

Este algoritmo tendrá complejidad:

$$ T(n) = 2T\left(\frac{n}{2}\right) + T(merge) $$

Donde $T(merge)$ es la complejidad de la función `merge`.

Para poder obtener una complejidad aceptable, necesitamos que la función `merge` sea lineal respecto al $n$, así que consideraremos lo siguiente:

- Ordenar ascendentemente $n$ elementos es equivalente a extraer el mínimo de ellos, colocarlo al final de la respuesta y eliminarlo de los datos originales: realizar esto hasta que ya no queden datos.

- Si $L$ y $R$ están ordenados, entonces el mínimo de todos los elementos será `min(L[0],R[0])`.

- Si mantenemos para $L$ y para $R$ indices que señalen el minimo elemento que aun no ha sido eliminado entonces podemos "eliminar" un elemento aumentando en 1 el indice correspondiente.

Luego de un análisis de los 3 puntos anteriores podemos plantear la estructura del merge:

```Python
merge(L,R):
    pL = 0 // Indice de L 
    pR = 0 // Indice de R
    ans = {}
    while pL < L.length and pR < R.length:
        if L[pL] < R[pR]:
            ans = ans U {L[pL]}
            pL = pL + 1
        else:
            ans = ans U {R{pR}}
            pR = pR + 1
    while pL < L.length:
        ans = ans U {L[pL]}
        pL = pL + 1
    while pR < R.length:
        ans = ans U {R[pR]}
        pR = pR + 1
    return ans
```

La función anterior tiene complejidad $O(n)$ debido a que $pL$ y $pR$ a lo mucho aumentarán $|L|$ y $|R|$ respectivamente.

Notemos que el primer while asigna el mínimo actual como se propuso en un primer momento y solo se detendrá cuando alguno de los dos arreglos a unir estén "vacios".

Los dos últimos while son solamente para agregar los elementos que falten del arreglo que aún sigue con elementos por agregar.

Dado que la función `merge` es lineal, podemos reemplazar su complejidad en la recurrencia que teniamos antes:


$$ T(n) = 2T\left(\frac{n}{2}\right) + O(n) \longrightarrow T(n) = O(n\log{n}) $$

Problemas para implementar:

* [Merge Sort - Codechef](https://www.codechef.com/problems/MRGSRT)
* [Inversion Count](https://www.spoj.com/problems/INVCNT/)

### Quick Sort

El algoritmo Quick Sort también particiona el arreglo original como el Merge Sort pero usa un criterio diferente para hacerlo:

Entrada: Arreglo $a$ de tamaño $n$

1) Divide: Toma un elemento cualquiera como pivot, luego colocar en dos nuevos arreglos $L$ y $R$ los elementos $\leq pivot$ y $> pivot$ respectivamente. 

2) Conquer: Ordenar los arreglos $L$ y $R$.

3) Merge: Unir las 3 particiones en un nuevo arreglo ordenado $a' = L \cup \{pivot\} \cup R$.

Entonces, podemos definir nuestras funciones a usar:

1) `quickSort(a)`: Devuelve el arreglo $a'$, el cual contiene los mismos elementos que $a$ ordenados de manera ascendente.

2) `partition(a,pivot)`: Devuelve los arreglos $L$ y $R$, en los cuales se colocarán (de manera estable) los elementos $\leq pivot$ y $>pivot$ respectivamente.

Considerando la idea detrás del algoritmo, podemos ir planteando la estructura de la función `quickSort(a)`:

```Python
quickSort(a):
    if a.length <= 1: return a
    p = choosePivot(a)
    L, R = partition(a,a[p])
    quickSort(L)
    quickSort(R)
    return L U {a[p]} U R
```

En el algoritmo dado tomamos una función extra llamada `choosePivot(a)`, la cual recibe el arrego $a$ y devuelve la posición del elemento pivote a elegir. Consideremos que esta acción la usamos como función debido a que su estructura podría afectar al desempeño del algoritmo.

Además de la función anterior también debemos dar una idea de la función `partition(a,pivot)`, por lo que su estructura será la siguiente:

```Python
partition(a,pivot):
    L = {}
    R = {}
    for x in a:
        if x <= pivot:
            L = L U {x}
        else:
            R = R U {x}
    return L,R
```

Es sencillo notar que el procedimiento interno de la función es tal como se propuso en un primer momento.

Teóricamente, el mejor caso de complejidad es $O(n\log{n})$, mientras que el peor caso es $O(n^{2})$. A pesar de lo anterior, podemos usar tranquilos el algoritmo debido a que la complejidad promedio es $O(n\log{n})$.

## Maximum Subarray Sum

Para resolver el problema del subarreglo con suma máxima usando Divide and Conquer debemos plantear mantener más información de la que intuitivamente podríamos necesitar sobre los subproblemas.

Analicemos cómo llegar a la solución y cómo combinar la información de cada subproblema:

Entrada: Arreglo de enteros $a$ de longitud $n$.

1) Divide: Particionar el arreglo $a$ en dos mitades $L = a[0,\ldots,\frac{n}{2}]$ y $R = a[\frac{n}{2}+1,\ldots,n-1]$.

2) Conquer: Obtener, para $L$ y $R$, la respuesta del arreglo, la suma de todos los elementos del arreglo, el mejor prefijo y el mejor sufijo.

3) Merge: Unir adecuadamente la información de ambos subarreglos $L$ y $R$ para procesar lo requerido del total.

La parte *Divide* no será muy difícil de entender, pues es similar al Merge Sort explicado anteriormente. Por otro lado, el *Conquer* parece algo inusual debido a que debemos saber si la información que llevamos es suficiente y necesaria.

Primero, definimos como "mejor" prefijo/sufijo a aquel prefijo/sufijo que tenga mayor suma, este puede ser procesado en $O(1)$ siempre, dado que si tenemos los subarreglos $L$ y $R$, entonces el mejor prefijo/sufijo de la unión de ambos será:

$$ prefix = max(L.prefix, L.total + R.prefix) $$
$$ suffix = max(R.suffix, R.total + L.suffix) $$

Esto no requiere prueba por la definición de "mejor" prefijo/sufijo.

Además de ello, la suma total de la unión de $L$ y $R$ será $total = L.total + R.total$. 

Ahora acabamos de llegar a la pregunta principal: ¿Por qué necesitamos el valor de $prefix$ y $suffix$? La respuesta se puede dar de manera sencilla considerando lo siguiente:

$$ L.ans = \max{\left\{\text{Maxima suma contigua del subarreglo L}\right\}} $$
$$ R.ans = \max{\left\{\text{Maxima suma contigua del subarreglo R}\right\}} $$

Poniéndolo de manera más matemática, el $ans$ toma el subarreglo de suma máxima **dentro** del arreglo de referencia; por lo tanto, no considera los rangos generados al unir los dos subarreglos (los cuales serían el producto cartesiano de los intervalos $[0,\frac{n}{2}] \times [\frac{n}{2}+1,n-1]$). Para resolver la posible falta de candidatos a respuesta están nuestros prefijos y sufijos, logrando así que el nuevo $ans$ sea:

$$ ans = \max{\{L.ans,R.ans,L.suffix + R.prefix\}} $$

La justificación de por qué nos bastan estos 3 valores es por la definición de "mejor" prefijo/sufijo respecto al mejor subarreglo cruzado.

Finalmente, ya tenemos la prueba de por qué necesitamos los 4 atributos de cada subproblema, así que podemos plantear las funciones a usar:

1) `solve(L,R)`: Recibe los indices $L$ y $R$ que determinan el subarreglo de $a$ a resolver, devuelven un nodo con la información correspondiente

2) `merge(a,b)`: Recibe dos nodos $a$ y $b$, los cuales son datos sobre el subarreglo izquierdo y derecho respectivamente. Devuelve la información de la unión de ambos subarreglos.

Veamos la estructura de `solve`:

```Python
solve(L,R):
    if L == R:
        return nodo(a[L],a[L],a[L],a[L]) // nodo(ans,prefix,suffix,total)
    mi = (L + R) / 2
    nodo a = solve(L,mi)
    nodo b = solve(mi + 1, R)
    return merge(a,b)
```

Y finalmente, como habiamos considerado, la estructura de `merge`:

```Python
merge(a,b):
    nodo q
    q.ans = max(max(a.ans,b.ans),a.suffix + b.prefix)
    q.total = a.total + b.total
    q.prefix = max(a.prefix, a.total + b.prefix)
    q.suffix = max(b.suffix, b.total + a.suffix)
    return q
```

Ahora ya tenemos nuestras funciones y estructuras definidas, por lo que veamos la complejidad:

$$ T(n) = 2T\left(\frac{n}{2}\right) + O(1) $$

Realizando un pequeño análisis, llegamos a la conclusión de que:

$$ T(n) = O(n) $$

Así que hemos llegado a una misma complejidad que el mejor algoritmo de Programación Dinámica que resuelve el mismo problema, el cual veremos al llegar a dicho tema.

Problema para implementar:

* [The Maximum Subarray](https://www.hackerrank.com/challenges/maxsubarray/problem)

## Binary Search

Una de las técnicas más usadas derivadas del Divide and Conquer es la búsqueda binaria (*Binary Search*), la cual toma como referencia una función que es total o parcialmente monótona dentro de un rango para obtener una respuesta o reducir el conjunto a analizar de manera eficiente.

En este caso, la parte *Merge* no considera la combinación de respuestas de todos los subproblemas, sino que solamente toma la respuesta de algunos de ellos.

Además, dado que la técnica se basa en una función monótona, se suele hacer un mapeo de pertenencia usando una función llamada **predicado**, la cual devolverá un booleano de manera conveniente.

Entonces, dadas las condiciones, una búsqueda binaria se puede aplicar cuando los valores del predicado tienen alguna de las dos siguientes estructuras:

$$ VVVV\ldots VVVVFFFF\ldots FFFF $$
$$ FFFF\ldots FFFFVVVV\ldots VVVV $$

Y lo usual es que nos pregunten con qué argumento se obtiene el último verdadero-primer falso y el último falso-primer verdadero respectivamente.

Ahora, por simplicidad, analicemos la primera estructura, considerando una posición $x$ la cual se evalúa a alguno de los dos valores posibles:

1) Si $pred(x)$ es verdadero, entonces **todos** los elementos $\leq x$ son evaluados a verdadero.

2) Si $pred(x)$ es falso, entonces **todos** los elementos $> x$ son evaluados a falso.

Usando los dos puntos anteriores como referencia, la búsqueda binaria toma un rango de referencia $[lo,hi]$, toma el elemento medio de ambos (adecuadamente) $mi$ y decidir si el rango de referencia se reduce a $[lo,mi]$ o $[mi,hi]$.

Es sencillo notar que si tenemos un rango de tamaño $n$ entonces:

$$ T(n) = T\left(\frac{n}{2}\right) + T(predicado) $$

Donde $T(predicado)$ es la complejidad de evaluar el predicado en un punto cualquiera. De manera general, tendremos:

$$ T(n) = T(predicado)\cdot O(\log_{2}{n}) $$

Sin pérdida de generalidad, asumamos que siempre tendremos la primera estructura como valores del predicado, entonces para hallar el índice del primer falso en un arreglo de valores $a$ de longitud $n$ podemos usar el siguiente algoritmo:

```Python
lower_bound(a,n):
    lo = 0, hi = n - 1
    while lo < hi:
        mi = lo + (hi - lo) / 2 # Sumamos la semidiferencia para evitar overflow
        if pred(mi): lo = mi + 1
        else hi = mi
    return lo
```

La justificación de por qué se llega al primer falso es la siguiente:

1) Si pred(mi) es **verdadero**, nos vamos al siguiente de $mi$, lo que implica que se irá a la siguiente posición a medida que sea verdadero, por lo que eventualmente llegaría a un falso.

2) Si pred(mi) es **falso**, nos vamos a $mi$, lo que implica que se irá a una posición falsa siempre, reduciéndose hasta ya no poder más: el último índice también dará falso y no tendrá ningún falso antes.

Ahora, si nos piden el último verdadero solo necesitamos realizar una ligera modificación al algoritmo anterior:

```Python
upper_bound(a,n):
    lo = 0, hi = n - 1
    while lo < hi:
        mi = lo + (hi - lo + 1) / 2 # Sumamos la semidiferencia para evitar overflow
        if pred(mi): lo = mi
        else hi = mi - 1
    return lo
```

La justificación se da de manera análoga al caso anterior.

### Binary Search the Answer

Para casos continuos en los que el rango sea todos los reales entre $lo$ y $hi$, debemos plantear una condición de salida diferente, debido a que comparar dos reales muy cercanos entre sí no siempre es fácil para la computadora, y deberíamos considerar que el tiempo que se demoraría para que se llegue a cumplir la condición de que $lo = hi$ es muy alto en la mayoría de escenarios.

Con el fin de resolver esta problemática, podemos usar un for con una cantidad de pasos fija, para tener la certeza de que el bucle se detendrá en un tiempo prudente. Por último, para estos problemas, no se agrega o disminuye 1 porque cuando el rango se reduzca lo suficiente esto inducirá al error:

```Python
binarySearch():
    lo = 0, hi = x
    for i = 0 to 70:
        mi = (lo + hi) / 2.0
        if pred(mi): lo = mi
        else hi = mi
```

Esta técnica es llamada *Binary Search the Answer* debido a que su aplicación más común es la de hallar la respuesta de manera directa.

## Problemas para practicar

* [K-Dominant Character](https://codeforces.com/contest/888/problem/C)
* [Energy exchange](https://codeforces.com/contest/68/problem/B)
* [Guilty — to the kitchen!](https://codeforces.com/contest/42/problem/A)
* [Three Base Stations](https://codeforces.com/contest/51/problem/C)
* [Math is Love](https://www.spoj.com/problems/MATHLOVE/)
* [Digits Sequence (Hard Edition)](https://codeforces.com/problemset/problem/1177/B)
* [Magic Powder - 2](https://codeforces.com/problemset/problem/670/D2)