# Práctica 10 (Divide y Vencerás)

**Alumno:** Axel Daniel Malváez Flores

**5to** Semestre

# Ejercicios

In [23]:
import numpy as np
from math import sqrt
import copy

## Ejercicio 1

Dado un arreglo $L$, para índices $i, j$ con $i<j$, decimos que $L_i$ y $L_j$ forman una *inversión* si $L_i>L_j$. Por ejemplo, el arreglo:

$$
L = [2, 4, 1, 3, 5]
$$

Tiene tres inversiones: $(2,1),(4,1),(4,3)$.

Diseña un algoritmo de divide y vencerás que cuente el número de inversiones en un arreglo. Este debe de correr en tiempo $O(n\log n)$.

**Explicación:**  
La idea es similar a *merge sort*, dividir el arreglo en dos o más mitades iguales en cada paso hasta que el caso base sea alcanzado. 

* Creamos una función *merge* que cuenta el número de inversiones cuando dos mitades del arreglo son mezclada y para esto se crean dos índices, $i$ y $j$ para la primera y segunda mitad respectivamente y verificamos si a[i] es más grande que a[j] entonces tendremos que habrá (mid - i) inversiones, esto porque los subarreglos izquierdo y derecho están otdenados, entonces todos los elementos restantes en el subarray izquierdo (a[i+1], a[i+2] … a[mid]) serán más grandes que a[j].

* Ahora creamos otra función recursiva para dividir el arreglo en dos subarreglos y encontrar la respuesta asumiendo que el número de inversiones es el número de inversiones en la primera mitad, el número de inversiones en la segunda mitad y el número de inversiones fusionando ambos subarreglos.

Notemos que el caso base de recursión es cuando hay solo un elemento en la mitad del arreglo dado. Finalmente imprimimos el resultado.

Ahora el análisis lo damos por funciones:
* merge(): El análisis total es $O(n)$
    * Línea 36-41: $O(1)$
    * Línea 45-56: $O(\frac{n}{2})$
    * Línea 60-63: $O(n)$
    * Línea 67-70: $O(n)$
    * Línea 73-74: $O(n)$

* _mergeSort():
    * Línea 14-19: $O(1)$
    * Línea 22: $\text{T}(\frac{n}{2})$
    * Línea 25: $\text{T}(\frac{n}{2})$
    * Línea 28: $O(n)$

Entonces nuestra relación de recurrencia de esta función será:

$$
\text{T}(n) = 2\text{T}(\frac{n}{2}) + Cn
$$

Y utilizando nuestro **Teorema Maestro**, tenemos algo del estilo $aT(\frac{n}{b}) + f(n)$ con:  
* $a$ = 2
* $b$ = 2
* $f(n)$ = n (lineal)

Así calculando el $c_{crit} = \log_a b = \log_2 2 = 1$. Y notando que $f(n) = O(n^{c_{crit}}) = O(n^1) = O(n)$, entonces como $f(n) = \Theta (n^{c_{crit}}\log ^{0} n)$ con $k=0$ y por tanto la complejidad de nuestro algoritmo será de:

$$
T(n) = \Theta (n^{c_{crit}}\log^{k+1} n) = \Theta (n^{1}\log n) = \Theta (n\log n)
$$

Es decir la complejidad de nuestro algoritmo es $\Theta (n\log n)$.

* count_inversions(): El análisis total depende de ```_mergeSort()``` y así está será de $O(n \log n)$

Por lo tanto la complejidad total de nuestro algoritmo es de $O(n \log n)$

In [24]:
def count_inversions(S):
    ''' 
    Función que utilizamos para llamar al algoritmo de inversión
    ''' 
    n = len(S)
    # A temp_arr is created to store sorted array in merge function
    temp_arr = [0]*n
    return _mergeSort(S, temp_arr, 0, n - 1)
  
def _mergeSort(arr, temp_arr, left, right):
    '''
    Usaremos merge sort para encontrar las inversiones de nuestra lista 
    '''
    inv_count = 0

    # Si tenemos más elementos en el lado derecho, hacemos recursión
    if left < right:
        # Calculamos la mitad del arreglo
        mid = (left + right)//2
  
        # Contamos las inversiones en el subarray izquierdo
        inv_count += _mergeSort(arr, temp_arr, left, mid)
  
        # Contamos las inversiones en el subarray derecho
        inv_count += _mergeSort(arr, temp_arr, mid + 1, right)

        # Fusionará dos subarrays en un subarray ordenado
        inv_count += merge(arr, temp_arr, left, mid, right)
    return inv_count

def merge(arr, temp_arr, left, mid, right):
    '''
    Esta función mezcla dos subarreglos en un único subarreglo ordenado 
    '''
    # Índice de inicio del subarray izquierdo
    i = left
    # Índice de inicio del subarray derecho
    j = mid + 1 
    # Índice de inicio del que será el subarray ordenado
    k = left     
    inv_count = 0
    
    # Las condiciones se checan para asegurar que i y j no exceden sus limites del
    # subarray
    while i <= mid and j <= right:
        # No habrá inversión si: arr[i] <= arr[j]
        if arr[i] <= arr[j]:
            temp_arr[k] = arr[i]
            k += 1
            i += 1
        else:
            # Ocurrirá una inversión
            temp_arr[k] = arr[j]
            inv_count += (mid-i + 1)
            k += 1
            j += 1

    # Copiamos los elementos restantes del subarreglo izquierdo
    # en nuestro array temporal
    while i <= mid:
        temp_arr[k] = arr[i]
        k += 1
        i += 1
  
    # Copiamos los elementos restantes del subarreglo derechos
    # en nuestro array temporal
    while j <= right:
        temp_arr[k] = arr[j]
        k += 1
        j += 1
    
    # Copiamos el subarray ordenado en el arreglo original
    for loop_var in range(left, right + 1):
        arr[loop_var] = temp_arr[loop_var]
          
    return inv_count

In [25]:
L = [2, 4, 1, 3, 5]
inversions = count_inversions(L)
print(f'Número de inversiones de la lista L = {L} son {inversions}')

Número de inversiones de la lista L = [1, 2, 3, 4, 5] son 3


## Ejercicio 2

Supón que tienes un conjunto $S$ de $n$ puntos en el plano. Diseña un algoritmo de divide y vencerás para encontrar el par de puntos más cercano. Tu algoritmo debe de correr en tiempo $O(n\log n)$.

Suponemos que cada punto es una dupla de números reales.

**Explicación**  
Recibimos una lista de puntos $S$ y lo que queremos es encontrar la pareja de puntos $p_1$ y $p_2$ son los puntos más cercanos. Entonces empezamos revisando si la longitud de esta lista es menor o igual a 3 y de ser así lo resuelve por fuerza bruta, sin embargo esto es constante debido a que sabemos la longitud de esta lista. Sino, entonces dividimos al espacio de puntos por la mitad, y encontramos la pareja más cercana en la división izquierda y en la división derecha recursivamente.  

Ahora ya que se resolvió en la parte recursiva, dado que ya tenemos a los puntos más cercanos de cada lado, ahora podemos encontrar el mínimo de entre los dos lados y obtenemos una distancia $d$ mínima. Por lo tanto la distancia $d$ a la que están $p_1$ y $p_2$ puede ser la mínima, sin embargo necesitamos considerar una pareja que se encuentre dispersa sobre nuestro punto medio.

Entonces sabemos que si existe una pareja con una distancia más pequeña que $d$ la cuál es dividida por la línea, entonces ambos puntos deben estar dentro de la distancia $d$ de la línea. Entonces creamos la lista $Sy$ en la cual guardaremos los puntos que se encuentran dentro de esta región 

$$
\text{Ix} [0] - \text{min distance} [0] < \text{y} [0] < \text{x bar} + \text{min distance} [0]
$$


y que a su vez se encuentran ordenados por la coordenada $y$ (para solo recorrer una vez) y así podemos deducir que si cualquier par de puntos en nuestra lista están más cerca en el espacio, entonces están igual de cerca en nuestra lista.

Finalmente podemos regresar la distancia mínima entre dos puntos (los más cercanos) en nuestro arreglo creado $Sy$ dándonos la distancia mínima en todo el espacio de puntos.

Por tanto la complejidad de nuestro algoritmo será:
* Dividr los puntos en 2 sub-listas y posteriormente encontrar los puntos más cercanos basados en los límites calculados y ponerlos en un arreglo: O(n)
* Encontrar el nuevo arreglo $Sy$ acorde al punto medio: O(n)
* Ordenar por puntos: $O(n\log n)$
* Encontrar los puntos más cercanos: $O(n)$ (del arreglo $Sy$)

Explicaremos por función:  
* ```sort_cordinates()```:   Complejidad final $O(n\log n)$ 

* ```euclidiana()```:   Complejidad final $O(1)$  

* ```fuerza_bruta()```:   Complejidad final $O(n^2)$  

* ```closest_par()```:   Complejidad final $O(n\log n)$
    * Línea 5-6 = $O(1)$   (Es constante porque sólo entra si la longitud de la lista es menor o igual a 3 y como sabemos esta longitud entonces la complejidad del algoritmo de fuerza bruta recae a $O(1)$).
    * Línea 8 = $O(1)$
    * Línea 10 = $O(n/2)$
    * Línea 11 = $O(n/2)$
    * Línea 13-14 = $O(1)$  (Suponiendo que obtener un elemento de una lista es constante)
    * Línea 16-20 = $O(n)$
    * Línea 22 = $\text{T}(\frac{n}{2})$ 
    * Línea 23 = $\text{T}(\frac{n}{2})$
    * Línea 25-27 = $O(1)$  (Suponiendo que obtener un elemento de una lista es constante)
    * Línea 29-31 = $O(n)$
    * Línea 23-39 = $O(n)$

    Por lo tanto vemos que nuestra relación de recurrencia para una longitud $n > 1$ es:  
    $$ 
    \begin{align*}
        \text{T}(n) &= Cn + \text{T}(\frac{n}{2}) + \text{T}(\frac{n}{2})\\
        &= 2 \text{T}(\frac{n}{2}) + Cn
    \end{align*}
    $$

    Y utilizando nuestro **Teorema Maestro**, tenemos algo del estilo $aT(\frac{n}{b}) + f(n)$ con:  
    * $a$ = 2
    * $b$ = 2
    * $f(n)$ = n (lineal)

    Así calculando el $c_{crit} = \log_a b = \log_2 2 = 1$. Y notando que $f(n) = O(n^{c_{crit}}) = O(n^1) = O(n)$, entonces como $f(n) = \Theta (n^{c_{crit}}\log ^{0} n)$ con $k=0$ y por tanto la complejidad de nuestro algoritmo será de:

    $$
    T(n) = \Theta (n^{c_{crit}}\log^{k+1} n) = \Theta (n^{1}\log n) = \Theta (n\log n)
    $$

    Es decir la complejidad de nuestro algoritmo es $\Theta (n\log n)$.

In [26]:
def sort_cordinates(S,x):
    ''' 
    Función que ordena una lista de puntos en el plano 2D, que dependiendo de la variable x
    se ordena por la coordenada x o por la coordenada y.
    '''
    X = []
    if x == 1:
        X = [xs for xs, ys in S]
    else:
        X = [ys for xs, ys in S]
    indices = np.argsort(X, kind='Merge')
    S_ = []
    for i in indices:
        S_.append(S[i])
    return S_

In [27]:
def euclidiana(x,y):
    '''
    Distancia de dos puntos representados como duplas de números reales. Utilizamos la 
    fórmula de la distancia euclidea. 
    '''
    return sqrt((x[0] - y[0])**2 + (x[1] - y[1])**2)

In [28]:
def fuerza_bruta(S):
    '''
    Un método por fuerza bruta regresa la mínima distancia
    entre dos puntos de S 
    ''' 
    n = len(S)
    distancia_minima = euclidiana(S[0], S[1])
    par_buscado = (S[0], S[1])

    if len(S) == 2:
        return euclidiana(S[0], S[1]), (S[0], S[1])

    for i in range(n):
        for j in range(i+1,n):
            distancia = euclidiana(S[i], S[j])
            if distancia < distancia_minima:
                distancia_minima = distancia
                par_buscado = (S[i], S[j])                
    return distancia_minima, par_buscado

In [29]:
def closest_pair(Px,Py):
    ''' 
    Método optimizado para regresar la mínima distancia entre dos puntos de S
    '''
    if len(Px) <= 3:
        return fuerza_bruta(Px)

    midpoint_x = len(Px) // 2

    Ix = Px[:midpoint_x]
    Fx = Px[midpoint_x:]
    
    medio_x = Px[midpoint_x]
    Iy,Fy = [], []

    for point in Py:
        if point[0] < int(medio_x[0]):
            Iy.append(point)
        else:
            Fy.append(point)
    
    min_distance_left = closest_pair(Ix, Iy)
    min_distance_right = closest_pair(Fx, Fy)
    
    min_distance = min(min_distance_left, min_distance_right)  # Tupla con la distancia minima y los puntos
    x_bar = Ix[-1][0]   # Obtenemos el valor del último punto de la primer mitad 
    Sy = []

    for y in Py:
        if x_bar - min_distance[0] < y[0] < x_bar + min_distance[0]:
            Sy.append(y)
    
    for i in range(len(Sy) - 1):   
        for j in range(i+1, min(i + 7, len(Sy))):   
            points = Sy[i]
            points_close = Sy[j]
            distancia = euclidiana(points, points_close)
            if distancia < min_distance[0]:
                min_distance = distancia, (points, points_close)
    
    return min_distance

In [30]:
P = [(2, 3), (12, 30), (40, 50), (5, 1), (12, 10),(3, 4), (7,2), (2,4)]
P = sort_cordinates(P, True)
distance, points = fuerza_bruta(P)
print('La distancia más pequeña es',distance, 'entre los puntos p1 =', points[0], 'y p2 =', points[1])

La distancia más pequeña es 1.0 entre los puntos p1 = (2, 3) y p2 = (2, 4)


In [31]:
P = [(2, 3), (12, 30), (40, 50), (5, 1), (12, 10),(3, 4), (7,2), (2,4)]
P = [(2, 3), (12, 30), (40, 50), (5, 1), (2,10)]
Px = sort_cordinates(P, True)
Py = sort_cordinates(P, False)
dis, puntos = closest_pair(Px, Py)
print('La distancia más pequeña es',dis, 'entre los puntos p1 =', puntos[0], 'y p2 =', puntos[1])

La distancia más pequeña es 3.605551275463989 entre los puntos p1 = (5, 1) y p2 = (2, 3)


# Ejercicio 3

Diseña un algoritmo de divide y vencerás que invierta un arreglo. Por ejemplo, $[1,2,3,4]$ se vuelve $[4,3,2,1]$.

**Explicación**  
Nuestro algoritmo recibe una lista $A$. Primeramente calculamos su longitud y dependiendo de ella regresamos la lista vacía, la misma lista por tener 1 elemento o bien dividimos el problema en 2, recursivamente llamamos a nuestra función con el inicio hasta la mitad de la lista y lo guardamos en una variable y también llamamos a nuestra función con la mitad de la lista hasta el final y lo guardamos en otra variable. Finalmente concatenamos primero la última variable con la primera variable (para invertir).

**Demostración Complejidad**  
Hagamos un análisis para posteriormente obtener nuestra función de recurrencia:  (Asumimos que la función ```len``` es constante y de un paso)
* Línea 2: 1 OE
* Línea 3: 2 OE + 1 OE = 3 OE
    * Línea 4: 1 OE
* Línea 5: 2 OE + 3 OE = 5 OE
    * Línea 6: 3 OE
* Línea 8: 3 OE
* Línea 9: T($\frac{n}{2}$) OE
* Línea 10: T($\frac{n}{2}$) OE
* Línea 11: 4 OE

Por lo tanto vemos que nuestra relación de recurrencia para una longitud $n > 1$ es:  
$$ 
\begin{align*}
    \text{T}(n) &= 10 + \text{T}(\frac{n}{2}) + \text{T}(\frac{n}{2})\\
    &= 2 \text{T}(\frac{n}{2}) + 10
\end{align*}
$$

Y utilizando nuestro **Teorema Maestro**, tenemos algo del estilo $aT(\frac{n}{b}) + f(n)$ con:  
* $a$ = 2
* $b$ = 2
* $f(n)$ = 10  (constante)

Así calculando el $c_{crit} = \log_a b = \log_2 2 = 1$. Y notando que $f(n) = O(n^c) = O(n^0) = O(1)$, entonces tenemos que $c<c_{crit}$, y por tanto la complejidad de nuestro algoritmo es de:

$$
T(n) = \Theta (n^{c_{crit}}) = \Theta (n^{1}) = \Theta (n)
$$

Es decir la complejidad de nuestro algoritmo es lineal.

In [32]:
def reverse_array(A):
    n = len(A)
    if n == 0:
        return []
    elif n == 1:
        return [A[0]]
    else: 
        mitad = n//2
        izq = reverse_array(A[0:mitad])
        der = reverse_array(A[mitad:])
        return(der + izq)

In [33]:
A = [1,2,3,4]
reverse_array(A)

[4, 3, 2, 1]