<a href="https://colab.research.google.com/github/franzeszperez/03MAIR-Algoritmos-de-optimizacion/blob/master/Evaluables/ClosestPair/TwoClosestPoints.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### Introducción

El problema de encontrar el par de puntos más cercano en un conjunto de n puntos es un problema clasico de geometría computacional. Cuando se habla del plano euclídeo, fue uno de los primeros problemas tratados en el estudio de la complejidad computacional de los algoritmos geométricos. 

Hay varias maneras de solucionar el problema, entre las que se encuentran la técnica de fuerza bruta, de divide y vencerás o de programación dinámica. En este notebook se van a venir las técnicas de fuerza bruta y de divide y vencerás. 

Como posibles aplicaciones, se encuentra por ejemplo la técnica de agrupar los puntos en función de su distancia, el algoritmo llamado K-Nearest Neighbours.

### Cálculo del tiempo del algoritmo

In [0]:
from time import time

def calcular_tiempo(f):
    def wrapper(*args, **kwargs):
        
        inicio = time()       
        resultado = f(*args, **kwargs)       
        tiempo = time() - inicio
        print("Tiempo de ejecución para algoritmo: "+str(tiempo)+'\n')
        return resultado
    return wrapper

### Cálculo de la distancia para un set de puntos

A continuación se muestra una función genérica para calcular la distancia entre dos puntos de dimensión cualquiera, que se usará en los algoritmo posteriores.

In [0]:
import math
def distance(first, second):
  dist = 0
  if isinstance(first, int):
    # Es un número.
    dist = abs(first - second)
  else:
    # Es una tupla.
    for i in range(len(first)):
      dist += (first[i] - second[i])**2
    dist = math.sqrt(dist)
  return dist

### Resolución del problema con Fuerza Bruta

Este algoritmo recorre todos los puntos dos veces, mediante dos bucles, con tal de computar la diferencia entre cada par de puntos. Esto hace que se calcule la distancia dos veces para cada par de puntos.

In [0]:
# Brute force nD
@calcular_tiempo 
def brute_force_nd(listnd):
  minDistance = 999999999999
  closestPoints = (0, 0)

  for i, value1 in enumerate(listnd):
    for j, value2 in enumerate(listnd):
      if(i==j):
        continue
      else:
        if distance(value1, value2) < minDistance:
          minDistance = distance(value1, value2)
          closestPoints = (value1, value2)
  print("Fuerza Bruta - Los puntos más cercanos son: " + str(closestPoints) + ", a una distancia de " + str(minDistance))  

### Resolución del problema con un enfoque de Fuerza Bruta mejorada 

Este algoritmo, a diferencia del anterior, mejora la eficiencia del algoritmo, pues no recorre todos los puntos dos veces, sino que calcula la diferencia entre cada par de puntos una única vez.

In [0]:
# Brute force nD (Improved)
@calcular_tiempo 
def brute_force_nd_improved(listnd):
  minDistance = 999999999999
  closestPoints = (0, 0)
  
  for i in range(len(listnd)-1):
    for j in range(i+1,len(listnd)):
      if distance(listnd[i], listnd[j]) < minDistance:
        minDistance = distance(listnd[i], listnd[j])
        closestPoints = (listnd[i], listnd[j])
  print("Fuerza Bruta mejorada - Los puntos más cercanos son: " + str(closestPoints) + ", a una distancia de " + str(minDistance))  

### Resolución del problema con un enfoque de Divide y Vencerás

El enfoque de Divide y Vencerás utiliza la recursividad para solucionar el problema, retornando en cada iteración la distancia mínima que encuentra (modificada o no).

---

La función recursiva closest_recursive_nd recibe en cada iteración una lista de tamaño una unidad menor a la recibida en la iteración immediatamente anterior, hasta llegar a una lista de tamaño 1. 

In [0]:
def closest_recursive_nd(listnd, closestPoints, minDistance):
  if(len(listnd)==1):
    return closestPoints, minDistance
  else:
    for index in range(1,len(listnd)-1):
      if distance(listnd[0], listnd[index]) < minDistance:
        minDistance = distance(listnd[0], listnd[index])
        closestPoints = (listnd[0], listnd[index])
    return closest_recursive_nd(listnd[1:], closestPoints, minDistance)

In [0]:
# Divide and Conquer nD
@calcular_tiempo 
def divide_conquer_nd(listnd):
  minDistance = 999999999999
  closestPoints = (0, 0)
  closestPoints, minDistance = closest_recursive_nd(listnd, closestPoints, minDistance)
  print("Divide y vencerás - Los puntos más cercanos son: " + str(closestPoints) + ", a una distancia de " + str(minDistance))  

### Dimensión 1D

Se genera una lista de tamaño 1D, formada por 700 elementos.

In [7]:
import random

list1d = [random.randrange(1, 100000000) for x in range(700)]
print("Lista 1D:")
print(list1d)

bf = brute_force_nd(list1d)
bfi = brute_force_nd_improved(list1d)
dc = divide_conquer_nd(list1d)

Lista 1D:
[62466504, 76820619, 27686699, 71773711, 34761688, 92833708, 91964341, 57128259, 83873386, 36694889, 17927885, 54948547, 2751741, 47354041, 65300528, 7405767, 49630151, 97429901, 1267617, 33400246, 79846496, 83472119, 47229213, 14176783, 93812292, 65074986, 97066166, 6924216, 69639986, 48633489, 62537781, 48460178, 38323079, 76297627, 93459598, 44746602, 10334658, 86855898, 71262461, 99024763, 39838937, 39723401, 23336070, 11122448, 81822463, 61136050, 83323613, 36875583, 11438341, 85965856, 66252642, 50074816, 11824969, 59549415, 30977549, 92498285, 8043654, 29501402, 96635647, 18677190, 20097358, 86883495, 71884449, 60720060, 68879628, 32775233, 45714595, 43636259, 37489430, 25062332, 66011370, 31553310, 61390878, 87743464, 97051082, 53546948, 68227888, 35304768, 8866514, 77432105, 41232798, 12030465, 17366125, 65274669, 86399682, 47452330, 6423067, 72462459, 21844173, 83145245, 31449872, 66774231, 1080664, 697730, 79606525, 42499114, 79642941, 92749239, 15971032, 91187041,

### Dimensión 2D

Se genera una lista de tamaño 2D, formada por 700 elementos.

In [8]:
print("Lista 2D:")
list2d = [(random.randrange(1,10000), random.randrange(1,10000)) for x in range(700)]
print(list2d)

bf = brute_force_nd(list2d)
bfi = brute_force_nd_improved(list2d)
dc = divide_conquer_nd(list2d)

Lista 2D:
[(8718, 3861), (4036, 4643), (7034, 423), (2429, 9890), (8727, 867), (2606, 6740), (2011, 6141), (1819, 1197), (9275, 5695), (7446, 8178), (5489, 6208), (9851, 1393), (7498, 7360), (3717, 7858), (9027, 2587), (6009, 5626), (3339, 8430), (1084, 587), (9364, 5494), (7856, 8672), (9718, 7341), (507, 885), (4768, 5734), (188, 240), (2357, 987), (634, 6749), (6386, 3969), (7885, 3560), (7747, 3989), (9279, 7225), (4832, 3370), (2566, 4124), (6809, 1478), (5116, 9620), (2458, 6198), (6984, 3337), (2750, 4753), (4619, 2157), (3763, 4235), (9293, 3585), (668, 6943), (7120, 7315), (2516, 1442), (8689, 7134), (664, 8225), (4284, 5786), (626, 3024), (2064, 8701), (1085, 7248), (9069, 7893), (3780, 1138), (2094, 5797), (8630, 6933), (8900, 585), (7141, 3917), (8937, 482), (1357, 4949), (2418, 9365), (731, 9704), (4077, 4022), (1189, 5068), (222, 4034), (1502, 143), (6047, 7739), (5016, 1762), (680, 9429), (6248, 5690), (3538, 1224), (4426, 6262), (2314, 5755), (4074, 4275), (4235, 9013),

### Dimensión 3D

Se genera una lista de tamaño 3D, formada por 700 elementos.

In [14]:
print("Lista 3D:")
list3d = [(random.randrange(1,10000), random.randrange(1,10000), random.randrange(1,10000)) for x in range(700)]
print(list3d)

bf = brute_force_nd(list3d)
bfi = brute_force_nd_improved(list3d)
dc = divide_conquer_nd(list3d)

Lista 3D:
[(406, 470, 7217), (6954, 8033, 8443), (1608, 6285, 1150), (205, 7404, 490), (9261, 6425, 2563), (1881, 4962, 28), (6388, 434, 7683), (3426, 8157, 4703), (7655, 8739, 919), (9538, 8894, 8091), (3037, 6896, 6107), (6295, 2741, 1418), (7013, 5653, 6054), (3322, 9178, 9481), (9085, 978, 1584), (7296, 7902, 4676), (1152, 6117, 6482), (7440, 9393, 5981), (6229, 696, 2617), (2619, 940, 8840), (3256, 46, 7452), (6010, 5269, 2606), (2708, 1454, 6342), (4072, 4498, 2493), (9554, 4948, 3250), (4960, 9221, 8563), (5034, 5997, 1976), (483, 3027, 9584), (3799, 2382, 8725), (3344, 3374, 7829), (4215, 2697, 3192), (9602, 1403, 4501), (708, 1697, 3245), (4885, 9649, 8306), (9897, 5634, 8101), (5620, 3939, 4213), (7734, 1118, 9915), (6496, 6228, 8758), (5788, 4874, 5245), (3545, 8986, 1699), (1320, 2725, 6217), (8810, 4380, 277), (9262, 9046, 315), (9240, 6445, 5144), (2887, 4661, 3444), (3524, 3156, 5255), (7293, 4721, 253), (2252, 9279, 3242), (9467, 2822, 2217), (1529, 5193, 5180), (601, 4

### Dimensión 10D

Se genera una lista de tamaño 10D, formada por 700 elementos.

In [16]:
print("Lista 10D:")
list10d = [(random.randrange(1,10000), random.randrange(1,10000), random.randrange(1,10000), random.randrange(1,10000), random.randrange(1,10000), random.randrange(1,10000), random.randrange(1,10000), random.randrange(1,10000), random.randrange(1,10000), random.randrange(1,10000)) for x in range(700)]
print(list10d)

bf = brute_force_nd(list10d)
bfi = brute_force_nd_improved(list10d)
dc = divide_conquer_nd(list10d)

Lista 10D:
[(1005, 2290, 2509, 2248, 9609, 3787, 970, 8480, 6588, 701), (9552, 9599, 4866, 6051, 8565, 7689, 5680, 7098, 4352, 8107), (7533, 4326, 8906, 7130, 7217, 1476, 2163, 4579, 7743, 6370), (3851, 4059, 1071, 1017, 8562, 6235, 7353, 4657, 1180, 4512), (3647, 3474, 581, 7798, 7667, 1255, 33, 9724, 6069, 3571), (4989, 841, 1287, 9481, 3929, 4393, 2475, 2676, 9215, 8323), (6772, 7561, 5027, 9346, 2855, 6823, 9878, 4059, 6711, 7698), (1855, 2504, 409, 4025, 8506, 2055, 6950, 4500, 1992, 766), (3752, 4437, 1639, 4248, 8749, 1329, 3510, 8556, 3967, 5572), (6432, 5237, 9498, 1214, 4903, 6745, 6087, 4340, 7757, 7180), (3578, 5672, 7002, 1834, 7533, 4600, 4796, 1071, 5643, 9138), (822, 7729, 5994, 8689, 6313, 4331, 1833, 8037, 2416, 6183), (1526, 7563, 3372, 371, 8508, 1404, 3455, 4168, 3803, 7786), (3379, 2425, 5949, 4659, 9057, 1592, 2778, 2253, 7081, 5831), (6902, 2570, 4286, 3464, 3425, 6468, 1151, 3985, 6815, 734), (739, 6828, 9498, 7093, 9764, 1030, 5834, 7302, 3157, 5790), (9804, 5

### Conclusiones

En los tres casos, las soluciones obtenidas por el algoritmo son las mismas, lo que indica que el funcionamiento es correcto. La diferencia radica en la eficiencia, y por tanto, el tiempo de ejecución. 

Cualquiera que sea el tamaño de la lista, como era de esperar, el algoritmo de fuerza bruta obtiene el peor tiempo de ejecución de los tres, tardando aproximadamente el doble que los otros algoritmos. Por otro lado, la eficiencia del algoritmo de fuerza bruta mejorada y el de divide y vencerás es similar.