In [31]:
import math
import random

def main():
    # closest_pair_dist의 n log n 개선.
    print('# closest_pair_dist의 n log n 개선.')

    # 예제 입력.
    p = [(2, 3), (12, 30), (40, 50), (5, 1), (12, 10), (3, 4)]

    # x좌표와 y좌표에 대해 정렬한 리스트 생성.
    px = p[:]
    px.sort(key = lambda e: e[0])
    py = p[:]
    py.sort(key = lambda e: e[1])

    brute = closest_pair(p)
    nlogn = closest_pair_dist(px, py, len(p))

    print(f'브루트 포싱을 이용한 방법: {brute}')
    print(f'분할정복 기법을 개선한 방법: {nlogn}')
    print()

    n = 100
    m = 100

    for _ in range(n):
        p = []
        for _ in range(m):
            # 임의의 점 생성.
            p.append((random.random() * 100, random.random() * 100))

        px = p[:]
        px.sort(key = lambda e: e[0])
        py = p[:]
        py.sort(key = lambda e: e[1])

        brute = closest_pair(p)
        nlogn = closest_pair_dist(px, py, len(p))

        # print(brute)
        # print(nlogn)
        # print()

        if brute != nlogn:
            print('abort')
            break
    
    print(f'서로 다른 {m}개의 점을 추출하여 {n}번 수행 완료.')

In [32]:
# x에 대한 점들의 리스트와 y에 대한 점들의 리스트를 동시에 고려하여 점 사이 거리의 최솟값 계산.
def closest_pair_dist(points_x, points_y, n):
    # 점의 개수가 3개 이하이면 브루트 포싱을 이용해 최솟값 계산.
    if n <= 3:
        return closest_pair(points_x)

    # x에 대해 정렬된 리스트를 이용하여 x좌표의 중앙값과 그 점에서의 y좌표 추출.
    mid = n // 2
    mid_x = points_x[mid][0]
    mid_y = points_x[mid][1]

    # x좌표를 기준으로 왼쪽과 오른쪽 부분 리스트를 생성한 것처럼 y좌표에 대해서 왼쪽과 오른쪽(또는 아래쪽과 위쪽) 부분 리스트 생성.
    points_y_l = []
    points_y_r = []
    for i in range(len(points_x)):
        point = points_y[i]

        # x좌표 기준 왼쪽 리스트의 점과 기준 y좌표보다 아래쪽에 있는 점 추출.
        if point[0] < mid_x or (point[0] == mid_x and point[1] < mid_y):
            points_y_l.append(point)

        # x좌표 기준 오른쪽 리스트의 점과 기준 y좌표보다 위쪽에 있는 점 추출.
        else:
            points_y_r.append(point)

    dl = closest_pair_dist(points_x[:mid], points_y_l, mid)         # 왼쪽 부분 리스트에 대해서 분할정복 수행.
    dr = closest_pair_dist(points_x[mid:], points_y_r, n - mid)     # 오른쪽 부분 리스트에 대해서 분할정복 수행.
    d = min(dl, dr)     # dl과 dr 중 최솟값을 저장.

    # 중간 띠 구역에 대해서 최솟값 추출.
    pointsm = []
    for i in range(n):
        # 점 사이의 거리가 최소가 될 수 있는 후보를 y좌표를 기준으로 추출.
        if abs(points_y[i][0] - mid_x) < d:
            pointsm.append(points_y[i])
    ds = strip_closest(pointsm, d)      # 띠 구역에 대해서 최솟값 추출.

    return min(d, ds)       # 거리의 최솟값 추출 및 반환.

In [33]:
# 왼쪽 부분 리스트과 오른쪽 부분 리스트의 중간 부분의 점들의 거리 계산.
def strip_closest(points, d):
    n = len(points)
    d_min = d       # 함수를 호출한 함수에서 계산한 최소 거리를 사용.

    for i in range(n):
        j = i + 1

        # y 좌표를 기준으로 생각한 거리가 d_min보다 작으면 수행. (d_min의 후보)
        # y 좌표가 오름차순 정렬되어 있으므로 모든 점에 대해 if 문을 수행하지 않고 while 문으로 대체 가능.
        while j < n and points[j][1] - points[i][1] < d_min:
            dij = dist(points[i], points[j])    # 실제 거리가 d_min보다 작으면 d_min 갱신.
            if dij < d_min:
                d_min = dij
            j += 1

    return d_min

In [34]:
# 점 사이의 거리의 최솟값을 브루트 포싱으로 계산.
def closest_pair(points):
    min_d = float('inf')

    # 모든 가능한 점들의 조합에 대해 거리 계산 및 최솟값 갱신.
    for i in range(len(points)):
        for j in range(i + 1, len(points)):
            p1 = points[i]
            p2 = points[j]

            if p1 == p2:
                continue
            d = dist(p1, p2)
            if d < min_d:
                min_d = d

    return min_d

In [35]:
# 두 점 사이의 거리 반환.
def dist(p1, p2):
    dx = p2[0] - p1[0]
    dy = p2[1] - p1[1]

    return math.sqrt(dx * dx + dy * dy)

In [37]:
if __name__ == '__main__':
    main()

# closest_pair_dist의 n log n 개선.
브루트 포싱을 이용한 방법: 1.4142135623730951
분할정복 기법을 개선한 방법: 1.4142135623730951

서로 다른 100개의 점을 추출하여 100번 수행 완료.
