# 최소 공통 조상 (Lowest Common Ancestor)

`-` 최소 공통 조상: 루트가 있는 트리에서 두 정점를 모두 자손으로 가지면서 깊이가 가장 깊은 정점

## 가장 가까운 공통 조상

- 문제 출처: [백준 3584번](https://www.acmicpc.net/problem/3584)

`-` 두 정점을 $u$와 $v$라고 하자

`-` $u$에서 부모로 계속 거슬러 올라가면서 정점을 집합에 기록한다

`-` $v$에서 부모로 계속 거슬러 올라가면서 $u$의 부모 집합에 해당 정점이 있는지 판단한다

`-` 존재한다면 그것이 가장 가까운 공통 조상이다

`-` 먼저 탐색한다는 것은 가장 가까운 부모라는 것이고 이는 깊이가 깊은 것이기 때문이다

`-` 최악의 경우 트리의 높이는 $N$이고 이를 $2$번 탐색하므로 알고리즘의 시간 복잡도는 $O(N)$이다

In [5]:
def trace_to_root(u, root, node2parent):
    route = [u]
    while u != root:
        u = node2parent[u]
        route.append(u)
    return route


def find_nearest_common_ancestor(u, v, root, node2parent):
    route = trace_to_root(u, root, node2parent)
    route = set(route)
    while v not in route:
        v = node2parent[v]
    return v


def solve_testcase():
    N = int(input())
    node2parent = [-1 for _ in range(N + 1)]
    for _ in range(N - 1):
        A, B = map(int, input().split())
        node2parent[B] = A
    for i in range(1, N + 1):
        if node2parent[i] == -1:
            root = i
            break
    u, v = map(int, input().split())
    nearest_common_ancestor = find_nearest_common_ancestor(u, v, root, node2parent)
    print(nearest_common_ancestor)


def solution():
    T = int(input())
    for _ in range(T):
        solve_testcase()


solution()

# input
# 2
# 16
# 1 14
# 8 5
# 10 16
# 5 9
# 4 6
# 8 4
# 4 10
# 1 13
# 6 15
# 10 11
# 6 7
# 10 2
# 16 3
# 8 1
# 16 12
# 16 7
# 5
# 2 3
# 3 4
# 3 1
# 1 5
# 3 5

 2
 16
 1 14
 8 5
 10 16
 5 9
 4 6
 8 4
 4 10
 1 13
 6 15
 10 11
 6 7
 10 2
 16 3
 8 1
 16 12
 16 7


4


 5
 2 3
 3 4
 3 1
 1 5
 3 5


3


## LCA

- 문제 출처: [백준 11437번](https://www.acmicpc.net/problem/11437)

`-` 루트가 있는 트리에서 두 정점의 최소 공통 조상(Lowest Common Ancestor)를 찾자

`-` [가장 가까운 공통 조상](https://www.acmicpc.net/problem/3584)과 본질적으로 동일한 문제이다

`-` 정점의 수가 $N$, 쿼리의 수가 $M$일 때 전체 동작의 시간 복잡도는 $O(NM)$이다

`-` 같은 방법으로 푸니 $22\%$에서 시간 초과가 발생했다

`-` 조금 최적화를 해보자

`-` $u$와 $v$가 다른 서브 트리에 있고 최소 공통 조상이 $p$라고 해보자

`-` $u$와 $v$가 다른 서브 트리에 있으므로 $p$는 $u$와 $v$가 아닌 다른 정점이다

`-` $v$의 서브 트리 안에 있는 정점 $c$가 있을 때 $u$와 $c$의 최소 공통 조상은 누구일까?

`-` 이는 $p$인데 $c$가 부모를 따라 거슬러 올라가다 보면 $v$를 만나게 되고 $u$와 $v$의 최소 공통 조상은 $p$이기 때문이다

`-` 즉, $u$와 $v$의 최소 공통 조상이 $p$이면 각각의 서브 트리 안에 있는 정점 $c_u, c_v$의 최소 공통 조상도 $p$이다

`-` 자식뿐만 아니라 $p$와 $u$를 잇는 경로에 있는 정점과 $p$와 $v$를 잇는 정점간의 최소 공통 조상도 $p$이다

`-` 그런데 서브 트리는 고려하지 않는게 낫다

`-` 루트를 기준으로 $\frac{N-1}{2}$씩 나눠 가졌다고 해보자

`-` 그러면 루트의 두 자식 각각의 서브 트리에는 $\frac{N-1}{2}$만큼의 정점이 있다

`-` 이들간의 최소 공통 조상은 루트인데 연산 횟수가 $\frac{(N-1)^2}{4}$으로 $O\left(N^2\right)$이다

`-` $N$이 최대 $50000$이므로 제한 시간안에 통과하지 못한다

`-` 대신 $p$와 $v$를 잇는 정점과 $u$간의 최소 공통 조상도 $p$가 되도록 메모이제이션 하겠다

`-` 이 작업은 원래 최소 공통 조상 구하려면 필요했던 것이었고 시간 복잡도는 $O(N)$이다

`-` $u$와 $v$가 바뀐 반대 상황은 메모리를 아끼기 위해 기록하지 않겠다

`-` 일단 해보고 그래도 시간 초과나면 같은 서브 트리에 속한 경우도 최적화 해보자

`-` $N$과 $M$이 크지 않아서 이 정도만 최적화해도 통과했다

In [23]:
from collections import defaultdict


def make_tree(node, parent, node2parent):
    node2parent[node] = parent
    stack = [(node, parent)]
    while stack:
        u, u_parent = stack.pop()
        for child in tree[u]:
            if child == u_parent:
                continue
            node2parent[child] = u
            stack.append((child, u))


def trace_to_root(u, node2parent):
    route = [u]
    while u != ROOT:
        u = node2parent[u]
        route.append(u)
    return route


def find_lowest_common_ancestor(u, v, node2parent):
    if v < u:
        u, v = v, u
    if (u, v) in dp:
        return dp[(u, v)]
    route = trace_to_root(u, node2parent)
    route_set = set(route)
    pair = [(u, v)]
    lowest_common_ancestor = v
    while v not in route_set:
        if (u, v) in dp:
            lowest_common_ancestor = dp[(u, v)]
            break
        v = node2parent[v]
        pair.append((u, v))
        lowest_common_ancestor = v
    for a, b in pair:
        if b < a:
            a, b = b, a
        dp[(a, b)] = lowest_common_ancestor
    return lowest_common_ancestor


def solution():
    global tree, dp, ROOT
    N = int(input())
    node2parent = [-1 for _ in range(N + 1)]
    dp = {}  # dp[(u, v)]는 u와 v의 최소 공통 조상
    ROOT = 1
    NONE = -1
    tree = defaultdict(list)
    for _ in range(N - 1):
        A, B = map(int, input().split())
        tree[A].append(B)
        tree[B].append(A)
    make_tree(ROOT, NONE, node2parent)
    M = int(input())
    for _ in range(M):
        u, v = map(int, input().split())
        nearest_common_ancestor = find_lowest_common_ancestor(u, v, node2parent)
        print(nearest_common_ancestor)


solution()

# input
# 15
# 1 2
# 1 3
# 2 4
# 3 7
# 6 2
# 3 8
# 4 9
# 2 5
# 5 11
# 7 13
# 10 4
# 11 15
# 12 5
# 14 7
# 6
# 6 11
# 10 9
# 2 6
# 7 6
# 8 13
# 8 15

 15
 1 2
 1 3
 2 4
 3 7
 6 2
 3 8
 4 9
 2 5
 5 11
 7 13
 10 4
 11 15
 12 5
 14 7
 6
 6 11


2


 10 9


4


 2 6


2


 7 6


1


 8 13


3


 8 15


1


## 합성함수와 쿼리

- 문제 출처: [백준 17435번](https://www.acmicpc.net/problem/17435)

`-` 효율적인 최소 공통 조상 구현을 위한 sparse table 구현

`-` 많은 시도 끝에 포기 당했다

`-` 함수 $f: \{1, \dots, m\} \to \{1, \dots, m\}$이므로 비둘기집 원리에 의해 $x$에 $f$를 취하다보면 사이클이 생긴다

`-` 나는 이를 비사이클 부분과 사이클 부분으로 나누어 풀고자 했다

`-` 하지만 실패했고 질문 검색을 보고 희소 배열의 개념을 알게 됐다

`-` $f_n(x)$에서 $n$을 $2$의 거듭제곱꼴로 나누어 연산을 적용한다

`-` 간단하게 $19 = 16 + 2 + 1$이므로 $1$부터 $m$까지의 모든 $x$에 대해 $f_{16}(x), f_2(x), f_1(x)$를 알고 있다면 $f_{19}(x) = f_{16}(f_2(f_1(x)))$로 나타낼 수 있다

`-` 나이브하게 하면 $f$를 $19$번 적용해야 되지만 미리 세팅만 해두면 $3$번만 적용하면 된다

`-` 즉, $O\left(\log n\right)$의 연산이면 $f_n(x)$를 계산할 수 있다

`-` 그럼 이제 $k$는 $2$의 거듭제곱꼴일 때 $f_k(x)$를 미리 계산해보자

`-` 여기서부터는 안 봐서 모른다

`-` 일단 $f_1(x)$ 계산은 쉽고 $f_2(x)$도 마찬가지다

`-` $f_4(1)$을 고려하자

`-` 이건 $f_2(f_2(1))$이다

`-` $f_2(x)$는 알고 있으니 $f_2(f_2(1))$을 계산할 수 있다

`-` 그냥 간단하게 $f_2(x)$를 알고 있고 거기에 $f_2$를 다시 취하면 $f_4$를 계산한 결과이다

`-` 즉, $f_{2k}(x)$를 알기 위해 $f_k(x)$에 $f_k$를 취해주면 된다

`-` 배열의 원소가 $m$개이므로 매 단계마다 $O(m)$의 시간 복잡도를 가진다

`-` 그리고 단계의 횟수는 $O\left(\log n\right)$이므로 배열을 미리 준비하는 것은 $O(m \log n)$의 시간 복잡도를 가진다

`-` 쿼리당 $O(\log n)$의 시간 복잡도를 가지고 쿼리가 $Q$개이므로 $O\left(Q \log n\right)$이다

`-` 따라서 전체 알고리즘으 시간 복잡도는 $O\left(\left(m+Q\right)\log n\right)$이다

In [1]:
import math


def query(n, x, dp):
    binary = bin(n)[2:]
    for i, b in enumerate(binary[::-1]):
        if b == "0":
            continue
        x = dp[i][x]
    return x


def sparse_table(f_results, max_n):
    m = len(f_results)
    dp = [[0] * (m + 1) for _ in range(int(math.log2(max_n)) + 1)]  # dp[i][x]는 f_{2^i}(x)
    for x, f_x in enumerate(f_results, start=1):
        dp[0][x] = f_x
    for i in range(1, int(math.log2(max_n)) + 1):
        for x in range(1, m + 1):
            dp[i][x] = dp[i - 1][dp[i - 1][x]]
    return dp


def solution():
    m = int(input())
    f_results = list(map(int, input().split()))
    max_n = 500000
    dp = sparse_table(f_results, max_n)
    Q = int(input())
    for _ in range(Q):
        n, x = map(int, input().split())
        answer = query(n, x, dp)
        print(answer)


solution()

# input
# 5
# 3 3 5 4 3
# 5
# 1 1
# 2 1
# 11 3
# 1000 4
# 5 1

 5
 3 3 5 4 3
 5
 1 1


3


 2 1


5


 11 3


5


 1000 4


4


 5 1


3


## LCA 2

- 문제 출처: [백준 11438번](https://www.acmicpc.net/problem/11438)

`-` 두 노드의 가장 가까운 공통 조상이 몇 번인지 찾아내는 쿼리를 수행하자

`-` 트리의 루트는 $1$번이다

`-` $x$를 노드라고 할 때 $f(x)$는 $x$의 부모를 뜻한다고 하자

`-` 두 노드 $u,v$가 주어졌을 때 둘의 최소 공통 조상을 찾는 것은 $f^n(u) = f^m(v)$를 만족하는 노드 중 $u,v$와 가장 가까운 노드를 찾는 것이다

`-` $f^n(u) = f^m(v)$를 만족하는 $n$ 중에서 최솟값을 $n_{\min}$이라 하자

`-` 그럼 $f^{n_{\min}}(u)$가 $u,v$의 최소 공통 조상이다

`-` 트리의 구조를 생각해보면 당연하다

`-` 물론 $f^{m_{\min}}(v)$도 $u,v$의 최소 공통 조상이다

`-` 어느것이든 상관없다

`-` 중요한 건 $f^n(u) = f^m(v)$를 만족하는 $n,m$을 어떻게 찾을 것인지이다

`-` 트리의 루트가 $1$번이므로 노드 $u,v$에 $f$를 취하다보면 결국엔 $1$이 도출된다

`-` 노드의 개수가 $N$이므로 임의의 노드에 $f$를 적용하는 걸 $N-1$번 반복하다 보면 $1$이 나오게 된다

`-` 하지만 $f$를 $N-1$번 적용하는 건 $O(N)$의 시간 복잡도를 가지게 되므로 모든 노드에 대해 수행하는 건 $O\left(N^2\right)$이다

`-` 이는 시간 초과를 면할 수 없다

`-` 이를 해결하기 위해 [합성함수와 쿼리](https://www.acmicpc.net/problem/17435)를 해결하는데 사용한 희소 배열을 이용할 것이다

`-` 희소 배열을 이용하면 $f^N(u)$를 $O(\log N)$에 계산할 수 있다

`-` 두 노드 $u,v$와 루트 $1$ 사이의 거리를 $d_u, d_v$라고 하자

`-` 그럼 $f^{d_u}(u) = f^{d_v}(v) = 1$이다

`-` $u,v$가 루트까지 가는 경로를 생각해보면 공통 경로와 개별 경로로 나눌 수 있다

`-` 둘의 최소 공통 조상을 $a$라 하자

`-` $u \to a$와 $v \to a$는 개별 경로이고 $a \to 1$은 공통 경로이다

`-` $f^k(a) = 1$을 만족하는 $k$가 존재한다

`-` 따라서 $f^{d_u - k}(u) = f^{d_v - k}(v) = 1$

`-` 근데 우리는 최소 공통 조상을 모르기 때문에 당연히 $k$가 얼마인지도 모른다

`-` 임의의 $i$에 대해 $f^{d_u - i}(u)$와 $f^{d_v - i}(v)$를 계산하자

`-` 만약 $f^{d_u - i}(u) = f^{d_v - i}(v)$라면 해당 노드는 공통 경로에 위치하고 있는 것이다

`-` 따라서 최소 공통 조상을 찾으려면 $i$를 더 키워서 탐색해야 한다

`-` 만약 두 값이 다르다면 각 노드는 개별 경로에 위치하고 있는 것이고 최소 공통 조상을 찾기 위해 $i$를 더 작게 해야 한다

`-` 이를 반복하다 보면 $i=k$가 된다

`-` 효율적으로 범위를 줄이기 위해 $d = \min(d_u, d_v)$라 하고 $i = \left\lfloor\frac{d}{2}\right\rfloor$부터 시작할 것이다

`-` 범위를 반 씩 줄여가면서 더 이상 탐색할 공간이 없을 때까지 반복하자

`-` 두 노드의 최소 공통 조상을 계산하는 건 최악의 경우 $O\left(\log^2 N\right)$이다

`-` 쿼리의 개수가 $M$이므로 전체 쿼리의 시간 복잡도는 $O\left(M \log^2 N\right)$이다

`-` 희소 배열을 준비하는 것은 $O(N \log N)$이다

`-` 따라서 전체 알고리즘의 시간 복잡도는 $O\left(N \log N + M \log^2 N\right)$이다

`-` 임의의 노드에서 루트까지의 거리도 희소 배열을 사용해 미리 계산해두어야 한다

`-` 알고리즘은 올바른데 시간 초과에 걸린다 ($N$이 더 작은 LCA 문제 해결함)

`-` 합성함수 연산에서 내장 함수 `bin`을 사용했는데 비트 연산으로 바꿨다

`-` 루트까지의 거리(깊이) 측정을 dfs를 사용해 $O(N)$에 수행하도록 만들었다

`-` 이렇게 하니 시간 안에 해결할 수 있었다

In [2]:
import math
import sys
from collections import defaultdict

sys.setrecursionlimit(10**5 + 2)


def dfs(tree, node, parent, parents):
    for child in tree[node]:
        if child == parent:
            continue
        parents[child] = node
        dfs(tree, child, node, parents)
    return parents


def compute_sparse_table(parents, n_max):
    dp = [[NONE] * (N + 1) for _ in range(n_max + 1)]  # dp[i][u] = f^{2^i}(u)
    for j, p in enumerate(parents):
        dp[0][j] = p
    for i in range(1, n_max + 1):
        for u in range(1, N + 1):
            dp[i][u] = dp[i - 1][dp[i - 1][u]]
    return dp


def composite_func(x, n, sparse_table):
    i = 0
    while True:
        if n & 1:
            x = sparse_table[i][x]
        n >>= 1
        i += 1
        if n == 0:
            break
    return x


def compute_dists_to_root(tree, sparse_table):
    dists_to_root = [0] * (N + 1)
    stack = [(ROOT, 0)]
    visited = set([ROOT])
    while stack:
        node, dist = stack.pop()
        for child in tree[node]:
            if child in visited:
                continue
            dists_to_root[child] = dist + 1
            visited.add(child)
            stack.append((child, dist + 1))
    return dists_to_root


def query(u, v, dists_to_root, sparse_table):
    if u == v:
        return u
    d_u = dists_to_root[u]
    d_v = dists_to_root[v]
    d = min(d_u, d_v)
    upper = d
    lower = 0
    while lower <= upper:
        mid = (upper + lower) // 2
        f_u = composite_func(u, d_u - mid, sparse_table)
        f_v = composite_func(v, d_v - mid, sparse_table)
        if f_u == f_v:
            lower = mid + 1
        else:
            upper = mid - 1
    lca = composite_func(u, d_u - upper, sparse_table)
    return lca


def solution():
    global N, ROOT, NONE
    N = int(input())
    n_max = int(math.log2(N))
    ROOT = 1
    NONE = 0
    tree = defaultdict(list)
    for _ in range(N - 1):
        u, v = map(int, input().split())
        tree[u].append(v)
        tree[v].append(u)
    parents = [NONE] * (N + 1)
    parents = dfs(tree, ROOT, NONE, parents)
    sparse_table = compute_sparse_table(parents, n_max)
    dists_to_root = compute_dists_to_root(tree, sparse_table)
    M = int(input())
    for _ in range(M):
        u, v = map(int, input().split())
        answer = query(u, v, dists_to_root, sparse_table)
        print(answer)


solution()

# input
# 15
# 1 2
# 1 3
# 2 4
# 3 7
# 6 2
# 3 8
# 4 9
# 2 5
# 5 11
# 7 13
# 10 4
# 11 15
# 12 5
# 14 7
# 6
# 6 11
# 10 9
# 2 6
# 7 6
# 8 13
# 8 15

 15
 1 2
 1 3
 2 4
 3 7
 6 2
 3 8
 4 9
 2 5
 5 11
 7 13
 10 4
 11 15
 12 5
 14 7
 6
 6 11


2


 10 9


4


 2 6


2


 7 6


1


 8 13


3


 8 15


1
