# 세그먼트 트리 (Segment Tree)

`-` 참고: https://en.wikipedia.org/wiki/Segment_tree

`-` 참고: https://book.acmicpc.net/ds/segment-tree

## 구간 합 구하기

- 문제 출처: [백준 2042번](https://www.acmicpc.net/problem/2042)

`-` 세그먼트 트리를 건실하게 구현할 수 있으면 문제를 해결할 수 있다

`-` 세그먼트 트리에서 리프 노드는 각 배열의 단일 값이다

`-` 데이터의 개수가 $N$이라면 리프 노드의 개수도 $N$이다

`-` 완전 이진 트리라면 리프 노드의 개수는 $2^{H}$이며 $H$는 트리의 높이이다

`-` 루트 노드의 높이는 $0$이며 자식으로 거슬러 내려갈수록 높이가 $1$씩 증가한다

`-` 트리의 높이가 $H$일 때 가능한 리프 노드의 개수는 $1 \sim 2^H$이다

`-` 따라서 $H=\lceil\log_2{N}\rceil$이다

`-` $\log_2{N}$개의 리프 노드를 담기 위한 트리의 높이는 $\lceil\log_2{N}\rceil$개의 리프 노드를 담기 위한 트리의 높이와 같다

`-` 즉, 리프 노드의 개수를 $2^H$ 꼴로 만든 것이고 이때의 트리의 높이는 $H$이다

`-` 트리의 높이가 $H$일 때 총 노드의 개수는 $2^{H+1} - 1$이다

`-` 이진 트리에서 루트의 번호를 $1$이라고 하자

`-` 그러면 $i$번째 루트의 왼쪽 자식의 번호는 $2i$이고 오른쪽 자식의 번호는 $2i + 1$이다

`-` 구간 합을 위한 세그먼트 트리에선 $\operatorname{tree}[i] = \operatorname{tree}[2i] + \operatorname{tree}[2i + 1]$이다

`-` 즉, 부모 노드는 자식 노드의 합과 같으며 루트 노드는 모든 리트 노드들의 합이다

- 초기화

`-` 우선 세그먼트 트리를 초기화 해야 한다

`-` 점화식 $\operatorname{tree}[i] = \operatorname{tree}[2i] + \operatorname{tree}[2i + 1]$를 바탕으로 트리를 초기화하자

`-` 재귀적으로 자식 노드에게 함수를 전파하기 위해 트리의 인덱스가 필요하다

`-` 또한 해당 노드가 배열의 어디서부터 어디까지의 구간 합을 나타내는지 위한 $\operatorname{start}$와 $\operatorname{end}$ 변수가 필요하다

`-` 트리를 크기가 $2^H$인 빈 배열로 초기화하자

`-` 이 트리 배열에서 루트는 $1$번이다

`-` 전체 배열의 구간 합은 처음부터 끝이므로 인덱스는 $0$부터 $N-1$이다

`-` 또한 루트부터 시작하므로 트리의 인덱스는 $1$이다

`-` $\operatorname{start}$와 $\operatorname{end}$가 같으면 리프 노드이므로 구간 합은 배열에서 $\operatorname{start}$번 째의 값과 같다

`-` 다르다면 자식 노드에 대해 재귀적으로 수행하자

`-` $\operatorname{mid}$를 $\operatorname{start}$와 $\operatorname{end}$의 가운데라고 하자

`-` 왼쪽 자식의 트리 인덱스는 $2i$이며 $\operatorname{start}$부터 $\operatorname{mid}$까지의 구간 합을 계산할 것이다

`-` 오른쪽 자식의 트리 인덱스는 $2i + 1$이며 $\operatorname{mid}+1$부터 $\operatorname{end}$까지의 구간 합을 계산할 것이다

`-` 그리고 구간 합 점화식 $\operatorname{tree}[i] = \operatorname{tree}[2i] + \operatorname{tree}[2i + 1]$에 따라 트리를 업데이트 한다

`-` $2^H$개의 노드를 초기화하므로 시간 복잡도는 $O\left(2^H\right) = O(N)$이다

- 배열 원소 변경

`-` 바뀐 배열의 인덱스를 $\operatorname{index}$라고 하자

`-` 그럼 세그먼트 트리에서 해당 $\operatorname{index}$를 포함하는 구간 합 노드의 값도 변경해야 한다

`-` 루트 트리에서 시작하여 해당 인덱스를 포함하는 구간 합 노드의 원소를 변경할 것이다

`-` 일단 해당 인덱스를 포함하는 리프 노드로 가서 배열의 원소와 해당 리프 노드의 값을 변경한다

`-` 그리고 점화식 $\operatorname{tree}[i] = \operatorname{tree}[2i] + \operatorname{tree}[2i + 1]$에 따라 변경된 원소를 기반으로 트리를 업데이트 한다

`-` 최악의 경우 트리의 높이만큼 연산하므로 시간 복잡도는 $O(\log N)$이다

- 구간 합 계산

`-` 트리의 노드가 구간 합을 계산할 구간에 포함된다면 그 트리가 가진 값을 결괏값에 더해주고 함수를 종료하면 된다

`-` 만약 해당 구간을 벗어난다면 자식 노드를 탐색할 필요 없이 항등원을 반환하며 함수를 종료한다

`-` 일부 구간만 걸친다면 왼쪽 자식과 오른쪽 자식에 대해 재귀적으로 연산을 반복하자

`-` 최악의 경우 트리의 높이만큼 연산하므로 시간 복잡도는 $O(\log N)$이다

In [7]:
import math


def init_tree(array, tree, i, start, end):
    if start > end:
        tree[i] = 0
        return
    if start == end:
        tree[i] = array[start]
        return
    mid = (start + end) // 2
    left_child = 2 * i
    right_child = left_child + 1
    init_tree(array, tree, left_child, start, mid)
    init_tree(array, tree, right_child, mid + 1, end)
    tree[i] = tree[left_child] + tree[right_child]


def update_tree(index, value, array, tree, i, start, end):
    if index < start or index > end:
        return
    if start == end:
        array[index] = value
        tree[i] = value
        return
    mid = (start + end) // 2
    left_child = 2 * i
    right_child = left_child + 1
    update_tree(index, value, array, tree, left_child, start, mid)
    update_tree(index, value, array, tree, right_child, mid + 1, end)
    tree[i] = tree[left_child] + tree[right_child]
    
    
def compute_prefix_sum(left, right, tree, i, start, end):
    if left <= start <= end <= right:
        return tree[i]
    if start > right or end < left:
        return 0
    mid = (start + end) // 2
    left_child = 2 * i
    right_child = left_child + 1
    left_sum = compute_prefix_sum(left, right, tree, left_child, start, mid)
    right_sum = compute_prefix_sum(left, right, tree, right_child, mid + 1, end)
    return left_sum + right_sum


def solution():
    N, M, K = map(int, input().split())
    UPDATE = 1
    SUM = 2
    H = math.ceil(math.log2(N))
    start = 0
    end = N - 1
    tree = [0 for _ in range(2**(H + 1))]  # i의 왼쪽 자식은 2i, 오른쪽 자식은 2i + 1, 루트는 1번
    array = [int(input()) for _ in range(N)]
    ROOT = 1
    init_tree(array, tree, ROOT, start, end)
    for _ in range(M + K):
        a, b, c = map(int, input().split())
        if a == UPDATE:
            index = b - 1
            update_tree(index, c, array, tree, ROOT, start, end)
        elif a == SUM:
            left = b - 1
            right = c - 1
            prefix_sum = compute_prefix_sum(left, right, tree, ROOT, start, end)
            print(prefix_sum)


solution()

# input
# 5 2 2
# 1
# 2
# 3
# 4
# 5
# 1 3 6
# 2 2 5
# 1 5 2
# 2 3 5

 5 2 2
 1
 2
 3
 4
 5
 1 3 6
 2 2 5


17


 1 5 2
 2 3 5


12


## 구간 곱 구하기

- 문제 출처: [백준 11505번](https://www.acmicpc.net/problem/11505)

`-` [구간 합 구하기](https://www.acmicpc.net/problem/2042) 문제에서 구간 합을 계산했다면 이번엔 구간 곱을 계산해야 한다

`-` 합이 아니라 곱이므로 항등원으로 $0$ 대신 $1$을 사용해야 한다

`-` 나머지는 동일하게 수행하면 된다

In [8]:
import math


def init_tree(array, tree, node, start, end):
    if start == end:
        tree[node] = array[start]
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    init_tree(array, tree, left_child, start, mid)
    init_tree(array, tree, right_child, mid + 1, end)
    tree[node] = (tree[left_child] * tree[right_child]) % P


def update_tree(index, value, array, tree, node, start, end):
    if index < start or index > end:
        return
    if start == end:
        array[index] = value
        tree[node] = value
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    update_tree(index, value, array, tree, left_child, start, mid)
    update_tree(index, value, array, tree, right_child, mid + 1, end)
    tree[node] = (tree[left_child] * tree[right_child]) % P


def compute_prefix_product(left, right, tree, node, start, end):
    if left > end or right < start:
        return 1
    if left <= start <= end <= right:
        return tree[node]
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    left_product = compute_prefix_product(left, right, tree, left_child, start, mid)
    right_product = compute_prefix_product(left, right, tree, right_child, mid + 1, end)
    return (left_product * right_product) % P


def solution():
    global P
    N, M, K = map(int, input().split())
    P = 10**9 + 7
    UPDATE = 1
    PRODUCT = 2
    H = math.ceil(math.log2(N))
    start = 0
    end = N - 1
    tree = [1 for _ in range(2**(H + 1))]
    array = [int(input()) % P for _ in range(N)]
    ROOT = 1
    init_tree(array, tree, ROOT, start, end)
    for _ in range(M + K):
        a, b, c = map(int, input().split())
        if a == UPDATE:
            index = b - 1
            value = c % P
            update_tree(index, value, array, tree, ROOT, start, end)
        elif a == PRODUCT:
            left = b - 1
            right = c - 1
            prefix_sum = compute_prefix_product(left, right, tree, ROOT, start, end)
            print(prefix_sum)


solution()

# input
# 5 2 2
# 1
# 2
# 3
# 4
# 5
# 1 3 6
# 2 2 5
# 1 5 2
# 2 3 5

 5 2 2
 1
 2
 3
 4
 5
 1 3 6
 2 2 5


240


 1 5 2
 2 3 5


48


## 최솟값과 최댓값

- 문제 출처: [백준 2357번](https://www.acmicpc.net/problem/2357)

`-` 세그먼트 트리에 구간 최솟값과 구간 최댓값을 저장하는 문제이다

`-` 구간 합 세그먼트 트리에서 더하기 연산을 최솟값 연산으로 변경하면 구간 최솟값을 계산할 수 있다

`-` 최댓값은 더하기 연산을 최댓값 연산으로 변경하면 된다

`-` 항등원은 최솟값의 경우 $\infty$, 최댓값의 경우 $-\infty$이다

`-` `min`, `max` 함수를 사용하기보다 부등호를 사용하는 것이 더 빠르다

In [16]:
import math


def init_tree(array, tree, node, start, end, operator):
    if start == end:
        tree[node] = array[start]
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    init_tree(array, tree, left_child, start, mid, operator)
    init_tree(array, tree, right_child, mid + 1, end, operator)
    tree[node] = operator(tree[left_child], tree[right_child])


def query(left, right, tree, node, start, end, operator, identity):
    if left > end or right < start:
        return identity
    if left <= start <= end <= right:
        return tree[node]
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    left_query = query(left, right, tree, left_child, start, mid, operator, identity)
    right_query = query(left, right, tree, right_child, mid + 1, end, operator, identity)
    return operator(left_query, right_query)


def solution():
    N, M = map(int, input().split())
    INF = float("inf") 
    array = [int(input()) for _ in range(N)]
    H = math.ceil(math.log2(N))
    tree_size = 2**(H + 1)
    min_tree = [INF for _ in range(tree_size)]
    max_tree = [-INF for _ in range(tree_size)]
    ROOT = 1
    start = 0
    end = N - 1
    min_operator = min
    max_operator = max
    init_tree(array, min_tree, ROOT, start, end, min_operator)
    init_tree(array, max_tree, ROOT, start, end, max_operator)
    for _ in range(M):
        a, b = map(int, input().split())
        left = a - 1
        right = b - 1
        prefix_min = query(left, right, min_tree, ROOT, start, end, min_operator, INF)
        prefix_max = query(left, right, max_tree, ROOT, start, end, max_operator, -INF)
        print(prefix_min, prefix_max)


solution()

# input
# 10 4
# 75
# 30
# 100
# 38
# 50
# 51
# 52
# 20
# 81
# 5
# 1 10
# 3 5
# 6 9
# 8 10

 10 4
 75
 30
 100
 38
 50
 51
 52
 20
 81
 5
 1 10


5 100


 3 5


38 100


 6 9


20 81


 8 10


5 81


## 수열과 쿼리 16

- 문제 출처: [백준 14428번](https://www.acmicpc.net/problem/14428)

`-` [최솟값과 최댓값](https://www.acmicpc.net/problem/2357) 문제에서 구간 최솟값을 계산했었다

`-` 여기서는 최솟값의 인덱스를 출력해야 한다

`-` 트리의 노드에 인덱스를 저장하고 트리를 갱신할 땐 배열의 인덱스에 접근하여 더 작은 값의 인덱스로 설정한다

`-` 만약 둘의 배열 값이 같다면 인덱스가 더 작은 값으로 갱신해야 한다

`-` 수열의 인덱스는 $1$부터 시작하니 주의하자

`-` 배열의 $0$번째 원소를 무한으로 설정하여 항등원이 $0$을 반환하도록 만들었다

In [3]:
import math


def init_tree(array, tree, node, start, end):
    if start == end:
        tree[node] = start
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    init_tree(array, tree, left_child, start, mid)
    init_tree(array, tree, right_child, mid + 1, end)
    left_argmin = tree[left_child]
    right_argmin = tree[right_child]
    if array[left_argmin] < array[right_argmin]:
        tree[node] = left_argmin
    elif array[right_argmin] < array[left_argmin]:
        tree[node] = right_argmin
    else:
        if left_argmin < right_argmin:
            tree[node] = left_argmin
        else:
            tree[node] = right_argmin


def update_tree(index, value, array, tree, node, start, end):
    if index < start or index > end:
        return
    if start == end:
        array[index] = value
        tree[node] = index
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    update_tree(index, value, array, tree, left_child, start, mid)
    update_tree(index, value, array, tree, right_child, mid + 1, end)
    left_argmin = tree[left_child]
    right_argmin = tree[right_child]
    if array[left_argmin] < array[right_argmin]:
        tree[node] = left_argmin
    elif array[right_argmin] < array[left_argmin]:
        tree[node] = right_argmin
    else:
        if left_argmin < right_argmin:
            tree[node] = left_argmin
        else:
            tree[node] = right_argmin


def compute_prefix_argmin(left, right, array, tree, node, start, end):
    if left > end or right < start:
        return 0  # array[0] == INF
    if left <= start <= end <= right:
        return tree[node]
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    left_argmin = compute_prefix_argmin(left, right, array, tree, left_child, start, mid)
    right_argmin = compute_prefix_argmin(left, right, array, tree, right_child, mid + 1, end)
    if array[left_argmin] < array[right_argmin]:
        return left_argmin
    if array[right_argmin] < array[left_argmin]:
        return right_argmin
    if left_argmin < right_argmin:
        return left_argmin
    return right_argmin


def solution():
    N = int(input())
    UPDATE = 1
    ARGMIN = 2
    INF = float("inf")
    array = [INF] + list(map(int, input().split()))
    M = int(input())
    H = math.ceil(math.log2(N))
    tree_size = 2**(H + 1)
    tree = [INF for _ in range(tree_size)]
    ROOT = 1
    start = 1
    end = N
    init_tree(array, tree, ROOT, start, end)
    for _ in range(M):
        operator, i, j = map(int, input().split())
        if operator == UPDATE:
            update_tree(i, j, array, tree, ROOT, start, end)
        elif operator == ARGMIN:
            left = i
            right = j
            prefix_argmin = compute_prefix_argmin(left, right, array, tree, ROOT, start, end)
            print(prefix_argmin)


solution()

# input
# 5
# 5 4 3 2 1
# 6
# 2 1 3
# 2 1 4
# 1 5 3
# 2 3 5
# 1 4 3
# 2 3 5

 5
 5 4 3 2 1
 6
 2 1 3


3


 2 1 4


4


 1 5 3
 2 3 5


4


 1 4 3
 2 3 5


3


## 수열과 쿼리 21

- 문제 출처: [백준 16975번](https://www.acmicpc.net/problem/16975)

`-` 이때까지 푼 세그먼트 트리 문제와는 조금 다르다

`-` 단순하게 각 원소에 $k$를 더하는 행위를 수행한다면 시간 초과이다

`-` 최악의 경우 모든 원소에 $k$를 더해야 하는데 이는 $O(N)$이다

`-` 그리고 이를 쿼리의 개수 $M$만큼 반복하므로 총 시간 복잡도는 $O(NM)$이다

`-` $N$과 $M$은 최대 $100000$이니 제한 시간 안에 통과할 수 없다

`-` 이 뜻은 구간 내에 속하는 원소를 전부 갱신하면 안된다는 것이다

`-` 잘 생각해보면 어차피 출력은 배열의 원소 하나 뿐이다

`-` 이는 세그먼트 트리에서 리프 노드에 속하는 원소이다

`-` 하나의 값만 출력하니 굳이 구간 합을 저장할 필요가 없다

`-` 배열의 갱신 없이 $A_i$부터 $A_j$까지 $k$를 더했다는 정보만 기록하고 이를 바탕으로 실제 $A_x$를 출력할 때 $x$를 포함하는 구간에 대해서만 $k$를 $A_x$에 더하면 되지 않을까?

`-` 기존의 누적 합 세그먼트 트리는 리프 노드는 배열의 값을 가지고 나머지 노드는 자식 노드의 합을 저장했다

`-` 여기서는 부모 노드가 구간 합이 아닌 해당 구간에 $k$만큼 더했다는 정보를 기록하도록 하자

`-` 즉, $A_0$부터 $A_{N-1}$까지 $k$를 더했다면 루트 노드는 현재 저장한 값에 $k$를 추가로 더한다

`-` 그리고 $A_x$를 출력할 때 루트 노드부터 내려가 통과하는 지점의 노드가 가지고 있는 값을 누적하고 $A_x$에 도달하면 누적 값과 $A_x$를 더한 값을 출력하면 된다

`-` 리프 노드는 기존의 세그먼트 트리와 동일한 정보를 저장한다

`-` 하지만 나머지 노드는 구간 합이 아닌 해당 구간에 더해진 값을 저장한다

`-` 처음에 초기화할 때 리프 노드는 배열의 값으로 설정하고 나머진 $0$으로 설정한다 (아직 합산할 값이 없다)

`-` 위와 같이 하면 구간 합 정보를 저장하는 것과 배열의 원소를 출력하는 연산의 시간 복잡도가 둘 다 $O(\log N)$이다

In [27]:
import math


def init_tree(array, tree, node, start, end):
    if start == end:
        tree[node] = array[start]
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    init_tree(array, tree, left_child, start, mid)
    init_tree(array, tree, right_child, mid + 1, end)


def update_tree(left, right, k, tree, node, start, end):
    if left > end or right < start:
        return
    if left <= start and end <= right:
        tree[node] += k
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    update_tree(left, right, k, tree, left_child, start, mid)
    update_tree(left, right, k, tree, right_child, mid + 1, end)


def query(index, tree, node, start, end, aggregate):
    if index < start or index > end:
        return 0
    if start == end:
        return tree[node] + aggregate
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    left_query = query(index, tree, left_child, start, mid, aggregate + tree[node])
    right_query = query(index, tree, right_child, mid + 1, end, aggregate + tree[node])
    return left_query + right_query


def solution():
    N = int(input())
    array = list(map(int, input().split()))
    M = int(input())
    H = math.ceil(math.log2(N))
    tree_size = 2**(H + 1)
    tree = [0] * tree_size
    ROOT = 1
    start = 0
    end = N - 1
    init_tree(array, tree, ROOT, start, end)
    UPDATE = 1
    PRINT = 2
    for _ in range(M):
        info = list(map(int, input().split()))
        if info[0] == UPDATE:
            left = info[1] - 1
            right = info[2] - 1
            k = info[3]
            update_tree(left, right, k, tree, ROOT, start, end)
        elif info[0] == PRINT:
            index = info[1] - 1
            aggregate = 0
            a_x = query(index, tree, ROOT, start, end, aggregate)
            print(a_x)


solution()

# input
# 5
# 1 2 3 4 5
# 4
# 1 3 4 6
# 2 3
# 1 1 3 -2
# 2 3

 5
 1 2 3 4 5
 4
 1 3 4 6
 2 3


9


 1 1 3 -2
 2 3


7


## 데이터 구조

- 문제 출처: [백준 12899번](https://www.acmicpc.net/problem/12899)

`-` 세그먼트 트리를 활용하여 $K$번째 원소를 효율적으로 찾는 문제라고 한다

`-` 근데 생각해도 모르겠어서 어떤 느낌으로 푸는 건지 찾아봤다

`-` 주어지는 정수 $X$의 범위는 $1$부터 $2000000$까지이다

`-` 각 리프 노드를 데이터베이스 $S$에 존재하는 정수 $X$의 개수로 설정하여 세그먼트 트리를 만들자 (이 부분이 떠올리기 어려웠음)

`-` 그럼 루트 노드는 $S$에 존재하는 모든 정수의 개수를 가리킨다

`-` 처음엔 데이터베이스 $S$가 비어있으므로 초깃값은 모두 $0$이다

`-` $K$번째로 작은 수를 출력한 후 삭제하는 쿼리를 수행해야 한다

`-` 이때 $S$에 최소 $K$개의 원소가 있으므로 오류가 발생하진 않는다

`-` $1$번 노드인 루트 노드부터 탐색을 시작하자

`-` 그럼 $K$번째로 작은 원소는 루트 노드의 왼쪽 자식 또는 오른쪽 자식에 존재할 것이다

`-` 왼쪽 자식이 나타내는 값을 $L$이라 하자

`-` 만약 $K \le L$라면 $K$번째로 작은 원소는 왼쪽 자식에 있으며 $S$에 왼쪽 자식의 데이터만 있다고 생각하고 $K$번째로 작은 원소를 출력하면 된다

`-` 만약 $K > L$라면 $K$번째로 작은 원소는 오른쪽 자식에 있으며 $S$에 오른쪽 자식의 데이터만 있다고 생각하고 $K-L$번째로 작은 원소를 출력하면 된다

`-` 이를 리프 노드까지 재귀적으로 수행하여 $K$번째로 작은 원소를 찾으면 된다

`-` 노드가 가리키는 구간의 길이가 $1$이면 리프 노드인 것이다 (`start = end`)

`-` 그 후 리프 노드가 가리키는 값을 $1$ 줄인 뒤 세그먼트 트리를 갱신하면 된다

`-` 오른쪽 자식의 모든 원소는 왼쪽 자식의 모든 원소보다 크기에 이것이 가능하다

`-` 정수 추가 쿼리는 단순히 갱신만 하면 된다

`-` 트리를 갱신하는 과정을 생각해보면 리프 노드까지 이동하며 거쳐간 노드가 가리키는 값에 $1$을 더하거나 $1$을 뺀다 

`-` 추가 쿼리는 리프 노드까지 이동하며 방문한 노드에 $1$을 더하면 되고 삭제 쿼리는 $1$을 차감하면 된다

`-` 이러면 탐색하면서 갱신까지 할 수 있다

`-` 가능한 정수의 개수를 $X$라 할 때 추가 쿼리든 삭제 쿼리든 $O(\log X)$에 처리할 수 있다

`-` 쿼리가 총 $N$개 주어지므로 전체 알고리즘의 시간 복잡도는 $O(N\log X)$이다

`-` 이 문제를 풀었다면 클래스 $6$에 등재된 [사탕상자](https://www.acmicpc.net/problem/2243) 문제도 풀 수 있으니 날먹하러 가자

In [1]:
import math


def append(index, tree, node, start, end):
    if index < start or index > end:
        return
    tree[node] += 1
    if start == end:
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    append(index, tree, left_child, start, mid)
    append(index, tree, right_child, mid + 1, end)


def remove(k, tree, node, start, end, answers):
    tree[node] -= 1
    if start == end:
        answers.append(start)
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = left_child + 1
    left_child_size = tree[left_child]
    if k <= left_child_size:
        remove(k, tree, left_child, start, mid, answers)
        return
    remove(k - left_child_size, tree, right_child, mid + 1, end, answers)


def solution():
    N = int(input())
    max_value = 2000000
    h = math.ceil(math.log2(max_value))
    tree_size = 2**(h + 1) - 1
    tree = [0] * (tree_size + 1)
    start, end = 1, max_value
    root = 1
    answers = []
    for _ in range(N):
        T, X = map(int, input().split())
        if T == 1:
            append(X, tree, root, start, end)
        else:
            remove(X, tree, root, start, end, answers)
    print("\n".join(map(str, answers)))


solution()

# input
# 5
# 1 11
# 1 29
# 1 89
# 2 2
# 2 2

 5
 1 11
 1 29
 1 89
 2 2
 2 2


29
89


`-` 다른 사람 코드 보니까 추가 쿼리와 삭제 쿼리를 비재귀로 구현했다 (재귀보다 훨씬 빠름)

## 디지털 비디오 디스크(DVDs)

- 문제 출처: [백준 9345번](https://www.acmicpc.net/problem/9345)

`-` 관찰이 필요한 세그먼트 트리 응용문제라고 한다

`-` 손님이 $L$번 선반부터 $R$번 선반까지에 있는 DVD를 가져갈 때 DVD가 $L$번부터 $R$번까지 있는지 확인해야 한다

`-` 임의의 노드에 대해 해당 노드가 담당하는 구간에 실제로 DVD가 전부 있는지 여부를 기록할 수 있다

`-` 근데 이렇게 하면 문제를 해결하지 못한다

`-` 부모 노드의 정보는 왼쪽 자식 노드와 오른쪽 자식 노드의 결합으로 이루어지는데 이것만으론 부족하다

`-` 예컨대 왼쪽 자식 노드와 오른쪽 자식 노드엔 자기가 담당하는 구간에 DVD가 전부 없을 수 있지만 이들을 합치면 확장된 영역엔 DVD가 전부 있을 수 있다

`-` 간단하게 $0$번 선반에 $N-1$번 DVD가 있고 $N-1$번 선반에 $0$번 DVD가 있다고 해보자 (진일이가 바꿔놓았다)

`-` 루트 노드의 왼쪽 자식과 오른쪽 자식 모두 자기가 담당하는 구간에 DVD가 전부 있지 않다

`-` 하지만 루트 노드를 기준으로 하면 모든 DVD가 존재한다 (진열 순서는 상관없다)

`-` 따라서 다른 기준을 생각해야 한다

`-` 예컨대 구간 합을 사용할 수 있을 것 같다

`-` 그런데 $2$번 DVD와 $3$번 DVD나 $1$번 DVD와 $4$번 DVD나 DVD 번호의 합은 $5$로 같아서 구분할 수 없다

`-` 대신에 최솟값과 최댓값을 사용하자! (crack)

`-` 어떤 노드가 담당하는 구간이 $(s,e)$라 하고 DVD 번호의 최솟값과 최댓값이 $s$와 $e$라고 하자

`-` 그럼 해당 노드가 담당하는 구간엔 DVD가 실제로 전부 존재한다

`-` 왜냐하면 DVD는 총 $e-s+1$개 존재하고 최솟값과 최댓값이 $s$와 $e$이므로 $s+1$부터 $e-1$까지 $e-s-1$개의 DVD가 존재해야 한다

`-` 그런데 DVD의 번호는 모두 다르므로 $s+1$번 DVD부터 $e-1$번 DVD까지 연속적으로 모두 존재해야 개수를 맞출 수 있다

`-` 즉, 임의의 노드가 담당하는 선반 구간이 $(s,e)$이고 해당 선반 구간에 있는 DVD 번호의 최솟값과 최댓값이 $s$와 $e$라면 모든 DVD가 제대로 존재하는 것이다

`-` 한편, 진일이가 DVD를 바꿔 끼우면 세그먼트 트리를 갱신해야 한다

`-` $A$번 선반의 DVD와 $B$번 선반의 DVD를 바꿨다고 하자

`-` 만약 어떤 노드의 구간 $(s,e)$에 대해 $s > B$ 또는 $e < A$를 만족하면 DVD의 변경이 해당 노드와 그의 자식 노드들에 영향을 끼치지 않는다

`-` $A < s \le e < B$를 만족해도 마찬가지다

`-` $s \le A \le B \le e$를 만족한다면 자기 자신은 영향을 받지 않지만 자식들은 영향을 받을 수 있다

`-` 어떤 노드가 영향을 받는다면 자신이 맡은 구간에서 하나의 값만 바뀔 뿐이다 ($A$ 또는 $B$)

`-` 이는 기본적인 세그먼트 트리의 갱신이므로 문제 없다

`-` 먼저 배열의 값을 서로 바꾼 뒤 세그먼트 트리를 갱신하면 된다

`-` 진일이가 DVD를 바꿔 끼우는 쿼리와 손님이 원하는 DVD가 전부 존재하는지 확인하는 쿼리 모두 $O(\log N)$에 처리할 수 있다

`-` 따라서 전체 알고리즘의 시간 복잡도는 $O(TK\log N)$이다

In [8]:
import math


def init_tree(array, tree, node, start, end, operator):
    if start == end:
        tree[node] = array[start]
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = 2 * node + 1
    init_tree(array, tree, left_child, start, mid, operator)
    init_tree(array, tree, right_child, mid + 1, end, operator)
    tree[node] = operator(tree[left_child], tree[right_child])


def update_tree(left, right, array, tree, node, start, end, operator):
    if (left > end or right < start) or (left < start and end < right):
        return
    if start == end:
        tree[node] = array[start]
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = 2 * node + 1
    update_tree(left, right, array, tree, left_child, start, mid, operator)
    update_tree(left, right, array, tree, right_child, mid + 1, end, operator)
    tree[node] = operator(tree[left_child], tree[right_child])


def range_query(left, right, tree, node, start, end, operator, identity):
    if left > end or right < start:
        return identity
    if left <= start and end <= right:
        return tree[node]
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = 2 * node + 1
    left_query = range_query(left, right, tree, left_child, start, mid, operator, identity)
    right_query = range_query(left, right, tree, right_child, mid + 1, end, operator, identity)
    return operator(left_query, right_query)


def solve_testcase():
    N, K = map(int, input().split())
    shelf2dvd = list(range(N))
    inf = float("inf")
    h = math.ceil(math.log2(N))
    tree_size = 2**(h + 1) - 1
    min_tree = [0] * (tree_size + 1)
    max_tree = [0] * (tree_size + 1)
    start, end = 0, N - 1
    root = 1
    min_operator = min
    max_operator = max
    init_tree(shelf2dvd, min_tree, root, start, end, min_operator)
    init_tree(shelf2dvd, max_tree, root, start, end, max_operator)
    answers = []
    for _ in range(K):
        Q, A, B = map(int, input().split())
        if Q == 0:
            shelf2dvd[A], shelf2dvd[B] = shelf2dvd[B], shelf2dvd[A]
            update_tree(A, B, shelf2dvd, min_tree, root, start, end, min_operator)
            update_tree(A, B, shelf2dvd, max_tree, root, start, end, max_operator)
        else:
            range_min = range_query(A, B, min_tree, root, start, end, min_operator, inf)
            range_max = range_query(A, B, max_tree, root, start, end, max_operator, -inf)
            answer = "YES" if range_min == A and range_max == B else "NO"
            answers.append(answer)
    print("\n".join(answers))


def solution():
    T = int(input())
    for _ in range(T):
        solve_testcase()


solution()

# input
# 2
# 5 8
# 1 0 4
# 1 1 2
# 0 1 3
# 1 2 2
# 1 1 3
# 1 0 0
# 1 0 2
# 1 2 4
# 5 5
# 0 1 2
# 0 2 3
# 0 1 3
# 1 0 1
# 1 0 2

 2
 5 8
 1 0 4
 1 1 2
 0 1 3
 1 2 2
 1 1 3
 1 0 0
 1 0 2
 1 2 4


YES
YES
YES
YES
YES
NO
NO


 5 5
 0 1 2
 0 2 3
 0 1 3
 1 0 1
 1 0 2


YES
NO


## 회사 문화 2

- 문제 출처: [백준 14268번](https://www.acmicpc.net/problem/14268)

`-` 오일러 투어 테크닉으로 트리에서 세그먼트 트리를 쓰는 문제라고 한다

`-` 근데 나는 오일러 투어 테크닉이 뭔지 모른다

`-` 트리에 세그먼트 트리를 바로 적용하기엔 문제가 있다

`-` 임의의 서브 트리가 세그먼트 트리상에서 연속된 위치에 존재해야 한다

`-` 그래야 구간 쿼리를 $O(\log n)$에 수행할 수 있다

`-` 어떻게 해야 할까?

`-` 임의의 서브 트리에 속한 노드가 배열상에서 연속되게 하도록 조작해보면 DFS의 방문 순서를 따른다는 것을 알게 된다 

`-` 이를 실현하기 위해 DFS를 수행해서 방문한 순서대로 배열에 위치시키자! (crack)

`-` 즉, 배열의 $i$번 인덱스는 $i$번째로 방문한 직원의 번호를 가리킨다

`-` 이제 임의의 서브 트리는 세그먼트 트리상에서 연속된 위치에 존재하게 된다

`-` 칭찬 쿼리를 보면 $i$번 직원만 칭찬을 받는게 아니라 $i$번 직원을 루트 노드로 하는 서브 트리에 속한 모든 직원이 같이 칭찬을 받는다

`-` 칭찬 받은 직원의 번호를 $i$, $i$번 직원을 서브 트리로 하여 DFS를 수행했을 때 마지막으로 방문한 직원의 번호를 $j$라 하자

`-` 그럼 배열상에서 $i$번 직원의 인덱스와 $j$번 직원의 인덱스를 알고 있으니 구간 $(i, j)$에 $w$를 더하는 쿼리와 동치이다

`-` 또한 출력 쿼리를 보면 한 명의 직원이 칭찬을 받은 정도만 출력한다

`-` 즉, 리프 노드가 가리키는 값만 출력한다

`-` 구간 업데이트와 점 쿼리는 [수열과 쿼리 21](https://www.acmicpc.net/problem/16975) 문제를 해결한 테크닉으로 $O(\log n)$에 수행할 수 있다

`-` 그런데 칭찬 쿼리를 수행하려면 임의의 직원을 기준으로 DFS를 수행했을 때 마지막으로 방문하는 직원의 번호를 알아야 한다

`-` 마지막으로 방문하는 직원의 번호는 어떻게 알 수 있을까?

`-` 임의의 노드를 기준으로 DFS를 실행하면 언젠간 함수가 종료된다

`-` 그럼 DFS가 종료되기 전 마지막으로 호출한 DFS에서 방문한 노드가 우리가 찾는 직원의 번호가 된다

`-` DFS의 시간 복잡도는 $O(n)$이므로 전체 알고리즘의 시간 복잡도는 $O(n + m\log n)$이 된다

In [27]:
import math
import sys
from collections import defaultdict

sys.setrecursionlimit(11**5)


def dfs(graph, node, parent, array, last_visited_employees):
    global LAST, NTH
    LAST = node
    array[NTH] = node
    NTH += 1
    for child in graph[node]:
        if child == parent:
            continue
        dfs(graph, child, node, array, last_visited_employees)
    last_visited_employees[node] = LAST


def update_tree(left, right, w, tree, node, start, end):
    if left > end or right < start:
        return
    if left <= start and end <= right:
        tree[node] += w
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = 2 * node + 1
    update_tree(left, right, w, tree, left_child, start, mid)
    update_tree(left, right, w, tree, right_child, mid + 1, end)


def query(index, tree, node, start, end, aggregate):
    if index < start or index > end:
        return 0
    if start == end:
        return tree[node] + aggregate
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = 2 * node + 1
    left_query = query(index, tree, left_child, start, mid, tree[node] + aggregate)
    right_query = query(index, tree, right_child, mid + 1, end, tree[node] + aggregate)
    return left_query + right_query


def solution():
    global LAST, NTH
    n, m = map(int, input().split())
    parents = map(int, input().split())
    graph = defaultdict(list)
    for u, u_p in enumerate(parents, start=1):
        graph[u].append(u_p)
        graph[u_p].append(u)
    LAST = -1
    NTH = 0
    none = -1
    root = 1
    array = [0] * n
    last_visited_employees = [0] * (n + 1)
    dfs(graph, root, none, array, last_visited_employees)
    emplyee2index = [0] * (n + 1)
    for i, e in enumerate(array):
        emplyee2index[e] = i
    h = math.ceil(math.log2(n))
    tree_size = 2**(h + 1) - 1
    tree = [0] * (tree_size + 1)
    start, end = 0, n - 1
    answers = []
    for _ in range(m):
        info = list(map(int, input().split()))
        if info[0] == 1:
            i, w = info[1:]
            j = last_visited_employees[i]
            left, right = emplyee2index[i], emplyee2index[j]
            update_tree(left, right, w, tree, root, start, end)
        else:
            i = info[1]
            index = emplyee2index[i]
            aggregate = 0
            answer = query(index, tree, root, start, end, aggregate)
            answers.append(answer)
    print("\n".join(map(str, answers)))


solution()

# input
# 6 9
# -1 1 1 2 2 3
# 1 2 10
# 1 4 10
# 1 5 100
# 1 6 1000
# 2 2
# 2 3
# 2 4
# 2 5
# 2 6

 6 9
 -1 1 1 2 2 3
 1 2 10
 1 4 10
 1 5 100
 1 6 1000
 2 2
 2 3
 2 4
 2 5
 2 6


10
0
20
110
1000


`-` DFS를 사용해 모든 서브 트리가 배열 상에서 연속되도록 트리를 $1$차원 배열로 변환하는 기법을 오일러 투어 테크닉이라 부른다고 한다

`-` 변환하고 나면 세그먼트 트리를 활용해 구간 쿼리를 효율적으로 적용할 수 있다!

## 증가 수열의 개수

- 문제 출처: [백준 17409번](https://www.acmicpc.net/problem/17409)

`-` 다이나믹 프로그래밍과 세그먼트 트리의 조화를 느끼는 문제라고 한다

`-` 일단 단순하게 동적 계획법으로 접근하여 풀어보자

`-` $i$번째 원소를 마지막으로 하는 부분 수열 중 길이가 $x$인 것의 개수를 $\operatorname{dp}[i][x]$라고 하자

`-` 길이가 $1$인 부분 수열은 자기 자신 하나 뿐이므로 $x$는 최소 $2$이다 ($K=1$이면 정답은 $N$이다)

`-` 그럼 $\operatorname{dp}[i+1][x] = \sum\limits_{j=0}^{i}\left\{\operatorname{dp}[j][x-1] \cdot I(A_{i+1} > A_j)\right\}$이다

`-` 위 풀이의 시간 복잡도는 $O\left(KN^2\right)$이고 $N$은 최대 $100000$, $K$는 최대 $10$이므로 시간 초과이다

`-` 이제 세그먼트 트리를 적용해서 조화를 느껴보자

`-` 처음엔 [데이터 구조](https://www.acmicpc.net/problem/12899) 문제에서 사용한 테크닉을 적용할려고 했는데 생각해보니 그럴 필요는 없었다 (왜 티어 똑같냐고 생각했음)

`-` 여태까지 고려한 길이가 $1$부터 $K-1$까지인 부분 수열 중 마지막 원소가 $A_i$보다 작다면 새로운 원소 $A_i$를 추가할 수 있다

`-` 길이마다 가능한 부분 수열이 다르니 이를 따로 고려할 것이다

`-` 수열의 모든 원소는 다르다

`-` 따라서 임의의 길이를 가지는 부분 수열에 대해 마지막 원소와 그 때 가능한 부분 수열의 개수를 매핑할 수 있다 (crack)

`-` 이를 구간 합 세그먼트 트리로 관리한다면 새로운 원소 추가와 구간 쿼리를 $O(\log N)$에 수행할 수 있다!

`-` 세그먼트 트리의 리프 노드는 해당 원소를 마지막으로 하는 부분 수열의 개수를 뜻한다

`-` 길이가 $1$부터 $K-1$ 사이인 부분 수열이 유의미하니 각각에 대해 세그먼트 트리를 만들어두자

`-` 첫 번째 원소부터 마지막 원소까지 순회하면서 부분 수열의 마지막 원소가 될 수 있으면 세그먼트 트리에 추가하자

`-` 예컨대 길이가 $k$인 부분 수열에 대해 이를 관리하는 세그먼트 트리에서 $(1,A_{i}-1)$ 구간의 합을 계산하자

`-` 이는 마지막 원소가 $A_i$보다 작은 길이가 $k$인 부분 수열의 개수를 뜻한다

`-` 새로운 원소를 추가했으니 길이가 $k+1$인 세그먼트 트리로 접근하여 $A_i$를 가리키는 리프 노드에 계산한 구간의 합만큼 더한 후 갱신하자

`-` 이를 반복하면 되며 길이가 $K$인 부분 수열을 만들었으면 개수를 정답에 누적해주자

`-` 전체 알고리즘의 시간 복잡도는 $O(KN\log N)$이다

`-` $O\left(KN^2\right)$의 시간 복잡도를 가지는 동적 계획법을 세그먼트 트리로 최적화하여 $O(KN\log N)$의 시간 복잡도로 만드는 신선한 문제였다

`-` 참고로 $10^9+7$로 나눈 나머지를 출력해야 정답이다 (이것 때문에 시간 초과 $2$번 받음)

In [28]:
import math


def update(index, value, tree, node, start, end):
    if index < start or index > end:
        return
    if start == end:
        tree[node] += value
        tree[node] %= MOD
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = 2 * node + 1
    update(index, value, tree, left_child, start, mid)
    update(index, value, tree, right_child, mid + 1, end)
    tree[node] = (tree[left_child] + tree[right_child]) % MOD


def query(left, right, tree, node, start, end):
    if left > end or right < start:
        return 0
    if left <= start and end <= right:
        return tree[node]
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = 2 * node + 1
    left_sum = query(left, right, tree, left_child, start, mid)
    right_sum = query(left, right, tree, right_child, mid + 1, end)
    return (left_sum + right_sum) % MOD


def solution():
    global MOD
    N, K = map(int, input().split())
    array = list(map(int, input().split()))
    MOD = 10**9 + 7
    if K == 1:
        print(N)
        return
    h = math.ceil(math.log2(N + 1))
    tree_size = 2**(h + 1) - 1
    trees = [[]]
    trees.extend([[0] * (tree_size + 1) for _ in range(K - 1)])
    start, end = 1, N
    root = 1
    answer = 0
    for e in array:
        for k in range(K):
            if k == 0:
                update(e, 1, trees[k + 1], root, start, end)
                continue
            count = query(1, e - 1, trees[k], root, start, end)
            if k == K - 1:
                answer += count
                answer %= MOD
                continue
            update(e, count, trees[k + 1], root, start, end)
    print(answer)


solution()

# input
# 5 3
# 1 2 3 5 4

 5 3
 1 2 3 5 4


7


`-` 이 문제를 풀었으면 [blobhyperthink](https://www.acmicpc.net/problem/24505) 문제도 날먹할 수 있다

`-` 이 문제에서 $K=11$이고 중복 원소가 존재하는 경우이다

`-` 첫 번째 원소부터 마지막 원소까지 차례대로 순회하므로 지금 고려하고 있는 원소는 여태까지 고려한 원소보다 인덱스가 크다

`-` 따라서 마지막 위치에 원소를 추가하여 새로운 부분수열을 만드는데 지장이 없으므로 원소가 중복돼도 상관없다

## 수열과 쿼리 24

- 문제 출처: [백준 17408번](https://www.acmicpc.net/problem/17408)

`-` 기본적인 세그먼트 트리 문제이다

`-` $A_i + A_j$가 최대일려면 구간에서 상위 $2$개의 값을 골라 더하면 된다

`-` $2$번 쿼리를 수행하기 위해 각 노드별로 상위 $2$개의 값을 저장하고 있자 (순서대로 가지고 있자)

`-` 리프 노드의 경우 값이 하나밖에 없으니 $0$을 추가로 가지고 있자 (가장 작은 값이 $1$이다)

`-` $1$번 쿼리는 원래 하던대로 하면 된다

`-` 이 왜 플 $4$?

In [3]:
import math


def top_two(array1, array2):
    if array1[MIN] > array2[MAX]:
        return array1
    if array2[MIN] > array1[MAX]:
        return array2
    if array1[MAX] > array2[MAX]:
        return [array1[MAX], array2[MAX]]
    return [array2[MAX], array1[MAX]]


def init(array, tree, node, start, end):
    if start == end:
        tree[node] = [array[start], 0]
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = 2 * node + 1
    init(array, tree, left_child, start, mid)
    init(array, tree, right_child, mid + 1, end)
    tree[node] = top_two(tree[left_child], tree[right_child])


def update(index, value, tree, node, start, end):
    if index < start or index > end:
        return
    if start == end:
        tree[node][MAX] = value
        return
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = 2 * node + 1
    update(index, value, tree, left_child, start, mid)
    update(index, value, tree, right_child, mid + 1, end)
    tree[node] = top_two(tree[left_child], tree[right_child])


def range_top_two(left, right, tree, node, start, end):
    if left > end or right < start:
        return [0, 0]
    if left <= start and end <= right:
        return tree[node]
    mid = (start + end) // 2
    left_child = 2 * node
    right_child = 2 * node + 1
    left_top_two = range_top_two(left, right, tree, left_child, start, mid)
    right_top_two = range_top_two(left, right, tree, right_child, mid + 1, end)
    return top_two(left_top_two, right_top_two)


def solution():
    global MIN, MAX
    N = int(input())
    array = list(map(int, input().split()))
    M = int(input())
    MIN, MAX = 1, 0
    h = math.ceil(math.log2(N))
    tree_size = 2**(h + 1)
    tree = [0] * tree_size
    start, end = 0, N - 1
    root = 1
    init(array, tree, root, start, end)
    answers = []
    for _ in range(M):
        query = list(map(int, input().split()))
        operator = query[0]
        if operator == 1:
            _, i, v = query
            update(i - 1, v, tree, root, start, end)
        else:
            _, l, r = query
            e1, e2 = range_top_two(l - 1, r - 1, tree, root, start, end)
            answers.append(e1 + e2)
    print("\n".join(map(str, answers)))


solution()

# input
# 5
# 5 4 3 2 1
# 6
# 2 2 4
# 2 1 4
# 1 5 5
# 2 3 5
# 1 4 9
# 2 3 5

 5
 5 4 3 2 1
 6
 2 2 4
 2 1 4
 1 5 5
 2 3 5
 1 4 9
 2 3 5


7
9
8
14


`-` 또 다른 풀이가 있었다 (풀이보니까 난이도가 이해된다)

`-` 세그먼트 트리에 구간 내 최댓값의 인덱스를 저장하자

`-` 원하는 구간에 대해 최댓값의 인덱스를 찾은 뒤 양 옆 구간에 대해 쿼리를 수행한다

`-` 둘 중 더 큰 값이 두 번째로 큰 값이 된다