# 가장 긴 증가하는 부분 수열 문제 (Longest Increasing Sequence Problem)

`-` 주어진 수열에서 오름차순으로 정렬된 가장 긴 부분수열을 찾는 문제

`-` 다이나믹 프로그래밍을 이용한 $O\left(N^2\right)$ 풀이와 이분 탐색을 이용한 $O(N\log N)$ 풀이

## 가장 긴 증가하는 부분 수열

- 문제 출처: [백준 11053번](https://www.acmicpc.net/problem/11053)

`-` 모르겠다 공부 ㄱㄱ

`-` 공부하고 왔음

`-` 수열 $A = \{10, 20, 30, 11, 12, 13, 14, 40, 15, 16\}$ 이런 수열이 있다고 해보자

`-` 위에서 다룬 수열을 A라고 해보자 

`-` $A[6] = 13, \operatorname{dp}[6] = 4$이다. $\operatorname{dp}[6] = 4$라는 뜻은 $A[6]$이 마지막 원소이고 만약 수열 $A$가 $A[5]$까지만 존재했다면 가장 긴 증가하는 부분 수열의 길이는 $3$이라는 의미이다

`-` $A[6]$을 추가하는데 되도록이면 증가하는 부분 수열의 길이가 크면 좋음 ---> $A[6]$이 마지막 원소가 될 수 있는 여러개의 증가하는 부분 수열 중에서 길이가 가장 긴 것에 $A[6]$을 추가해야 함

`-` 즉 $\operatorname{dp}[1]$에서 $\operatorname{dp}[5]$중에서 가장 큰 값에다 $A[6]$을 추가하여 새로운 $\operatorname{dp}[6]$을 만듦 ---> `dp[i]는 i번째 인덱스 값을 수열의 마지막 원소로 가지는 증가하는 부분 수열 중 가장 길이가 긴 것`

`-` 가장 긴 증가하는 부분 수열 점화식: $\operatorname{dp}[n] = \max(\operatorname{dp}[i], \operatorname{dp}[j], \dots, \operatorname{dp}[k]) + 1, \quad (A[n] > A[i], A[j],\dots,A[k])$

In [63]:
N = int(input())
dp = [0] * 1001
data = list(map(int, input().split()))
arr = [0] + data
for i in range(1, N + 1):
    for j in range(i):
        if arr[i] > arr[j]:
            dp[i] = max(dp[j] + 1, dp[i])
print(max(dp))

# input
# 16
# 1 8 3 9 2 2 4 1 6 4 10 10 9 7 7 6

 16
 1 8 3 9 2 2 4 1 6 4 10 10 9 7 7 6


5


## 가장 긴 증가하는 부분 수열 2

- 문제 출처: [백준 12015번](https://www.acmicpc.net/problem/12015)

`-` [가장 긴 증가하는 부분 수열](https://www.acmicpc.net/problem/11053) 문제는 코드의 시간복잡도가 $O\left(N^2\right)$이어도 통과됐다

`-` 이를 $O(N\log N)$으로 바꿔보자

`-` $\operatorname{dp}[n] = \max(\operatorname{dp}[i], \operatorname{dp}[j], \dots, \operatorname{dp}[k]) + 1, \quad (A[n] > A[i], A[j],\dots,A[k])$

`-` 여기서 `dp[n]은 A[n]을 마지막 원소로 가지는 가장 긴 증가하는 부분 수열의 길이`로 정의된다

`-` $\operatorname{dp}[n]$을 계산하는데 있어서 $\operatorname{dp}[i]$가 최대이든 $\operatorname{dp}[j]$가 최대이든 중요하지 않다

`-` 단지, $\operatorname{dp}[i], \operatorname{dp}[j], \dots, \operatorname{dp}[k]$ 중에서 최댓값만 구한 다음에 $+1$을 하면 된다

`-` $\operatorname{dp}[n]$의 최대값을 구하기위해 필요한 정보는 $A[n]$이 $A[i], \cdots, A[j]$보다 큰지와 이를 만족하는 $A[i], \cdots, A[j]$들 중에서 제일 큰 $\operatorname{dp}[\cdot]$는 무엇이냐이다

`-` 만약 배열 $A$가 오름차순 정렬되어 있으면 $A[1]\leq A[2]\leq\cdots\leq A[n-1]$이 되고 $A[n]$이 들어갈 위치를 찾는데는 이분 탐색을 이용하면 $O(\log N)$이다

`-` 예컨대 $A[1]\leq A[2]\leq A[3]\leq A[n]\cdots\leq A[n-1]$이라면 $\operatorname{dp}[n]$은 $\max(\operatorname{dp}[1], \operatorname{dp}[2],\operatorname{dp}[3])+1$이 된다

`-` $[\star]$ 여기서 중요한 점은 $\operatorname{dp}[1], \operatorname{dp}[2],\operatorname{dp}[3]$ 중에서 무엇이 최댓값인지가 아니라 최댓값이 무엇이냐는 것이다 $[\star]$

`-` `10, 20, 50`이나 `10, 25, 50`이나 `10, 45, 50`이나 증가하는 부분 수열의 길이는 모두 $3$이다

- 이를 통해 가장 긴 증가하는 부분 수열을 다음과 같이 계산할 수 있다

`-` `A[n]`를 원소로 가지는 빈 리스트 `lst`을 생각하자 

`-` 여기서 `lst[n]`은 증가하는 부분수열의 길이가 $n$인 수열중에서 가장 작은 마지막 원소를 뜻한다

`-` 첫 번째 원소부터 순차 탐색하여 `A[i]`가 `lst`의 어떤 위치에 삽입되어야 할 지 이분 탐색을 통해 찾고 해당 위치에 삽입한다 (따라서 `lst`는 오름차순으로 정렬됨)

`-` 첫 번째 원소부터 순차 탐색했으므로 `lst`에 존재하는 원소들은 모두 인덱스가 `i`보다 작다 (`lst`에서 `i`가 가장 큰 인덱스이므로 `A[i]`는 증가하는 부분수열의 마지막 원소가 된다) 

`-` `lst`에서 `A[i]`의 인덱스를 `j`라고 하면 바로 왼쪽 원소는 `lst[j - 1]`이다 

`-` `A[i] > lst[j - 1]`이고 `lst[j - 1]`은 `lst`의 정의에 의해 길이가 `j - 1`인 증가하는 부분수열중에서 가장 작은 마지막 원소이다

`-` 만약 기존의 `lst[j]`가 `A[i]`보다 작다면 `lst[j]`보다 강한 조건인 `A[i]`를 사용할 이유가 없다(`A[i]`보다 크면 당연히 `lst[j]`보다도 크지만 역은 성립 안한다)

`-` 만약 기존의 `lst[j]`가 `A[i]`보다 크다면 더 약한 조건인 `A[i]`로 `lst[j]`를 대체한다

`-` 그런데 `A[i]`는 기존의 `lst`에서 `lst[j - 1]`보다 크고 `lst[j]`보다 작아서 `lst[j]`에 삽입되었다

`-` 따라서 항상 `lst[j] <= A[i]`이므로 `lst[j]`를 `A[i]`로 갱신하면 된다

`-` 위의 논리는 새로 삽입된 `A[i]`의 `dp`를 계산하는데 있어서 `무엇이 최댓값인지가 아니라 최댓값이 무엇인지가 중요`하기 때문에 성립한다

In [106]:
INF = 1e9
N = int(input())
arr = (list(map(int, input().split())))
lst = [INF] * (N + 1)  # 편의상 N + 1 크기의 배열로 만듦 (파이썬은 인덱스가 0부터 시작)
lst[0] = 0  # 초기값
lst[1] = arr[0]  # lst[n]은 증가하는 부분수열의 길이가 n인 것들 중에서 가장 작은 마지막 원소
LIS = 1  # 가장 긴 증가하는 부분 수열의 길이 (Longest Increasing Subsequence)
# solve
for i in range(1, N):  # for문은 O(N)이고 while문은 이분 탐색으로 O(log N)이므로 전체 코드의 시간복잡도는 O(N log(N))이다
    left = 1
    right = i  # 1 ~ i, 0을 제외하면 실질적으로 i개의 원소가 lst에 들어있음
    mid = (left + right) // 2
    while left <= mid:  # left와 mid가 같은 상황에서 lst[mid] < arr[i]이면 mid + 1에 삽입하고 lst[mid] >= arr[i]이면 left에 삽입하고 싶음
        if lst[mid] < arr[i]: 
            left = mid + 1
        else:
            right = mid - 1
        mid = (left + right) // 2
    # arr[i]가 lst에 어느 위치에 들어가야 하는지를 찾았다 (lst[left]에 삽입)
    # lst[left]를 arr[i]로 갱신
    # arr[i]는 lst[left]에 삽입되므로 기존의 lst에서 lst[left - 1]보단 크고 lst[left]보다 작다
    # 따라서 lst[left] >= arr[i]가 항상 성립한다 (등호는 동일한 원소일 떄)
    lst[left] = arr[i]
    if left > LIS:
        LIS = left        
# 출력
print(LIS)

# input
# 16
# 1 8 3 9 2 2 4 1 6 4 10 10 9 7 7 6

 16
 1 8 3 9 2 2 4 1 6 4 10 10 9 7 7 6


5


`-` 이분 탐색으로 해결해야 된다는 것을 알고 있었는데도 5시간이나 걸렸음

## 가장 긴 바이토닉 부분 수열

- 문제 출처: [백준 11054번](https://www.acmicpc.net/problem/11054)

`-` 질문 검색에서 아이디어 참고함

`-` `증가하는 부분 수열 + 감소하는 부분 수열 - 1(겹치는 부분)`의 `최댓값`을 구하자

`-` $\operatorname{dp\_up}[n]$은 $n$를 마지막 원소로 가지는 증가하는 부분 수열 중 길이가 가장 긴 것

`-` $\operatorname{dp\_down}[n]$은 $n$를 첫번째 원소로 가지는 감소하는 부분 수열 중 길이가 가장 긴 것

In [38]:
N = int(input())
dp_up = [0] * 1001
dp_down = [1] * 1001
data = list(map(int, input().split()))
arr = [0] + data
# 가징 긴 바이토닉 부분 수열
for i in range(1, N + 1):
    for j in range(i):
        if arr[i] > arr[j]:
            dp_up[i] = max(dp_up[j] + 1, dp_up[i])
for i in range(N, 0, -1):
    for j in range(N, i, -1):
        if arr[i] > arr[j]:
            dp_down[i] = max(dp_down[j] + 1, dp_down[i])
print(max(list(map(lambda x, y: x + y, dp_up, dp_down))) - 1)

 10
 1 5 2 1 4 3 4 5 2 1


7


`-` 위에서 사용한 `lambda 함수` 간단히 참고

In [45]:
a = [1, 2, 3, 4, 5]
b = [10, 1 ,2, 3, 4]
print(max(list(map(lambda x, y: x + y, a, b))) - 1)

10


`-` 서로 동일한 index위치에 있는 값을 더한 후 `최대값 - 1`을 출력

`-` 리스트 길이가 다르다면? 

In [2]:
a = [1, 2, 3, 20, 20]
b = [1 ,2, 10]
print(max(list(map(lambda x, y: x + y, a, b))) - 1)

12


`-` $b$는 길이가 $3$이어서 $a$의 $4$와 $5$ 원소는 고려되지 않음

## 전깃줄

- 문제 출처: [백준 2565번](https://www.acmicpc.net/problem/2565)

`-` $A$와 $B$는 연결되어 있으므로 세트임

`-` 우선 $A, B$에 대해 오름차순 정렬을 함 ($A, B$ 순서 바뀌어도 ok) ---> 전깃줄이 전봇대에 연결되는 위치는 전봇대 위에서부터 차례대로 번호가 매겨지므로

`-` $\operatorname{dp}[n]$은 $n$번째 전깃줄이 마지막에 위치하는 `LIS`임

`-` $n$번째의 전깃줄은 $n-1$번째 전깃줄에 대해 $A, B$ 각각 숫자가 커야함

`-`  $\operatorname{dp}$의 최대값을 구한 후 $N$에서 빼면 제거해야 할 전깃줄의 개수임

In [1]:
N = int(input())
arr = [[0, 0]]
dp = [0] * 101
for _ in range(N):
    arr.append(list(map(int, input().split())))
arr1 = sorted(arr, key = lambda x: (x[0], x[1]))
for i in range(1, N + 1):
    for j in range(i):
        if arr1[i][0] > arr1[j][0] and arr1[i][1] > arr1[j][1]:
            dp[i] = max(dp[j] + 1, dp[i])
print(N - max(dp))

# input
# 8
# 1 8
# 3 9
# 2 2
# 4 1
# 6 4
# 10 10
# 9 7
# 7 6

 8
 1 8
 3 9
 2 2
 4 1
 6 4
 10 10
 9 7
 7 6


3


## 가장 긴 증가하는 부분 수열 4

- 문제 출처: [백준 14002번](https://www.acmicpc.net/problem/14002)

`-` [가장 긴 증가하는 부분 수열](https://www.acmicpc.net/problem/11053) 문제에서 길이만 출력했다면 여기서는 부분 수열도 같이 출력해야 한다

`-` $\operatorname{dp}[n]$을 $n$번째 원소를 마지막 원소로 하는 부분 수열 중 가장 긴 것의 길이라고 하자

`-` 그러면 $n$보다 작은 $i,j,\cdots,k$에 대해 다음의 점화식이 성립한다

`-` $\operatorname{dp}[n] = \max(\operatorname{dp}[i], \operatorname{dp}[j], \dots, \operatorname{dp}[k]) + 1, \quad (A[n] > A[i], A[j],\dots,A[k])$

`-` 그런데 이제 부분 수열이 필요하므로 이전의 부분 수열 중 가장 긴 것에 $a_n$을 추가하여 $\operatorname{dp}[n]$을 구성하자

`-` 전체 알고리즘의 시간 복잡도는 $O\left(N^2\right)$이지만 $N$이 최대 $1000$이므로 1초 안에 해결할 수 있다

In [17]:
def solution():
    N = int(input())
    a_n = list(map(int, input().split()))
    SEQ = 0
    LEN = 1
    dp = [[[a_n[i]], 1] for i in range(N)]  # dp[i]는 i번째 원소를 마지막 원소로 하는 가장 긴 부분 수열과 그 때의 길이
    for i in range(1, N):
        max_len = 0
        for j in range(i):
            if dp[j][LEN] > max_len and a_n[i] > a_n[j] and dp[j][LEN] >= dp[i][LEN]:
                subsequence = dp[j][SEQ]
                max_len = dp[j][LEN]
        if max_len > 0:
            dp[i][SEQ] = subsequence.copy()
            dp[i][SEQ].append(a_n[i])
            dp[i][LEN] = max_len + 1
    LIS = max(dp[i][LEN] for i in range(N))
    print(LIS)
    for i in range(N):
        if dp[i][LEN] == LIS:
            print(*dp[i][SEQ])
            break


solution()

# input
# 6
# 10 20 10 30 20 50

 6
 10 20 10 30 20 50


4
10 20 30 50


## 가장 긴 증가하는 부분 수열 5

- 문제 출처: [백준 14003번](https://www.acmicpc.net/problem/14003)

`-` [가장 긴 증가하는 부분 수열 2](https://www.acmicpc.net/problem/12015) 문제에 역추적을 더한 문제이다

`-` [가장 긴 증가하는 부분 수열 4](https://www.acmicpc.net/problem/14002) 문제를 풀고 기여 의견을 봤는데 힌트를 얻어버렸다

`-` LIS에 새로운 원소를 등록할 때 해당 원소 앞의 원소를 가리키도록 추적해놓으면 된다

`-` 그럼 LIS가 매번 업데이트 되더라도 LIS 자체를 사용하는게 아니라 미리 추적해놓은 것을 사용하므로 문제 없다

In [2]:
def compute_lis(array, n):
    LIS_array = [None] * n  # LIS_array[i]는 i + 1 길이의 증가하는 부분 수열의 마지막 원소의 인덱스
    LIS_array[0] = 0
    LIS = 1  # 가장 긴 증가하는 부분 수열의 길이
    dp = [None] * n  # dp[i]는 LIS를 이루는 array[i] 앞의 위치한 원소의 인덱스
    for i, x in enumerate(array[1:], start=1):
        left = 0
        right = LIS - 1
        while left <= right:
            mid = (left + right) // 2
            index = LIS_array[mid]
            value = array[index]
            if x <= value:
                right = mid - 1
            else:
                left = mid + 1
        LIS_array[left] = i
        if left == LIS:
            LIS += 1
        if left == 0:
            continue
        dp[i] = LIS_array[left - 1]
    index_last = LIS_array[LIS - 1]
    lis = []
    while True:
        a = array[index_last]
        lis.append(a)
        index_last = dp[index_last]
        if index_last is None:
            break
    lis = lis[::-1]
    return lis


def solution():
    global INF
    N = int(input())
    array = list(map(int, input().split()))
    INF = float("inf")
    lis = compute_lis(array, N)
    print(len(lis))
    print(*lis)


solution()

# input
# 6
# 10 20 10 30 20 50

 6
 10 20 10 30 20 50


4
10 20 30 50
