# heapq

- Heap은 최대값, 최소값을 찾아내는 연산을 빠르게 하기 위해 고안
- 완전 이진 트리를 기본 구조로 가진다.
- 최소 힙(min heap) : 부모 노드가 자식 노드의 값보다 작다
    - 이진 탐색 트리와의 차이점 : 부모 노드 기준 왼쪽 노드와 오른쪽 노드의 규칙이 없다
    
## Insert

- 데이터 삽입은 왼쪽에서 오른쪽 순서로 완전 이진 트리를 구성
- 입력된 데이터와 부모 노드의 값을 비교
- 입력 데이터가 부모보다 작다면 데이터가 부모노드가 된다.

## Delete

- delete 순서
    - 루트노드 삭제
    - 트리의 말단에서 가장 오른쪽에 있는 노드를 루트로 승격
    
## heapq 모듈

- 부모 노드의 인덱스 = 1
    - 자식노드의 인덱스 :
        - 부모노드 인덱스 = 자식 인덱스 // 2
        - 왼쪽 자식 인덱스 = 부모 인덱스 * 2
        - 오른쪽 자식 인덱스 = 부모 인덱스 * 2 + 1

### 데이터 추가

In [4]:
import heapq
result=[]
heapq.heappush(result,14)
print(result)

heapq.heappush(result,10)
print(result)

heapq.heappush(result,6)
print(result)

heapq.heappush(result,8)
print(result)

heapq.heappush(result,12)
print(result)

heapq.heappush(result,4)
print(result)

[14]
[10, 14]
[6, 14, 10]
[6, 8, 10, 14]
[6, 8, 10, 14, 12]
[4, 8, 6, 14, 12, 10]


### 데이터 삭제

In [5]:
heapq.heappop(result)
print(result)

[6, 8, 10, 14, 12]


### 리스트 변환

In [6]:
_list = [14,10,6,8,12,4]
heapq.heapify(_list)
print(_list)

[4, 8, 6, 10, 12, 14]


### 최대 힙 표현

- reverse sign 이용해서 최소를 최대로 표현

In [10]:
reverse_sign = lambda x: -1*x
max_heap = list(map(reverse_sign, _list))
heapq.heapify(max_heap)
max_heap = list(map(reverse_sign, max_heap))
max_heap

[14, 12, 6, 10, 8, 4]

## (예시) 수상자 3명을 선정하려면?

In [11]:
import heapq

data = [
    (12.23,'강보람'),
    (12.31,'김지원'),
    (11.98,'박시우'),
    (11.99,'장준혁'),
    (11.67,'차정웅'),
    (12.02,'박중수'),
    (11.57,'차동현'),
    (12.04,'고미숙'),
    (11.92,'한시우'),
    (12.22,'이민석')
]

In [12]:
data

[(12.23, '강보람'),
 (12.31, '김지원'),
 (11.98, '박시우'),
 (11.99, '장준혁'),
 (11.67, '차정웅'),
 (12.02, '박중수'),
 (11.57, '차동현'),
 (12.04, '고미숙'),
 (11.92, '한시우'),
 (12.22, '이민석')]

In [13]:
h=[]
for score in data:
    heapq.heappush(h,score)
h

[(11.57, '차동현'),
 (11.92, '한시우'),
 (11.67, '차정웅'),
 (11.98, '박시우'),
 (11.99, '장준혁'),
 (12.23, '강보람'),
 (12.02, '박중수'),
 (12.31, '김지원'),
 (12.04, '고미숙'),
 (12.22, '이민석')]

In [14]:
for i in range(3):
    print(heapq.heappop(h))

(11.57, '차동현')
(11.67, '차정웅')
(11.92, '한시우')


- heap에서는 루트노드만 출력하므로 ranking 순으로 출력할 수 있다

### 우선 순위 큐

- heapq에 튜플이 삽입될 경우엔, 튜플의 첫 번째 요소가 정렬의 기준이 된다.
    - 첫 번째 요소는 우선순위 값, 두 번째 요소는 데이터

In [1]:
import heapq

q=[]
heapq.heappush(q,(4,10))
heapq.heappush(q,(1,10))
heapq.heappush(q,(3,10))
heapq.heappush(q,(2,10))
print(q)

[(1, 10), (2, 10), (3, 10), (4, 10)]


In [2]:
heapq.heappop(q)
print(q)

[(2, 10), (4, 10), (3, 10)]


### 최대 힙 (백준 11279)

In [2]:
import heapq

N = int(input())
h=[]
cand=list()
reverse_sign = lambda x: -1*x

for _ in range(N):
    x=int(input())
    if x==0:
        if len(cand)==0:
            print('result: ',0)
        else:
            max_ls = list(map(reverse_sign, cand))
            heapq.heapify(max_ls)
            cand = list(map(reverse_sign,max_ls))
            result = cand.pop(0)
            print('result: ',result)
            
    elif x>0:
        cand.append(x)

13
0
result:  0
1
2
0
result:  2
0
result:  1
3
2
1
0
result:  3
0
result:  2
0
result:  1
0
result:  0
0
result:  0


- 시간초과
    - heapify 때문인듯 (시간복잡도가 O(n) 이므로)

In [7]:
import heapq

N=int(input())
heap=[]
for _ in range(N):
    t = int(input())
    t = -t
    if t == 0:
        if len(heap)==0:
            print(0)
        else:
            print(-heapq.heappop(heap))
    else:
        heapq.heappush(heap,t)

13
0
0
1
2
0
2
0
1
3
2
1
0
3
0
2
0
1
0
0
0
0


- heapify 없이 pop & push만으로 결과 출력

### 최소 힙 (백준 1927)

In [8]:
import heapq

N = int(input())
heap = []

for _ in range(N):
    t = int(input())
    if t==0:
        if len(heap)==0:
            print(0)
        else:
            print(heapq.heappop(heap))
    else:
        heapq.heappush(heap,t)

9
0
0
12345678
1
2
0
1
0
2
0
12345678
0
0
32


## 다익스트라 알고리즘

- 한 지점에서 다른 특정 지점까지의 최단 경로를 구해야 하는 경우 사용

In [1]:
INF = int(1e9)

# 노드의 개수 , 간선의 개수 입력받기
N,M = map(int, input().split())
start = int(input())
graph = [[] for _ in range(N+1)]
visited = [False]*(N+1)
# 최단 거리 테이블 모두 무한으로 초기화
distance = [INF]*(N+1)

for _ in range(M):
    # a노드에서 b노드로 가는 비용이 c이다 (방향성이 존재)
    a, b, c = map(int, input().split())
    graph[a].append((b,c))
    
# 방문하지 않은 노드 중에서 가장 최단 거리가 짧은 노드의 번호를 반환
def get_smallest_node():
    min_val = INF
    index=0 # 가장 거리가 짧은 노드(인덱스)
    for i in range(N+1):
        if distance[i] < min_val and not visited[i]:
            min_val = distance[i]  # min_val를 계속 update 시켜주면서 비교 (그리디)
            index=i
            
    return index

def dijkstra(start):
    # 시작 노드에 대해서 초기화
    distance[start] = 0
    visited[start] = True
    for j in graph[start]:
        distance[j[0]] = j[1]
    # 시작 노드를 제외한 전체 (n-1)개의 노드에 대해 반복
    for i in range(N-1):
        # 현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
        now = get_smallest_node()
        visited[now] = True
        # 현재 노드와 연결된 다른 노드를 확인
        for j in graph[now]:
            cost = distance[now] + j[1]
            if cost<distance[j[0]]:
                distance[j[0]] = cost
                
dijkstra(start)

for i in range(1,N+1):
    # 도달할 수 없는 경우, 무한이라고 출력
    if distance[i] == INF:
        print('INFINITY')
        
    else:
        print(distance[i])
        

6 11
1
1 2 2
1 3 5
1 4 1
2 3 3
2 4 2
3 2 3
3 6 5
4 3 3
4 5 1
5 3 1
5 6 2
0
2
3
1
2
4


## heapq 를 이용한 최단 거리

- get_smalles_node() 함수를 heapq를 이용해서 사용
- 시간 복잡도 : O(E logV), E:간선 개수, V:노드 개수
    - while문을 통해 실제로는 V개의 노드를 전부 보지 않는 것을 확인할 수 있다.
    - 따라서 시간 복잡도는 O(ElogE) 이다.

In [3]:
import heapq
INF = int(1e9)

N, M = map(int, input().split())
start = int(input())
graph = [[] for _ in range(N+1)]
distance = [INF]*(N+1)

for _ in range(M):
    a,b,c = map(int, input().split())
    graph[a].append((b,c))
    
    
def dijkstra(start):
    q = []
    # 시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
    heapq.heappush(q,(0,start))
    distance[start] = 0
    while q:
        # 최단 거리가 가장 짧은 노드에 대한 정보 꺼내기
        dist, now = heapq.heappop(q)
        # 현재 노드가 이미 처리된 적이 있다면 무시
        if distance[now] < dist:
            continue
            
        # 현재 노드와 인접한 다른 노드들을 확인
        for i in graph[now]:
            cost = dist+i[1]
            # 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
            if cost<distance[i[0]]:
                distance[i[0]] = cost
                heapq.heappush(q, (cost, i[0]))
                
dijkstra(start)

for i in range(1,N+1):
    if distance[i]==INF:
        print('INFINITY')
    else:
        print(distance[i])

6 11
1
1 2 2
1 3 5
1 4 1
2 3 3
2 4 2
3 2 3
3 6 5
4 3 3
4 5 1
5 3 1
5 6 2
0
2
3
1
2
4


## 플로이드 워셜 알고리즘

- 모든 지점에서 다른 모든 지점까지의 최단 경로를 모두 구해야 하는 경우에 사용
- 2차원 리스트에 '최단 거리' 정보를 저장하여 사용
    - 모든 노드에 대하여 다른 모든 노드로 가는 최단 거리 정보를 담아야 하기 때문
- 각 단계에서는 해당 노드를 거쳐 가는 경우를 고려한다
- 현재 노드 제외 N-1 노드 중에서 서로 다른 노드 (A, B)쌍을 선택
- 점화식
$$D_{ab} = min(D_{ab}, D_{ak}+D_{kb})$$
    - A에서 B로 가는 최소 비용과 A에서 K를 거쳐 B로 가는 비용을 비교

In [5]:
INF = int(1e9)

N = int(input())
M = int(input())
# 2차원 리스트를 만들고, 모든 값을 무한으로 초기화
graph = [[INF]*(N+1) for _ in range(N+1)]

# 자기 자신에서 자기 자신으로 가는 비용은 0으로 초기화
for a in range(1,N+1):
    for b in range(1,N+1):
        if a==b:
            graph[a][b]=0
            
# 각 간선에 대한 정보를 입력받아, 그 값으로 초기화
for _ in range(M):
    # a에서 b로 가는 비용을 c로 설정
    a,b,c = map(int, input().split())
    graph[a][b]=c
    
for k in range(1,N+1):
    for a in range(1,N+1):
        for b in range(1,N+1):
            # a==b 일 때는 min(0, graph[a][k]+graph[k][b])이므로 0을 min으로 출력
            graph[a][b] = min(graph[a][b], graph[a][k]+graph[k][b])
            
            
# 결과 출력
for a in range(1,N+1):
    for b in range(1, N+1):
        if graph[a][b]==INF:
            print('INFINITY')
            
        else:
            print(graph[a][b], end=' ')
    print()

4
7
1 2 4
1 4 6
2 1 3
2 3 7
3 1 5
3 4 4
4 3 2
0 4 8 6 
3 0 7 9 
5 9 0 4 
7 11 2 0 


## 실전문제

### 미래 도시

- 1~N 까지의 회사 존재
- 특정 회사끼리는 도로를 통해 연결됨
- A는 1번 회사에 위치해 있다
- X번 회사에 방문할 예정
- K번 회사에서 소개팅 예정
    - 1 -> K -> X 회사
- 연결된 회사는 양방향으로 이동이 가능
- 최소 이동 시간을 구하라
    - X회사에 만일 도달할 수 없다면 -1 출력

In [53]:
# 다익스트라 알고리즘
import heapq

N, M = map(int, input().split())
graph = [[] for _ in range(N+1)]

for _ in range(M):
    # a와 b가 양방향으로 이동이 가능하며 cost가 1로 전부 동일
    a,b = map(int,input().split())
    graph[a].append((b,1))
    graph[b].append((a,1))

X, K = map(int, input().split())

4 2
1 3
2 4
3 4


In [55]:
INF = int(1e9)
start = 1
# X 제외한 최단거리 기록용 리스트 (1 -> K)
distance_X = [INF]*(N+1)
# X 포함한 최단거리 기록용 리스트 (K -> X)
distance = [INF]*(N+1)

def dijkstra(start,K,X):
    # X회사를 제외하고 K에 도달할 최단 거리 계산
    q_X = []
    heapq.heappush(q_X, (0,start))
    distance_X[start]=0
    
    # X노드의 경우 INF로 제외 (index 문제로 pop을 하지 않음)
    graph_X = graph.copy()
    graph_X[X] = INF
    
    # X 회사를 제외하고 다익스트라 알고리즘 수행
    while q_X:
        dist, now = heapq.heappop(q_X)
        
        # 최단거리가 아니면 무시
        if distance_X[now] < dist:
            continue
        
        # X회사를 제거했으므로 현재노드가 X이면 무시
        if now == X:
            continue
        
        # 최단거리 계산
        for i in graph_X[now]:
            cost = dist+i[1]
            if cost<distance_X[i[0]]:
                distance_X[i[0]] = cost
                heapq.heappush(q_X, (cost, i[0]))
    
    # X 회사 포함, start = K 회사
    q = []
    heapq.heappush(q, (0,K))
    distance[K]=0
    while q:
        dist,now = heapq.heappop(q)
        if distance[now] < dist:
            continue
        
        for i in graph[now]:
            cost = dist+i[1]
            if cost < distance[i[0]]:
                distance[i[0]]=cost
                heapq.heappush(q, (cost, i[0]))
    
    # 1에서 K로 가는 최단 거리 + K에서 X로 가는 최단 거리
    result = distance_X[K] + distance[X]
    return result

result = dijkstra(1,K,X)
# X 회사에 도달할 수 없는 경우 -1 출력
if result >= INF:
    print(-1)
else:
    print(result)

-1


In [52]:
#### 플로이드 워셜 알고리즘
INF = int(1e9)
N, M = map(int, input().split())
graph = [[INF]*(N+1) for _ in range(N+1)]

for a in range(1,N+1):
    for b in range(1,N+1):
        if a==b:
            graph[a][b]=0

for _ in range(M):
    a,b = map(int, input().split())
    graph[a][b]=1
    graph[b][a]=1
    
X, K = map(int, input().split())
    
for k in range(1,N+1):    
    for a in range(1,N+1):
        for b in range(1,N+1):
            graph[a][b] = min(graph[a][b], graph[a][k]+graph[k][b])
        
distance = graph[1][K] + graph[K][X]

if distance >= INF:
    print(-1)
else:
    print(distance)

4 2
1 3
2 4
3 4
-1


### 전보

- N개의 도시
- 도시 C에서 보낸 메세지에서 받게 되는 도시의 개수?
- 도시들이 모두 메세지를 받는 데까지 걸린 시간?

In [56]:
import heapq

INF = int(1e9)
N, M, C = map(int, input().split())
graph = [[] for _ in range(N+1)]
distance = [INF]*(N+1)

for _ in range(M):
    x,y,z = map(int, input().split())
    graph[x].append((y,z))

3 2 1
1 2 4
1 3 2


In [64]:
def dijkstra(start):
    q = []
    heapq.heappush(q, (0,start))
    distance[start]=0
    
    while q:
        dist, now = heapq.heappop(q)
        
        if distance[now]<dist:
            continue
        
        for i in graph[now]:
            cost = dist+i[1]
            if cost<distance[i[0]]:
                distance[i[0]]=cost
                heapq.heappush(q, (cost,i[0]))
                
dijkstra(C)
print(distance)
# INF이 아닌 노드와 시작 노드 제외하고 도달할 수 있는 노드 개수, INF 제외 최대로 걸리는 시간
result = [len(list(filter(lambda x: x!=INF and x!=0, distance))), max(list(filter(lambda x: x!=INF, distance)))]
print(*result)

[1000000000, 0, 4, 2]
2 4


In [65]:
# 답안
import heapq

INF = int(1e9)
N, M, C = map(int, input().split())
graph = [[] for _ in range(N+1)]
distance = [INF]*(N+1)

for _ in range(M):
    x,y,z = map(int, input().split())
    graph[x].append((y,z))
    
def dijkstra(start):
    q = []
    heapq.heappush(q, (0,start))
    distance[start]=0
    
    while q:
        dist, now = heapq.heappop(q)
        if distance[now]< dist:
            continue
        for i in graph[now]:
            cost = dist+i[1]
            if cost<distance[i[0]]:
                distance[i[0]]=cost
                heapq.heappush(q, (cost,i[0]))
                
dijkstra(C)

count=0
max_distance=0
for d in distance:
    if d!= INF:
        count += 1
        max_distance = max(max_distance,d)
        
print(count-1, max_distance)

3 2 1
1 2 4
1 3 2
2 4


## 빗물 (백준 14719)

In [81]:
H, W = map(int, input().split())
heights = list(map(int, input().split()))

4 8
3 1 2 2 1 1 1 3


In [84]:
heights

[3, 1, 2, 2, 1, 1, 1, 3]

In [83]:
start = 0
end = 1
result = 0   # 빗물 count

while True:
    print(f'start: {start}, end: {end}, result: {result}')
    if end == W-1:
        min_height = min(heights[start], heights[end])
        result += min_height * (end-start-1) - sum(heights[start+1:end])
        break
        
    if (end+1<W) and (heights[start]-heights[end] <= 0 or heights[end]>heights[end+1]):
        min_height = min(heights[start], heights[end])
        result += min_height * (end-start-1) - sum(heights[start+1:end])
        start = end
    
    end += 1

print(result)
# 반례 : [3,1,2,2,1,1,1,3]

start: 0, end: 1, result: 0
start: 0, end: 2, result: 0
start: 0, end: 3, result: 0
start: 3, end: 4, result: 1
start: 3, end: 5, result: 1
start: 3, end: 6, result: 1
start: 3, end: 7, result: 1
4


In [42]:
# 답안
result = 0
for i in range(1,W-1):
    left_max = max(heights[:i])
    right_max = max(heights[i+1:])
    
    lower_one = min(left_max, right_max)
    
    if heights[i] < lower_one:
        result += lower_one - heights[i]
        
print(result)

5
