# <span style = 'color: black; background-color: #dcffe4'> Sec.5 자료구조 (스택, 큐, 해쉬, 힙) </span>
--- 

# <span style = 'color: black; background-color: #ffdce0'> 스택과 큐 </span> 
### 스택 
* LIFO : Last in First out (후입선출) 
* 쌓아둔 접시, 마지막에 쌓은 접시가 맨 위에, 마지막에 쌓은 접시를 먼저 꺼내게 됨  
* 2가지 주요 연산 
    - push( ) : 요소를 컬렉션에 추가 
    - pop( ) : 가장 최근에 삽입된 요소 제거 

### 큐 
* FIFO : First in First out (선입선출) 
* 맛집에 입장하기 위해 선 줄, 가장 먼저 줄을 선 사람이 먼저 입장 
* 시퀀스의 한 쪽 끝에는 엔티티를 추가하고, 반대쪽 끝에는 제거할 수 있는 엔티티 컬렉션 

### 특징 
* 파이썬은 스택 자료형을 별도로 제공하진 않음 
* 리스트가 스택/큐 연산을 모두 지원함 
* 다만 리스트는 큐 연산을 수행하기에 비효율적이므로 데크(deque) 자료형을 사용하면 더 좋은 성능 
---

### 스택 문제 예시 
#### 1) 괄호 매칭 판별

In [63]:
def bracket_check(s: str) -> bool: 
    stack = [] 

    # 괄호 짝 딕셔너리 
    table = {
        ')': '(', 
        '}': '{', 
        ']': '[', 
        }

    for char in s: 
        # 열린 괄호를 찾으면 스택에 push 
        if char not in table:
            stack.append(char) 

        # 닫힌 괄호를 찾았는데, 
        # 스택이 비어있거나 괄호의 짝이 맞지 않으면 
        elif not stack or table[char] != stack.pop(): 
            return False 

    return len(stack) == 0  

In [66]:
bracket_check('()()[]{}' )

True

#### 2) 괄호 유효 판별 

In [74]:
def bracket_check2(s: str): 
    stack = [] 

    for idx, letter in enumerate(s): 

        if letter == '(': 
            stack.append(letter) 
        
        elif letter == ')': 
            if stack:           # 유효한 괄호 (짝 맞음) 
                stack.pop() 
            
            else:               # 유효하지 않은 괄호 (짝 안 맞음) 
                stack.append(letter)  # 인덱스도 같이 출력 
                stack.append(idx) 
                return stack 
    
    return stack 

string = '2.4 + )(3.141592 * .21)' 

print(len(string)) 
print(bracket_check2( string )) 

23
[')', 6]


# <span style = 'color: black; background-color: #ffdce0'> 1. 가장 큰 수 *** </span>
--- 

In [None]:

# 가장 큰 수 (스택) ***

import sys 
sys.stdin = open('/Users/kimmh/Desktop/Algorithm/Sec5/1. 가장 큰 수/in5.txt', 'rt') 

#--------------------------------------------------------------------------------# 
# 1. 주어진 숫자의 자릿수들 중 m개의 숫자를 제거하여 가장 큰 수를 만들고자 
# 2. 숫자의 순서는 유지  
# ex) 5276823 3 >> 7823 
# 
# 입력) 숫자와 제거해야 할 자릿수 (m) 
# 출력) 가장 큰 수 
#--------------------------------------------------------------------------------# 

N, m = map(int, input().split()) 

num = list(map(int, str(N))) 

# print(num, m) 

stack = [] 


# 자릿수 순서대로 비교해가며 stack에 추가 
# 큰 수가 등장할 경우 last in 요소들 pop 

for i in num: 
    # 숫자 제거 가능하다면 다 제거 
    # while stack은 필요한가? >> YES (반복문 시작할 때) 
    while stack and m > 0 and stack[-1] < i:
        stack.pop() 
        m -= 1 
    stack.append(i) 

# 다 지우지 못한 경우 (m이 0이 아님) 
if m != 0: 
    stack = stack[ : -m] 

for i in stack: 
    print(i, end='') 


'''
'구분자'.join( 리스트 ) : 문자열 합치기 

result = ''.join( map(str, stack) ) 
print(result) 
'''


# <span style = 'color: black; background-color: #ffdce0'> 2. 쇠막대기 ***** </span>
--- 

In [None]:

# 쇠막대기 (스택) ***** 문제 이해가 어려움 

import sys 
sys.stdin = open('/Users/kimmh/Desktop/Algorithm/Sec5/2. 쇠막대기/in1.txt', 'rt') 

#--------------------------------------------------------------------------------# 
# 1. 여러개의 쇠막대기를 레이저로 절단하고자 
# 2. 쇠막대기를 아래에서 위로 쌓아놓고, 레이저를 위에서 수직으로 발사 
# 
# 3. 쇠막대기는 자신보다 긴 쇠막대 위에만 놓일 수 있으며, 끝점은 겹치지 않도록 놓는다. 
# 4. 각 쇠막대기를 자르는 레이저는 적어도 한 개 
# 5. 레이저는 쇠막대기의 양 끝점과 겹치지 않음 
# 6. 레이저는 '()' 으로 표현됨 
# 7. 쇠막대기 왼쪽 끝은 '(' and 오른쪽 끝은 ')' 
# 
# 8. 잘려진 쇠막대기 조각의 총 개수 출력 
# 
# 입력) 쇠막대기와 레이저의 배치를 표현하는 괄호 (최대 길이 100,000) 
# 출력) 조각 개수 
#--------------------------------------------------------------------------------# 

bracket = input() 

stack = [] 
cnt = 0 

# ( ) ( ( ( ( ) ( ) ) ( ( ) ) ( ) ) ) ( ( ) ) 
# 0 0 0 0 0 0 3 0 3 1 0 0 3 1 0 2 1 1 0 0 1 1  : cnt   (해당 시점에 쪼개진 막대 개수) 
# + - + + + + - + - - + + - - + - - - + + - -  : stack (겹쳐진 막대 개수) 
# 1 0 1 2 3 4 3 4 3 2 3 4 3 2 3 2 1 0 1 2 1 0 

# '(' : cnt엔 아무런 변화 없이 쌓아놓음 (막대이거나 레이저이거나) 
# ')' : cnt에 변화가 생김 
#       1) 레이저 : 쌓여있는 막대 개수만큼 추가 
#       2) 막대 끝점 : 한 개 추가 (막대 하나 끝) 

for i in range(len(bracket)): 

    if bracket[i] == '(': 
        stack.append( bracket[i] ) 

    elif bracket[i] == ')':         # else: 
        stack.pop() 

        if bracket[i-1] == '(':     # 레이저 지점이라면, 
            cnt += len(stack)       # 쌓인 막대만큼 추가 
        
        elif bracket[i-1] == ')':   # 한 막대의 끝점이라면, 
            cnt += 1                # 1개 추가 

print(cnt) 


# <span style = 'color: black; background-color: #ffdce0'> 3. 후위표기식 만들기 (Infix to Postfix) ******* </span> 
--- 
* [후위표기법 구현 및 계산](https://velog.io/@jin0106/Python-%ED%9B%84%EC%9C%84%ED%91%9C%EA%B8%B0%EB%B2%95-%EB%B0%8F-%EA%B3%84%EC%82%B0%EB%B2%95)  
* [문제와 유사한 코드](https://velog.io/@jiffydev/algo-34)

In [None]:

# 후위표기식 만들기 ******* 후위표기법 자체가 헷갈림 + 문제도 개어려움 (사칙연산 우선순위 이용) 

import sys 
sys.stdin = open('/Users/kimmh/Desktop/Algorithm/Sec5/3. 후위표기식 만들기/in5.txt', 'rt') 

#--------------------------------------------------------------------------------# 
# 1. 중위표기식 입력 > 후위표기식으로 변환 
# 2. 중위표기식 : 연산자가 피연산자 사이에 존재 (3 + 5) 
# 3. 후위표기식 : 연산자가 피연산자 뒤에 있는 표기식 (3 5 +) 
#
# ex1) 3 + 5 * 2    =  3 5 2 * + 
# ex2) (3 + 5) * 2  =  3 5 + 2 * 
# ex3) 3 + 5 * 2 / (7 - 2) =  3 5 2 * 7 2 - / + 
# ex4) 3 * (5 + 2) - 9     =  3 5 2 + * 9 - 
# 
# 입력) 중위표기식 (길이 100 이하) 
# 출력) 후위표기식 
#--------------------------------------------------------------------------------# 

# 괄호가 필요없음 
# 인간과 달리 컴퓨터는 내부에서 원래 스택을 활용해 중위표기법을 후위표기법으로 반환하여 연산을 한다고 한다. 
# 이 과정에서 괄호표기가 없는 후위표기법을 이용하는것이 중위표기법 보다 속도가 빠르다고 한다. 
#  ( https://velog.io/@jin0106/Python-%ED%9B%84%EC%9C%84%ED%91%9C%EA%B8%B0%EB%B2%95-%EB%B0%8F-%EA%B3%84%EC%82%B0%EB%B2%95 ) 


# 숫자 2개 나오면 바로 뒤의 연산 수행 
# 3 5 2 * 7 2 - / +  ==  3 10 5 / +  ==  3 2 +  ==  5 

# 후위표기와 스택: 연산자의 우선순위에 따라 스택에 연산자를 push/pop한다. 

# ( : 나오면 바로 스택에 push한다.
# ) : 우선순위가 가장 높은 괄호연산자가 끝난다는 뜻이므로, 괄호 안에 남아있는 연산자를 전부 pop하고 ( 도 pop해줌. ) 는 처음부터 스택에 넣지 않는다.
# * / : 스택에 * / 가 있다면 그것들을 먼저 없어질 때까지 pop해주고 끝나면 push한다. (+, -은 우선순위가 낮으므로 pop안함) 
# + - : 스택에 다른 사칙연산자가 있다면 그것들을 먼저 없어질 때까지 (괄호연산자 직전가지)pop해주고 끝나면 push한다. 


### ex3) 3 + 5 * 2 / (7 - 2)  =  3 5 2 * 7 2 - / + 

# 3 : result에 붙임 
# + : stack에 push                          result = '3' ,  stack = [+] 
# 5 : result에 붙임                          result = '35' ,  stack = [+] 
# * : stack에 push                          result = '35' ,  stack = [+, *] 
# 2 : result에 붙임                          result = '352' ,  stack = [+, *] 
# / : 일단 stack의 마지막이 * / 인지 확인 
#     * 이므로 pop하여 result에 붙임            result = '352*' ,  stack = [+, /] 
# ( : stack에 push                          result = '352*' ,  stack = [+, /, (] 
# 7 : result에 붙임                          result = '352*7' ,  stack = [+, /, (] 
# - : stack에 push                          result = '352*7' ,  stack = [+, /, (, -] 
# 2 : result에 붙임                          result = '352*72' ,  stack = [+, /, (, -] 
# ) : ( 아니라면 계속 stack에서 pop하여 result에 붙임 
#     반복문 종료하고 ( 도 pop                  result = '352*72-' ,  stack = [+, /] 

# stack 빌 때까지 stack에서 pop하여 result에 붙임 



### ex4) 3 * (5 + 2) - 9  =  3 5 2 + * 9 - 

# 3 : result에 붙임 
# * : stack에 push                          result = '3' ,  stack = [*] 
# ( : stack에 push                          result = '3' ,  stack = [*, (] 
# 5 : result에 붙임                          result = '35' ,  stack = [*, (] 
# + : stack에 push                          result = '35' ,  stack = [*, (, +] 
# 2 : result에 붙임                          result = '352' ,  stack = [*, (, +] 
# ) : ( 아니라면 계속 stack에서 pop하여 result에 붙임  
#     반복문 종료하고 ( 도 pop                  result = '352+' ,  stack = [*] 
# - : ( 아니라면 계속 stack에서 pop하여 result에 붙임  
#     반복문 종료하고 stack에 push              result = '352+*' ,  stack = [-] 
# 9 : result에 붙임                          result = '352+*9' ,  stack = [-] 

# stack 빌 때까지 stack에서 pop하여 result에 붙임 


infix = input() 

result = '' 

stack = [] 

for i in infix: 

    if i.isdecimal(): 
        result += i 
    
    else: 

        if i == '(': 
            stack.append(i) 
        
        elif i == ')': 
            while stack and stack[-1] != '(': 
                result += stack.pop() 
            stack.pop() 
        
        elif i == '*' or i == '/': 
            while stack and (stack[-1]=='*' or stack[-1]=='/'): 
                result += stack.pop() 
            stack.append(i) 
        
        elif i == '+' or i == '-': 
            while stack and stack[-1] != '(': 
                result += stack.pop() 
            stack.append(i) 

while stack: 
    result += stack.pop() 

print(result) 



# <span style = 'color: black; background-color: #ffdce0'> 4. 후위식 연산 (Postfix) </span> 
--- 

In [None]:

# 후위표기식 연산 *** 후위표기법 이해하면 쉬움 

import sys 
sys.stdin = open('/Users/kimmh/Desktop/Algorithm/Sec5/4. 후위식 연산/in5.txt', 'rt') 

#--------------------------------------------------------------------------------# 
# 1. 후위표기식 입력 > 연산 결과 출력 
# 2. 중위표기식 : 연산자가 피연산자 사이에 존재 (3 + 5) 
# 3. 후위표기식 : 연산자가 피연산자 뒤에 있는 표기식 (3 5 +) 
#
# ex1) 3 5 2 + * 9 -  ==  21 
# 
# 입력) 중위표기식 (길이 100 이하) 
# 출력) 후위표기식 
#--------------------------------------------------------------------------------# 

# 숫자 2개 나오면 바로 뒤의 연산 수행 
# 3 5 2 * 7 2 - / +  ==  3 10 5 / +  ==  3 2 +  ==  5 

# 후위표기와 스택: 연산자의 우선순위에 따라 스택에 연산자를 push/pop한다. 


# ex1) 3 5 2 * 7 2 - / + 

# 3 : stack에 push      stack = [3] 
# 5 : stack에 push      stack = [3, 5] 
# 2 : stack에 push      stack = [3, 5, 2] 
# * : stack 마지막 2개 pop하여 연산 후 stack에 push     stack = [3, 10] 
# 7 : stack에 push      stack = [3, 10, 7] 
# 2 : stack에 push      stack = [3, 10, 7, 2] 
# - : stack 마지막 2개 pop하여 연산 후 stack에 push     stack = [3, 10, 5] 
# / : stack 마지막 2개 pop하여 연산 후 stack에 push     stack = [3, 2]   (나눗셈 순서 유의) 
# + : stack 마지막 2개 pop하여 연산 후 stack에 push     stack = [5] 

post_fix = input() 

stack = [] 

for i in post_fix: 

    if i.isdecimal(): 
        stack.append(int(i)) 

    else: 
        if i == '+': 
            n2 = stack.pop() 
            n1 = stack.pop() 

            stack.append(n1 + n2) 
        
        elif i == '-': 
            n2 = stack.pop() 
            n1 = stack.pop() 

            stack.append(n1 - n2) 
        
        elif i == '*': 
            n2 = stack.pop() 
            n1 = stack.pop() 

            stack.append(n1 * n2) 
        
        elif i == '/': 
            n2 = stack.pop() 
            n1 = stack.pop() 

            stack.append(n1 / n2) 

print(stack[0]) 


# <span style = 'color: black; background-color: #ffdce0'> 5. 공주구하기 (큐) *** </span>
--- 

In [None]:

# 공주구하기 (큐) *** (큐의 기본개념 문제) 

import sys 
sys.stdin = open('/Users/kimmh/Desktop/Algorithm/Sec5/5. 공주구하기/in5.txt', 'rt') 

#--------------------------------------------------------------------------------# 
# 1. 공주를 구하러 갈 왕자 선정 
# 2. 왕자들 나이순으로 1 ~ N번까지 번호 
# 3. 시계방향으로 동그랗게 앉음 
# 4. K를 외치게 되는 왕자 제외하고 원 밖으로 나옴 
# 5. 다음 왕자부터 다시 1부터 시작, K 외치면 제외 
#
# ex1) N=8, K=3 
#      1, 2, 3 > 3번 제외  > 1, 2 뒤에 붙임 [4 5 6 7 8 1 2]
#      4, 5, 6 > 6번 제외  > 4, 5 뒤에 붙임 [7 8 1 2 4 5]
#      7, 8, 1 > 1번 제외  > 7, 8 뒤에 붙임 [2 4 5 7 8] 
#      2, 4, 5 > 5번 제외  > 2, 4 뒤에 붙임 [7 8 2 4] 
#      7, 8, 2 > 2번 제외  > 7, 8 뒤에 붙임 [4 7 8] 
#      4, 7, 8 > 8번 제외  > 4, 7 뒤에 붙임 [4 7] 
#      4, 7, 4 > 4번 제외  > 7 뒤에 붙임 
#      len( ) == 1 >> print 
# 
# 입력) N, K  (N은 5 이상 1000 이하) (K는 2 이상 9 이하) 
# 출력) 마지막 남은 왕자의 번호 
#--------------------------------------------------------------------------------# 

# FIFO : First in First out 

# K - 1 번은 popleft 하여 뒤로 append 
# 마지막 K번째는 그냥 popleft 

from collections import deque  # Double Ended Queue 

N, K = map(int, input().split()) 

que = list(range(1, N+1)) 

que = deque(que) 


while que: 

    for _ in range(K-1): 
        tmp = que.popleft() 
        que.append(tmp) 
    
    que.popleft() 

    if len(que) == 1: 
        print( que[0] ) 
        break 


# <span style = 'color: black; background-color: #ffdce0'> 6. 응급실 **** </span>
--- 

In [None]:

# 응급실 (큐) 

import sys 
sys.stdin = open('/Users/kimmh/Desktop/Algorithm/Sec5/6. 응급실/in5.txt', 'rt') 

#--------------------------------------------------------------------------------# 
# 1. 응급실은 환자가 도착한 순서대로 진료 / 위험도 높은 환자는 빨리 응급조치 
# 2. 접수 순서대로의 환자 목록 (N) 중에서 제일 앞에 있는 차트 꺼냄 
# 3. 나머지 환자 중 위험도가 더 높은 환자가 존재하면 맨 뒤로 다시 넣음 
# 4. 그렇지 않은 경우 진료 
# 5. 대기목록 상 M번째 환자는 몇번째로 진료 받는지 출력  (M은 0부터 N-1) 
# 
# 입력1) N, M  (N은 5 이상 100 이하) (M은 0 이상 N 미만) 
# 입력2) N명의 위험도  (50 이상 100 이하) (같은 값 존재 가능) 
# 출력) M번째 환자의 진료 순서 
#--------------------------------------------------------------------------------# 

# FIFO : First in First out 

from collections import deque 

# ex1) 70 
# 60 50 70 80 90  
# 50 70 80 90 60 
# 70 80 90 60 50 
# 80 90 60 50 70 
# 90 60 50 70 80   90 진료 (popleft) 
# 60 50 70 80 
# 50 70 80 60 
# 70 80 60 50 
# 80 60 50 70      80 진료 
# 60 50 70 
# 50 70 60 
# 70 60 50         70 진료  >>> 3번째로 진료받음 

# if tmp < max(que) : 틀린 건 아니지만 연산이 무조건 N번 돌아감 
# if any (tmp < q for q in Q) : 연산이 N 이하 

# ex2) 60_0 
# 60_0 60_1 90 60_2 60_3 60_4   >> 2번 popleft하여 append 
# 90 60_2 60_3 60_4 60_0 60_1   >>  90 진료 (popleft) (+ count) 
# 60_2 60_3 60_4 60_0 60_1      >>> 5번째로 진료받음 


##### 같은 위험도 존재할 수 있기 때문에 인덱스도 같이 저장해야 함 (큐 요소를 튜플로)   (idx, val) in enumerate( ) 

N, M = map(int, input().split()) 

danger = list( map(int, input().split()) ) 

que = [ (idx, val) for idx, val in enumerate(danger) ] 

que = deque(que) 

cnt = 0 


while True: 

    tmp = que.popleft()     # First out 

    if any (tmp[1] < q[1] for q in que): 
        que.append(tmp) 
    
    else:                   # 진료 
        cnt += 1 

        if tmp[0] == M:     # 처음 목록에서 M번째 환자라면 
            print(cnt)      # 몇번째로 진료받는지 출력 
            break 


# <span style = 'color: black; background-color: #ffdce0'> 7. 교육과정 설계 ***** </span>
--- 

In [None]:

# 교육과정 설계 (큐) ***** (경우의 수 생각 잘 해야 함) 

import sys 
sys.stdin = open('/Users/kimmh/Desktop/Algorithm/Sec5/7. 교육과정 설계/in5.txt', 'rt') 

#--------------------------------------------------------------------------------# 
# 1. 1년 과정의 수업계획 작성 
# 2. 필수과목 : 반드시 이수해야 하며 순서도 정해져 있음 
# 3. 수업계획은 순서대로 앞에 수업이 이수되면 다음 수업을 시작하는 것으로 해석 
# 4. 같은 과목을 여러번 이수해도 됨 
# 5. 수업설계가 옳은 경우 'YES', 잘못된 경우 'NO' 출력 
# 
# 입력1) 필수과목의 순서 
# 입력2) N (1 이상 10 이하) 
# 입력3) N개의 수업설계 (각 줄마다) (길이 30 이하) 
# 출력) 'YES' / 'NO' 
#--------------------------------------------------------------------------------# 

# FIFO : First in First out 

# ex1-2) 
# CBA  :  FGCDAB  >> 'NO' 
# F : not in must 
# G : not in must 
# C : == must.popleft() 
# D : not in must 
# A : != must.popleft()  >>> break and print('NO') 

# ex2) 
# AFC  :  AFFDCCFF  >> 'YES' 
# A : == must.popleft() 
# F : == must.popleft() 
# F : not in must 
# D : not in must 
# C : == must.popleft() 
# len(must) == 0 >>> print('YES') 

from collections import deque 

must = input()

N = int(input()) 

for i in range(N): 

    plan = input() 
    must_tmp = deque(must) 

    for lecture in plan: 
        if lecture in must_tmp: 

            # 필수과목 순서가 틀린 경우 
            if lecture != must_tmp.popleft(): 
                print('#%d NO' % (i+1)) 
                break 
                
            # else:  필수과목 순서가 올바른 경우 
            # 아무것도 안함 (popleft 했으므로) 

            # 필수과목 모두 순서대로 이수한 경우 
            if len(must_tmp) == 0: 
                print('#%d YES' % (i+1)) 
                break 
    
    # 필수과목 순서가 맞았지만, 
    else: 
        # 이수하지 않은 필수과목 존재 
        if len(must_tmp) != 0: 
            print('#%d NO' % (i+1)) 


# <span style = 'color: black; background-color: #ffdce0'> 해시 </span> 
* 11장 (p.279~) 

### 해시 테이블 
 : 키를 값에 매핑할 수 있는 구조 (연관 배열 추상 자료형)  
대부분의 연산의 시간복잡도가 O(1) 

### 해시 함수 
 : 임의 크기 데이터를 고정 크기 값으로 매핑하는데 사용할 수 있는 함수를 지칭  
* 해시 테이블을 인덱싱하기 위해 해시 함수를 사용하는 것을 해싱 (Hashing) 이라 한다. 
* 해시 함수는 값 충돌을 최소화할 때 빛을 발한다. 


생각보다 값 충돌은 쉽게 일어남  
**Ex) 생일 문제**  
23명만 있어도 생일이 같은 2명이 존재할 확률이 50%를 넘어감 

In [3]:
import random 

trials = 100000         # 10만번 실험 
same_birthdays = 0      # 생일이 같은 실험의 수 

for _ in range(trials): 

    birthdays = [] 

    # 23명 모였을 때, 생일이 같을 경우 same_birthdays += 1
    for i in range(23): 
        bd = random.randint(1, 365) 

        if bd in birthdays: 
            same_birthdays += 1 
            break 

        birthdays.append(bd) 

# 10만번 중 생일이 같은 실험의 비율 (확률) 
print( f'{same_birthdays / trials * 100}%' ) 

50.731%


### 로드 팩터 
 : 해시 테이블에 저장된 데이터 개수 n을 버킷의 개수 k로 나눈 것 $\frac {n} {k}$  
 * 이 비율에 따라 해시 함수를 재작성하거나 해시 테이블 크기를 조정할지 결정  
 * 해시 함수가 키들을 잘 분산해 주는지 설명하는 효율성  

### 충돌에 대한 해시 테이블 구현 방식 
크게 "체이닝" 방식과 "오픈 어드레싱" 방식이 있음  
파이썬은 오픈 어드레싱 (선형 탐사방식) 
* 파이썬의 **딕셔너리 자료형은 해시 테이블로 구현되어 있음** 

# <span style = 'color: black; background-color: #ffdce0'> 8. 단어 찾기 (해쉬) *** </span>
--- 


In [None]:

# 단어찾기 (해쉬) *** (해시 개념문제)

import sys 
sys.stdin = open('/Users/kimmh/Desktop/Algorithm/Sec5/8. 단어찾기/in5.txt', 'rt') 

#--------------------------------------------------------------------------------# 
# 1. 시를 쓰기 전에 쓰일 단어를 미리 노트에 적어둠 
# 2. N개의 단어들 중 시에 쓰지 않은 단어 하나를 찾는 프로그램 작성 
# 
# 입력1) N (3 이상 100 이하) 
# 입력2) 노트에 적어둔 N개의 단어 (N줄에 걸쳐) 
# 입력3) 시에 쓰인 N-1개의 단어 (N-1줄에 걸쳐) 
# 출력) 시에 쓰지 않은 1개 단어 
#--------------------------------------------------------------------------------# 

N = int(input()) 

note = {} 

for _ in range(N): 
    tmp = input() 
    note[tmp] = 1 

for _ in range(N-1): 
    word_used = input() 
    note[word_used] = 0 


# items: 키-값 쌍을 모두 가져옴   (리스트 안의 튜플 형태로) 
# keys: 키를 모두 가져옴         (리스트 형태) 
# values: 값을 모두 가져옴       (리스트 형태) 

# print(note.items()) 

for key, val in note.items(): 
    if val == 1: 
        print(key) 
        break 


# <span style = 'color: black; background-color: #ffdce0'> 9. 아나그램 (구글) ***** </span>
--- 

In [None]:

# 아나그램 (구글) ***** 

import sys 
sys.stdin = open('/Users/kimmh/Desktop/Algorithm/Sec5/9. 아나그램(구글)/in4.txt', 'rt') 

#--------------------------------------------------------------------------------# 
# 1. 아나그램 (Anagram) : 알파벳 나열 순서는 달라도 구성이 일치하면 두 단어는 아나그램 
# 2. 알파벳과 그 개수가 모두 일치하는 경우 
# 3. 길이가 같은 두 단어가 주어지면 아나그램인지 판별하는 프로그램 작성 
# 
# 입력1) 첫번째 단어 
# 입력2) 두번째 단어 
# 출력) 'YES' / 'NO' 
#--------------------------------------------------------------------------------# 

word1 = input() 
word2 = input() 

anagram = {} 

for i in word1: 
    # 새로운 단어 > count 
    if i not in anagram: 
        anagram[i] = 1 
    # 중복된 단어 > count 
    else: 
        anagram[i] += 1     # 결국 val들은 각 첨자의 등장 횟수를 나타냄 

for j in word2: 
    if j in word1:          # 등장 횟수 일치하는지 판별하기 위해 역으로 count 
        anagram[j] -= 1


### 아나그램 해시 테이블의 값들만 뽑음 
check = anagram.values() 

for k in check: 
    # 구성이 하나라도 다른게 나오면 'NO' 
    if k != 0: 
        print('NO') 
        break 
# 구성이 다 같으면 (모두 0) 'YES' 
else: 
    print('YES') 


**anagram.get( key, 기본값 )**  
* 딕셔너리에 key가 있을 경우 그 값을 반환하지만, 
* 해당 key가 없을 경우 기본값을 반환 


In [None]:
### 소스코드 : get( ) 활용 

word1 = input() 
word2 = input() 

anagram = {} 

for i in word1: 
    anagram[i] = anagram.get(i, 0) + 1 

for j in word2: 
    anagram[j] = anagram.get(j, 0) - 1 


for k in word1: 
    # 구성이 하나라도 다른게 나오면 'NO' 
    if anagram.get(k) > 0: 
        print('NO') 
        break 
# 구성이 다 같으면 (모두 0) 'YES' 
else: 
    print('YES') 


# <span style = 'color: black; background-color: #ffdce0'> 힙 자료구조 </span>
* 15장 (p.447~)  

트리 기반의 자료구조  
최소 힙에서는 부모가 항상 자식보다 작거나 같다  
그렇다고 정렬된 구조는 아님 (부모/자식 간의 관계만 정의)  
이진 힙 (Binary Heap) 주로 사용  
Almost Complete Tree  
우선순위 큐와 유사 

## heapq 모듈 
: 이진 트리 기반의 최소 힙 자료구조 (파이썬에는 최소 힙만 구현되어 있음, 리스트 기반)  
* 최소값은 언제나 인덱스 0, 즉 이진 트리의 루트에 위치 
* $heap[k] \leq heap[2*k+1] \quad and  \quad heap[k] \leq heap[2*k+2]$  

#### 힙에 원소 추가  
* heapq.heappush( list, x ) : 대상 리스트에 원소 x 추가 
* 자동으로 힙의 정렬 방식 (이진트리) 따름  
* O(log N) 시간 복잡도 

#### 힙에서 원소 삭제 
* heapq.heappop( list ) : 대상 리스트의 인덱스 0 삭제 후 리턴 (list는 다시 이진트리 정렬)  
* O(log N) 시간 복잡도 

#### 리스트를 힙으로 변환 
* heapq.heapify( list ) : 기존 리스트가 힙 구조에 맞게 재배치됨 
* O(N) 시간 복잡도 

### <span style = 'color: black; background-color: #ffdce0'> [응용] 최대 힙 </span>
* 튜플을 원소로 추가/삭제하면, 튜플의 맨 앞 값을 기준으로 최소 힙으로 재배치되는 원리 이용 
1) 각 값에 대한 우선순위 구하고 
2) **(우선 순위, 값)** 구조의 튜플을 힙에 추가/삭제 
3) 힙에서 값을 읽어올 때는 각 튜플에서 인덱스 1 값을 취하면 됨 

In [12]:
import heapq

nums = [4, 1, 7, 3, 8, 5]
heap = []

for num in nums:
  heapq.heappush(heap, (-num, num))   # (우선 순위, 값) 튜플 추가 

while heap:
  print(heapq.heappop(heap)[1], end=' ')       # index 1 of tuple 

8 7 5 4 3 1 

### <span style = 'color: black; background-color: #ffdce0'> [응용] K번째 최소값 / 최대값 </span>

In [7]:
import heapq

def kth_smallest(nums, k): 
  heap = []
  for num in nums:
    heapq.heappush(heap, num)

  kth_min = None
  for _ in range(k):
    kth_min = heapq.heappop(heap)
  return kth_min 



ls = [4, 1, 7, 3, 8, 5]
heapq.heapify(ls) 
print(ls)                                    # 기존 힙 구조 

print(kth_smallest([4, 1, 7, 3, 8, 5], 3))   # 3번째로 작은 값 

[1, 3, 5, 4, 8, 7]
4


In [11]:
import heapq

def kth_largest(nums, k): 
  heap = [] 
  for num in nums: 
    heapq.heappush(heap, (-num, num)) 

  kth_max = None 
  for _ in range(k): 
    kth_max = heapq.heappop(heap) 
  return kth_max[1] 



ls = [4, 1, 7, 3, 8, 5]
heap1 = [] 
for i in ls: 
  heapq.heappush(heap1, (-i, i)) 

while heap1: 
  print(heapq.heappop(heap1)[1], end=' ')     # 기존 최대 힙 구조 

print()
print(kth_largest([4, 1, 7, 3, 8, 5], 3))     # 3번째로 큰 값 

8 7 5 4 3 1 
5


### <span style = 'color: black; background-color: #ffdce0'> [응용] 힙 정렬 </span> 

In [14]:
import heapq 

def heap_sort(nums): 
    heap = [] 
    for num in nums: 
        heapq.heappush(heap, num)   # 최소 힙 구조 
    
    sorted_nums = [] 
    while heap: 
        sorted_nums.append(heapq.heappop(heap)) 
    
    return sorted_nums 

print( heap_sort([4, 1, 7, 3, 8, 5]) ) 

[1, 3, 4, 5, 7, 8]


# <span style = 'color: black; background-color: #ffdce0'> 10. 최소힙 ** </span> 
---

In [None]:

# 최소힙 (힙 개념문제) 

import sys 
sys.stdin = open('/Users/kimmh/Desktop/Algorithm/Sec5/10. 최소힙/in5.txt', 'rt') 

#--------------------------------------------------------------------------------# 
# 1. 최소힙 자료를 이용하여 다음과 같은 연산을 하는 프로그램 작성  
# 2. 자연수가 입력되면 최소힙에 입력 
# 3. 0이 입력되면 최소힙에서 최소값을 꺼내 출력 (출력할 자료 없으면 -1 출력) 
# 4. -1 입력되면 프로그램 종료 
# 
# 입력) 각 줄에 걸쳐 숫자가 입력됨 (100,000개 이하) 
# 출력) 연산 결과 
#--------------------------------------------------------------------------------# 

import heapq 

heap = [] 

while True: 
    num = int(input()) 

    if num > 0: 
        heapq.heappush( heap, num ) 
    
    elif num == 0: 
        if len(heap) == 0: 
            print(-1) 
        else: 
            print(heapq.heappop( heap )) 
    
    elif num == -1: 
        break 


# <span style = 'color: black; background-color: #ffdce0'> 11. 최대힙 *** </span> 
---

In [None]:

# 최대힙 *** 

import sys 
sys.stdin = open('/Users/kimmh/Desktop/Algorithm/Sec5/11. 최대힙/in5.txt', 'rt') 

#--------------------------------------------------------------------------------# 
# 1. 최대힙 자료를 이용하여 다음과 같은 연산을 하는 프로그램 작성  
# 2. 자연수가 입력되면 최대힙에 입력 
# 3. 0이 입력되면 최대힙에서 최대값을 꺼내 출력 (출력할 자료 없으면 -1 출력) 
# 4. -1 입력되면 프로그램 종료 
# 
# 입력) 각 줄에 걸쳐 숫자가 입력됨 (100,000개 이하) 
# 출력) 연산 결과 
#--------------------------------------------------------------------------------# 

import heapq 

heap = [] 

while True: 
    num = int(input()) 

    if num > 0: 
        heapq.heappush( heap, (-num, num) )     # (우선순위, 값) 
    
    elif num == 0: 
        if len(heap) == 0: 
            print(-1) 
        else: 
            print( heapq.heappop( heap )[1] )   # index 1 
    
    elif num == -1: 
        break 
