## Data Collections Type
파이썬 집합 데이터의 타입으로는 list, tuple, set, dictionary가 있습니다.<br>
이번 실습에서는 집합 데이터의 활용에 대해 알아보도록 하겠습니다.<br>
![파이썬 데이터 타입](01_Data_type.jpg)



### 파이썬 집합 데이터
- list: 순서가 있다. 중복을 허용한다. mutable
- tuple: 순서가 있다. 중복을 허용한다. immutable
- set: 순서가 없다. 중복을 허용하지 않는다.
- dict: key와 value 쌍으로 구성된다. 순서가 없다.

| Collection | Mutable | Ordered | Duplication | Notation | Description | Empty Collection |
| :-: |  :-: |  :-: |  :-: |  :-: |  :-: |  :-: |
| string | no | yes |  yes | [ ] | "simple string" | s = '' or s = "" |
| list | yes | yes |  yes | [ ] | [ ["item0_0", 12 ], ["item1_0", 22 ] ] | l = [] |
| tuple | no | yes |  yes | ( ) | ( ["item0_0", 12 ], ["item1_0", 22 ] ) | t = () |
| set | yes | no |  no |{ } | { 1, 2, 3, 4, 5 } | S = set() |
| dictionary | yes | no | no |{ } | { 'one' : 1, 'two' : 2, 'three' : 3 } | d = {} |

* 집합데이터와 관련해 더 궁금하신 분은 < https://docs.python.org/3/library/collections.html#collections.OrderedDict >의 ``collections 모듈``을 읽어봅니다. <br>

### 각 집합 데이터별 내장 함수
각 집합 데이터별 특징에 따라 사용하는 내장함수가 다릅니다.<br>
이를테면 dictionary같은 경우는 현재 저장되어있는 key와 value를 각각 구분하여 반환할 수 있는 keys(), values(), items() 함수가 있는 반면, 다른 데이터 타입은 없죠.<br>
또한 in 연산자도 list나 tuple에서 쓰이기는 하지만 효율적인 코드 작성을 위해서 set 자료구조에서 더 많이 쓰입니다.<br>
각각의 내장함수를 해당 실습 파일에서 나열하면 너무 복잡하고, 정리가 안된 것처럼 보이기 때문에 이는 수업시간에 필기한 내용을 참고하여 사용하시는 게 더 깔끔할 것이라 생각합니다.<br>


### 모듈(라이브러리)
모듈은 어떤 특정한 분야에서 유용한 함수 등을 만들어 다른 사람들에게 제공하는 것을 의미합니다.<br>
모듈을 활용해 코드를 작성하면 비교적 더 깔끔하고 더 빠르게 작성할 수 있기에 이를 잘 활용하는 것도 중요합니다.<br>
그러나 파이썬 기초 수업에서 모든 모듈을 다루기에는 시간과 수업 범위를 벗어나는 것이므로 실습 시간을 통해 간략하게 설명하고자 합니다.<br>

### 모듈의 사용
모듈은 다음과 같은 방식으로 불러옵니다.
```python
import 모듈이름
```
혹은 모듈 내에서 특정한 함수만 사용한다면 다음과 같이 불러올 수 있습니다.
```python
from 모듈이름 import 모듈 내의 함수 이름
```

### 모듈의 활용
모듈은 다음과 같이 사용합니다.<br>
예시를 보시죠.
```python
import math # math 모듈 불러옴
print(math.sqrt(x)) # math 모듈 내의 sqrt()함수 사용 -> 모듈이름.모듈함수
```
원래는 ``모듈이름.모듈함수``의 방식으로 사용합니다.<br>
하지만 모듈의 사용에서 두번째 예시와 같이 모듈 내의 특정 함수만 사용한다면 다음과 같이 사용할수도 있습니다.
```python
from math import sqrt() # math 모듈 내의 sqrt()함수 불러오기
print(sqrt(x)) # math 모듈 내의 sqrt()함수 사용하기
```
간혹 가다가 긴 이름의 모듈은 다음과 같이 사용하기도 합니다.
```python
import pyautogui as pag # pyautogui 모듈을 불러와서 pag라고 칭하여 사용하기
pag.scroll(100) # pyautogui 모듈의 scroll함수 사용하기
```
위의 pyautogui는 파이썬에 내장되어있는 모듈이 아니기 때문에 이를 사용하기 위해서는 설치해야할 겁니다. <br>
이를 설치하기 위해서는 간단하게 프롬프트에서 ``pip install 모듈이름``을 입력하거나, 주피터 노트북에서 ``!pip install 모듈이름``을 입력해 설치하면 됩니다.<br>
하지만 모듈을 설치하여 사용하는 것은 파이썬 기초반의 범위를 너무 벗어나기에 저희는 이를 다루지 않을 겁니다.<br>

### 모듈의 종류
자주 사용하는 모듈을 몇 가지 소개해드리겠습니다.<br>
- sys 모듈: 컴퓨터와 관련된 조작을 하기위한 모듈
- bisect 모듈: 대용량의 데이터 검색을 할 때 빠르게 할 수 있도록 도와주는 모듈
- math 모듈: 수학적인 함수/변수를 사용하기 위한 모듈
- random 모듈: 랜덤값을 구하기 위해 사용하는 모듈
- itertools 모듈: 순열과 조합을 사용하기 위해 사용하는 모듈
- time 모듈: 시간과 관련된 모듈
그 밖에도 매우 많은 모듈이 있으니 아래의 사이트를 검색하여 한번 확인해보시기 바랍니다.<br>
<https://docs.python.org/3/library/>




In [14]:
# pyautogui 모듈 설치
!pip install pyautogui

Collecting pyautogui
  Downloading PyAutoGUI-0.9.53.tar.gz (59 kB)
Collecting pymsgbox
  Using cached PyMsgBox-1.0.9-py3-none-any.whl
Collecting PyTweening>=1.0.1
  Downloading pytweening-1.0.4.tar.gz (14 kB)
Collecting pyscreeze>=0.1.21
  Downloading PyScreeze-0.1.28.tar.gz (25 kB)
  Installing build dependencies: started
  Installing build dependencies: finished with status 'done'
  Getting requirements to build wheel: started
  Getting requirements to build wheel: finished with status 'done'
    Preparing wheel metadata: started
    Preparing wheel metadata: finished with status 'done'
Collecting pygetwindow>=0.0.5
  Using cached PyGetWindow-0.0.9.tar.gz (9.7 kB)
Collecting mouseinfo
  Using cached MouseInfo-0.1.3.tar.gz (10 kB)
Collecting pyrect
  Using cached PyRect-0.1.4.tar.gz (15 kB)
Collecting pyperclip
  Using cached pyperclip-1.8.2.tar.gz (20 kB)
Building wheels for collected packages: pyautogui, pygetwindow, pyscreeze, PyTweening, mouseinfo, pyperclip, pyrect
  Building whe

### time 모듈
파이썬 데이터 타입을 어떻게 사용하는지를 파악하기 위해선 글을 보는 것보다 직접 코드를 작성해가면서 확인해보는 것이 중요합니다.<br>
이를 위해 수업시간에 보셨을 시간과 관련한 여러 함수들이 포함된 라이브러리인 time 라이브러리를 소개해드리겠습니다<br>
time 모듈 내에는 time이라는 함수가 있습니다.

```python
import time
print(time.time())
```
##### 위의 코드를 아래에 입력한 뒤 실행해보세요.

time 모듈 내의 time()함수는 다음과 같은 동작을 합니다.<br>
##### 1970년 1월 1일부터 지금까지의 시간을 초단위로 반환합니다.<br>
그렇기 때문에 이를 활용해서 저희가 작성한 코드의 동작시간을 반환할 수 있는 것이죠.<br>
```python
import time
start_time = time.time()
# 코드 작성
end_time = time.time()
print(end_time - start_time) # 작성한 코드의 시간 계산
```

### 실습 문제 1
본론으로 돌아와서 해당 실습 문제를 해결할 때 time 모듈을 사용하기 위해 먼 길을 돌아왔습니다.<br>
본래 시간을 체크해가며 코드를 작성하는 것은 저희의 수업 범위를 벗어나는 것이지만 각 데이터 타입별 특징에 대해 더 자세히 파악하고자 위의 time 모듈을 소개해드렸습니다.<br>
그러면 문제를 내드리겠습니다.<br>

#### 문제 (백준 숫자 카드 2)
숫자 카드는 음이 아닌 정수 하나가 적혀져 있는 카드이다. 한빈이는 숫자 카드 N개를 가지고 있다. 정수 M개가 주어졌을 때, 이 수가 적혀있는 숫자 카드를 한빈이가 몇 개 가지고 있는지 구하는 ``함수``를 작성하시오.<br>
단, 데이터를 저장하는 데 사용하는 함수의 이름은 ``save_cards``, 출력에 사용되는 함수는 ``count_cards``로 합니다.<br>

#### 입력
첫째 줄에 한빈이가 가지고 있는 숫자 카드의 개수 n이 주어진다.<br>
둘째 줄에는 숫자 카드에 적혀있는 정수가 n개만큼 공백을 기준으로 구분되어 주어진다.<br>
셋째 줄에는 m이 주어진다.<br>
넷째 줄에는 한빈이가 몇 개 가지고 있는 숫자 카드인지 구해야할 m개의 정수가 주어지며 이 수도 공백을 기준으로 구분되어있다.<br>
넷째 줄에서 입력받은 카드의 숫자는 한빈이가 가지고 있는 숫자 카드의 최대값보다 작은 수를 가진다.

#### 출력
넷째 줄에 입력된 m개의 수에 대하여, 각 수가 적힌 숫자 카드를 한빈이가 몇 개 가지고 있는지를 공백으로 구분해 출력한다.

In [31]:
'''
예제 입력
10
6 3 2 10 10 10 11 11 7 3
8
10 9 11 2 3 4 5 7

예제 출력
3 0 2 1 2 0 0 1
'''
# 값 입력 받아서 리스트에 저장하는 코드
n = int(input())
cards1 = list(map(int, input().split()))
m = int(input())
cards2 = list(map(int, input().split()))

# 리스트를 파라미터로 전달해서 특정한 데이터 집합에 저장하는 함수 작성
# 아래에 코드를 추가로 작성해주세요.
def save_cards(cards1):
    data = []
    check_list = []
    # cards1중 최소값과 최대값의 범위의 인덱스를 가지도록 data 값 초기화
    for i in range(max(cards1) + 1):
        data.append(0) # [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
    #data=[1]
    #data=[1]*(max(cards1)+1)
        
    
    # 반복문을 통해 cards1를 하나씩 탐색하며 data리스트에서 card의 인덱스의 값을 1씩 증가
    '''for i in range(len(cards1)):
        print(cards1[i])
        data[cards1[i]] += 1 # [0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0]
    '''
    
    for x in cards1:
        data[x] += 1 # [0, 0, 1, 2, 0, 0, 1, 1, 0, 0, 3, 2]
    return data


# 하나의 정수와 위의 함수를 통해 실행한 데이터를 파라미터로 전달해 숫자 카드의 개수를 리턴한다.
def count_cards(card, data):
    # card에 해당하는 값 리턴하기
    count = data[card]
    return count
    
    
data = save_cards(cards1)
for card in cards2:
    x = count_cards(card, data)
    # 출력 조건에 맞게 코드 작성
    print(x)

1
1
1
1
1


In [24]:
'''
예제 입력
10
6 3 2 10 10 10 11 11 7 3
8
10 9 11 2 3 4 5 7

예제 출력
3 0 2 1 2 0 0 1
'''

n = int(input())
cards1 = list(map(int,input().split()))
m = int(input())
cards2 = list(map(int,input().split()))
#cards1 = [6, 3, 2, 10, 10, 10, 11, 11, 7, 3] 
#cards2 = [10, 9, 11, 2, 3, 4, 5, 7]
# data = [0, 0, 1, 2, 0, 0, 1, 1, 0, 0, 3, 2]

def save_card(card1):
    data = [0]*(max(cards1)+1)
    
    for x in cards1:
        data[x] +=1
        
    return data

#print(save_card(cards1))

def count_card(data,card2):
    data2 = []
    # data2 = [3,0,2,1,2,0,0,1]
    for card in card2:
        data2.append(data[card])
        
    return data2

#print(count_card(save_card(cards1),cards2))
data = save_card(cards1)
data2 = count_card(data,cards2)

for card_number in data2:
    print(card_number,end=" ")
    
#print(data2)

KeyboardInterrupt: Interrupted by user

In [27]:
n = int(input())
cards1 = list(map(int,input().split()))
m = int(input())
cards2 = list(map(int,input().split()))

def save_cards(card1):
    data = [0] * (max(cards1)+1)  #cards1의 최대수 + 1 만큼 data 리스트 만들기 -> 인덱스 번호 = 카드 숫자 자리 만들기
    
    for x in cards1: # cards1 안에 있는 숫자카드 -> data 리스트 자리로 표현하기
        data[x] += 1
        
    return data
    # ex) cards1 = [1, 3, 3, 2, 4, 5]
    # data = [0,1,1,2,1,1]
    
def count_cards(data,card2):
    data2 = [] # cards2 의 숫자카드와 관련된 빈 리스트 생성
    for card in card2:
        data2.append(data[card])
    # ex) cards2 = [2, 5, 1]
    # data2 = [1, 1, 1]
    return data2

data = save_cards(cards1)
data2 = count_cards(data,cards2)

for cardnumber in data2:
    print(cardnumber,end = " ")
    
'''
예제 입력
10
6 3 2 10 10 10 11 11 7 3
8
10 9 11 2 3 4 5 7

예제 출력
3 0 2 1 2 0 0 1
'''

1
1
1
1
1 

'\n예제 입력\n10\n6 3 2 10 10 10 11 11 7 3\n8\n10 9 11 2 3 4 5 7\n\n예제 출력\n3 0 2 1 2 0 0 1\n'

### 체크
이번에는 아래의 코드를 통해 리스트에 값을 저장했습니다.<br>
따로 입력을 받지 않고, 여러분들이 작성한 함수가 맞는지 판단하기 위함입니다.<br>
아래의 코드를 동작시켜 여러분이 작성한 코드가 맞는지 확인해봅시다.

In [40]:
import random
random.seed(100)
cards = []
for i in range(500000):
    cards.append(random.randint(0, int(1e5)))

    
data = save_cards(cards)
for card, ans in [[1, 5], [10, 3], [20, 5], [100, 3], [1000, 1], [1010, 7],  [2020, 5], [2022, 5], [10000, 4], [99999, 5]]:
    assert count_cards(card, data) == ans


### 실습 문제 2
이번에는 저장하는 데이터 타입의 방식을 바꿀겁니다.<br>
즉, save_cards 함수에서 저장할 데이터 타입을 바꿀겁니다.<br>
자연스럽게 count_cards 함수 내에서도 데이터를 체크하는 방식도 바꿔야겠죠.<br>
우선 위의 코드를 참고하되, data를 리스트로 저장하는 것이 아니라 딕셔너리 형태로 저장되도록 코드를 작성해보세요.<br>
참고로 check_list를 활용하거나, get함수를 활용하시면 문제를 해결하실 수 있습니다.<br>


In [2]:
# 센세 답 예제3
'''
예제 입력
10
6 3 2 10 10 10 11 11 7 3
8
10 9 11 2 3 4 5 7

예제 출력
3 0 2 1 2 0 0 1
'''

n = int(input())
cards1 = list(map(int,input().split()))
m = int(input())
cards2 = list(map(int,input().split()))

def save_cards3(cards1):
    data = {}
    check_set = set([])
    for x in cards1:
        if x not in check_set:
            data[x] = 0
            check_set.add(x) # append(x)
        data[x]+=1
    return data

def count_cards3(card,data):
    count = data[card]
    return count

8
1 1 2 2 2 4 5 5
3
3 2 1


In [13]:
# 센세 예제2
'''
예제 입력
10
6 3 2 10 10 10 11 11 7 3
8
10 9 11 2 3 4 5 7

예제 출력
3 0 2 1 2 0 0 1
'''
cards1=[6, 3, 2, 10, 10, 10, 11, 11, 7, 3]
cards2=[10, 9, 11, 2, 3, 4, 5, 7]
def save_cards2(cards1):
    data = {}
    check_list=[]
    for x in cards1:
        if x not in check_list:
            data[x]= 0
            check_list.append(x)
        data[x] +=1
        
    return data

print(save_cards2(cards1))

def count_cards2(card,data):
    #return data[card]
    return data.get(card,0)

print(count_cards2(4,save_cards2(cards1)))
        

{6: 1, 3: 2, 2: 1, 10: 3, 11: 2, 7: 1}


KeyError: 4

In [46]:
'''
예제 입력
10
6 3 2 10 10 10 11 11 7 3
8
10 9 11 2 3 4 5 7

예제 출력
3 0 2 1 2 0 0 1
'''
# 리스트를 파라미터로 전달해서 특정한 데이터 집합에 저장하는 함수 작성
# 아래에 코드를 추가로 작성해주세요.

#cards1 = [6, 3, 2, 10, 10, 10, 11, 11, 7, 3]
#cards2 = [10, 9, 11, 2, 3, 4, 5, 7]

def save_cards2(cards1):
    # 리스트로 cards1 = [6, 3, 2, 10, 10, 10, 11, 11, 7, 3]
    
    data = {}
    for key in range (0,(max(cards1)+1)):
        data[key]=0
    for card in cards1:
        data[card]+=1   
    #check_list = [] ????
    
        
    # 반복문을 통해 적절하게 코드작성
    
    return data

# 하나의 정수와 위의 함수를 통해 실행한 데이터를 파라미터로 전달해 숫자 카드의 개수를 리턴한다.
def count_cards2(card, data):
    #count = 0
    count = data[card]
    
    # card에 해당하는 값 리턴하기
    
    return count 

### 체크
에러가 발생한다면 다시 코드를 작성해보시기 바랍니다.

In [47]:
import random
random.seed(100)
cards = []
for i in range(500000):
    cards.append(random.randint(0, int(1e5)))
    
data = save_cards2(cards)
for card, ans in [[1, 5], [10, 3], [20, 5], [100, 3], [1000, 1], [1010, 7],  [2020, 5], [2022, 5], [10000, 4], [99999, 5]]:
    assert count_cards2(card, data) == ans

### 실습 문제 3
이번에는 save_cards에서의 check_list의 데이터 타입을 set으로 바꿀 겁니다.<br>
아래에 어느정도 작성된 코드를 바탕으로 추가로 코드를 작성해주시기 바랍니다.<br>

In [None]:
# 리스트를 파라미터로 전달해서 특정한 데이터 집합에 저장하는 함수 작성
# 아래에 코드를 추가로 작성해주세요.
def save_cards3(cards1):
    data = {}
    for key in range(0,(max(cards1)+1)):
        data[key]=0
    for card in (cards1):
        data[card]+=1
    check_list = set([]) #??
    # 반복문을 통해 적절하게 코드작성
    
    return data

# 하나의 정수와 위의 함수를 통해 실행한 데이터를 파라미터로 전달해 숫자 카드의 개수를 리턴한다.
def count_cards3(card, data):
    count = 0
    count=data[card]
    # card에 해당하는 값 리턴하기
    
    return count

### 체크
에러가 발생한다면 다시 코드를 작성해보시기 바랍니다.

In [None]:
import random
random.seed(100)
cards = []
for i in range(500000):
    cards.append(random.randint(0, int(1e5)))

data = save_cards3(cards)
for card, ans in [[1, 5], [10, 3], [20, 5], [100, 3], [1000, 1], [1010, 7],  [2020, 5], [2022, 5], [10000, 4], [99999, 5]]:
    assert count_cards3(card, data) == ans

### 실습 문제 4
이번에는 저희가 작성한 함수에 대해 각각 얼마나 빠른지 체크를 해볼 겁니다.<br>
아까 확인했던 time 모듈을 사용하여 시간을 체크해보겠습니다.<br>
아래의 코드를 실행시켜 위의 함수가 모두 오류없이 잘 실행된다면 실습 문제 4를 실행해보시고, 가장 빠른 것은 무엇인지, 가장 느린 함수는 무엇인지 확인해봅시다.<br>

In [None]:
import time
def check_time(function):
    s = time.time()
    function()
    e = time.time()
    return e - s

import random
random.seed(100)
cards = []
for i in range(500000):
    cards.append(random.randint(0, int(1e5)))
    
t1 = check_time(save_cards(cards))
t2 = check_time(save_cards2(cards))
t3 = check_time(save_cards3(cards))
print('첫번째 함수 소요시간:' t1)
print('두번째 함수 소요시간:' t2)
print('세번째 함수 소요시간:' t3)