# Chapter08 연관된 데이터를 딕셔너리로 짝을 짓자

## 8.1 키와 값을 가진 딕셔너리로 자료를 저장하자

딕셔너리도 리스트와 같이 값을 저장하는 자료구조로 파이썬에서는 기본 자료형으로 제공되고 있다. 하지만 딕셔너리에는 값과 관련된 키가 있다는 점이 큰 차이점이다

In [1]:
phone_book = {} # 공백 딕셔너리를 생성

In [2]:
phone_book["홍길동"] = "010-1234-5678"

In [4]:
print(phone_book)

{'홍길동': '010-1234-5678'}


In [5]:
phone_book = {"홍길동": "010-1234-5678"} # 딕셔너리를 생성하면서 동시에 초기화 하는 방법

In [6]:
phone_book["강감찬"] = "010-1234-5679"
phone_book["이순신"] = "010-1234-5680"
print(phone_book)

{'홍길동': '010-1234-5678', '강감찬': '010-1234-5679', '이순신': '010-1234-5680'}


## 8.2 딕셔너리의 기능을 알아보자

리스트와 마찬가지로 딕셔너리에는 어떤 유형의 값도 저장할 수 있다. 즉 정수, 문자열, 다른 리스트, 다른 딕셔너리도 항목으로 저장할 수 있다

In [7]:
person_dic = {'Name': '홍길동', 'Age':27, 'Class':'초급'}

print(person_dic['Name']) # 딕셔너리의 'Name'이라는 키로 값을 조회함
print(person_dic['Age']) # 딕셔너리의 'Age'이라는 키로 값을 조회함

홍길동
27


In [8]:
print(phone_book["강감찬"]) # 키를 가지고 연관된 값을 찾을 수 있다

010-1234-5679


In [9]:
phone_book.keys() # 딕셔너리에서 사용되는 모든 키를 출력하려면 keys()라는 메소드를 사용한다

dict_keys(['홍길동', '강감찬', '이순신'])

In [10]:
phone_book.values() # 딕셔너리에서 사용되는 모든 값을 출력하려면 values()를 사용한다

dict_values(['010-1234-5678', '010-1234-5679', '010-1234-5680'])

In [11]:
# 딕셔너리 내부의 모든 값을 출력하려면 items()를 사용할 수도 있다
phone_book.items()

dict_items([('홍길동', '010-1234-5678'), ('강감찬', '010-1234-5679'), ('이순신', '010-1234-5680')])

In [13]:
for name, phone_num in phone_book.items():
    print(name, ":", phone_num)

홍길동 : 010-1234-5678
강감찬 : 010-1234-5679
이순신 : 010-1234-5680


### 도전문제 8.1

In [18]:
contact = {'성':'홍', '이름':'길동', '직장':'학생'}

for a, b in contact.items():
    print(a, ":", b)

성 : 홍
이름 : 길동
직장 : 학생


## 8.3 딕셔너리의 다양하고 멋진 기능들을 수행하는 메소드

딕셔너리의 모든 항목을 하나씩 출력하기 위해서 for 루프를 사용

In [21]:
for key in phone_book.keys():
    print(key, ":", phone_book[key])

홍길동 : 010-1234-5678
강감찬 : 010-1234-5679
이순신 : 010-1234-5680


딕셔너리 안의 항목들은 자동으로 정렬되지 않아 sorted() 함수를 사용하여 딕셔너리의 키를 기준으로 정렬을 수행할 수 있다

In [23]:
sorted(phone_book) # 딕셔너리를 키를 기준으로 정렬하여 리스트를 반환

['강감찬', '이순신', '홍길동']

In [27]:
sorted_phone_book = sorted(phone_book.items(), key=lambda x: x[0])
print(sorted_phone_book)

[('강감찬', '010-1234-5679'), ('이순신', '010-1234-5680'), ('홍길동', '010-1234-5678')]


딕셔너리의 항목을 삭제하려면 del을 사용한다

In [28]:
del phone_book["홍길동"] # "홍길동" 키를 이용하여 딕셔너리의 한 항목 삭제
print(phone_book)

{'강감찬': '010-1234-5679', '이순신': '010-1234-5680'}


딕셔너리의 모든 항목을 삭제하려면 clear()를 사용한다

In [30]:
phone_book.clear()
print(phone_book)

{}


- keys() : 딕셔너리 내의 모든 키를 반환
- values() : 딕셔너리 내의 모든 값을 반환
- items() : 딕셔너리 내의 모든 항목을 쌍으로 반환
- get(key) : 키에 대한 값을 반환
- pop(key) : 키에 대한 값을 반환하고 그 항목을 삭제
- popitem() : 제일 마지막에 입력된 항목을 반환하고 그 항목을 삭제
- clear() : 딕셔너리 내의 모든 항목을 삭제

## 8.4 람다 함수 == 이름이 없는 함수

람다함수란 이름이 없는 함수로 정의할 수 있는데 간단한 1회용 작업에 유용하다

In [34]:
print("100과 200의 합 :", (lambda x, y: x + y)(100, 200)) # 100, 200이 람다 함수의 인자

100과 200의 합 : 300


In [38]:
t = (100, 200, 300)
(lambda x: x[0])(t) # t를 인자로 받아서 그 첫 항목 t[0]을 반환

100

In [39]:
(lambda x: x[1])(t) # t를 인자로 받아서 그 두 번째 항목 t[1]을 반환

200

In [42]:
phone_book = {"홍길동": "010-1234-5678", "강감찬":"010-1234-5679", "이순신":"010-1234-5680"}
print(phone_book.items()) # 딕셔너리의 items()는 키, 값을 튜플로 출력

dict_items([('홍길동', '010-1234-5678'), ('강감찬', '010-1234-5679'), ('이순신', '010-1234-5680')])


In [43]:
# 항목의 첫 인자인 이름을 기준으로 정렬한다 : 한글 사전 순서
sorted_phone_book1 = sorted(phone_book.items(), key=lambda x: x[0])
print(sorted_phone_book1)

[('강감찬', '010-1234-5679'), ('이순신', '010-1234-5680'), ('홍길동', '010-1234-5678')]


In [46]:
sorted_phone_book2 = sorted(phone_book.items(), key=lambda x: x[1])
print(sorted_phone_book2)

[('홍길동', '010-1234-5678'), ('강감찬', '010-1234-5679'), ('이순신', '010-1234-5680')]


## LAB 8-1 편의점 재고 관리 프로그램을 만들자

In [18]:
items = {"커피음료": 7, "펜": 3, "종이컵": 2, "우유": 1, "콜라": 4, "책": 5}

name = input("물건의 이름을 입력하시오: ")
print("재고 :", items[name])

물건의 이름을 입력하시오: 책
재고 : 5


### 도전문제 8.2

In [22]:
items = {"커피음료": 7, "펜": 3, "종이컵": 2, "우유": 1, "콜라": 4, "책": 5}

a = int(input("메뉴를 선택하시오 1) 재고조회 2) 입고 3) 출고 4) 종료 : "))
if a == 1:
    b = input("[재고조회] 물건의 이름을 입력하시오 : ")
    print("재고 :", items[b])
elif a == 2:
    c = input("[입고] 물건의 이름과 수량을 입력하시오 : ").split()
    print(c[0], "의 재고 :", items[c[0]]+int(c[1]))
elif a == 3:
    d = input("[출고] 물건의 이름과 수량을 입력하시오 : ").split()
    print(d[0], "의 재고 :", items[d[0]]-int(d[1]))
elif a == 4:
    print("프로그램을 종료합니다.")

메뉴를 선택하시오 1) 재고조회 2) 입고 3) 출고 4) 종료 : 4
프로그램을 종료합니다.


In [8]:
items = {"커피음료": 7, "펜": 3, "종이컵": 2, "우유": 1, "콜라": 4, "책": 5}

while True:
    a = int(input("메뉴를 선택하시오 1) 재고조회 2) 입고 3) 출고 4) 종료 : "))
    if a == 1:
        b = input("[재고조회] 물건의 이름을 입력하시오 : ")
        print("재고 :", items[b])
        continue
    elif a == 2:
        c = input("[입고] 물건의 이름과 수량을 입력하시오 : ").split()
        print(c[0], "의 재고 :", items[c[0]]+int(c[1]))
        continue
    elif a == 3:
        d = input("[출고] 물건의 이름과 수량을 입력하시오 : ").split()
        print(d[0], "의 재고 :", items[d[0]]-int(d[1]))
        continue
    elif a == 4:
        print("프로그램을 종료합니다.")
        break

메뉴를 선택하시오 1) 재고조회 2) 입고 3) 출고 4) 종료 : 1
[재고조회] 물건의 이름을 입력하시오 : 우유
재고 : 1
메뉴를 선택하시오 1) 재고조회 2) 입고 3) 출고 4) 종료 : 2
[입고] 물건의 이름과 수량을 입력하시오 : 우유 5
우유 의 재고 : 6
메뉴를 선택하시오 1) 재고조회 2) 입고 3) 출고 4) 종료 : 3
[출고] 물건의 이름과 수량을 입력하시오 : 펜 2
펜 의 재고 : 1
메뉴를 선택하시오 1) 재고조회 2) 입고 3) 출고 4) 종료 : 4
프로그램을 종료합니다.


## LAB 8-2 영한 사전을 만들어 보자

- '<' : 입력 명령
- '>' : 검색 명령
- '영어단어:우리만단어' 형태
- 프로그램 종료 : q

In [83]:
print("사전 프로그램 시작... 종료는 q를 입력")
dictionary = {}

while True:
    st = input("$ ")
    command = st[0] # 첫 입력 문자를 추출한다
    if command == '<':
        st = st[1:]
        inputStr = st.split(':')
        if len(inputStr) < 2:
            print("입력 오류가 발생했습니다.")
        else:
            dictionary[inputStr[0].strip()] = inputStr[1].strip()
    elif command == '>':
        st = st[1:]
        inputStr = st.strip()
        if inputStr in dictionary:
            print(dictionary[inputStr])
        else:
            print('{}가 사전에 없습니다.'.format(inputStr))
    elif command == 'q':
        break
    else:
        print("입력 오류가 발생했습니다.")
print("사전 프로그램을 종료합니다.")

사전 프로그램 시작... 종료는 q를 입력
$ < one:하나
$ < two:둘
$ < house:집
$ < Korea:한국
$ > one
하나
$ > house
집
$ > body
body가 사전에 없습니다.
$ q
사전 프로그램을 종료합니다.


## 8.5 순서가 중요하지 않은 대상들이 모이면 : 집합

파이썬에서 사용하는 집합은 수학의 집합과 비슷하며, 튜플과 달리 순서가 없는 자료형이다.

In [27]:
numbers = {2, 1, 3} # 숫자 3개로 이루어진 집합 자료형
numbers

{1, 2, 3}

집합 자료형에서는 요소가 중복되면 자동으로 중복된 요소를 제거한다.

In [28]:
set([1, 2, 3, 1, 2]) # 리스트로부터 집합을 생성함

{1, 2, 3}

In [29]:
set("abcdefa") # 문자열도 시퀀스형이라서 집합형으로 변환이 가능하다

{'a', 'b', 'c', 'd', 'e', 'f'}

In [30]:
numbers = set()

## 8.6 집합의 항목에 접근하는 연산

어떤 항목이 집합 안에 있는지를 검사하려면 리스트와 마찬가지로 in 연산자를 사용하면 된다.

In [31]:
numbers = {2, 1, 3}
if 1 in numbers: # 1이라는 항목이 numbers 집합에 있는가 검사
    print("집합 안에 1이 있습니다.")

집합 안에 1이 있습니다.


집합의 항목은 순서가 없기 때문에 인덱스를 사용 할 수 없다

In [33]:
numbers = {2, 1, 3}
for x in numbers:
    print(x, end=" ")

1 2 3 

In [34]:
for x in sorted(numbers): # 정렬된 순서로 항목을 출력하기 위해 sorted()를 사용
    print(x, end=" ")

1 2 3 

집합은 인덱스가 없기 때문에 인덱셍이나 슬라이싱 연산은 의미가 없다.

In [36]:
numbers = {1, 2, 3}
numbers.add(4) # numbers 집합에 원소 4를 추가
numbers

{1, 2, 3, 4}

In [37]:
numbers.remove(4) # numbers 집합에 원소 4를 삭제
numbers

{1, 2, 3}

in 연산자는 집합에서만 사용하는 것은 아니다.

In [38]:
a_list = ['hello', 'world', 'welcome', 'to', 'python']
'python' in a_list # 'python' 문자열이 a_list에 있는지 확인

True

## 8.7 집합에 적용할 수 있는 다양한 연산들을 살펴보자

< 집합 비교 연산 >

==, != 연산자를 사용하여 2개의 집합이 서로 같은지 검사

In [40]:
A = {1, 2, 3}
B = {1, 2, 3}
A == B # A가 B와 같은지 검사

True

<, <=, >, >= 연산자를 사용하여 진부분 집합인지 부분 집합인지 검사

In [41]:
A = {1, 2, 3, 4, 5}
B = {1, 2, 3}
B < A # B가 A의 진부분 집합인가 검사

True

< 항목들에 대한 정보 처리 >

집합에 대해서도 len(), max(), min(), sorted(), sum() 등의 메소드는 사용할 수 있다.

In [46]:
a_set = {1, 5, 4, 3, 7, 4} # 6개 항목으로 집합 생성

In [47]:
len(a_set) # 항목의 개수는 중복을 제외하면 5개이다

5

In [48]:
max(a_set) # 항목 가운데 가장 큰 수는 7

7

In [49]:
min(a_set) # 항목 가운데 가장 작은 수는 1

1

In [50]:
sorted(a_set) # 항목을 정렬하여 리스트를 만든다. 집합이므로 중복은 제거

[1, 3, 4, 5, 7]

In [51]:
sum(a_set) # 중복 원소는 하나만 사용되므로 전체 합은 20

20

< 집합에 적용할 수 있는 논리 연산 >

all()은 모든 항목이 True로 평가되었을 때 True이고 하나라도 False로 평가되면 False가 된다.
any()는 항목들 가운데 하나라도 True가 있으면 True이고 그렇지 않으면 False가 된다.

In [54]:
a_set = {1, 0, 2, 3, 3}
all(a_set) # a_set이 모두 True인가를 검사한다

False

In [55]:
any(a_set) # a_set에 0이 있는가를 검사한다

True

## 8.8 풍부하고 멋진 집합 연산이 있다

집합이 유용한 이유는 교집합이나 합집합과 같은 여러가지 집합 연산을 지원하기 때문이다.

In [58]:
A = {1, 2, 3}
B = {3, 4, 5}

합집합은 2개의 집합을 합하는 연산으로 | 연산자나 union() 메소드를 사용한다.

In [60]:
A | B # 합집합 연산

{1, 2, 3, 4, 5}

In [61]:
A.union(B) # 합집합 메소드

{1, 2, 3, 4, 5}

교집합은 2개 집합에서 겹치는 요소를 구하는 연산으로 & 연산자나 intersection() 메소드를 사용한다.

In [63]:
A & B # 교집합 연산

{3}

In [64]:
A.intersection(B) # 교집합 메소드

{3}

차집합은 하나의 집합에서 다른 집합의 요소를 빼는 연산으로 - 연산자나 difference() 메소드를 사용한다.

In [66]:
A - B # 차집합 연산

{1, 2}

In [67]:
A.difference(B) # 차집합 메소드

{1, 2}

대칭차집합은 두 집합의 합집합에서 교집합을 뺀 요소를 구하는 연산으로 ^ 연산자나 symmetric_difference() 메소드를 사용한다.

In [69]:
A ^ B # 대칭 차집합 연산

{1, 2, 4, 5}

In [70]:
A.symmetric_difference(B) # 대칭 차집합 메소드

{1, 2, 4, 5}

## LAB 8-3 파티 동시 참석자 알아내기

In [72]:
partyA = set(["Park", "Kim", "Lee"])
partyB = set(["Park", "Choi"])

print("2개의 파티에 모두 참석한 사람은 다음과 같습니다. ")
print(partyA.intersection(partyB))

2개의 파티에 모두 참석한 사람은 다음과 같습니다. 
{'Park'}


### 도전문제 8.3

In [74]:
# (1) 합집합
print("파티 A, B에 참석한 사람들 :", partyA.union(partyB))

파티 A, B에 참석한 사람들 : {'Park', 'Choi', 'Kim', 'Lee'}


In [76]:
# (2) 대칭차집합
print("파티 A, B에 중복없이 참석한 사람 :", partyA.symmetric_difference(partyB))

파티 A, B에 중복없이 참석한 사람 : {'Choi', 'Lee', 'Kim'}


In [75]:
print("파티 A, B에 중복없이 참석한 사람 :", partyA.union(partyB)-partyA.intersection(partyB))

파티 A, B에 중복없이 참석한 사람 : {'Choi', 'Lee', 'Kim'}


In [77]:
# (3) 차집합
print("파티 A에만 참석한 사람 :", partyA.difference(partyB))

파티 A에만 참석한 사람 : {'Lee', 'Kim'}


## 8.9 파일로부터 자료를 읽고 저장해보자

컴퓨터 파일이란 컴퓨터의 저장 장치 내에 데이터를 저장하기 위해 사용하는 논리적인 단위를 말한다.

In [1]:
f = open('hello.txt', 'w')  #파일을 쓰기 모드로 연다. 
f.write('Hello World!')     #hello.txt 파일에 Hello World를 쓴다.
f.close() # 파일을 닫는다

In [2]:
f = open('hello.txt', 'r') # 파일을 연다
s = f.read() # hello.txt 파일을 읽는다
print(s) # 파일의 내용을 출력한다
f.close() # 파일을 닫는다

Hello World!


## LAB 8-4 파일에서 중복되지 않은 단어의 개수 구하기

In [4]:
# 단어에서 구두점을 제거하고 소문자로 만든다
def process(w):
    output = ""
    for ch in w:
        if ch.isalpha():
            output += ch
    return output.lower()

words = set() # 중복을 방지하기 위해 집합 자료형에 단어를 넣자
fname = input("입력 파일 이름: ")
file = open(fname, "r") # 파일을 연다

# 파일의 모든 줄에 대하여 반복한다
for line in file:
    lineWords = line.split()
    for word in lineWords:
        words.add(process(word)) # 단어를 집합에 추가한다
        
print("사용된 단어의 개수 =", len(words))
print(words)

입력 파일 이름: proverb.txt
사용된 단어의 개수 = 18
{'of', 'well', 'alls', 'a', 'bad', 'travels', 'feather', 'together', 'ends', 'that', 'begun', 'is', 'half', 'done', 'birds', 'flock', 'fast', 'news'}


## 8.10 두 수의 약수와 최대공약수 그리고 프로그래밍적인 사고

10의 진약수

In [7]:
num = 10
divisors = []

for i in range(2, num):
    if num % i == 0:
        divisors.append(i)
        
print(num, "의 진약수 :", divisors)

10 의 진약수 : [2, 5]


48과 60의 최대공약수

In [12]:
def get_divisors(num): # num의 약수를 집합형으로 반환함
    divisors = set()
    for i in range(2, num):
        if num % i == 0:
            divisors.add(i)
    return divisors

x = 48
print(x, "의 진약수 :", get_divisors(x))
y = 60
print(y, "의 진약수 :", get_divisors(y))

48 의 진약수 : {2, 3, 4, 6, 8, 12, 16, 24}
60 의 진약수 : {2, 3, 4, 5, 6, 10, 12, 15, 20, 30}


In [14]:
A = get_divisors(x)
B = get_divisors(y)

print(A.intersection(B))
print(x, y, '의 최대공약수 :', max(A.intersection(B)))

{2, 3, 4, 6, 12}
48 60 의 최대공약수 : 12


### 핵심정리

- 딕셔너리는 키와 값으로 이루어진다
- 딕셔너리에 키를 제시하면 값을 반환한다
- 딕셔너리는 인덱스를 이용하여 접근하지 않고 키를 이용하여 항목에 접근한다
- 키를 이용하기 때문에 항목들 사이의 순서는 중요하지 않다
- 항목의 순서가 중요하지 않은 데이터로 집합이 있다
- 딕셔너리와 집합은 항목의 순서에 의미가 없으므로 슬라이싱을 적용할 수 없다
- 집합연산을 지원하는 풍부한 연산자와 메소드가 제공되고 있다