(ch:dicts-sets)=
# 사전과 집합

두 개의 비순차 자료형 사전과 집합을 소개한다.
비순차 자료형은 문자열, 리스트, 튜플과는 달리 순서를 따지지 않으며 항목의 중복도 허용하지 않는다.
사전은 프로그래밍언어에 따라 연관배열, 맵 등으로 불리기도 하며 매우 다양하게 활용된다.
집합과 사전은 해시 가능한 값만을 이용하기에 해시 가능성도 함께 소개한다. 
이후에는 논리식을 이용하여 간편하게 리스트와 정의하는 조건제시법을 다룬다.

## 사전 

사전 자료형은 **키**<font size = "2">key</font>와 **값**<font size = "2">value</font>의
쌍으로 구성된 항목들의 집합이며, **딕셔너리**<font size = "2">dictionary</font> 라고도 불린다.
예를 들어, `'Hello'` 와 `'World'` 를 키로, `'안녕'`, `'세계'` 를 각각의 키에 대한 값으로
갖는 사전은 다음과 같다.

```python
{'Hello':'안녕', 'World':'세계'}
```

**빈 사전**

빈 사전은 아무것도 포함하지 않는 사전을 의미한다. 빈 사전를 만드는 방법은 아래와 같다. 

In [1]:
empty_dict = {}
empty_dict

{}

다음 방식도 가능하다.

In [2]:
empty_dict = dict()
empty_dict

{}

**`dict()` 함수**

키-값의 튜플 형식의 항목을 갖는 모음 자료형을 사전으로 변환한다. 
단, 키로 사용되는 값은 해시 가능해야 한다.

In [3]:
data = [('Hello', '안녕'), ('World', '세계'), ('Programming', '프로그래밍')]
dict(data)

{'Hello': '안녕', 'World': '세계', 'Programming': '프로그래밍'}

`zip()` 함수를 활용하면 편리하다.

In [4]:
data = zip('abcde', [1, 2, 3, 4, 5])
data_dict = dict(data)
data_dict

{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}

**사전과 반복문**

사전에 대한 반복문은 키<font size='2'>key</font>에 대해 실행된다.

In [5]:
for item in data_dict:
    print(item, end=' ')

a b c d e 

키와 값의 쌍에 대해 반복문을 실행하려면 `items()` 메서드를 이용한다. 
단, 키와 값 각각에 대해 변수를 지정하는 게 좋다.

In [6]:
for key, value in data_dict.items():
    print(f"{key:>8} 키의 값: {value}")

       a 키의 값: 1
       b 키의 값: 2
       c 키의 값: 3
       d 키의 값: 4
       e 키의 값: 5


항목을 쪼개서 사용할 수도 있다.

In [7]:
for item in data_dict.items():
    key = item[0]
    value = item[1]
    print(f"{key:>8} 키의 값: {value}")

       a 키의 값: 1
       b 키의 값: 2
       c 키의 값: 3
       d 키의 값: 4
       e 키의 값: 5


값에 대해 반복문을 실행하려면 `values()` 메서드를 이용한다. 

In [8]:
for item in data_dict.values():
    print(item, end=' ')

1 2 3 4 5 

**`in` 연산자**

사전의 키로 사용되었는 여부를 알려주는 논리 연산자다.

In [9]:
'city' in {"name": "강현", "age": "3"} 

False

`in`의 부정은 `not in`을 사용한다. 즉
키로 사용되지 않았는지 여부를 뭍는다.

In [10]:
'city' not in {"name": "강현", "age": "3"} 

True

**`len()` 함수**

사전에 포함된 항목의 개수를 반환한다.

In [11]:
len({"name": "강현", "age": "3"}) 

2

### 사전 키 인덱싱 

사전에 사용된 키를 이용한 인덱싱이 지원된다. 
예를 들어, 아래 딕셔너리 `dic`에서 `'Hello'`에 대응하는 값을 확인하고자 하면  
다음과 같이 대괄호를 사용하는 인덱싱을 이용한다. 

In [12]:
dic = {'Hello' : '안녕', 'World' : '세계'}
dic['Hello']

'안녕'

존재하지 않는 키로 값을 추출하려고 하면, 오류가 발생한다. 

In [13]:
dic['Python']

KeyError: 'Python'

### 항목 추가, 업데이트, 삭제

아래와 같은 형식으로 사전에 항목을 추가하거나 업데이트 한다.

```python
사전[key] = value
```   

예를 들어, `dic`에 `Python : 파이썬` 항목을 다음과 같이 추가할 수 있다.

In [14]:
dic['Python'] = '파이썬'

dic

{'Hello': '안녕', 'World': '세계', 'Python': '파이썬'}

이미 사용된 키를 이용하면 키와 연결된 값이 업데이트 된다.

In [15]:
dic['World'] = '세상'
dic

{'Hello': '안녕', 'World': '세상', 'Python': '파이썬'}

사전의 항목은 `del` 명령어에 키를 지정하여 삭제한다.

In [16]:
del dic['World']
dic

{'Hello': '안녕', 'Python': '파이썬'}

### 사전 메서드 

사전 자료형이 제공하는 주요 메서드는 아래와 같다.

:::{list-table} 사전 주요 메서드
:widths: 12 10 38
:header-rows: 1
:name: dict-methods

*   - 기능
    - 메서드
    - 설명
*   - 키 확인
    - `keys()`
    - 사전에 사용된 키로 구성된 순차 자료형 값 반환
*   - 값 확인
    - `values()`
    - 사전에 사용된 값으로 구성된 순차 자료형 값 반환
*   - 키와 값 확인
    - `items()`
    - 사전에 사용된 키와 값의 순서쌍으로 구성된 순차 자료형 값 반환
*   - 값 반환
    - `get()`
    - 지정된 키에 대한 값 반환
:::

In [17]:
dic = {'Hello' : '안녕', 'World' : '세계'}

**`keys()` 메서드: 키로 이루어진 모음 자료형 반환**

In [18]:
dic.keys()

dict_keys(['Hello', 'World'])

**`values()` 메서드: 값으로 이루어진 모음 자료형 반환**

In [19]:
dic.values()

dict_values(['안녕', '세계'])

**`items()` 메서드: (키, 값) 모양의 쌍으로 이루어진 모음 자료형 반환**

In [20]:
dic.items()

dict_items([('Hello', '안녕'), ('World', '세계')])

**`get()` 메서드: 지정된 키와 연관된 값 반환**

In [21]:
dic.get('Hello')

'안녕'

존재하지 않는 키를 사용하면 기본값으로 `None`이 사용된다.

In [22]:
dic.get('hello')

키가 사용되지 않았을 때 기본값을 바꾸려면 둘째 인자를 지정한다.

In [23]:
dic.get('hello', "해당 키가 없어요.")

'해당 키가 없어요.'

**예제**

6명 정보를 이용하여 키는 이름, 값은 해당 이름의 정보를 담은 리스트를 사용하는 사전을
가리키는 `info_dict` 변수를 선언하라.

In [24]:
info_list = [['김강현', '010-1234-5678', 20, 172.5, '제주'],
             ['황현', '02-9871-1234', 19, 163.5, '서울'],
             ['남궁수현', '01-3456-7891', 21, 156.7, '경기'],
             ['최흥선', '070-4321-1111', 21, 187.2, '부산'],
             ['김선주', '010-3333-8888', 22, 164.6, '광주'],
             ['함중아', '010-7654-2345', 18, 178.3, '강원']]

답:

6명 각자의 이름을 키로, 나머지 정보로 구성된 리스트를 값으로 사용하는 사전을 구성한다.
이를 위해 `for` 반복문과 {numref}`%s절 <sec:unpacking>`의 리스트 해체를 이용한다.
먼저 `info_list`의 항목은 아래 형식임에 주의한다.

```python
person = ['김강현', '010-1234-5678', 20, 172.5, '제주']
```

위 리스트를 이름과 나머지로 구분하기 위해 다음과 같이 리스트 해체를 이용한다.

```python
name, *rest = person
```

그러면 `name`은 이름을, `rest`는 나머지 항목으로 구성된 리스트를 가리키게 되어
두 변수를 다음과 같이 선언한 것과 동일하다.

```python
name = person[0]
rest = person[1:]
```

위 설명을 정리해서 `info_dict` 변수를 아래와 같이 선언한다.

In [25]:
info_dict = dict()

for person in info_list:
    name, *rest = person
    info_dict[name] = rest

In [26]:
info_dict    

{'김강현': ['010-1234-5678', 20, 172.5, '제주'],
 '황현': ['02-9871-1234', 19, 163.5, '서울'],
 '남궁수현': ['01-3456-7891', 21, 156.7, '경기'],
 '최흥선': ['070-4321-1111', 21, 187.2, '부산'],
 '김선주': ['010-3333-8888', 22, 164.6, '광주'],
 '함중아': ['010-7654-2345', 18, 178.3, '강원']}

예를 들어 김선주의 정보를 보고 싶으면 다음과 같이 실행한다.

In [27]:
info_dict['김선주']

['010-3333-8888', 22, 164.6, '광주']

**예제**

이름을 물으면 나이를 확인해주는 `name_age()` 함수를 선언하라.
단, 이름이 없으면 "정보 없음"을 반환해야 한다.

힌트: `get()` 사전 메서드 활용

답:

앞서 선언한 `info_dict` 변수를 활용할 수 있다. 
이유는 이름을 사용하여 인덱싱을 적용하면 전화번호, 나이, 키, 출생지 정보로 구성된 리스트가 확인된다.
따라서 인덱싱으로 쉽게 나이를 확인할 수 있다.

그런데 키 인덱싱을 활용할 때 키가 사용되지 않았다면 오류가 발생한다.
따라서 `try-except` 명령문을 이용하여 다음과 같이 `name_age()` 함수를 구현할 수 있다.

In [28]:
def name_age(name):
    try:
        info = info_dict[name]
        return info[1]
    except KeyError:
        return "정보없음"

반면에 `get()` 메서드를 활용하면 오류 없이 코드가 실행된다.
다면 반환값이 `None`인지 여부를 구분해야 한다.

In [29]:
def name_age(name):
    info = info_dict.get(name)
    # info가 None이 아닌지 여부 판단
    if info:
        return info[1]
    else:
        return "정보없음"

## 집합

집합 자료형은 수학에서 다루는 집합처럼 작동하도록 만든 비순차 모음 자료형이며
다음과 같이 중괄호를 사용하여 정의된다.
집합은 항목의 중복을 허용하지 않고, 항목들 사이의 순서 또한 무시된다. 
따라서 인덱싱이나 슬라이싱을 지원하지 않는다.

`{항목1, 항목2, 항목3, ..., 항목n}`

In [34]:
a_set = {4, 4, 9.2, "apple", True, 4}
a_set

{4, 9.2, True, 'apple'}

**공집합**

공집합<font size = "2">empty set</font>은 아무것도 포함하지 않는 집합을 의미한다. 
공집합를 만드는 방법은 아래와 같다. 

In [35]:
empty_set = set()
empty_set

set()

`{}`은 빈 사전을 가리킴에 주의한다.

In [36]:
a = {}
type(a)

dict

**`set()` 함수**

임의의 모음 자료형을 집합으로 변환한다.
이 과정에서 순서와 중복이 무시된다.

In [37]:
set([5, 1, 1, 2, 5, 5, 1])

{1, 2, 5}

In [38]:
set((1, 3, 3, 9, 1))

{1, 3, 9}

순차 자료형의 항목에서 중복을 제거하고 싶을 때 `set()` 함수가 유용하게 활용된다.
예를 들어 아래 코드는 리스트에서 중복된 항목이 삭제된, 
하지만 동일한 항목을 포함한 새로운 리스트를 생성한다.
단, 기존 리스트에서 사용된 항목들의 순서는 보존되지 않음에 주의한다.

In [39]:
list(set([5, 1, 1, 2, 5, 5, 1]))

[1, 2, 5]

**`in` 연산자**

집합의 항목(원소)으로 등장하는지 여부를 알려주는 논리 연산자다.

In [40]:
1 in {1, 2, 3, 9, 4}

True

In [41]:
'a' not in {1, 'b', True, 9}

True

**`len()` 함수**

집합에 포함된 항목의 개수를 반환한다.

In [42]:
len({1, 3, 5, 7, 9})

5

(sec:set-methods)=
### 집합 메서드  

집합 자료형이 제공하는 주요 메서드는 아래와 같다.

:::{list-table} 사전 주요 메서드
:widths: 12 10 38
:header-rows: 1
:name: set-methods

*   - 기능
    - 메서드
    - 설명
*   - 합집합
    - `union()`
    - `A.union(B)`: `A` $\cup$ `B` 반환
*   - 교집합
    - `intersection()`
    - `A.intersection(B)`: `A` $\cap$ `B` 반환
*   - 차집합
    - `difference()`
    - `A.difference(B)`: `A - B`, 즉, `A`에만 포함된 항목들의 집합 반환
*   - 부분집합 여부
    - `issubset()`
    - `A.issubset(B)`: `A`가 `B`의 부분집합일 때 `True` 반환
*   - 항목 추가
    - `add()`
    - `A.add(c)`: 집합 `A`에 항목 `c` 추가. 반환값 `None`
*   - 학목 삭제
    - `remove()`
    - `A.remove(c)`: 집합 `A`에서 항목 `c` 삭제. 반환값 `None`
:::

여기서는 집합 메서드를 자세히 다루지 않는다.
이유는 각각의 메서드의 기능이 중, 고등학교에서 배운 집합 연산과 동일하기 때문이다.

- 합집합 생성

In [43]:
A = {1, 2, 3}
B = {2, 4}

In [44]:
A.union(B)

{1, 2, 3, 4}

- 교집합 생성

In [45]:
A.intersection(B)

{2}

- 차집합 생성

In [46]:
A.difference(B)

{1, 3}

- 부분집합 여부 확인

In [47]:
A.issubset(B)

False

In [48]:
A.issubset(A.union(B))

True

- 항목(원소) 추가

In [49]:
A.add(5)

In [50]:
A

{1, 2, 3, 5}

- 항목(원소) 삭제

In [51]:
A.remove(5)

In [52]:
A

{1, 2, 3}

여기서는 아래 예제를 이용하여 중복을 없애는 `set()` 함수의 유용성을 소개한다.

**예제**

`info_dict`를 이용하여 키는 나이, 값은 해당 나이를 갖는 사람의 수를 사용하는 사전을 가리키는 
`age_count_dict`를 선언하라.

답:

`info_dict`는 다음과 같다.

In [53]:
info_dict

{'김강현': ['010-1234-5678', 20, 172.5, '제주'],
 '황현': ['02-9871-1234', 19, 163.5, '서울'],
 '남궁수현': ['01-3456-7891', 21, 156.7, '경기'],
 '최흥선': ['070-4321-1111', 21, 187.2, '부산'],
 '김선주': ['010-3333-8888', 22, 164.6, '광주'],
 '함중아': ['010-7654-2345', 18, 178.3, '강원']}

먼저 나이로 구성된 리스트를 생성한다.

In [54]:
ages = []

for person in info_list:
    ages.append(person[2])
    
print(ages)

[20, 19, 21, 21, 22, 18]


리스트에 포함된 나이를 확인하기 위해 중복을 제거한다.
이를 위해 집합 자료형으로 변환시킨다.

In [55]:
ages_set = set(ages)
ages_set

{18, 19, 20, 21, 22}

`ages_set` 집합에 포함된 각각의 항목을 대상으로 `count()` 리스트 메서드를 적용하면 원하는 
사전을 생성할 수 있다.

In [56]:
age_count_dict = dict()

for age in ages_set:
    age_count_dict[age] = ages.count(age)

In [57]:
age_count_dict

{18: 1, 19: 1, 20: 1, 21: 2, 22: 1}

### 해시 가능성

집합의 항목으로 리스트, 사전, 집합과 같은 가변 자료형은 사용할 수 없다.

In [58]:
{[1, 3], 4}

TypeError: unhashable type: 'list'

사전의 키 또한 리스트를 키로 사용할 수 없다.

In [59]:
no_list_keys = {[1, 2]: "리스트는 키로 사용할 수 없음"}

TypeError: unhashable type: 'list'

이유는 리스트 등의 가변 자료형은 해시 가능하지 않기 때문이다.

**`hash()` 함수**

파이썬 객체의 해시 가능성은 `hash()` 함수의 인자로 사용될 수 있는가에 의해 결정된다.
즉 `hash()` 함수와 함께 호출됐을 때 오류가 발생하지 않아야 한다.
이렇게 `hash()` 함수와 함께 호출되었을 때 오류가 발생하지 않은 값을
**해시 가능**<font size="2">hashable</font>하다고 부른다.

해시 가능한 값에 대해 `hash()` 함수의 반환값은 특정 정수이며
서로 다른 두 값은 서로 다른 반환값을 갖는다.
즉, 조금이라도 다른 해시 가능한 값이 인자로 지정되면 다른 값을 계산한다.

In [5]:
hash('123')

-6307178578295685641

In [61]:
hash('123 ')

3543337771683958828

In [62]:
hash((1, 3, 4))

-1070212610609621906

In [63]:
hash((1, 2, 4))

-4363729961677198915

:::{admonition} 해시 함수의 반환값
:class: note

`hash()` 함수의 반환값이 실행할 때마다 달라질 수 있다.
이는 보안상의 이유로 무작위 기능이 적용되기 때문이다.
항상 고정된 값을 반환하는 해시 함수도 있지만 여기서는 다루지 않는다.
:::

반면에 리스트 등 가변 자료형의 객체는 해시 가능하지 않다.

In [64]:
hash([1, 3])

TypeError: unhashable type: 'list'

리스트를 포함한 튜플도 해시 가능하지 않다.

In [65]:
hash(([1, 2], 3))

TypeError: unhashable type: 'list'

집합에 해시 가능한 값만 포함될 수 있는 이유는 두 항목을 구별하기 위해 `hash()` 함수를 이용하기 때문이다.
반면에 리스트 등과 같은 가변 자료형의 값은 언제든 변할 수 있기에 정체를
제대로 파악할 수 없다.

(sec-comprehension)=
## 조건제시법

조건제시법<font size = "2">comprehension</font>을 이용하여 
리스트, 집합, 사전을 정의할 수 있다.

**리스트 조건제시법**

수학에서 0과 10사이에 있는 홀수들의 제곱을 원소로 갖는 집합을 조건제시법으로 표현하면
다음과 같다.

$$\{ x^2 \mid 0 \le x \le 10, \text{ 단 $x$는 홀수} \}$$

0과 10 사이에 있는 홀수들의 제곱을 항목으로 갖는 리스트를 `for` 반복문으로 구현해 보자.

In [66]:
zero2ten_odd = []

for x in range(11):
    if x%2 == 1:
        zero2ten_odd.append(x**2)

zero2ten_odd

[1, 9, 25, 49, 81]

조건제시법을 이용하여 보다 간단하게 리스트를 생성할 수 있다.

In [67]:
zero2ten_odd = [x**2 for x in range(11) if x%2 == 1]
zero2ten_odd

[1, 9, 25, 49, 81]

위 두 코드를 비교하면 조건제시법의 작동원리를 이해할 수 있을 것이다. 

**집합 조건제시법**

위 결과를 집합으로 구현하면 다음과 같다.

In [68]:
zero2ten_odd_set = {x**2 for x in range(11) if x%2 == 1}
zero2ten_odd_set

{1, 9, 25, 49, 81}

**사전 조건제시법**

조건제시법을 이용하여 사전을 생성하는 과정도 유사하다. 
아래 코드는 0부터 10 사이의 홀수를 키로, 홀수의 제곱은 값으로 갖는 항목으로 구성된 사전을 생성한다.

In [69]:
odd_squares = {x : x**2 for x in range(11) if x%2 == 1}
odd_squares

{1: 1, 3: 9, 5: 25, 7: 49, 9: 81}

반면에 아래 코드는 문장에 포함된 단어를 키로, 단어의 길이를 값으로 갖는 항목들로 구성된 사전을 생성한다.

In [70]:
words = '파이썬은 범용 프로그래밍 언어입니다.'.split()
print(words)

['파이썬은', '범용', '프로그래밍', '언어입니다.']


In [71]:
len_dict = {k : len(k) for k in words}
len_dict

{'파이썬은': 4, '범용': 2, '프로그래밍': 5, '언어입니다.': 6}

## 예제

**예제 1**

아래 코드 중 오류가 발생하는 코드를 예측하여 말하고, 코드를 실행시켜 확인하여라.

(1) 

In [1]:
dic1 = { 1 : 'a'}
dic1

{1: 'a'}

답:

사전의 키는 해시 가능해야 하는데, 정수는 해시 가능하다.

In [2]:
hash(1)

1

(2)

In [3]:
dic3 = {'abc' : 'a'}
dic3

{'abc': 'a'}

답:

사전의 키는 해시 가능해야 하는데, 문자열 해시 가능하다.

In [4]:
hash('abc')

-2898649570265123009

(3)

In [5]:
dic4 = {[1, 2] : 'a'}
dic4

TypeError: unhashable type: 'list'

답:

사전의 키는 해시 가능해야 하는데, 리스트는 해시 가능하지 않다.

In [6]:
hash([1, 2])

TypeError: unhashable type: 'list'

**예제 2**

영어 단어는 키로, 단어의 뜻은 값으로 하는 사전이 다음과 같이 주어졌다.

In [7]:
eng_dict = {'dog': '개', 'cat': '고양이', 'lion': '사자', 'tiger': '호랑이', 'snake': '뱀'}

영어 단어가 인자로 입력되었을 때 사전의 키로 사용되었다면 뜻을 반환하고,
아니면 아래 문장을 반환하는 `eng_fun()` 함수를 선언하라.
단, 대소문자는 구분하지 않는다.

    찾는 단어가 없습니다.

답:

사전에 키로 사용된 영어 단어는 모두 소문자만 사용한다.
따라서 입력값을 먼저 소문자만 사용하도록 한 다음에 키로 사용되었는지 여부를 판단한다.

In [8]:
def eng_fun(word):
    word = word.lower()
    if word in eng_dict:
        return eng_dict[word]
    else:
        return '찾는 단어가 없습니다.'

In [9]:
eng_fun('dog')

'개'

In [10]:
eng_fun('fox')

'찾는 단어가 없습니다.'

다음과 같이 사전의 `get()` 메서드를 이용하여 `eng_func()` 함수를 선언할 수도 있다.

In [11]:
def eng_fun(word):
    word = word.lower()
    return eng_dict.get(word, '찾는 단어가 없어요.')

In [12]:
eng_fun('dog')

'개'

In [13]:
eng_fun('fox')

'찾는 단어가 없어요.'

반면에 다음과 같이 사전 인덱싱을 이용하면 찾는 단어가 없는 경우 오류가 발생한다.

In [14]:
def eng_fun(word):
    word = word.lower()
    return eng_dict[word]

In [15]:
eng_fun('dog')

'개'

In [16]:
eng_fun('fox')

KeyError: 'fox'

다음과 같이 예외처리를 이용할 수는 있다.

In [17]:
def eng_fun(word):
    word = word.lower()
    try:
        return eng_dict[word]
    except:
        return "찾는 단어가 없어요."   

In [18]:
eng_fun('dog')

'개'

In [19]:
eng_fun('fox')

'찾는 단어가 없어요.'

하지만 예외처리를 하는 것보다는 `get()` 메서드를 사용하여 애초에 오류가 발생하지 않도록
코드를 작성하는 게 보다 중요하다.

**예제 3**

정수들의 리스트가 인자로 입력되었을 때 리스트의 항목은 키로,
해당 항목이 위치한 곳의 인덱스들의 리스트를 값으로 갖는 사전 객체를 반환하는 
`list2dic()` 함수를 구현하라.

`list2dic()` 함수는 예를 들어 아래와 같이 작동해야 한다.

```
list2dic([2, 5, 2, 3, 3, 2]) = {2: [0, 2, 5], 3: [3, 4], 5: [1]}
list2dic([15, 3, 15, 1, 3, 8]) = {1: [3], 3: [1, 4], 8: [5], 15: [0, 2]}
```

힌트: `enumerate()` 함수, 리스트의 `count()` 메서드,
`collections` 모듈의 `defaultdict` 클래스를 이용한다.

답 1:

In [20]:
def list2dic(xs):
    list_dict = dict()
    for i, item in enumerate(xs):
        if item in list_dict:
            list_dict[item].append(i)
        else:
            list_dict[item] = [i]

    return list_dict

In [21]:
print(list2dic([2, 5, 2, 3, 3, 2]))
print(list2dic([15, 3, 15, 1, 3, 8]))

{2: [0, 2, 5], 5: [1], 3: [3, 4]}
{15: [0, 2], 3: [1, 4], 1: [3], 8: [5]}


답 2:

`collections` 모듈의 `defaulitdict`를 활용하면 보다 간단하게 함수를 구현할 수 있다.

In [22]:
from collections import defaultdict

In [23]:
list_dict = defaultdict(list)

In [24]:
list_dict

defaultdict(list, {})

In [25]:
list_dict[1].append(3)

In [26]:
list_dict[2].append(0)

In [27]:
list_dict

defaultdict(list, {1: [3], 2: [0]})

In [28]:
def list2dic(xs):
    list_dict = defaultdict(list)
    for i, item in enumerate(xs):
        list_dict[item].append(i)

    return dict(list_dict)

In [29]:
print(list2dic([2, 5, 2, 3, 3, 2]))
print(list2dic([15, 3, 15, 1, 3, 8]))

{2: [0, 2, 5], 5: [1], 3: [3, 4]}
{15: [0, 2], 3: [1, 4], 1: [3], 8: [5]}


**예제 4**

(1) 아래 리스트를 리스트 조건제시법으로 정의하라.

    [3, 6, 9, 12, 15]

답:

In [50]:
multiples_3 = [ 3*x for x in range(1,6) ]
print(multiples_3)

[3, 6, 9, 12, 15]


또는

In [51]:
multiples_3 = [ x for x in range(1,16) if x % 3 == 0]
print(multiples_3)

[3, 6, 9, 12, 15]


(2) 0부터 20까지의 자연수 중에서 3으로 나눈 나머지가 2이면서 짝수인 수의 제곱으로 이루어진 리스트를 조건제시법으로 정의하라.
즉, 아래 리스트를 조건제시법으로 생성해야 한다.

```python
[4, 64, 196, 400]
```

답:

In [32]:
list_modulo3 = [x**2 for x in range(0, 21) if x%3 == 2 and x%2 == 0]

print(list_modulo3)

[4, 64, 196, 400]


**예제 5**

6명의 정보가 다음과 같다.

In [33]:
kgh = ['김강현', '010-1234-5678', 20, 172.3, '제주']
whang = ['황현', '02-9871-1234', 19, 163.5, '서울']
namgung = ['남세원', '010-3456-7891', 21, 156.7, '경기']
choihs = ['최흥선', '070-4321-1111', 21, 187.2, '부산']
sjkim = ['김현선', '010-3333-8888', 22, 164.6, '광주']
ja = ['함중아', '010-7654-2345', 18, 178.3, '강원']

In [34]:
info_list = [kgh, whang, namgung, choihs, sjkim, ja]
info_list

[['김강현', '010-1234-5678', 20, 172.3, '제주'],
 ['황현', '02-9871-1234', 19, 163.5, '서울'],
 ['남세원', '010-3456-7891', 21, 156.7, '경기'],
 ['최흥선', '070-4321-1111', 21, 187.2, '부산'],
 ['김현선', '010-3333-8888', 22, 164.6, '광주'],
 ['함중아', '010-7654-2345', 18, 178.3, '강원']]

(1) `info_list`에 포함된 6명의 이름과 전화번호만으로 구성된 사전을 가리키는 `phone_dict` 변수를 
`for` 반복문을 이용하여 선언하라.
단, 키는 이름, 값은 전화번호로 지정하며, 조건제시법은 사용하지 않는다.

답:

In [35]:
phone_dict = dict()

for people in info_list:
    name = people[0]
    phone_number = people[1]
    phone_dict[name] = phone_number

In [36]:
phone_dict    

{'김강현': '010-1234-5678',
 '황현': '02-9871-1234',
 '남세원': '010-3456-7891',
 '최흥선': '070-4321-1111',
 '김현선': '010-3333-8888',
 '함중아': '010-7654-2345'}

(2) `phone_dict` 변수가 가리키는 값을 조건제시법을 이용하여 선언하라.

답:

In [37]:
phone_dict = {people[0]:people[1] for people in info_list}

In [38]:
phone_dict

{'김강현': '010-1234-5678',
 '황현': '02-9871-1234',
 '남세원': '010-3456-7891',
 '최흥선': '070-4321-1111',
 '김현선': '010-3333-8888',
 '함중아': '010-7654-2345'}

(3) `phone_dict`를 이용해서 이름을 지정하면 전화번호를 알려주는 `phone_book()` 함수를 정의하라.

In [39]:
def phone_book(name):
    return phone_dict[name]

In [40]:
phone_book('김현선')

'010-3333-8888'

In [41]:
phone_book('최흥선')

'070-4321-1111'

**예제 6**

아래 문자열을 이용한다.

In [42]:
lyrics = "Twinkle, twinkle, little star. How I wonder what you are."

(1) 위 문자열을 소문자로 변경한 후, 공백을 기준으로 쪼개진 단어들의 리스트를 `lyrics_list` 변수에 할당하라.

In [43]:
lyrics_list = lyrics.lower().split()
lyrics_list

['twinkle,',
 'twinkle,',
 'little',
 'star.',
 'how',
 'i',
 'wonder',
 'what',
 'you',
 'are.']

(2) `lyrics_list`의 각 항목의 문자열 길이를 항목으로 갖는 리스트를 만들어라.  
예를 들어, `['hello', 'python']`의 경우, 각 항목의 문자열 길이를 항목으로 갖는 리스트는 `[5, 6]` 이다.

In [44]:
[len(x) for x in lyrics_list]

[8, 8, 6, 5, 3, 1, 6, 4, 3, 4]

(3) `lyrics_list`의 항목 중 일부는 콤마(,)나 마침표(.)가 사용되었다. 콤마나 마침표를 제외한 단어의 길이를 표시하도록 (2)의 코드를 수정하여라.

In [45]:
[len(x.strip('.').strip(',')) for x in lyrics_list]

[7, 7, 6, 4, 3, 1, 6, 4, 3, 3]

**예제 7**

리스트를 인자로 받아서 사용된 항목의 개수를 반환하는 함수
`count_elem()`를 구현하라.
단, 중복 항목은 하나로 간주한다.

```
count_elem([2, 5, 2, 3, 3, 8, 2, 7]) = 5
count_elem([15, 3, 15, 1, 3]) = 3
```

답:

In [46]:
def count_elem(xs):
    return len(set(xs))

print(count_elem([2, 5, 2, 3, 3, 8, 2, 7]))
print(count_elem([15, 3, 15, 1, 3]))

5
3


**예제 8**

교육 참가자 명단과 수료자 명단이 아래처럼 리스트로 주어다.

In [47]:
participant = ['Apeach', 'Ryan', 'Muzi', 'Choonsik', 'Neo', 'Tube']
completion = ['Ryan', 'Muzi', 'Neo', 'Choonsik']

수료하지 못한 사람들의 명단을 리스트로 출력하는 코드를 작성하여라.
단, 참여자 중 동명이인은 없고, 순서는 중요하지 않다. 

답:

In [48]:
unfinished = list(set(participant) - set(completion))
unfinished

['Apeach', 'Tube']

또는

In [49]:
unfinished = list(set(participant).difference(set(completion)))
unfinished

['Apeach', 'Tube']

## 연습문제

참고: [(연습) 사전과 집합](https://colab.research.google.com/github/codingalzi/42H/blob/master/practices/practice-dicts_sets.ipynb)