# 자료구조: 튜플(tuple)과 셋(set)

## 튜플

튜플(tuple)은 수학적 개념인 순서쌍을 구현한 자료구조이다.
튜플을 생성하는 방법은 `[]` 대신 `()`를 사용한다는 점을 제외하면 리스트와 동일하다.
튜플도 인덱스를 이용해서 저장된 값에 접근한다.
튜플과 리스트의 가장 큰 차이점은 리스트는 `mutable`하지만 튜플은 `immutable`하다는 것이다.
따라서 일단 생성된 튜플은 수정할 수 없다.
즉 값을 수정하거나 추가하거나 삭제할 수 없다.

In [1]:
heam = ('Darwin Dawkins Park', 184, 76)
print(type(heam))
print(heam)

<class 'tuple'>
('Darwin Dawkins Park', 184, 76)


In [2]:
print(heam[1])
print(heam[:2])
print(184 in heam)

184
('Darwin Dawkins Park', 184)
True


In [3]:
for value in heam:
    print(value)

Darwin Dawkins Park
184
76


In [4]:
print(len(heam))
print(heam.count(184))
print(heam.index(184))

3
1
1


In [5]:
heam[0] = 'Charles Darwin'

TypeError: 'tuple' object does not support item assignment

In [6]:
heam.append(30)

AttributeError: 'tuple' object has no attribute 'append'

리스트 자료구조와 같이 튜플 간의 `+` 연산과 튜플에 대한 정수 곱셈 연산이 가능하다.
이들 연산은 피연산자인 튜플을 변경하는 것이 아니라 연산 결과를 새로운 튜플로 준다,
따라서 이들 연산 결과를 저장해야 다른 연산에 사용할 수 있다.

In [7]:
print(heam + heam)
print(heam * 3)
print(heam)

('Darwin Dawkins Park', 184, 76, 'Darwin Dawkins Park', 184, 76)
('Darwin Dawkins Park', 184, 76, 'Darwin Dawkins Park', 184, 76, 'Darwin Dawkins Park', 184, 76)


내장함수 `list()`, `tuple()`를 사용하면 리스트를 튜플로 또는 튜플을 리스트로 변환할 수 있다.

In [8]:
gender = ['M']*2 + ['F']*4 + ['M'] + ['F']*2 + ['M'] + \
        ['F']*2 + ['M'] + ['F']*4 + ['M']*2
weight = [62.0, 62.9, 36.1, 54.6, 48.5, 42.0, 47.4, \
          50.6, 42.0, 48.7, 40.3, 33.1, 51.9, 42.4, \
          34.5, 51.1, 41.2, 51.9, 46.9]
metabolic_rate = [1792, 1666, 995, 1425, 1396, 1418, 1362, 1502,\
        1256, 1614, 1189, 913, 1460, 1124, 1052, 1347,\
        1204, 1867, 1439]

In [9]:
print(type(gender))
gender = tuple(gender)
print(type(gender))
gender = list(gender)
print(type(gender))

<class 'list'>
<class 'tuple'>
<class 'list'>


### 패킹(packing)

여러 값을 한 변수에 저장하면 해당 변수는 모든 값을 저장한 튜플이 된다.
이런 연산을 패킹이라 한다.

In [10]:
pack = 'joongyang' + ' ' + 'park', 'GNU', 12345, 3.141592
print(type(pack))
print(pack)

<class 'tuple'>
('joongyang park', 'GNU', 12345, 3.141592)


## 셋

값을 저장한 순서가 중요한 리스트나 튜플과 달리 **셋**(set)은 값의 순서는 아무런 의미가 없고 값의 중복도 허용하지 않는 자료구조이다.
셋은 수학적 개념인 집합을 구현한 자료구조라고 할 수 있다.
값이 저장된 순서가 아무런 의미도 없기 때문에 리스트와 튜플에서 사용했던 인덱스와 `[]`연산자를 셋에서는 사용할 수 없다.
셋은 `mutable`하기 때문에 새로운 원소를 추가/삭제할 수 있으며, 특정한 값이 집합의 원소인가를 알아 보는 연산, 합집합 연산, 교집합 연산, 차집합 연산 등을 수행하는 메소드와 연산자가 구현되어 있다.

셋은 쉼표로 구분한 원소를 `{}`로 감싸서 생성한다.
원소가 하나인 셋을 생성할 때도 값 뒤에 쉼표를 기재해야 한다.

In [11]:
A = {'가', '나', '다'}
print(A)
print(type(A))

{'다', '나', '가'}
<class 'set'>


셋에 원소 하나를 추가할 때는 `add()` 메소드를 사용하고, 여러 개의 원소를 추가할 때는 추가할 원소의 리스트를 인자로 `update()` 메소드를 호출하면 된다.
동일한 값을 여러 번 추가할 수는 있지만 셋은 중복을 허용하지 않기 때문에 한 번만 저장한다.

In [12]:
A.add('라')
print(A)
A.update(['라', '라', '마', '마'])
print(A)

{'다', '나', '라', '가'}
{'라', '나', '다', '가', '마'}


특정한 값을 제거하고자 하면 제거할 값을 인자로 `discard()` 또는 `remove()` 메소드를 호출하면 된다.

In [13]:
A.discard('가')
print(A)
A.remove('나')
print(A)

{'라', '나', '다', '마'}
{'라', '다', '마'}


`discard()` 메소드와 `remove()` 메소드의 차이는 셋에 없는 값을 삭제할 때 나타난다.
`discard()` 메소드는 셋에 없는 값을 삭제하려고 하면 그냥 무시하지만 `remove()` 메소드는 `KeyError` 오류를 발생시킨다.

In [14]:
A.discard('가')
print(A)
A.remove('가')
print(A)

{'라', '다', '마'}


KeyError: '가'

특정한 값이 집합의 원소인가를 알아볼 때는 `in` 연산자, 합집합 연산은 `|` 연산자 또는 `union()` 메소드, 교집합 연산은 `&` 연산자 또는 `intersection()` 메소드, 차집합 연산은 `-` 연산자 또는 `difference()` 메소드를 이용하여 수행할 수 있다.

In [15]:
print(A)
B = {'가', '나', '다'}
print(B)

{'라', '다', '마'}
{'다', '나', '가'}


In [16]:
print('가' in A)
print('가' not in A)

False
True


In [17]:
for ele in A:
    print(ele)

라
다
마


In [18]:
AorB = A | B
AcupB = A.union(B)
print(AorB)
print(AcupB)

{'가', '라', '나', '마', '다'}
{'가', '라', '나', '마', '다'}


In [19]:
AandB = A & B
AcapB = A.intersection(B)
print(AandB)
print(AcapB)

{'다'}
{'다'}


In [20]:
AminusB = A - B
AdiffB = A.difference(B)
print(AminusB)
print(AdiffB)
BminusA = B - A
BdiffA = B.difference(A)
print(BminusA)
print(BdiffA)

{'라', '마'}
{'라', '마'}
{'가', '나'}
{'가', '나'}


그 외에도 한 집합이 다른 집합의 부분집합(subset)인지 확대집합(superset)인지 또는 서로소 집합인지를 검사하여 결과를 논리값으로 반환하는 `issubset()`, `issuperset()`, `isdisjoint()` 메소드가 있다.

In [21]:
ans = A.issubset(B)
print(ans)

False


### 튜플과 셋에 사용할 수 있는 내장함수

내장함수 `all()`, `any()`, `enumerate()`, `len()`, `max()`, `min()`, `sorted()`, `sum()`은 리스트 자료구조 뿐만 아니라 튜플과 셋 자료구조에도 사용할 수 있다.

## 연습문제

1. 다음 패킹 또는 언패킹의 결과를 예상해보시오.
    * `a, b = "XY"`
    * `a, b = range(1, 10, 3)`
    * `a, *b = 1, 2, 3, 4, 5, 6`
    * `a, *b, c = 1, 2, 3, 4, 5, 6`
    * `a, *b = "X"`
    * `a, *b, c = "XY"`
    * `*a, b = [1]`
2. 전체집합 U, 부분집합 A, B가 아래와 같이 정의되어 있다. $A \cap B^c$와 $\left( A \cup B \right)^c$를 구하시오.
```python
U = set(range(1, 11))
A = {1, 3, 5, 7, 9}
B = {1, 2, 3, 4, 5}
```
3. 100 이하의 자연수 중에서 2의 배수 또는 3의 배수의 집합을 만들어 보시오.
4. 전체 고객의 이름이 저장된 셋은 S, 지난 3개월간 구매한 적이 있는 고객의 이름이 저장된 셋은 C, 지난 3개월간 방문한 적이 있는 고객의 이름이 저장된 셋은 V이다.
    * 지난 3개월간 구매한 적이 없는 고객의 명단을 구하시오.
    * 지난 3개월간 방문한 적이 없는 고객의 명단을 구하시오.
    * 지난 3개월간 방문했지만 구매한 적이 없는 고객의 명단을 구하시오.