### 집합형(set)

집합자료형(set)은 파이썬 V2.3부터 지원되기 시작한 자료형이다. 이 자료형은 집합과 관련된 작업들을 보다 쉽게 처리할 수 있도록 만들어지 자료형이다.

#### 집합자료형의 특징
1. 중복을 허용하지 않고 집합안에서 unique한 값을 가진다.
2. 순서가 없다.
3. set의 선언은 <code>중괄호 {}</code>를 사용하는 것은 dictionary와 유사하지만 key는 없고 value만 존재한다.
4. set(집합) 내부원소는 다양한 값을 함께 가질 수 있지만 mutable한 값은 가질 수 없다.


리스트나 튜블은 순서가 있기 때문에 인덱싱을 통해서 자료의 값을 가져올 수 있지만 set자료형은 순서가 없기 때문에 인덱싱으로 자료흘 가져올 수 없다. 따라서 set자료형의 저장된 값을 가져오기 위해서는 리스트나 튜플로 변환한 후에 인덱싱을 통해서 자료를 가져올 수 있다.

set자료형의 특징은 집합관련 연산이나 특히, 중복을 제거하기 위한 필터역할로 종종 사용된다.
set자료형은 빈 <code>중괄호 {}</code>로 선언할 수 없다. 선언하려면 중괄호안에 값을 가진 객체로 선언하거나 set()이라는 생성자로 선언한다.

생성자 set()에 iterable한 객체를 전달하면 자동으로 set자료형으로 변환해 준다.

#### 1. set자료형 선언

In [12]:
s = {}
print(type(s))

# 1. 선언(1) : 중괄호 내부에 값을 가진 객체로 선언하기
s = {1,2,3,4}
print(type(s))

# 2. 선언(2) : set()생성자로 선언하기
s1 = set()
print(type(s1))

# 3. 선언(3) : iterable객체를 이용한 선언
s2 = set([1,3,4,6,7])
print(s2)
print(type(s2))

# 4. 중복된 값이 있을 경우 자동으로 중복된 값이 제거된다.
# set()자료형은 순서가 없기 때문에 어떤 값이 먼저 나올지 모른다.
s = {1, 5, 1, 1, 1, 3, 8, 7}
print(s)

<class 'dict'>
<class 'set'>
<class 'set'>
{1, 3, 4, 6, 7}
<class 'set'>
{1, 3, 5, 7, 8}


#### 2. set자료형 사용하기
교집합/합집합/차집합을 구할경우에 많이 사용된다. set자료형의 요소에는 직접접근할 수 없기 때문에 집합형을 리스트나 튜플로 변환해서 접근해야 한다.

In [17]:
s = set([1,3,4,6,7])
l = list(s)
print(type(l))
print(s)
print(l)
print(l[0])

t = tuple(s) # or tuple(l)
print(t[1])

<class 'list'>
{1, 3, 4, 6, 7}
[1, 3, 4, 6, 7]
1
3


In [22]:
s1 = set([1,2,3,4,5,6])
s2 = set([4,5,6,7,8,9])
print(dir(s1))

['__and__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__iand__', '__init__', '__init_subclass__', '__ior__', '__isub__', '__iter__', '__ixor__', '__le__', '__len__', '__lt__', '__ne__', '__new__', '__or__', '__rand__', '__reduce__', '__reduce_ex__', '__repr__', '__ror__', '__rsub__', '__rxor__', '__setattr__', '__sizeof__', '__str__', '__sub__', '__subclasshook__', '__xor__', 'add', 'clear', 'copy', 'difference', 'difference_update', 'discard', 'intersection', 'intersection_update', 'isdisjoint', 'issubset', 'issuperset', 'pop', 'remove', 'symmetric_difference', 'symmetric_difference_update', 'union', 'update']


In [21]:
# 1. 교집합 (& or intersection())
print(s1 & s2)
print(s1.intersection(s2))

{4, 5, 6}
{4, 5, 6}


In [24]:
# 2. 합집합(| or union())
print(s1 | s2)
print(s1.union(s2))

{1, 2, 3, 4, 5, 6, 7, 8, 9}
{1, 2, 3, 4, 5, 6, 7, 8, 9}


In [26]:
# 3. 차집합(- or difference())
print(s1 - s2)
print(s1.difference(s2))

{1, 2, 3}
{1, 2, 3}


#### 3. set자료형 관련 함수

* add()    : 1개의 값을 추가
* update() : 여러개의 값을 추가
* remove() : 특정값을 삭제
* copy ()  : 자료를 복사

In [28]:
# 1. add
s = set([1,2,3])
# help(s)
s.add('x')
s.add('a')
s.add(4)
print(s)

{1, 2, 3, 4, 'a', 'x'}


In [31]:
# 2. update()
s.update([5,6,7])
print(s)
s.update([6,7,8])
print(s)
s.update(('l', 'm', 'n'))
print(s)

{1, 2, 3, 4, 5, 6, 7, 8, 'a', 'x'}
{1, 2, 3, 4, 5, 6, 7, 8, 'a', 'x'}
{1, 2, 3, 4, 5, 6, 7, 8, 'a', 'l', 'm', 'x', 'n'}


In [33]:
# 3. remove()
s.remove(3)
print(s)

# s.remove('z') # 값이 없을 경우에 KeyError 발생

KeyError: 3

In [34]:
# 4. copy() : set의 copy()함수는 얕은 복사
s = {1,3,5}
t = s.copy()
print(s)
print(t)

{1, 3, 5}
{1, 3, 5}


In [36]:
# issubset() : 부분집합 여부확인
a = {1,2,3,4,5}
b = {1,2,3}
print(a.issubset(b))
print(b.issubset(a))

False
True


In [38]:
# issuperset() : issubset과 반대 superset인지 여부 확인
a = {1,2,3,4,5}
b = {1,2,3}
print(a.issuperset(b))
print(b.issuperset(a))

True
False


In [42]:
# isdisjoint() : 교집합이 없으면 True 있으면 False
a = {1,2,3}
b = {4,5,6}
print(a.isdisjoint(b))

c = {1,2,3}
d = {3,4,5}
print(c.isdisjoint(d))

True
False
