### 집합형(set)

집합자료형(set)은 파이썬 v2.3부터 지원하기 시작한 자료형이다. 이 자료형은 집합과 관련된 작업들을 보다 쉽게 처리할 수 있도록 만들어진 자료형이다.

#### 집합자료형의 특징
1. 중복을 허용하지 않고 집합안에서 unique한 값을 가진다.
2. 순서가 없다.
3. set의 선언 <code>{}</code>를 사용하는 것은 dictionary와 유사하지만 key는 없고 value만 존재한다.
4. set(집합) 내부원소는 다양한 값을 함께 가질 수 있지만 mutable한 값은 가질 수 없다.

리스트나 튜플은 순서가 있기 때문에 인덱싱을 통해 자료의 값을 가져올 수 있지만 set자료형은 순서가 없기 때문에 인뎅싱으로 자료를 가져올 수 없다. 따라서 set자료형의 저장된 값을 가져오기 위해서는 리스트나 튜플로 변환한 후에 인덱싱을 통해 가져와야 한다.

set 자료형의 특징은 집합관련 연산이나 특히, 중복을 제거하기 위한 필터역할로 종종 사용된다.
set 자료형은 <code>{}</code>만으로 선언할 수 없다.  선언하기 위해서는 <code>{}</code>안에 값을 가진 객체로 선언하거나 <code>set()</code>이라는 생성자로 선언한다.

생성자 set()에 iterable한 객체를 전달하면 자동으로 set자료형으로 변환해준다.

#### 1. set자료형 선언

In [6]:
# 1. 선언(1) : 중괄호 내부에 값을 가진 객체로 선언
s ={1}

# 2. 선언(2) : set() 생성자로 선언
a = set()
print(type(s),type(a))
print(a)

# 3. 선언(3) : interable를 이용한선언
s2 = set([1,2,3,4,5,6,7])
print(s2)

# 4. 선언(4) : 중복된 값이 있을 경우, 자동으로 중복된 값이 제거됨
# set자료형은 순서가 없기 때문에 어떤 값이 나올지 모름

s = {1,2,3,4,5,1,6,7}
print(s)

<class 'set'> <class 'set'>
set()
{1, 2, 3, 4, 5, 6, 7}
{1, 2, 3, 4, 5, 6, 7}


#### 2. set자료형 사용하기
교집합/합집합/차집합을 구할 경우 많이 사용된다. set 자료형의 요소에는 직접 접근할 수 없기 때문에 집합형을 리스트나 튜플로 변환해서 접근해야한다.

In [None]:
s = {1,2,3,4,5,6,7}
l =list(s)
t = tuple(s)
print(l[3])
print(s , type(s))
print(l, type(l))
print(t, type(t))

In [17]:
s1 = set([1,2,3,4,5,6])
s2 = set([4,5,6,7,8,9])
dir(s1)

['__and__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__iand__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__isub__',
 '__iter__',
 '__ixor__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__rand__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__ror__',
 '__rsub__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__xor__',
 'add',
 'clear',
 'copy',
 'difference',
 'difference_update',
 'discard',
 'intersection',
 'intersection_update',
 'isdisjoint',
 'issubset',
 'issuperset',
 'pop',
 'remove',
 'symmetric_difference',
 'symmetric_difference_update',
 'union',
 'update']

In [16]:
# 1. 교집합 (& or intersection())
print(s1 & s2)
print(s1.intersection(s2))

{4, 5, 6}
{4, 5, 6}


In [18]:
# 2. 합집합 (| or union())
u1 = s1 | s2
u2 = s1.union(s2)
print(u1, u2)

{1, 2, 3, 4, 5, 6, 7, 8, 9} {1, 2, 3, 4, 5, 6, 7, 8, 9}


In [19]:
# 3. 차집합 (- or difference())
u1 = s1 - s2
u2 = s1.difference(s2)
print(u1, u2)

{1, 2, 3} {1, 2, 3}


#### 3. set자료형 관련 함수

* add() : 1개의 값을 추가
* update() : 다수의 값을 추가
* remove() : 특정 값을 삭제
* copy() : 복사


In [22]:
# 1. add()

s = set([1,2,3,4,5,6])
s.add('x')
print(s)

{1, 2, 3, 4, 5, 6, 'x'}


In [24]:
# 2. update()
s.update(['y','z'])
s.update(('m','l'))
print(s)

{1, 2, 3, 4, 5, 6, 'm', 'y', 'l', 'z', 'x'}


In [28]:
# 3. remove()
s.remove(('m'))
print(s) #값이 없을 경우 key error 발생

TypeError: remove() takes exactly one argument (3 given)

In [30]:
# 4. copy() set의 copy()는 얕은 복사
t = s.copy()
print(t)

{1, 2, 3, 4, 5, 6, 'y', 'l', 'z', 'x'}


In [34]:
# issubset() : 부분집합 여부 확인
a = {1,2,3,4,5}
b = {1,2,3}

print(a.issubset(b))
print(b.issuperset(a))
print(b.isdisjoint(a))


# issuperset() : issubset과 반대 
# isdijoint() : 교집합이 없으면 True

False
False
False
