# 집합형(set)

* 집합자료형(set)은 파이썬v2.3부터 지원하기 시작한 자료형이다.
* 이 자료형은 집합과 관련된 작업을 보다 쉽게 처리할 수 있도록 만들어진 자료형이다

## 집합자료형의 특징

1. 중복을 허용하지 않고 집합안에는 unique한 값을 가진다.
1. 순서가 없다. 
1. set의 선언은 `중괄호{}`로 선언한다. 중괄호로 선언하는 것은 dictionary와 유사하지만 `key가 없고 value만 있는 자료형`이다.
1. set의 내부요소(값)는 다양한 값을 가질 수 있지만 `mutable한 자료는 불가`

* 리스트나 튜플은 순서가 있기 때문에 indexing을 통해서 자료의 값을 가져올 수 있지만 set은 순서가 없기 때문에 indexing으로 자료를 가져올 수가 없다.
* 따라서, set자료형의 저장된 값을 읽기 위해서는 list나 tuple로 변환한 후에 indexing을 통해서 자료를 가져올 수 있다.

>* set자료형의 특징은 집합관련 연산이나 특히, 중복을 제거하기 위한 필터역활로 종종사용한다.
>* set자료형은 `빈 중괄호{}로 선언할 수 없다`. set자료형으로 선언하려면 중괄호안에 적어도 1개의 값이상을 가진 객체로 선언하거나 `set() 생성자함수로 선언`한다.
>* 생성자 set()함수의 매개변수에 iterable한 객체를 전달하면 자동으로 set자료형으로 변환해 준다.

## 1. set자료형의 선언

In [5]:
print(type({}), type({1}))
print()

print(dir({1}))
print()

print(dir({}))

<class 'dict'> <class 'set'>

['__and__', '__class__', '__class_getitem__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__iand__', '__init__', '__init_subclass__', '__ior__', '__isub__', '__iter__', '__ixor__', '__le__', '__len__', '__lt__', '__ne__', '__new__', '__or__', '__rand__', '__reduce__', '__reduce_ex__', '__repr__', '__ror__', '__rsub__', '__rxor__', '__setattr__', '__sizeof__', '__str__', '__sub__', '__subclasshook__', '__xor__', 'add', 'clear', 'copy', 'difference', 'difference_update', 'discard', 'intersection', 'intersection_update', 'isdisjoint', 'issubset', 'issuperset', 'pop', 'remove', 'symmetric_difference', 'symmetric_difference_update', 'union', 'update']

['__class__', '__class_getitem__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getstate__', '__gt__', '__hash__', '_

In [19]:
# 1. set자료형선언

# 1) 선언 : 중괄호 내부에 값을 가진 객체로 선언하기
s1 = {1,2,3,4}
print(s1, len(s1), type(s1), )

# 2) 선언 : set()생성자함수 이용
s2 = set()
print(s2, len(s2), type(s2), )

# 3) 선언 : set(iterable)생성자함수 이용
s3 = set([1,2,3,4])
print(s3, len(s3), type(s3), )

s3 = set((1,2,3,4))
print(s3, len(s3), type(s3), )

s3 = set(range(5))
print(s3, len(s3), type(s3), )

s3 = set({1:10, 'name':'소향'})
print(s3, len(s3), type(s3), )

# 4. 중복된 값이 있을 경우 자동으로 중복값이 제거된다.
# set자료형은 순서가 없기 때문에 무작위로 값을 추출한다.
s4 = {1,4,5,1,7,1,2,4,3,5}
print(s4, len(s4), type(s4))


{1, 2, 3, 4} 4 <class 'set'>
set() 0 <class 'set'>
{1, 2, 3, 4} 4 <class 'set'>
{1, 2, 3, 4} 4 <class 'set'>
{0, 1, 2, 3, 4} 5 <class 'set'>
{1, 'name'} 2 <class 'set'>
{1, 2, 3, 4, 5, 7} 6 <class 'set'>


## 2. set자료형 사용하기

* `교집합/합집합/차집합`을 구하는 경우에 많이 사용된다.
* set자료형의 요소에는 직접 접근할 수 없기 때문에 list 또는 tuple로 변환후 사용

In [21]:
s = set([1,3,4,6,7])
l = list(s)
t = tuple(s)
print(s, type(s))
print(l, type(l))
print(t, type(t))

{1, 3, 4, 6, 7} <class 'set'>
[1, 3, 4, 6, 7] <class 'list'>
(1, 3, 4, 6, 7) <class 'tuple'>


In [23]:
# 1. 교집합(intersection() or &)
s1 = {1,2,3,4,5,6}
s2 = {4,5,6,7,8,9}

print(s1 & s2)
print(s1.intersection(s2))

{4, 5, 6}
{4, 5, 6}


In [24]:
# 2. 합집합(union() or |)
print(s1 | s2)
print(s1.union(s2))

{1, 2, 3, 4, 5, 6, 7, 8, 9}
{1, 2, 3, 4, 5, 6, 7, 8, 9}


In [26]:
# 3. 차집합(difference() or -)
print(s1 - s2)
print(s1.difference(s2))
print()

print(s2 - s1)
print(s2.difference(s1))

{1, 2, 3}
{1, 2, 3}

{8, 9, 7}
{8, 9, 7}


## 3. set자료형 관련함수

* add()    : 1개의 값을 추가
* update() : 여러개의 값을 추가
* remove() : 특정값을 삭제
* copy()   : 자료를 복사

In [29]:
# 1. add()
s = set([1,2,3])
# help(s)

s.add('x'); s.add('y'); s.add('z'); s.add(4); s.add(2)
print(s)

{1, 2, 3, 4, 'y', 'x', 'z'}


In [36]:
# 2. update()
# s.update?
s.update([5,6,7])
print(s)

s.update([8,6,7])
print(s)

s.update(['a', 'b', 'c'])
print(s)

{1, 2, 3, 4, 5, 6, 7, 'a', 'y', 'b', 'x', 'z', 'c'}
{1, 2, 3, 4, 5, 6, 7, 8, 'a', 'y', 'b', 'x', 'z', 'c'}
{1, 2, 3, 4, 5, 6, 7, 8, 'a', 'y', 'b', 'x', 'z', 'c'}


In [37]:
# 3. remove()
s.remove(8)
print(s)

# 없는 값을 삭제할 경우 에러 발생
# s.remove('10') KeyError: '10'

{1, 2, 3, 4, 5, 6, 7, 'a', 'y', 'b', 'x', 'z', 'c'}


KeyError: '10'

In [51]:
# 4. copy
# set.copy? : 얕은 복사
# s1 = {1,2,['x', 'y'],3} # set에는 mutable자료형 저장불가
s1 = {1,2,('x', 'y'),3}
s2 = s1.copy()

print('s1의 id = ', id(s1))
print('s2의 id = ', id(s2))

s.remove(3)
print(s1, s2)

s1의 id =  1699413709920
s2의 id =  1699413710592
{1, 2, 3, ('x', 'y')} {1, 2, 3, ('x', 'y')}


In [53]:
# 5. issubset() : 부분집합여부를 확인
a = {1,2,3,4,5}
b = {1,2,3}

print(a.issubset(b))
print(b.issubset(a))

False
True


In [55]:
# 6. issuperset(): issubset()과 반대 모집합여부확인
print(a.issuperset(b))
print(b.issuperset(a))

True
False


In [58]:
# 7. isdisjoint() : 교집합이 아니면 True, 있으면 False
a = {1,2,3}
b = {4,5,6}
print(a.isdisjoint(b))
print(b.isdisjoint(a))
print()

a = {1,2,3}
b = {3,5,6}
print(a.isdisjoint(b))
print(b.isdisjoint(a))

True
True

False
False
