## 07. 집합 (set)
- 원소의 중복을 혀용하지 않는 여러 데이터의 모음
- 순서가 없는 컬렉션 자료형


In [None]:
# set 만들기

s1 = {1, 2, 3}
print(s1, type(s1))
# {1, 2, 3} <class 'set'>

s2 = {1, 1, 1, 2, 2, 2, 3, 3, 4}
print(s2)
# {1, 2, 3, 4}

# 빈 set 만들기
# 유의사항 : 중괄호 {} 에 원소를 넣지 않고 선언하면 빈 dict로 인식됨

s3 = {}
print(type(s3))
# <class 'dict'>

# set 함수로 생성

s4 = set()
print(type(s4))
# <class 'set'>

# set 함수의 활용 : 원소의 중복 제거

my_list = [1,1,2,2,2,2,2,3,3,4,4]
s5 = set(my_list) # set으로 변환 -> 중복 원소 제거
print(s5)
# {1, 2, 3, 4}
my_list = list(s5)
print(my_list, type(my_list))
# [1, 2, 3, 4] <class 'list'>

In [None]:
# 인덱싱 제한

s1 = {10,20,30}
# s1[1] -> 제한
s_list = list(s1) # 변환하는 과정에서 순서가 보장되지 않을 수 있음
s_list[2]

In [None]:
# 자료형 제한
# 가변 자료형은 원소로 사용할 수 없음

s1 = {1,2,3,[1,2,3]}
print(s1)

In [None]:
# set 연산
# 집합의 연산 : 합집합, 교집합, 차집합, 대칭차집합

a = {1,2,3}
b = {3,4,5,6}

# 합집합
s_union1 = a | b
s_union2 = a.union(b)
print("1", s_union1)
print("2", s_union2)
# 1 {1, 2, 3, 4, 5, 6}
# 2 {1, 2, 3, 4, 5, 6}

# 교집합
s_inter1 = a & b
s_inter2 = a.intersection(b)
print("1", s_inter1)
print("2", s_inter2)
# 1 {3}
# 2 {3}

# 차집합
s_diff1 = a - b
s_diff2 = b.difference(a)
print("1", s_diff1)
print("2", s_diff2)
# 1 {1, 2}
# 2 {4, 5, 6}

# 대칭차집합
s_symm1 = (a | b) - (a & b)
s_symm2 = a ^ b
s_symm3 = a.symmetric_difference(b)
print("1", s_symm1)
print("2", s_symm2)
print("3", s_symm3)
# 1 {1, 2, 4, 5, 6}
# 2 {1, 2, 4, 5, 6}
# 3 {1, 2, 4, 5, 6}


In [None]:
# set 메서드

s1 = {1,2,3}

# 원소의 추가
s1.add(4)
print(s1)
# {1, 2, 3, 4}

# 여러 원소 추가 (iterable) 리스트, 튜플, 문자열 등
s1.update([5,6,7])
print(s1)
# {1, 2, 3, 4, 5, 6, 7}

# 원소 제거
s1.remove(4)
print(s1)
# {1, 2, 3, 5, 6, 7}
# s1.remove(10) # 존재하지 않는 원소 삭제 시도시 에러
s1.discard(10) # discard 는 존재하지 않는 원소 삭제 시도시 에러 X
s1.discard(7) # 동일하게 제거 가능
print(s1)
# {1, 2, 3, 5, 6}
print(s1.pop()) # 임의의 값 하나 제거, 리스트와 같이 제거한 값 반환
# 1
print(s1)
# {2, 3, 5, 6}

In [None]:
# 부분집합(subset) 관련 메서드

a = {10, 20, 30, 40, 50} # 상위집합 (superset)
b = {20, 30, 40} # 부분집합 (subset)
c = {100, 200, 300, 400}

# 부분집합 여부 확인
print(b.issubset(a))
print(a.issubset(b))
# True
# False

# 상위집합 여부 판단
print(a.issuperset(b))
print(b.issuperset(a))
# True
# False

# 공통 원소 보유 여부 확인
print(a.isdisjoint(b))
print(a.isdisjoint(c))
print(b.isdisjoint(c))
# False
# True
# True

In [None]:
# 실습1. set 종합 연습

# 1. 중복 제거 및 개수 세기

submission = ['kim', 'lee', 'kim', 'park', 'choi', 'lee', 'lee']

submission_set = set(submission)
submission_len = len(submission_set)

print(f"""제출한 학생 수: {submission_len}
제출자 명단: {submission_set}""")

In [None]:
# 2. 공통 관심사 찾기

user1 = {'SF', 'Action', 'Drama'}
user2 = {'Drama', 'Romance', 'Action'}

user_inter = user1 & user2
user_symm = user1 ^ user2
user_union = user1 | user2

print(f"공통 관심 장르 : {user_inter}")
print(f"서로 다른 장르 : {user_symm}")
print(f"전체 장르 : {user_union}")

In [None]:
# 3. 부분집합 관계 판단

my_certificates = {'SQL', 'Python', 'Linux'}
job_required = {'SQL', 'Python'}

subset_check = job_required.issubset(my_certificates)

print(f"지원 자격 충족 여부 : {subset_check}")