# 집합(Set)

## 1. 집합(Set)
### 1-1. 집합이란?
집합은 0개 이상의 원소에 대해 중복을 허용하지 않으면서 순서 없이 저장하는 컨테이너 자료형이다.
중괄호{}를 이용해 생성한다. 각 원소는 콤마(,)를 기준으로 구분된다.

In [1]:
numbers = {10, 20, 30, 40, 50}

print(numbers)  # 순서 없이 출력됨에 주의
print(type(numbers))

{50, 20, 40, 10, 30}
<class 'set'>


집합의 원소는 기본 자료형과 변경 불가능한 컨테이너만 허용된다. 변경 가능한 컨테이너인 리스트, 집합, 딕셔너리는 원소로써 허용되지 않는다.

In [None]:
# 기본 자료형과 변경 불가능한 컨테이너는 집합의 원소로 허용됨
# 정수, 실수, 문자열, 불린, 튜플, 레인지
data = {1, 1.5, "hello", True, (1, 2), range(10)}

print(data)


In [None]:
# 변경 가능한 컨테이너는 집합의 원소로 허용되지 않음 (에러 발생)
try:
    data = {[1, 2]}
except TypeError as e:
    print(f"TypeError: {e}")

집합은 원소의 중복을 허용하지 않는다. 만약, 중복 데이터를 넣으면 중복이 제거된다.

In [2]:
numbers = {1, 1, 1, 1}

print(numbers)

{1}


빈 집합도 생성 가능하다. 단, 이때는 중괄호로 생성하면 딕셔너리로 취급되므로 내장함수 set을 이용한다.

In [3]:
empty_dict = {}  # 빈 중괄호는 집합이 아닌, 딕셔너리로 취급됨에 주의
print(empty_dict)
print(type(empty_dict))

empty_set = set()  # 빈 집합은 내장함수 set으로 생성
print(empty_set)
print(type(empty_set))

{}
<class 'dict'>
set()
<class 'set'>


내장함수 len을 사용하면 집합의 길이를 알 수 있다.

In [None]:
numbers = {10, 20, 30, 40, 50}

print(len(numbers))  # numbers의 길이 출력

내장함수 set을 사용하면 다른 컨테이너 자료형을 집합으로 형변환할 수 있다.

In [None]:
number_list = [10, 20, 30, 40, 50]

print(set(number_list))  # 리스트를 집합으로 형변환 (이때 중복이 있다면 중복이 제거됨)

### 1-2. 집합 연산
집합은 교집합, 합집합, 차집합 연산을 제공한다.


#### 교집합(&)
두 집합에 공통으로 존재하는 원소를 담은 집합을 생성한다.

In [None]:
a = {1, 2, 3}
b = {3, 4, 5}

print(a & b)  # a 집합과 b 집합의 교집합 출력

#### 합집합(|)
두 집합의 모든 원소를 담은 집합을 생성한다.

In [None]:
a = {1, 2, 3}
b = {3, 4, 5}

print(a | b)  # a 집합과 b 집합의 합집합 출력 (중복은 제거됨)

#### 차집합(-)
왼쪽 집합에만 존재하는 원소를 담은 집합을 생성한다.

In [None]:
a = {1, 2, 3}
b = {3, 4, 5}

print(a - b)  # a 집합에서 b 집합을 차집합한 결과 출력
print(b - a)  # b 집합에서 a 집합을 차집합한 결과 출력

## 2. 집합의 멤버십 연산
집합도 멤버십 연산자를 사용해 원소의 포함 여부를 알 수 있다.
### 2-1. in 연산자
원소 in 집합의 형식으로 작성하며, 해당 원소가 집합에 있으면 True, 없으면 False를 반환한다.

In [None]:
numbers = {1, 2, 3}

print(1 in numbers)  # True
print(4 in numbers)  # False

### 2-2. not in 연산자
원소 not in 집합의 형식으로 작성하며, 해당 원소가 집합에 없으면 True, 있으면 False를 반환한다.

In [None]:
numbers = {1, 2, 3}

print(1 not in numbers)  # False
print(4 not in numbers)  # True

## 3. 집합의 반복
집합은 리스트, 문자열, 튜플과 달리 인덱스가 없으므로 원소를 직접 꺼내서 반복해야 한다.
집합은 순서가 없는 컨테이너이므로, 항상 같은 순서로 반복되지 않을 수 있다.

In [None]:
numbers = {1, 2, 3}

for number in numbers:  # numbers의 원소를 하나씩 꺼내서 number에 할당
    print(number)

print("---")

for number in {1, 2, 3}:
    print(number)

## 4. 자주 사용하는 집합 메서드
### 4-1. add
집합.add(원소)의 형식으로 작성한다. 원소 한 개를 집합에 삽입한다.

In [None]:
numbers = {1, 2, 3}
numbers.add(4)  # numbers에 원소 4를 삽입

print(numbers)

numbers.add(1)  # 중복 원소 삽입 시 변화 없음
print(numbers)

### 4-2. update
집합.update(컨테이너)의 형식으로 작성한다.
컨테이너의 모든 원소들을 집합에 삽입한다. 여러 원소들을 한꺼번에 삽입할 때 자주 사용한다.

In [4]:
numbers = {1, 2, 3}
numbers.update([4, 5, 6])  # numbers에 리스트 [4, 5, 6]의 원소들을 삽입

print(numbers)

{1, 2, 3, 4, 5, 6}


### 4-3. remove, discard
집합에서 특정 원소를 삭제한다.

In [None]:
numbers = {1, 2, 3}
numbers.remove(3)
print(numbers)

numbers = {1, 2, 3}
numbers.discard(3)
print(numbers)

- **remove**: 원소가 존재하지 않는 경우 에러(KeyError)가 발생한다.
- **discard**: 원소가 존재하지 않는 경우 아무 일도 일어나지 않는다.

In [None]:
numbers = {1, 2, 3}
print("discard(4) 실행 (에러 없음):")
numbers.discard(4)
print(numbers)

print("\nremove(4) 실행 (에러 발생):")
try:
    numbers.remove(4)
except KeyError as e:
    print(f"KeyError: {e}")

# tuple


immutable한 list. 즉 변경이 불가능한 list.

In [2]:
t = (1, 2, 3)

print(t[1])

2


In [None]:
# t[2] = 3
# 에러가 납니다.

SyntaxError: invalid syntax (308640689.py, line 2)

In [None]:
#