# Python Sets

**학습 날짜**: 2025-11-22  
**참고 자료**: [Python Sets - W3Schools](https://www.w3schools.com/python/python_sets.asp)


## 학습 내용

### Sets 기본

- Sets는 여러 항목을 단일 변수에 저장하는 데 사용됨
- Python에서 컬렉션 데이터를 저장하는 4가지 Built-in 데이터 타입 중 하나 (List, Tuple, Set, Dictionary)
- 중괄호 `{}`를 사용하여 세트 생성
- `set()` 생성자 함수를 사용하여 세트 생성 가능

### Set Items (세트 항목)

세트 항목은 **unordered (순서 없음)**, **unchangeable* (변경 불가*)**, **unindexed (인덱싱 없음)**, **no duplicates (중복 없음)** 특징을 가짐.

*세트 항목은 변경 불가하지만, 항목을 제거하거나 추가할 수 있음

#### Unordered (순서 없음)

- 세트가 unordered라는 것은 항목들이 정의된 순서가 없다는 의미
- 세트 항목은 사용할 때마다 다른 순서로 나타날 수 있음
- 인덱스나 키로 참조할 수 없음

#### Unchangeable (변경 불가)

- 세트 항목은 변경 불가능하며, 세트 생성 후 항목을 변경할 수 없음
- 하지만 항목을 제거하고 새로운 항목을 추가할 수는 있음

#### Duplicates Not Allowed (중복 불가)

- 세트는 같은 값을 가진 두 항목을 가질 수 없음
- 중복 값은 자동으로 무시됨
- `True`와 `1`은 세트에서 같은 값으로 간주됨
- `False`와 `0`은 세트에서 같은 값으로 간주됨

#### Unindexed (인덱싱 없음)

- 세트 항목은 인덱싱되어 있지 않음
- 인덱스나 키로 접근할 수 없음
- `for` 루프로 순회하거나 `in` 키워드로 확인 가능

### Set Length

- `len()` 함수를 사용하여 세트에 몇 개의 항목이 있는지 확인 가능

### Set Items - Data Types

- 세트 항목은 모든 데이터 타입이 될 수 있음
- 한 세트에 서로 다른 데이터 타입을 포함할 수 있음 (문자열, 정수, 불리언 등 혼합 가능)

### type()

- Python의 관점에서 세트는 데이터 타입이 `'set'`인 객체로 정의됨
- `type()` 함수로 세트의 데이터 타입 확인 가능

### The set() Constructor

- `set()` 생성자 함수를 사용하여 새 세트를 생성할 수 있음
- 리스트나 튜플을 세트로 변환할 때 주로 사용 (이중 괄호 주의)

### Python Collections (Arrays)

Python에는 4가지 컬렉션 데이터 타입이 있음:

- **List**: 순서 있음, 변경 가능, 중복 허용
- **Tuple**: 순서 있음, 변경 불가, 중복 허용
- **Set**: 순서 없음, 변경 불가*, 인덱싱 없음, 중복 없음
- **Dictionary**: 순서 있음** (Python 3.7+), 변경 가능, 중복 없음

*Set 항목은 변경 불가하지만, 항목을 제거하거나 추가할 수 있음  
**Python 3.7부터 Dictionary는 순서가 있음. Python 3.6 이전에는 순서 없음

컬렉션 타입을 선택할 때는 해당 타입의 속성을 이해하는 것이 유용함. 특정 데이터 세트에 적합한 타입을 선택하면 의미를 보존하고, 효율성이나 보안을 향상시킬 수 있음.


## Python 코드 실습


In [None]:
# Sets 기본 - 중괄호로 세트 생성
thisset = {"apple", "banana", "cherry"}
print(thisset)  # 순서가 보장되지 않음


In [None]:
# Duplicates Not Allowed - 중복 값은 자동으로 무시됨
thisset = {"apple", "banana", "cherry", "apple"}
print(thisset)  # 중복된 "apple"은 하나만 남음


In [None]:
# True and 1 are considered the same value
thisset = {"apple", "banana", "cherry", True, 1, 2}
print(thisset)  # True와 1 중 하나만 남음


In [None]:
# False and 0 are considered the same value
thisset = {"apple", "banana", "cherry", False, True, 0}
print(thisset)  # False와 0 중 하나만 남음


In [None]:
# Set Length - len() 함수
thisset = {"apple", "banana", "cherry"}
print(len(thisset))


In [None]:
# Set Items - Data Types
# 같은 타입
set1 = {"apple", "banana", "cherry"}  # 문자열
set2 = {1, 5, 7, 9, 3}                # 정수
set3 = {True, False, False}            # 불리언

# 다른 타입 혼합
set4 = {"abc", 34, True, 40, "male"}
print(set1, set2, set3, set4)


In [None]:
# type() - 세트의 데이터 타입 확인
myset = {"apple", "banana", "cherry"}
print(type(myset))  # <class 'set'>


In [None]:
# set() Constructor - 생성자 함수로 세트 생성
thisset = set(("apple", "banana", "cherry"))  # 주의: 이중 괄호
print(thisset)


### Access Set Items (세트 항목 접근)

세트는 인덱싱되어 있지 않으므로 인덱스나 키로 접근할 수 없음.


In [None]:
# Loop through the set - for 루프로 순회
thisset = {"apple", "banana", "cherry"}
for x in thisset:
    print(x)


In [None]:
# Check if Item Exists - in 키워드로 항목 확인
thisset = {"apple", "banana", "cherry"}
print("banana" in thisset)  # True


In [None]:
# Check if Item is NOT present - not in 키워드
thisset = {"apple", "banana", "cherry"}
print("banana" not in thisset)  # False


### Add Set Items (세트 항목 추가)


In [None]:
# Add Items - add() 메서드로 항목 추가
thisset = {"apple", "banana", "cherry"}
thisset.add("orange")
print(thisset)


In [None]:
# Add Sets - update() 메서드로 다른 세트의 항목 추가
thisset = {"apple", "banana", "cherry"}
tropical = {"pineapple", "mango", "papaya"}
thisset.update(tropical)
print(thisset)


In [None]:
# Add Any Iterable - update()는 세트뿐만 아니라 모든 이터러블 객체 가능
thisset = {"apple", "banana", "cherry"}
mylist = ["kiwi", "orange"]
thisset.update(mylist)
print(thisset)


### Remove Set Items (세트 항목 제거)


In [None]:
# Remove Item - remove() 메서드 (항목이 없으면 에러 발생)
thisset = {"apple", "banana", "cherry"}
thisset.remove("banana")
print(thisset)


In [None]:
# Remove Item - discard() 메서드 (항목이 없어도 에러 발생 안 함)
thisset = {"apple", "banana", "cherry"}
thisset.discard("banana")
print(thisset)


In [None]:
# pop() - 랜덤 항목 제거 (어떤 항목이 제거될지 알 수 없음)
thisset = {"apple", "banana", "cherry"}
x = thisset.pop()  # 제거된 항목 반환
print(x)
print(thisset)


In [None]:
# clear() - 세트 비우기
thisset = {"apple", "banana", "cherry"}
thisset.clear()
print(thisset)  # 빈 세트 출력: set()


In [None]:
# Delete the set completely - del 키워드로 세트 전체 삭제
thisset = {"apple", "banana", "cherry"}
del thisset
# print(thisset)  # 에러: 세트가 삭제됨


### Loop Sets (세트 순회)


In [None]:
# Loop Items - for 루프로 순회
thisset = {"apple", "banana", "cherry"}
for x in thisset:
    print(x)


### Join Sets (세트 결합)


In [None]:
# Union - union() 메서드 또는 | 연산자 (모든 항목)
set1 = {"a", "b", "c"}
set2 = {1, 2, 3}
set3 = set1.union(set2)
print(set3)

# | 연산자 사용
set4 = set1 | set2
print(set4)


In [None]:
# Join Multiple Sets - 여러 세트 결합
set1 = {"a", "b", "c"}
set2 = {1, 2, 3}
set3 = {"John", "Elena"}
set4 = {"apple", "bananas", "cherry"}

myset = set1.union(set2, set3, set4)
print(myset)

# | 연산자로 여러 세트 결합
myset2 = set1 | set2 | set3 | set4
print(myset2)


In [None]:
# Join a Set and a Tuple - union()은 다른 데이터 타입과도 결합 가능
x = {"a", "b", "c"}
y = (1, 2, 3)
z = x.union(y)
print(z)  # 세트 반환


In [None]:
# Update - update() 메서드 (원본 세트 변경)
set1 = {"a", "b", "c"}
set2 = {1, 2, 3}
set1.update(set2)
print(set1)  # set1이 변경됨


In [None]:
# Intersection - intersection() 메서드 또는 & 연산자 (교집합만)
set1 = {"apple", "banana", "cherry"}
set2 = {"google", "microsoft", "apple"}
set3 = set1.intersection(set2)
print(set3)  # {"apple"} - 공통 항목만

# & 연산자 사용
set4 = set1 & set2
print(set4)


In [None]:
# intersection_update() - 원본 세트 변경
set1 = {"apple", "banana", "cherry"}
set2 = {"google", "microsoft", "apple"}
set1.intersection_update(set2)
print(set1)  # set1이 변경됨


In [None]:
# Intersection with True/False and 1/0
set1 = {"apple", 1, "banana", 0, "cherry"}
set2 = {False, "google", 1, "apple", 2, True}
set3 = set1.intersection(set2)
print(set3)  # True와 1, False와 0은 같은 값으로 간주


In [None]:
# Difference - difference() 메서드 또는 - 연산자 (차집합)
set1 = {"apple", "banana", "cherry"}
set2 = {"google", "microsoft", "apple"}
set3 = set1.difference(set2)
print(set3)  # set1에만 있는 항목

# - 연산자 사용
set4 = set1 - set2
print(set4)


In [None]:
# difference_update() - 원본 세트 변경
set1 = {"apple", "banana", "cherry"}
set2 = {"google", "microsoft", "apple"}
set1.difference_update(set2)
print(set1)  # set1이 변경됨


In [None]:
# Symmetric Difference - symmetric_difference() 메서드 또는 ^ 연산자 (대칭 차집합)
set1 = {"apple", "banana", "cherry"}
set2 = {"google", "microsoft", "apple"}
set3 = set1.symmetric_difference(set2)
print(set3)  # 양쪽에 모두 없는 항목만

# ^ 연산자 사용
set4 = set1 ^ set2
print(set4)


In [None]:
# symmetric_difference_update() - 원본 세트 변경
set1 = {"apple", "banana", "cherry"}
set2 = {"google", "microsoft", "apple"}
set1.symmetric_difference_update(set2)
print(set1)  # set1이 변경됨


### Python frozenset (불변 세트)


In [None]:
# Create a frozenset - frozenset() 생성자로 불변 세트 생성
x = frozenset({"apple", "banana", "cherry"})
print(x)
print(type(x))  # <class 'frozenset'>


### Set Methods (세트 메서드)

Python 세트에서 사용 가능한 주요 메서드:

- `add()`: 세트에 요소 추가
- `clear()`: 세트의 모든 요소 제거
- `copy()`: 세트의 복사본 반환
- `difference()` (`-`): 두 세트의 차집합 반환
- `difference_update()` (`-=`): 현재 세트에서 다른 세트의 항목 제거
- `discard()`: 지정된 항목 제거 (없어도 에러 없음)
- `intersection()` (`&`): 두 세트의 교집합 반환
- `intersection_update()` (`&=`): 현재 세트를 교집합으로 업데이트
- `isdisjoint()`: 두 세트가 교집합이 없는지 확인
- `issubset()` (`<=`, `<`): 현재 세트가 다른 세트의 부분집합인지 확인
- `issuperset()` (`>=`, `>`): 현재 세트가 다른 세트의 상위집합인지 확인
- `pop()`: 랜덤 항목 제거 및 반환
- `remove()`: 지정된 항목 제거 (없으면 에러 발생)
- `symmetric_difference()` (`^`): 두 세트의 대칭 차집합 반환
- `symmetric_difference_update()` (`^=`): 현재 세트를 대칭 차집합으로 업데이트
- `union()` (`|`): 두 세트의 합집합 반환
- `update()` (`|=`): 현재 세트를 다른 세트와 합집합으로 업데이트


## Java와의 비교

> **참고**: Collections 섹션의 Java 비교는 추후 추가 예정입니다.


## 정리

### 핵심 내용

1. Sets는 여러 항목을 단일 변수에 저장하는 컬렉션 타입
2. Unordered, Unchangeable*, Unindexed, No Duplicates 특징을 가짐
3. 인덱싱이 없어 `for` 루프나 `in` 키워드로만 접근 가능
4. `add()`, `update()` 메서드로 항목 추가
5. `remove()`, `discard()`, `pop()`, `clear()`, `del`로 항목 제거
6. `for` 루프로 순회 가능
7. `union()` (`|`), `intersection()` (`&`), `difference()` (`-`), `symmetric_difference()` (`^`)로 세트 결합
8. `frozenset()`로 불변 세트 생성 가능
9. `True`와 `1`, `False`와 `0`은 세트에서 같은 값으로 간주됨
10. 다양한 세트 연산 메서드와 연산자 제공

### 느낀 점

- Python의 세트는 수학적 집합 연산을 지원하여 매우 유용함.
- 중복 제거에 효과적이고, 집합 연산이 직관적임.
- `frozenset`으로 불변 세트를 만들 수 있어 딕셔너리의 키로 사용 가능.
- 연산자와 메서드가 모두 제공되어 선택의 폭이 넓음.
