# Collection Types 심화

## 📋 학습 목표
1. 각 Collection Type의 특징과 차이를 설명할 수 있다
2. 시간/공간 복잡도를 고려하여 적절한 자료구조를 선택할 수 있다
3. collections 모듈의 고급 자료구조를 활용할 수 있다
4. Hashing의 동작 원리를 이해한다

---

# 📚 1. Sequence Types (50분)

## 🔑 핵심 개념

### Collection이란?
- **Collection**: 여러 개의 데이터를 하나로 묶어서 관리하는 자료구조
- Python의 주요 Collection Types:
  - **Sequence Types**: 순서가 있는 컬렉션 (list, tuple, str, bytes, range)
  - **Mapping Type**: 키-값 쌍의 컬렉션 (dict)
  - **Set Types**: 중복 없는 컬렉션 (set, frozenset)

### Sequence Type이란?
- **정의**: 요소들이 순서대로 저장되어 있고, 인덱스로 접근 가능한 컬렉션
- **특징**: 
  - 인덱싱 (indexing): `seq[0]`
  - 슬라이싱 (slicing): `seq[1:3]`
  - 길이 확인: `len(seq)`
  - 반복 가능 (iterable): for 루프 사용 가능

### Mutable vs Immutable
| 구분 | Mutable (가변) | Immutable (불변) |
|------|----------------|------------------|
| 의미 | 생성 후 수정 가능 | 생성 후 수정 불가 |
| 예시 | list, dict, set | tuple, str, frozenset |
| 장점 | 유연한 데이터 조작 | 안전성, 해시 가능 |
| 단점 | 의도치 않은 변경 가능 | 수정 시 새 객체 생성 |

In [None]:
# Collection의 예시
print("=== Collection Types 예시 ===")

# Sequence (순서가 있음)
my_list = [1, 2, 3, 4, 5]
my_tuple = (1, 2, 3, 4, 5)
my_string = "Hello"

# Mapping (키-값 쌍)
my_dict = {'a': 1, 'b': 2, 'c': 3}

# Set (중복 없음, 순서 없음)
my_set = {1, 2, 3, 4, 5}

print(f"List: {my_list}")
print(f"Tuple: {my_tuple}")
print(f"String: {my_string}")
print(f"Dict: {my_dict}")
print(f"Set: {my_set}")

In [None]:
# Mutable vs Immutable 비교
print("\n=== Mutable vs Immutable ===")

# Mutable (list)
mutable_list = [1, 2, 3]
print(f"Original list: {mutable_list}, id: {id(mutable_list)}")
mutable_list[0] = 100  # 수정 가능
print(f"Modified list: {mutable_list}, id: {id(mutable_list)}")
print("→ 같은 객체가 수정됨 (id 동일)\n")

# Immutable (tuple)
immutable_tuple = (1, 2, 3)
print(f"Original tuple: {immutable_tuple}, id: {id(immutable_tuple)}")
try:
    immutable_tuple[0] = 100  # 에러 발생!
except TypeError as e:
    print(f"Error: {e}")
    print("→ 수정 불가능!")

## 1.1 List (Mutable Sequence)

### 📖 List란?
- **정의**: 여러 개의 값을 순서대로 저장하는 가변(mutable) 시퀀스
- **특징**:
  - 대괄호 `[]`로 생성
  - 다양한 타입의 요소를 함께 저장 가능
  - 요소 추가/삭제/수정 가능
  - 동적 크기 (자동으로 크기 조정)
- **사용 시기**: 데이터를 순서대로 저장하고 자주 수정할 때

In [None]:
# List 기본 생성
numbers = [1, 2, 3, 4, 5]
mixed = [1, "hello", 3.14, True]

print(f"Numbers: {numbers}")
print(f"Mixed types: {mixed}")

In [None]:
# List는 mutable - 요소 변경 가능
fruits = ['apple', 'banana', 'cherry']
print(f"Original: {fruits}")

fruits[1] = 'blueberry'
print(f"Modified: {fruits}")

# 요소 추가
fruits.append('date')
print(f"After append: {fruits}")

# 요소 삽입
fruits.insert(1, 'avocado')
print(f"After insert: {fruits}")

In [None]:
# List comprehension
squares = [x**2 for x in range(1, 6)]
print(f"Squares: {squares}")

even_squares = [x**2 for x in range(1, 11) if x % 2 == 0]
print(f"Even squares: {even_squares}")

## 1.2 Tuple (Immutable Sequence)

### 📖 Tuple이란?
- **정의**: 여러 개의 값을 순서대로 저장하는 불변(immutable) 시퀀스
- **특징**:
  - 소괄호 `()`로 생성 (또는 괄호 생략 가능)
  - 생성 후 수정 불가능
  - List보다 메모리 효율적
  - Dictionary의 키로 사용 가능 (hashable)
- **사용 시기**: 
  - 변경되지 않아야 하는 데이터 (좌표, 날짜 등)
  - 함수에서 여러 값 반환
  - Dictionary의 키로 사용

In [None]:
# Tuple 생성
coordinates = (10, 20)
rgb = (255, 128, 0)
single = (42,)  # 단일 요소 튜플은 콤마 필요

print(f"Coordinates: {coordinates}")
print(f"RGB: {rgb}")
print(f"Single element: {single}")

In [None]:
# Tuple의 불변성
point = (3, 4)
print(f"Point: {point}")

try:
    point[0] = 5  # 에러 발생!
except TypeError as e:
    print(f"Error: {e}")

In [None]:
# Tuple unpacking
x, y = (10, 20)
print(f"x: {x}, y: {y}")

# 함수에서 여러 값 반환
def get_min_max(numbers):
    return min(numbers), max(numbers)

minimum, maximum = get_min_max([3, 1, 4, 1, 5, 9, 2, 6])
print(f"Min: {minimum}, Max: {maximum}")

## 1.3 String (Text Sequence)

### 📖 String이란?
- **정의**: 문자들의 불변(immutable) 시퀀스
- **특징**:
  - 따옴표 `'`, `"`, `'''`, `"""`로 생성
  - 텍스트 데이터 저장 및 처리
  - 불변 → 수정 시 새로운 문자열 생성
  - 다양한 문자열 메서드 제공 (upper, lower, split, replace 등)
- **사용 시기**: 텍스트 데이터를 다룰 때

In [None]:
# String 기본 연산
text = "Python Programming"

print(f"Original: {text}")
print(f"Uppercase: {text.upper()}")
print(f"Lowercase: {text.lower()}")
print(f"Length: {len(text)}")

In [None]:
# String slicing
text = "Hello, World!"

print(f"First 5: {text[:5]}")
print(f"Last 6: {text[-6:]}")
print(f"Every 2nd char: {text[::2]}")
print(f"Reverse: {text[::-1]}")

In [None]:
# String methods
sentence = "  Hello, Python World!  "

print(f"Strip: '{sentence.strip()}'")
print(f"Replace: {sentence.replace('Python', 'Java')}")
print(f"Split: {sentence.split()}")
print(f"Starts with 'Hello': {sentence.strip().startswith('Hello')}")

## 1.4 Bytes and Bytearray

### 📖 Bytes와 Bytearray란?
- **Bytes**: 
  - **정의**: 불변 바이트 시퀀스
  - **특징**: 0-255 범위의 정수들의 불변 시퀀스
  - **사용 시기**: 바이너리 데이터, 파일 I/O, 네트워크 통신

- **Bytearray**:
  - **정의**: 가변 바이트 시퀀스
  - **특징**: bytes의 가변 버전
  - **사용 시기**: 바이트 데이터를 수정해야 할 때

- **Encoding/Decoding**:
  - String → Bytes: `encode()`
  - Bytes → String: `decode()`

In [None]:
# Bytes (불변)
b = b'Hello'
print(f"Bytes: {b}")
print(f"Type: {type(b)}")
print(f"Length: {len(b)}")

# String to bytes
text = "안녕하세요"
encoded = text.encode('utf-8')
print(f"Encoded: {encoded}")
print(f"Decoded: {encoded.decode('utf-8')}")

In [None]:
# Bytearray (가변)
ba = bytearray(b'Hello')
print(f"Original: {ba}")

ba[0] = ord('J')  # 첫 글자를 'J'로 변경
print(f"Modified: {ba}")
print(f"As string: {ba.decode('utf-8')}")

## 1.5 Range

### 📖 Range란?
- **정의**: 숫자 시퀀스를 나타내는 불변 객체
- **특징**:
  - 실제로 모든 값을 메모리에 저장하지 않음 (지연 평가)
  - 매우 메모리 효율적
  - `range(start, stop, step)` 형태
- **사용 시기**: 
  - for 루프에서 특정 횟수만큼 반복
  - 규칙적인 숫자 시퀀스가 필요할 때

### 💡 Range vs List
- `range(1000000)`: 메모리에 시작, 끝, 간격만 저장 → 작은 메모리
- `list(range(1000000))`: 모든 100만 개 숫자를 저장 → 큰 메모리

In [None]:
# Range 기본 사용
r1 = range(5)           # 0, 1, 2, 3, 4
r2 = range(1, 6)        # 1, 2, 3, 4, 5
r3 = range(0, 10, 2)    # 0, 2, 4, 6, 8

print(f"range(5): {list(r1)}")
print(f"range(1, 6): {list(r2)}")
print(f"range(0, 10, 2): {list(r3)}")

In [None]:
# Range의 메모리 효율성
import sys

# List는 모든 값을 메모리에 저장
list_version = list(range(1000000))
range_version = range(1000000)

print(f"List size: {sys.getsizeof(list_version):,} bytes")
print(f"Range size: {sys.getsizeof(range_version):,} bytes")

## 🎯 연습 문제 1

1. 1부터 100까지의 숫자 중 3의 배수만 포함하는 리스트를 생성하세요.
2. 주어진 문자열을 역순으로 뒤집으세요.
3. 튜플을 사용하여 좌표 (x, y)를 저장하고, 원점으로부터의 거리를 계산하세요.

In [None]:
# 연습 문제 풀이 공간

# 1. 3의 배수 리스트


# 2. 문자열 역순


# 3. 좌표와 거리


---

# 📚 2. Mapping & Set Types (50분)

## 🔑 핵심 개념

### Mapping Type이란?
- **정의**: 키(key)와 값(value)을 쌍으로 저장하는 컬렉션
- **특징**:
  - 키로 값에 빠르게 접근 (O(1))
  - 키는 고유해야 함 (중복 불가)
  - 키는 hashable 객체여야 함
- **대표 타입**: dict, OrderedDict, defaultdict, Counter

### Set Type이란?
- **정의**: 중복되지 않는 요소들의 모음
- **특징**:
  - 순서 없음 (unordered)
  - 중복 자동 제거
  - 집합 연산 지원 (합집합, 교집합, 차집합)
  - 빠른 멤버십 테스트 (O(1))
- **대표 타입**: set, frozenset

### Hashable이란?
- **정의**: 해시 함수로 고유한 해시 값을 생성할 수 있는 객체
- **조건**: 불변(immutable)이어야 함
- **Hashable**: int, float, str, tuple, frozenset
- **Not Hashable**: list, dict, set
- **용도**: Dictionary의 키, Set의 요소로 사용

In [None]:
# Mapping vs Set 비교
print("=== Mapping Type (Dict) ===")
person = {'name': 'Alice', 'age': 25, 'city': 'Seoul'}
print(f"Person: {person}")
print(f"Name 접근: person['name'] = {person['name']}")
print(f"키로 빠른 검색: O(1)\n")

print("=== Set Type ===")
numbers = {1, 2, 3, 4, 5, 5, 5}  # 중복 자동 제거
print(f"Set: {numbers}")
print(f"3 in numbers: {3 in numbers}  # O(1) 검색")
print(f"10 in numbers: {10 in numbers}")

In [None]:
# Hashable vs Not Hashable
print("\n=== Hashable 객체 ===")
print(f"hash('hello'): {hash('hello')}")
print(f"hash(42): {hash(42)}")
print(f"hash((1, 2, 3)): {hash((1, 2, 3))}")

print("\n=== Not Hashable 객체 ===")
try:
    print(hash([1, 2, 3]))
except TypeError as e:
    print(f"List는 hashable하지 않음: {e}")

try:
    print(hash({'a': 1}))
except TypeError as e:
    print(f"Dict는 hashable하지 않음: {e}")

## 2.1 Dictionary (dict)

### 📖 Dictionary란?
- **정의**: 키-값 쌍을 저장하는 가변 매핑 타입
- **특징**:
  - 중괄호 `{}`로 생성
  - 키로 값에 O(1) 시간에 접근
  - Python 3.7+부터 삽입 순서 보장
  - 키는 hashable 객체만 가능
- **사용 시기**: 
  - 키-값 관계가 있는 데이터
  - 빠른 검색이 필요할 때
  - JSON 데이터 처리

In [None]:
# Dictionary 기본 생성
student = {
    'name': 'Alice',
    'age': 20,
    'major': 'Computer Science'
}

print(f"Student: {student}")
print(f"Name: {student['name']}")
print(f"Age: {student.get('age')}")

In [None]:
# Dictionary 메서드
student = {'name': 'Bob', 'age': 21}

# 키 추가/수정
student['grade'] = 'A'
student['age'] = 22

print(f"Updated: {student}")
print(f"Keys: {student.keys()}")
print(f"Values: {student.values()}")
print(f"Items: {student.items()}")

In [None]:
# Dictionary comprehension
numbers = [1, 2, 3, 4, 5]
squares_dict = {x: x**2 for x in numbers}
print(f"Squares: {squares_dict}")

# 조건부 dictionary comprehension
even_squares = {x: x**2 for x in range(1, 11) if x % 2 == 0}
print(f"Even squares: {even_squares}")

## 2.2 collections 모듈

### 📖 collections 모듈이란?
- **정의**: Python 표준 라이브러리의 특수 컨테이너 자료형 모듈
- **제공하는 주요 자료구조**:
  - **OrderedDict**: 순서 보장 + 순서 관련 메서드 제공
  - **defaultdict**: 기본값을 자동으로 생성하는 dict
  - **Counter**: 카운팅에 특화된 dict
  - **deque**: 양방향 큐 (이번 강의에서는 다루지 않음)
  - **namedtuple**: 필드 이름이 있는 tuple (이번 강의에서는 다루지 않음)

### 💡 언제 collections 모듈을 사용하나요?
- 일반 dict/list로는 코드가 복잡해질 때
- 특정 패턴의 작업을 자주 할 때 (카운팅, 그룹화 등)
- 코드를 더 간결하고 명확하게 만들고 싶을 때

In [None]:
from collections import OrderedDict

# OrderedDict - 삽입 순서 보장 (Python 3.7+에서는 일반 dict도 순서 보장)
od = OrderedDict()
od['banana'] = 3
od['apple'] = 4
od['pear'] = 1

print(f"OrderedDict: {od}")

# move_to_end 메서드
od.move_to_end('banana')
print(f"After move_to_end: {od}")

In [None]:
from collections import defaultdict

# defaultdict - 기본값 자동 생성
word_count = defaultdict(int)

words = ['apple', 'banana', 'apple', 'cherry', 'banana', 'apple']
for word in words:
    word_count[word] += 1

print(f"Word count: {dict(word_count)}")

# defaultdict with list
group_by_length = defaultdict(list)
for word in words:
    group_by_length[len(word)].append(word)

print(f"Grouped by length: {dict(group_by_length)}")

In [None]:
from collections import Counter

# Counter - 카운팅 특화
words = ['apple', 'banana', 'apple', 'cherry', 'banana', 'apple', 'date']
counter = Counter(words)

print(f"Counter: {counter}")
print(f"Most common 2: {counter.most_common(2)}")
print(f"Apple count: {counter['apple']}")

# Counter 연산
c1 = Counter(['a', 'b', 'c', 'a'])
c2 = Counter(['a', 'b', 'd'])

print(f"c1 + c2: {c1 + c2}")
print(f"c1 - c2: {c1 - c2}")

## 2.3 Set (집합)

### 📖 Set이란?
- **정의**: 중복되지 않는 요소들의 가변 컬렉션
- **특징**:
  - 중괄호 `{}`로 생성 (빈 set은 `set()`)
  - 순서 없음 (unordered)
  - 중복 자동 제거
  - O(1) 검색/삽입/삭제
  - 수학적 집합 연산 지원
- **사용 시기**:
  - 중복 제거가 필요할 때
  - 빠른 멤버십 테스트 (in 연산)
  - 집합 연산 (교집합, 합집합 등)

### 💡 Set의 집합 연산
- **Union (합집합)**: `a | b` 또는 `a.union(b)`
- **Intersection (교집합)**: `a & b` 또는 `a.intersection(b)`
- **Difference (차집합)**: `a - b` 또는 `a.difference(b)`
- **Symmetric Difference (대칭차)**: `a ^ b` 또는 `a.symmetric_difference(b)`

In [None]:
# Set 생성
fruits = {'apple', 'banana', 'cherry'}
numbers = set([1, 2, 3, 2, 1])  # 중복 제거됨

print(f"Fruits: {fruits}")
print(f"Numbers: {numbers}")

# Set에 요소 추가
fruits.add('date')
print(f"After add: {fruits}")

In [None]:
# Set operations (집합 연산)
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

print(f"A: {a}")
print(f"B: {b}")
print()
print(f"Union (합집합): {a | b}")
print(f"Intersection (교집합): {a & b}")
print(f"Difference (차집합): {a - b}")
print(f"Symmetric Difference (대칭차): {a ^ b}")

In [None]:
# Set methods
set1 = {1, 2, 3}
set2 = {2, 3, 4}

print(f"Is subset: {set1.issubset({1, 2, 3, 4, 5})}")
print(f"Is superset: {{1, 2, 3, 4, 5}.issuperset(set1)}")
print(f"Is disjoint: {set1.isdisjoint({4, 5, 6})}")

## 2.4 Frozenset (불변 Set)

### 📖 Frozenset이란?
- **정의**: 불변(immutable) 집합
- **특징**:
  - Set의 불변 버전
  - 생성 후 수정 불가 (요소 추가/삭제 불가)
  - Hashable → Dict의 키나 Set의 요소로 사용 가능
  - 집합 연산은 가능
- **사용 시기**:
  - 변경되지 않아야 하는 집합 데이터
  - Dictionary의 키로 집합을 사용해야 할 때
  - Set의 요소로 집합을 사용해야 할 때

### 💡 Set vs Frozenset
| 특성 | Set | Frozenset |
|------|-----|----------|
| 가변성 | Mutable | Immutable |
| 요소 추가/삭제 | 가능 | 불가능 |
| Hashable | ✗ | ✓ |
| Dict 키 사용 | 불가 | 가능 |
| Set 요소 사용 | 불가 | 가능 |

In [None]:
# Frozenset 생성
fs = frozenset([1, 2, 3, 4, 5])
print(f"Frozenset: {fs}")

# Frozenset은 dictionary의 키로 사용 가능
sets_dict = {
    frozenset([1, 2]): 'set A',
    frozenset([3, 4]): 'set B'
}

print(f"Dictionary with frozenset keys: {sets_dict}")
print(f"Value for {{1, 2}}: {sets_dict[frozenset([1, 2])]}")

## 🎯 연습 문제 2

1. 문자열에서 각 문자의 등장 횟수를 Counter로 세고, 가장 많이 등장한 문자 3개를 출력하세요.
2. 두 리스트에서 공통 요소와 고유 요소를 set을 사용하여 찾으세요.
3. defaultdict를 사용하여 학생들의 성적을 과목별로 그룹화하세요.

In [None]:
# 연습 문제 풀이 공간

# 1. Counter 사용


# 2. Set 연산


# 3. defaultdict 사용


---

# 📚 3. Performance & Best Practices (50분)

## 🔑 핵심 개념

### Time Complexity (시간 복잡도)란?
- **정의**: 알고리즘이 실행되는 데 걸리는 시간을 입력 크기에 따라 표현한 것
- **Big-O 표기법**: 최악의 경우를 나타냄
  - **O(1)**: 상수 시간 - 입력 크기와 무관 (가장 빠름)
  - **O(log n)**: 로그 시간 - 이진 탐색
  - **O(n)**: 선형 시간 - 모든 요소를 한 번씩 확인
  - **O(n log n)**: 선형 로그 시간 - 효율적인 정렬
  - **O(n²)**: 이차 시간 - 중첩 루프

### Space Complexity (공간 복잡도)란?
- **정의**: 알고리즘이 실행되는 데 필요한 메모리 공간
- **고려사항**: 대용량 데이터를 다룰 때 중요

### Hash Table이란?
- **정의**: 키를 해시 함수로 변환하여 값을 저장/검색하는 자료구조
- **원리**: 
  1. 키를 해시 함수에 넣어 해시 값(정수) 생성
  2. 해시 값을 인덱스로 사용하여 값 저장/검색
- **장점**: O(1) 검색/삽입/삭제
- **Python에서**: Dict와 Set이 해시 테이블로 구현됨

### 💡 왜 성능이 중요한가요?
- 작은 데이터: 성능 차이 미미
- 큰 데이터: 성능 차이가 실행 시간에 큰 영향
- 예: 100만 개 데이터에서 검색
  - List (O(n)): 최대 100만 번 비교
  - Set (O(1)): 약 1번 비교

## 3.1 Time Complexity 비교

각 자료구조의 연산별 시간 복잡도를 이해하는 것이 중요합니다.

In [None]:
import time

# List vs Set - Membership test
size = 100000
test_list = list(range(size))
test_set = set(range(size))
target = size - 1  # 최악의 경우 (마지막 요소)

# List search: O(n)
start = time.time()
result = target in test_list
list_time = time.time() - start

# Set search: O(1)
start = time.time()
result = target in test_set
set_time = time.time() - start

print(f"List search time: {list_time:.6f} seconds")
print(f"Set search time: {set_time:.6f} seconds")
print(f"Speed difference: {list_time / set_time:.1f}x faster")

### 시간 복잡도 요약

| 연산 | List | Set | Dict |
|------|------|-----|------|
| 검색 | O(n) | O(1) | O(1) |
| 삽입 | O(1)* | O(1) | O(1) |
| 삭제 | O(n) | O(1) | O(1) |
| 정렬 | O(n log n) | - | - |

*List의 append는 O(1), insert는 O(n)

In [None]:
# List 연산 시간 복잡도 실험
test_list = list(range(100000))

# append: O(1)
start = time.time()
test_list.append(100001)
print(f"Append time: {time.time() - start:.6f} seconds")

# insert at beginning: O(n)
start = time.time()
test_list.insert(0, -1)
print(f"Insert at start time: {time.time() - start:.6f} seconds")

# pop from end: O(1)
start = time.time()
test_list.pop()
print(f"Pop from end time: {time.time() - start:.6f} seconds")

# pop from beginning: O(n)
start = time.time()
test_list.pop(0)
print(f"Pop from start time: {time.time() - start:.6f} seconds")

## 3.2 Hashing 메커니즘

Set과 Dict가 O(1) 검색을 가능하게 하는 Hashing의 원리를 이해합니다.

In [None]:
# Hash 함수
print(f"Hash of 'hello': {hash('hello')}")
print(f"Hash of 42: {hash(42)}")
print(f"Hash of (1, 2, 3): {hash((1, 2, 3))}")

# Hashable vs Unhashable
try:
    print(hash([1, 2, 3]))  # List는 hashable하지 않음
except TypeError as e:
    print(f"Error: {e}")

In [None]:
# Hashable 객체의 조건
# 1. 불변(immutable)이어야 함
# 2. __hash__() 메서드를 구현해야 함
# 3. __eq__() 메서드를 구현해야 함

class Point:
    def __init__(self, x, y):
        self.x = x
        self.y = y
    
    def __hash__(self):
        return hash((self.x, self.y))
    
    def __eq__(self, other):
        return self.x == other.x and self.y == other.y
    
    def __repr__(self):
        return f"Point({self.x}, {self.y})"

# Set에 사용 가능
points = {Point(1, 2), Point(3, 4), Point(1, 2)}  # 중복 제거됨
print(f"Points set: {points}")

# Dict의 키로 사용 가능
point_names = {
    Point(0, 0): "Origin",
    Point(1, 0): "Unit X",
    Point(0, 1): "Unit Y"
}
print(f"Point names: {point_names}")

## 3.3 적절한 자료구조 선택 기준

상황에 맞는 자료구조를 선택하는 것이 중요합니다.

In [None]:
# 시나리오 1: 중복 제거
numbers_with_duplicates = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]

# Bad: List comprehension (O(n²))
unique_list = []
for num in numbers_with_duplicates:
    if num not in unique_list:
        unique_list.append(num)

# Good: Set (O(n))
unique_set = set(numbers_with_duplicates)
unique_list_from_set = list(unique_set)

print(f"Unique (bad way): {unique_list}")
print(f"Unique (good way): {sorted(unique_list_from_set)}")

In [None]:
# 시나리오 2: 빈도 카운팅
words = ['apple', 'banana', 'apple', 'cherry', 'banana', 'apple']

# Bad: Manual counting with dict
count_dict = {}
for word in words:
    if word in count_dict:
        count_dict[word] += 1
    else:
        count_dict[word] = 1

# Better: defaultdict
from collections import defaultdict
count_defaultdict = defaultdict(int)
for word in words:
    count_defaultdict[word] += 1

# Best: Counter
from collections import Counter
count_counter = Counter(words)

print(f"Manual dict: {count_dict}")
print(f"Defaultdict: {dict(count_defaultdict)}")
print(f"Counter: {count_counter}")
print(f"Most common: {count_counter.most_common(2)}")

In [None]:
# 시나리오 3: 순서가 중요한 경우
# List: 순서 보장, 인덱스 접근, 중복 허용
# Tuple: 불변, 순서 보장, 중복 허용
# OrderedDict: 순서 보장, 키-값 쌍, 중복 키 불가

# 학생 성적을 입력 순서대로 관리
from collections import OrderedDict

grades = OrderedDict()
grades['Alice'] = 95
grades['Bob'] = 87
grades['Charlie'] = 92

print("Grades in order:")
for name, grade in grades.items():
    print(f"  {name}: {grade}")

## 3.4 Space Complexity (공간 복잡도)

메모리 사용량도 고려해야 합니다.

In [None]:
import sys

# 동일한 데이터의 메모리 사용량 비교
data = list(range(10000))

as_list = data
as_tuple = tuple(data)
as_set = set(data)
as_dict = {i: i for i in data}

print(f"List size: {sys.getsizeof(as_list):,} bytes")
print(f"Tuple size: {sys.getsizeof(as_tuple):,} bytes")
print(f"Set size: {sys.getsizeof(as_set):,} bytes")
print(f"Dict size: {sys.getsizeof(as_dict):,} bytes")

## 3.5 Best Practices 요약

In [None]:
# Best Practice 1: 멤버십 테스트에는 Set 사용
# Bad
allowed_users = ['alice', 'bob', 'charlie']  # List
if 'alice' in allowed_users:  # O(n)
    print("Allowed")

# Good
allowed_users = {'alice', 'bob', 'charlie'}  # Set
if 'alice' in allowed_users:  # O(1)
    print("Allowed")

In [None]:
# Best Practice 2: 카운팅에는 Counter 사용
from collections import Counter

# Bad
words = ['apple', 'banana', 'apple']
word_count = {}
for word in words:
    word_count[word] = word_count.get(word, 0) + 1

# Good
word_count = Counter(words)
print(word_count.most_common(1))

In [None]:
# Best Practice 3: 불변 데이터에는 Tuple 사용
# Bad: List for coordinates (가변이지만 변경할 필요 없음)
point = [3, 4]
point[0] = 5  # 실수로 변경 가능

# Good: Tuple for coordinates (불변)
point = (3, 4)
# point[0] = 5  # Error: tuple은 변경 불가

In [None]:
# Best Practice 4: 키-값 매핑에는 Dict 사용
# Bad: Two parallel lists
names = ['Alice', 'Bob', 'Charlie']
ages = [25, 30, 35]
# Alice의 나이를 찾으려면 인덱스를 찾아야 함
index = names.index('Alice')
alice_age = ages[index]

# Good: Dictionary
people = {'Alice': 25, 'Bob': 30, 'Charlie': 35}
alice_age = people['Alice']  # 직접 접근
print(f"Alice's age: {alice_age}")

## 🎯 종합 연습 문제

다음 시나리오에 가장 적합한 자료구조를 선택하고 구현하세요:

1. 웹사이트 방문자 로그 분석: 각 페이지의 방문 횟수 카운팅
2. 두 사용자의 친구 목록에서 공통 친구 찾기
3. 학생들의 과목별 성적 저장 및 조회
4. 최근 검색어 10개 저장 (순서 유지, 중복 제거)

In [None]:
# 종합 연습 문제 풀이 공간

# 1. 페이지 방문 횟수 카운팅


# 2. 공통 친구 찾기


# 3. 학생 성적 관리


# 4. 최근 검색어 관리


---

# 🎯 체크리스트

이번 강의를 통해 다음을 할 수 있나요?

- [ ] 각 Collection의 시간 복잡도를 안다
- [ ] 상황에 맞는 자료구조를 선택할 수 있다
- [ ] collections 모듈을 활용할 수 있다
- [ ] Hashable 개념을 이해한다
- [ ] List vs Tuple의 차이를 설명할 수 있다
- [ ] Set operations을 활용할 수 있다
- [ ] Dict vs OrderedDict vs defaultdict의 차이를 안다
- [ ] Counter를 활용한 카운팅을 할 수 있다

---

# 💡 핵심 요약

## Sequence Types
- **List**: 가변, 순서 보장, 중복 허용, O(n) 검색
- **Tuple**: 불변, 순서 보장, 중복 허용, 메모리 효율적
- **String**: 불변 텍스트, 다양한 문자열 메서드 제공
- **Bytes/Bytearray**: 바이트 데이터 처리
- **Range**: 메모리 효율적인 숫자 시퀀스

## Mapping & Set Types
- **Dict**: 키-값 쌍, O(1) 검색/삽입/삭제
- **OrderedDict**: 순서 보장 + 추가 메서드
- **defaultdict**: 기본값 자동 생성
- **Counter**: 카운팅 특화
- **Set/Frozenset**: 중복 제거, O(1) 멤버십 테스트

## Performance
- **List**: 인덱스 접근 O(1), 검색 O(n)
- **Set/Dict**: 검색/삽입/삭제 O(1)
- **Hashing**: hashable 객체만 dict 키나 set 요소 가능

## 선택 기준
- **멤버십 테스트 빈번** → Set
- **키-값 매핑** → Dict
- **카운팅** → Counter
- **순서 중요 + 불변** → Tuple
- **순서 중요 + 가변** → List

---

# 📚 추가 학습 자료

- **필수:**
  - Collections: https://ds31x.tistory.com/122
  - List: https://ds31x.tistory.com/34
  - String: https://ds31x.tistory.com/125
  - Dict: https://ds31x.tistory.com/31

- **권장:**
  - collections.abc: https://ds31x.tistory.com/241
  - Hashing: https://ds31x.tistory.com/248

---