# Module 5: 특수화와 최적화 (Specialization and Optimization)

## CPython의 적응형 인터프리터 (Python 3.11+)

이 노트북에서는 Python 3.11부터 도입된 **적응형 인터프리터(Adaptive Interpreter)**와 **특수화(Specialization)** 메커니즘을 알아봅니다.

### 학습 목표
- 적응형 인터프리터의 동작 원리 이해
- 특수화가 성능에 미치는 영향 파악
- 타입 안정성과 성능의 관계 분석
- 실제 코드에서 특수화 효과 측정

---

## 1. 소개: 왜 특수화가 필요한가?

### Python의 동적 타이핑과 성능 문제

Python은 동적 타이핑 언어로, 실행 시점에 타입이 결정됩니다. 이는 유연성을 제공하지만 성능 오버헤드를 야기합니다:

```python
a + b  # a와 b의 타입을 런타임에 확인해야 함
```

매번 `a`와 `b`의 타입을 확인하고, 해당 타입에 맞는 `__add__` 메서드를 찾아 호출해야 합니다.

### 해결책: 적응형 특수화 (Adaptive Specialization)

Python 3.11은 **핫 코드 경로(hot code path)**를 감지하여 자주 사용되는 타입 조합에 대해 특수화된 바이트코드를 생성합니다:

| 단계 | 설명 | 예시 |
|------|------|------|
| **Tier 1** | 일반 바이트코드 | `BINARY_OP` (일반 연산) |
| **Tier 2** | 적응형 바이트코드 | `BINARY_OP_ADAPTIVE` (타입 관찰) |
| **Tier 3** | 특수화 바이트코드 | `BINARY_OP_ADD_INT` (int 전용) |

### 특수화의 장점

1. **빠른 실행**: 타입 체크 없이 직접 연산 수행
2. **동적 최적화**: 런타임에 실제 사용 패턴에 맞게 최적화
3. **자동화**: 개발자가 신경 쓸 필요 없음

---

## 2. 특수화 메커니즘

### 2.1 바이트코드 진화 과정

특수화는 다음과 같은 과정으로 진행됩니다:

```
초기 상태: BINARY_OP
     ↓ (8번 실행 후)
적응형: BINARY_OP_ADAPTIVE
     ↓ (타입 패턴 관찰)
특수화: BINARY_OP_ADD_INT
```

### 2.2 타입 가드(Type Guard)와 Deoptimization

특수화된 코드는 **타입 가드**를 포함합니다. 예상한 타입이 아닌 경우 **deoptimization**이 발생하여 일반 바이트코드로 돌아갑니다:

```python
def add(x, y):
    return x + y

# 1. add(1, 2) 호출 → int + int 패턴 감지 → BINARY_OP_ADD_INT로 특수화
# 2. add(3, 4) 호출 → int + int → 특수화된 코드 사용 (빠름)
# 3. add(1.5, 2.5) 호출 → float + float → 타입 가드 실패 → deoptimization
# 4. 다시 add(1, 2) 호출 → 패턴 재학습 필요
```

### 2.3 주요 특수화된 연산자

Python 3.11+에서 특수화되는 주요 연산:

| 원래 연산 | 특수화된 버전 | 조건 |
|-----------|---------------|------|
| `BINARY_OP` | `BINARY_OP_ADD_INT` | int + int |
| `BINARY_OP` | `BINARY_OP_ADD_FLOAT` | float + float |
| `BINARY_OP` | `BINARY_OP_ADD_UNICODE` | str + str |
| `BINARY_SUBSCR` | `BINARY_SUBSCR_LIST_INT` | list[int] |
| `BINARY_SUBSCR` | `BINARY_SUBSCR_TUPLE_INT` | tuple[int] |
| `STORE_ATTR` | `STORE_ATTR_SLOT` | __slots__ 사용 클래스 |
| `LOAD_ATTR` | `LOAD_ATTR_SLOT` | slot 기반 속성 접근 |

---

## 3. 실습 1: 적응형 카운터 관찰

`dis` 모듈을 사용하여 바이트코드에서 적응형 명령어를 확인해 봅시다.

In [None]:
import dis
import sys

print(f"Python 버전: {sys.version}")
print(f"Python {sys.version_info.major}.{sys.version_info.minor}.{sys.version_info.micro}")

In [None]:
# 간단한 함수의 바이트코드 확인
def add_numbers(a, b):
    return a + b

print("=== add_numbers 함수 바이트코드 ===")
dis.dis(add_numbers)

### 적응형 바이트코드 확인

Python 3.11+에서는 `dis` 모듈에 `adaptive=True` 옵션을 사용하여 적응형 바이트코드를 확인할 수 있습니다.

In [None]:
# Python 3.11+에서 적응형 바이트코드 확인
if sys.version_info >= (3, 11):
    print("\n=== 적응형 바이트코드 (초기 상태) ===")
    dis.dis(add_numbers, adaptive=True)
    
    # 함수를 여러 번 호출하여 특수화 유도
    print("\n=== 함수를 20번 호출 후 ===")
    for i in range(20):
        add_numbers(i, i + 1)
    
    dis.dis(add_numbers, adaptive=True)
else:
    print("Python 3.11+에서만 적응형 바이트코드를 확인할 수 있습니다.")

In [None]:
# 더 복잡한 예제: 리스트 순회
def sum_list(items):
    total = 0
    for item in items:
        total += item
    return total

print("=== sum_list 바이트코드 ===")
dis.dis(sum_list)

if sys.version_info >= (3, 11):
    # 특수화 유도
    for _ in range(10):
        sum_list([1, 2, 3, 4, 5])
    
    print("\n=== 특수화 후 ===")
    dis.dis(sum_list, adaptive=True)

---

## 4. 실습 2: 타입 안정 코드 vs 불안정 코드

타입 안정성이 특수화와 성능에 미치는 영향을 비교해 봅시다.

In [None]:
# 타입 안정 코드: 항상 같은 타입 사용
def stable_sum():
    total = 0
    for i in range(1000):
        total += i  # 항상 int + int
    return total

# 타입 불안정 코드: 여러 타입 혼합
def unstable_sum():
    total = 0
    for i in range(1000):
        if i % 2 == 0:
            total += i       # int + int
        else:
            total += float(i)  # int + float
    return total

# 바이트코드 비교
print("=== 타입 안정 코드 ===")
dis.dis(stable_sum)

print("\n=== 타입 불안정 코드 ===")
dis.dis(unstable_sum)

### 특수화 상태 확인 (Python 3.11+)

In [None]:
if sys.version_info >= (3, 11):
    # 타입 안정 함수 특수화
    print("타입 안정 함수 특수화 중...")
    for _ in range(10):
        stable_sum()
    
    print("\n=== 타입 안정 함수 (특수화 후) ===")
    dis.dis(stable_sum, adaptive=True)
    
    # 타입 불안정 함수 특수화
    print("\n타입 불안정 함수 특수화 중...")
    for _ in range(10):
        unstable_sum()
    
    print("\n=== 타입 불안정 함수 (특수화 후) ===")
    dis.dis(unstable_sum, adaptive=True)

---

## 5. 실습 3: 성능 측정

`timeit` 모듈을 사용하여 특수화의 성능 효과를 측정합니다.

In [None]:
import timeit

def measure_performance(func, setup_func=None, number=1000, repeat=5):
    """함수의 실행 시간을 측정합니다."""
    # 워밍업: 특수화 유도
    if setup_func:
        setup_func()
    
    for _ in range(100):
        func()
    
    # 실제 측정
    times = []
    for _ in range(repeat):
        elapsed = timeit.timeit(func, number=number)
        times.append(elapsed)
    
    avg_time = sum(times) / len(times)
    min_time = min(times)
    
    print(f"실행 횟수: {number}회")
    print(f"반복 측정: {repeat}회")
    print(f"평균 시간: {avg_time*1000:.3f} ms")
    print(f"최소 시간: {min_time*1000:.3f} ms")
    print(f"평균/회: {avg_time/number*1e6:.3f} µs")
    
    return avg_time

In [None]:
# 타입 안정 코드 성능 측정
print("=== 타입 안정 코드 성능 ===" + "="*40)
stable_time = measure_performance(stable_sum, number=10000)

print("\n=== 타입 불안정 코드 성능 ===" + "="*40)
unstable_time = measure_performance(unstable_sum, number=10000)

# 성능 비교
print("\n=== 성능 비교 ===" + "="*40)
if unstable_time > 0:
    ratio = unstable_time / stable_time
    print(f"타입 불안정 / 타입 안정 = {ratio:.2f}x")
    print(f"타입 안정 코드가 {ratio:.2f}배 빠릅니다")

### 추가 성능 비교: 속성 접근

In [None]:
# 속성 접근 성능 비교
class Point:
    __slots__ = ['x', 'y']
    
    def __init__(self, x, y):
        self.x = x
        self.y = y

class PointDict:
    def __init__(self, x, y):
        self.x = x
        self.y = y

def access_slots():
    p = Point(1, 2)
    total = 0
    for _ in range(1000):
        total += p.x + p.y
    return total

def access_dict():
    p = PointDict(1, 2)
    total = 0
    for _ in range(1000):
        total += p.x + p.y
    return total

print("=== __slots__ 사용 (안정) ===")
slots_time = measure_performance(access_slots, number=5000)

print("\n=== 일반 dict 사용 (불안정) ===")
dict_time = measure_performance(access_dict, number=5000)

print("\n=== 속성 접근 성능 비교 ===")
if dict_time > 0:
    ratio = dict_time / slots_time
    print(f"dict / slots = {ratio:.2f}x")
    print(f"__slots__가 약 {ratio:.2f}배 빠릅니다")

---

## 6. 실습 4: 특수화 통계 확인 (선택)

Python 3.11+에서는 특수화 관련 통계를 확인할 수 있는 방법을 제공합니다.

In [None]:
# sys._stats() 사용 (Python 3.11+, 빌드 옵션에 따라 다름)
def check_specialization_stats():
    """특수화 통계를 확인합니다."""
    try:
        import sys
        stats = sys._stats()
        print("특수화 통계:")
        for key, value in stats.items():
            print(f"  {key}: {value}")
        return stats
    except (AttributeError, TypeError) as e:
        print(f"sys._stats()를 사용할 수 없습니다: {e}")
        print("(Python이 특수화 통계 기능으로 빌드되지 않았을 수 있습니다)")
        return None

# _opcode 모듈 확인
def check_opcode_specializations():
    """_opcode 모듈의 특수화 정보를 확인합니다."""
    try:
        import _opcode
        print("\n_opcode 모듈 메서드:")
        for attr in dir(_opcode):
            if not attr.startswith('_'):
                print(f"  - {attr}")
        
        # 특수화된 opcode 목록 확인
        if hasattr(_opcode, 'get_specialized_opcodes'):
            print("\n특수화된 opcode 목록:")
            opcodes = _opcode.get_specialized_opcodes()
            for op in opcodes[:20]:  # 처음 20개만
                print(f"  - {op}")
    except ImportError:
        print("\n_opcode 모듈을 사용할 수 없습니다.")

check_specialization_stats()
check_opcode_specializations()

---

## 7. (선택) Python 3.13 JIT 소개

Python 3.13에서는 실험적인 **JIT(Just-In-Time) 컴파일러**가 도입되었습니다.

In [None]:
# Python 3.13+ JIT 확인
def check_jit_status():
    """JIT 컴파일러 상태를 확인합니다."""
    import sys
    
    print(f"Python 버전: {sys.version_info.major}.{sys.version_info.minor}.{sys.version_info.micro}")
    
    if sys.version_info >= (3, 13):
        try:
            # sys.flags에서 JIT 활성화 여부 확인
            if hasattr(sys.flags, 'jit'):
                print(f"JIT 활성화: {sys.flags.jit}")
            else:
                print("sys.flags.jit 속성이 없습니다.")
            
            # 환경변수 확인
            import os
            jit_env = os.environ.get('PYTHON_JIT', '미설정')
            print(f"PYTHON_JIT 환경변수: {jit_env}")
            
            # sys._stats로 JIT 통계 확인 (빌드 옵션에 따라 다름)
            try:
                stats = sys._stats()
                if 'jit' in str(stats).lower():
                    print("\nJIT 관련 통계:")
                    for key, value in stats.items():
                        if 'jit' in key.lower():
                            print(f"  {key}: {value}")
            except:
                pass
                
        except Exception as e:
            print(f"JIT 상태 확인 중 오류: {e}")
    else:
        print("JIT는 Python 3.13+에서만 사용 가능합니다.")
        print("\nPython 3.13 JIT 특징:")
        print("  - PYTHON_JIT=1 환경변수로 활성화")
        - copy-and-patch JIT 컴파일
        - Tier 3 바이트코드를 기계어로 컴파일")
        - 실험적 기능 (production 사용 주의)")

check_jit_status()

### JIT 성능 비교 (Python 3.13+에서 실행)

In [None]:
# JIT 성능 테스트용 함수
def jit_test_function(n=10000):
    """JIT 컴파일 효과를 측정하기 위한 계산 집약적 함수"""
    total = 0
    for i in range(n):
        total += i * i
    return total

def jit_fibonacci(n=30):
    """재귀 호출이 많은 함수"""
    if n <= 1:
        return n
    return jit_fibonacci(n - 1) + jit_fibonacci(n - 2)

# JIT 효과 측정
import sys
if sys.version_info >= (3, 13):
    print("=== JIT 성능 테스트 ===" + "="*40)
    
    # 워밍업
    print("워밍업 중...")
    for _ in range(100):
        jit_test_function(1000)
    
    # 측정
    print("\n=== 계산 집약적 함수 ===")
    measure_performance(lambda: jit_test_function(10000), number=100)
    
    print("\n=== 재귀 함수 ===")
    measure_performance(lambda: jit_fibonacci(25), number=10)
else:
    print("Python 3.13+에서만 JIT 테스트가 가능합니다.")
    print("\n테스트 함수 미리보기:")
    dis.dis(jit_test_function)

---

## 8. 연습 문제

### 문제 1: 타입 안정성 개선

다음 코드의 성능을 타입 안정성을 높여 개선해 보세요.

In [None]:
# 문제: 이 함수를 타입 안정하게 개선하세요
def calculate_mixed(n):
    result = 0
    for i in range(n):
        if i % 3 == 0:
            result += i
        elif i % 3 == 1:
            result += i * 1.0
        else:
            result += str(i)  # 문자열 추가!
    return result

# 개선된 버전을 작성하고 성능을 비교해 보세요
def calculate_stable(n):
    # 여기에 코드를 작성하세요
    pass

# 테스트
print("원본 함수 결과:", calculate_mixed(10))
# print("개선 함수 결과:", calculate_stable(10))  # 주석 해제 후 테스트

### 문제 2: 특수화 확인

다음 함수들의 바이트코드를 확인하고, 어떤 특수화가 일어날 수 있는지 예측해 보세요.

In [None]:
# 예제 1: 리스트 인덱싱
def get_items(lst):
    result = []
    for i in range(len(lst)):
        result.append(lst[i])
    return result

# 예제 2: 딕셔너리 접근
def count_words(words):
    counts = {}
    for word in words:
        if word not in counts:
            counts[word] = 0
        counts[word] += 1
    return counts

# 예제 3: 메서드 호출
def process_strings(strings):
    result = []
    for s in strings:
        result.append(s.upper().strip())
    return result

# 각 함수의 바이트코드를 확인하고 특수화 예측
print("=== 예제 1: 리스트 인덱싱 ===")
dis.dis(get_items)

print("\n=== 예제 2: 딕셔너리 접근 ===")
dis.dis(count_words)

print("\n=== 예제 3: 메서드 호출 ===")
dis.dis(process_strings)

### 문제 3: 성능 최적화

다음 코드를 최적화하여 특수화 효과를 극대화해 보세요.

In [None]:
# 비효율적인 코드
def inefficient_sum(data):
    total = 0
    i = 0
    while i < len(data):
        item = data[i]
        if isinstance(item, int):
            total = total + item
        elif isinstance(item, float):
            total = total + item
        i += 1
    return total

# 최적화된 버전을 작성하세요
def optimized_sum(data):
    # 여기에 최적화된 코드를 작성하세요
    pass

# 테스트 데이터
test_data = list(range(1000)) + [float(i) for i in range(1000)]

# 성능 비교
print("원본 함수:")
original_time = measure_performance(lambda: inefficient_sum(test_data), number=1000)

# print("\n최적화 함수:")
# optimized_time = measure_performance(lambda: optimized_sum(test_data), number=1000)

---

## 9. 요약 및 정리

### 핵심 개념

1. **적응형 인터프리터**: Python 3.11+에서 도입된 핫 코드 경로 자동 최적화
2. **특수화(Specialization)**: 자주 사용되는 타입 조합에 대해 최적화된 바이트코드 생성
3. **타입 안정성**: 일관된 타입 사용이 특수화 효율을 높임
4. **Deoptimization**: 예상치 못한 타입이 나타나면 일반 코드로 되돌아감

### 성능 최적화 팁

| 팁 | 설명 |
|----|------|
| 타입 일관성 유지 | 변수에 한 가지 타입만 사용 |
| `__slots__` 사용 | 클래스 속성 접근 최적화 |
| 리스트/튜플 우선 | 일반적인 시퀀스 타입 사용 |
| 워밍업 고려 | 핫 코드는 반복 실행으로 특수화 유도 |

### 참고 자료

- [PEP 659 – Specializing Adaptive Interpreter](https://peps.python.org/pep-0659/)
- [Python 3.11 Release Notes – Faster CPython](https://docs.python.org/3/whatsnew/3.11.html)
- [Python 3.13 JIT Compiler](https://docs.python.org/3.13/whatsnew/3.13.html)

---

## 부록: Python 버전별 특수화 기능 요약

| 버전 | 특수화 기능 |
|------|-------------|
| Python 3.10 이하 | 특수화 없음 |
| Python 3.11 | 적응형 인터프리터, BINARY_OP 특수화 |
| Python 3.12 | 더 많은 특수화, 성능 개선 |
| Python 3.13 | 실험적 JIT 컴파일러 추가 |

### 특수화된 Opcode 목록 (Python 3.11+)

```
BINARY_OP_ADD_INT
BINARY_OP_ADD_FLOAT
BINARY_OP_ADD_UNICODE
BINARY_OP_MULTIPLY_INT
BINARY_OP_MULTIPLY_FLOAT
BINARY_SUBSCR_LIST_INT
BINARY_SUBSCR_TUPLE_INT
BINARY_SUBSCR_DICT
STORE_ATTR_SLOT
STORE_ATTR_WITH_HINT
LOAD_ATTR_SLOT
LOAD_ATTR_MODULE
COMPARE_OP_INT
...
```