# Class 9. Module & Package System

## 📌 학습 목표
1. import의 동작 원리를 설명할 수 있다
2. Package를 구조화하고 관리할 수 있다
3. `__name__ == "__main__"`의 의미를 이해한다
4. pip와 가상환경을 활용할 수 있다

---

## 🕐 1. Module의 모든 것

### 1.1 Module이란?

#### 💡 핵심 개념

**Module**: Python 코드를 담고 있는 파일 (`.py`)

**Module의 역할**:
1. **코드 재사용**: 한 번 작성한 코드를 여러 곳에서 사용
2. **Namespace 분리**: 이름 충돌 방지
3. **코드 구조화**: 관련된 기능을 묶어서 관리

**Module의 종류**:
```
1. Built-in Module    : Python에 내장 (sys, os, math)
2. Standard Library   : Python 설치 시 포함 (json, datetime)
3. Third-party Module : pip로 설치 (numpy, pandas)
4. User-defined Module: 직접 작성한 .py 파일
```

In [None]:
# Module 예시
print("=== Module 종류 ===")

# 1. Built-in Module
import sys
print(f"1. Built-in: sys.version = {sys.version[:20]}...")

# 2. Standard Library
import json
data = json.dumps({'name': 'Alice', 'age': 25})
print(f"2. Standard Library: json.dumps() = {data}")

# 3. Third-party (설치되어 있다면)
try:
    import numpy as np
    print(f"3. Third-party: numpy version = {np.__version__}")
except ImportError:
    print("3. Third-party: numpy가 설치되지 않음")

# 4. User-defined는 파일로 작성 필요

### 1.2 import 메커니즘

#### import가 실행될 때 일어나는 일

```python
import my_module
```

**1단계**: Module 찾기 (Search)
- `sys.path`에 있는 경로들을 순서대로 검색
- `my_module.py` 파일 찾기

**2단계**: Module 컴파일 (Compile)
- `.py` → `.pyc` (bytecode)
- `__pycache__` 디렉토리에 저장

**3단계**: Module 실행 (Execute)
- 모듈의 모든 코드 실행
- Module Namespace 생성

**4단계**: Module Caching (Cache)
- `sys.modules`에 저장
- 다음 import부터는 캐시 사용

**5단계**: Name Binding (Bind)
- 현재 Namespace에 모듈 이름 바인딩

In [None]:
# import 메커니즘 확인
import sys

print("=== import 메커니즘 ===")

# 1. Module Search Path
print("\n1. sys.path (Module 검색 경로):")
for i, path in enumerate(sys.path[:3], 1):
    print(f"   {i}. {path}")
print("   ...")

# 2. Module Cache
print("\n2. sys.modules (캐시된 Module):")
cached_modules = list(sys.modules.keys())[:5]
for module in cached_modules:
    print(f"   - {module}")
print(f"   ... (총 {len(sys.modules)}개)")

# 3. import 후 확인
import math
print(f"\n3. math import 후:")
print(f"   'math' in sys.modules: {'math' in sys.modules}")
print(f"   'math' in dir(): {'math' in dir()}")

### 1.3 import 방식

#### 다양한 import 문법

In [None]:
# import 방식
print("=== import 방식 ===")

# 1. 기본 import
import math
print(f"1. import math")
print(f"   math.pi = {math.pi}")

# 2. as로 별칭
import numpy as np  # numpy가 없으면 주석 처리
# print(f"\n2. import numpy as np")
# print(f"   np.array([1, 2, 3]) = {np.array([1, 2, 3])}")

# 3. from import (특정 항목만)
from math import sqrt, pi
print(f"\n3. from math import sqrt, pi")
print(f"   sqrt(16) = {sqrt(16)}")
print(f"   pi = {pi}")

# 4. from import as (별칭)
from math import factorial as fact
print(f"\n4. from math import factorial as fact")
print(f"   fact(5) = {fact(5)}")

# 5. from import * (비권장!)
# from math import *
print("\n5. from math import * (비권장)")
print("   → Namespace 오염 위험")

#### import 방식 비교

| 방식 | 장점 | 단점 | 사용 시기 |
|------|------|------|----------|
| `import module` | 명확한 출처 | 긴 이름 | 기본 선택 |
| `import module as alias` | 짧은 이름 | 관례 필요 | 긴 이름 모듈 |
| `from module import name` | 짧게 사용 | 출처 불명확 | 자주 사용하는 것만 |
| `from module import *` | 모든 것 사용 | Namespace 오염 | ❌ 사용 금지 |

### 1.4 `__name__` 변수

#### 핵심: "이 파일이 직접 실행되었는가?"

**`__name__` 변수의 값**:
```python
# 파일이 직접 실행됨
__name__ == "__main__"

# 파일이 import됨
__name__ == "module_name"
```

In [None]:
# __name__ 확인
print("=== __name__ 변수 ===")
print(f"현재 __name__: {__name__}")

# Jupyter Notebook에서는 '__main__'이 아닐 수 있음
if __name__ == "__main__":
    print("이 코드는 직접 실행되었습니다")
else:
    print(f"이 코드는 '{__name__}' 모듈로 import되었습니다")

#### `__name__`의 활용

**패턴**: Module로도 쓰고 Script로도 실행

```python
# calculator.py
def add(a, b):
    return a + b

def subtract(a, b):
    return a - b

# Module로 import될 때는 실행 안 됨
if __name__ == "__main__":
    # Script로 실행될 때만 실행
    print("Calculator Test")
    print(f"5 + 3 = {add(5, 3)}")
    print(f"5 - 3 = {subtract(5, 3)}")
```

**사용 예**:
```bash
# Script로 실행
$ python calculator.py
Calculator Test
5 + 3 = 8
5 - 3 = 2

# Module로 import
>>> import calculator
>>> calculator.add(10, 20)
30
```

### 1.5 Module Search Path

#### `sys.path`의 구성

**Module 검색 순서**:
1. 현재 디렉토리
2. `PYTHONPATH` 환경 변수
3. 표준 라이브러리 경로
4. site-packages (pip 설치 경로)

In [None]:
# sys.path 확인
import sys

print("=== Module Search Path ===")
print("\nsys.path:")
for i, path in enumerate(sys.path, 1):
    print(f"{i}. {path}")

# 동적으로 경로 추가
print("\n경로 추가:")
new_path = "/my/custom/path"
sys.path.append(new_path)
print(f"sys.path에 '{new_path}' 추가됨")
print(f"마지막 경로: {sys.path[-1]}")

### 1.6 Module Caching

#### `sys.modules`의 역할

**핵심**: Module은 한 번만 실행되고 캐시됨

In [None]:
# Module Caching 확인
import sys

print("=== Module Caching ===")

# math를 여러 번 import
import math
print(f"첫 import: id(math) = {id(math)}")

import math
print(f"두 번째 import: id(math) = {id(math)}")
print("→ 같은 객체 (캐시 사용)")

# sys.modules 확인
print(f"\n'math' in sys.modules: {'math' in sys.modules}")
print(f"sys.modules['math']: {sys.modules['math']}")

# Module 재로딩 (개발 시에만)
import importlib
print("\nModule 재로딩:")
importlib.reload(math)
print("math 모듈 재로딩됨")

---

## 🕑 2. Package 구조화

### 2.1 Package vs Module

#### 개념 정리

**Module**: 단일 `.py` 파일
```
calculator.py
```

**Package**: Module들을 담은 디렉토리
```
my_package/
    __init__.py
    module1.py
    module2.py
```

**Package의 특징**:
- 디렉토리에 `__init__.py` 포함 (Python 3.3+는 선택)
- 계층적 구조 가능
- Namespace로 구조화

### 2.2 Package 구조 예시

#### 전형적인 Package 구조

```
my_project/
│
├── my_package/              # Package 루트
│   ├── __init__.py         # Package 초기화
│   ├── module1.py          # Module 1
│   ├── module2.py          # Module 2
│   │
│   └── sub_package/        # Sub-package
│       ├── __init__.py
│       └── module3.py
│
├── tests/                  # 테스트
│   └── test_module1.py
│
├── setup.py                # 설치 스크립트
├── requirements.txt        # 의존성
└── README.md               # 문서
```

### 2.3 `__init__.py`의 역할

#### `__init__.py`가 하는 일

**1. Package 표시** (Python 3.3 이전 필수)
```python
# 빈 파일이어도 OK
# my_package/__init__.py
```

**2. Package 초기화 코드**
```python
# my_package/__init__.py
print("Package 초기화")
VERSION = "1.0.0"
```

**3. 편의 Import**
```python
# my_package/__init__.py
from .module1 import func1
from .module2 import func2

# 사용자는 간단하게
from my_package import func1  # 대신 from my_package.module1 import func1
```

**4. `__all__` 정의**
```python
# my_package/__init__.py
__all__ = ['func1', 'func2']
```

### 2.4 Absolute vs Relative Import

#### Absolute Import (절대 경로)

**특징**: Package 이름부터 전체 경로

```python
# my_package/module1.py
from my_package.module2 import func2
from my_package.sub_package.module3 import func3
```

**장점**:
- 명확하고 읽기 쉬움
- 파일 이동 시에도 안전

**단점**:
- Package 이름이 길면 불편

#### Relative Import (상대 경로)

**특징**: 현재 위치 기준으로 상대 경로

```python
# my_package/module1.py
from . import module2         # 같은 디렉토리
from .module2 import func2    # 같은 디렉토리
from ..other_package import something  # 상위 디렉토리
from .sub_package import module3      # 하위 디렉토리
```

**기호**:
- `.` : 현재 디렉토리
- `..` : 상위 디렉토리
- `...` : 상위의 상위

**장점**:
- Package 이름 변경에 강함
- 짧고 간결

**단점**:
- Package 내부에서만 사용 가능
- 직접 실행 시 오류 (must be in package)

#### 권장 사항

**PEP 8 권장**:
- **Absolute Import 선호**
- Relative Import는 복잡한 구조에서만

```python
# ✅ 권장: Absolute Import
from my_package.utils import helper

# ⚠️ 신중히: Relative Import
from .utils import helper

# ❌ 비권장: Wildcard Import
from my_package import *
```

### 2.5 `__all__` 변수

#### `__all__`의 역할

**정의**: `from module import *` 시 import될 이름 목록

```python
# module.py
def public_func():
    pass

def _private_func():
    pass

__all__ = ['public_func']  # 이것만 export
```

**효과**:
```python
from module import *
# public_func만 import됨
# _private_func는 import 안 됨
```

### 2.6 Namespace Package (Python 3.3+)

#### 새로운 Package 방식

**특징**: `__init__.py` 없이도 Package

```
my_namespace/
    part1/
        module1.py  # __init__.py 없음!
    part2/
        module2.py  # __init__.py 없음!
```

**장점**:
- 여러 곳에 분산된 Package 통합 가능
- Plugin 시스템에 유용

**단점**:
- 초기화 코드 실행 불가
- 혼란 가능성

---

## 🕒 3. Package Management

### 3.1 pip 기초

#### pip란?

**pip**: Python Package Installer

**주요 명령어**:
```bash
# Package 설치
pip install package_name

# 특정 버전 설치
pip install package_name==1.0.0

# 업그레이드
pip install --upgrade package_name

# 제거
pip uninstall package_name

# 설치된 Package 목록
pip list

# Package 정보
pip show package_name

# requirements.txt로 설치
pip install -r requirements.txt

# requirements.txt 생성
pip freeze > requirements.txt
```

In [None]:
# pip 명령어 (Jupyter에서 실행)
print("=== pip 기초 ===")

# 설치된 Package 목록 (일부)
import subprocess

result = subprocess.run(['pip', 'list'], capture_output=True, text=True)
lines = result.stdout.split('\n')[:10]
print("\n설치된 Package (상위 10개):")
for line in lines:
    print(line)
print("...")

### 3.2 requirements.txt

#### 의존성 관리의 핵심

**requirements.txt**: 프로젝트가 필요로 하는 Package 목록

**예시**:
```txt
# requirements.txt
numpy==1.21.0
pandas>=1.3.0
matplotlib
requests~=2.26.0
```

**버전 지정 방식**:
- `==1.0.0` : 정확한 버전
- `>=1.0.0` : 이상
- `<=1.0.0` : 이하
- `~=1.0.0` : 호환 버전 (1.0.x)
- 버전 없음: 최신 버전

**사용법**:
```bash
# 현재 환경의 Package 목록 저장
pip freeze > requirements.txt

# requirements.txt로 설치
pip install -r requirements.txt
```

### 3.3 Virtual Environment

#### 가상환경이 필요한 이유

**문제 상황**:
```
프로젝트 A: Django 2.0 필요
프로젝트 B: Django 3.0 필요
→ 충돌! 😱
```

**해결**: 프로젝트마다 독립적인 환경

```
System Python
    |
    ├── venv_A/  → Django 2.0
    └── venv_B/  → Django 3.0
```

#### venv 사용법

**Python 내장 도구**:

```bash
# 1. 가상환경 생성
python -m venv myenv

# 2. 활성화
# Windows
myenv\Scripts\activate

# macOS/Linux
source myenv/bin/activate

# 3. Package 설치
(myenv) $ pip install numpy pandas

# 4. 비활성화
(myenv) $ deactivate
```

**virtualenv (대안)**:
```bash
pip install virtualenv
virtualenv myenv
```

### 3.4 conda

#### conda vs pip

| 특징 | pip | conda |
|------|-----|-------|
| 관리 대상 | Python Package | 모든 Package (C, R 등) |
| 가상환경 | venv 별도 | 통합 제공 |
| 의존성 해결 | 약함 | 강력 |
| 속도 | 빠름 | 느림 |
| 생태계 | PyPI | Anaconda |

**conda 기본 명령어**:
```bash
# 환경 생성
conda create -n myenv python=3.9

# 환경 활성화
conda activate myenv

# Package 설치
conda install numpy pandas

# 환경 목록
conda env list

# 환경 삭제
conda env remove -n myenv

# environment.yml로 환경 생성
conda env create -f environment.yml

# environment.yml 생성
conda env export > environment.yml
```

#### conda vs mamba

**mamba**: conda의 빠른 대안

```bash
# mamba 설치
conda install mamba -c conda-forge

# conda 대신 mamba 사용 (명령어 동일)
mamba install numpy
mamba create -n myenv python=3.9
```

**차이점**:
- mamba: 의존성 해결이 훨씬 빠름 (C++로 재작성)
- 명령어는 conda와 동일

### 3.5 Best Practices

#### Package 관리 모범 사례

**1. 항상 가상환경 사용**
```bash
# 프로젝트마다 독립적인 환경
python -m venv venv
source venv/bin/activate
```

**2. requirements.txt 관리**
```bash
# 개발 시작
pip install -r requirements.txt

# 새 Package 설치 후
pip freeze > requirements.txt
```

**3. 버전 고정**
```txt
# 프로덕션
numpy==1.21.0  # 정확한 버전

# 개발
numpy>=1.21.0  # 유연한 버전
```

**4. .gitignore 설정**
```gitignore
venv/
__pycache__/
*.pyc
.env
```

**5. 환경 분리**
```txt
requirements-dev.txt   # 개발용
requirements-prod.txt  # 프로덕션용
requirements-test.txt  # 테스트용
```

---

## 📊 종합 실습

### 실습 1: Simple Package 만들기

#### 목표: 기본 Package 구조 이해

**디렉토리 구조**:
```
calculator_package/
    __init__.py
    basic.py
    advanced.py
```

**코드**:
```python
# calculator_package/__init__.py
"""Calculator Package"""
from .basic import add, subtract
from .advanced import power, sqrt

__version__ = "1.0.0"
__all__ = ['add', 'subtract', 'power', 'sqrt']

# calculator_package/basic.py
def add(a, b):
    """Add two numbers"""
    return a + b

def subtract(a, b):
    """Subtract two numbers"""
    return a - b

# calculator_package/advanced.py
def power(base, exp):
    """Calculate power"""
    return base ** exp

def sqrt(x):
    """Calculate square root"""
    return x ** 0.5
```

**사용**:
```python
# 방법 1
from calculator_package import add, power
print(add(2, 3))      # 5
print(power(2, 3))    # 8

# 방법 2
import calculator_package as calc
print(calc.add(2, 3))     # 5
print(calc.__version__)   # 1.0.0
```

### 실습 2: requirements.txt 실습

**시나리오**: 데이터 분석 프로젝트

```txt
# requirements.txt
numpy==1.21.0
pandas==1.3.0
matplotlib==3.4.2
seaborn==0.11.1
jupyter==1.0.0
```

**설치**:
```bash
# 가상환경 생성
python -m venv data_env

# 활성화
source data_env/bin/activate  # macOS/Linux
data_env\Scripts\activate     # Windows

# Package 설치
pip install -r requirements.txt

# 확인
pip list
```

---

## 🎯 체크리스트

### Module
- [ ] import 메커니즘을 설명할 수 있다
- [ ] `sys.path`의 역할을 안다
- [ ] `sys.modules`의 역할을 안다
- [ ] `__name__` 변수를 활용할 수 있다

### Package
- [ ] Package 구조를 설계할 수 있다
- [ ] `__init__.py`의 역할을 안다
- [ ] Absolute/Relative Import를 구분할 수 있다
- [ ] `__all__` 변수를 사용할 수 있다

### Package Management
- [ ] pip 명령어를 사용할 수 있다
- [ ] requirements.txt를 관리할 수 있다
- [ ] Virtual Environment를 생성할 수 있다
- [ ] conda와 pip의 차이를 안다

---

## 💡 핵심 요약

### Module & Import
```python
# Module = .py 파일
# import 시: 찾기 → 컴파일 → 실행 → 캐싱 → 바인딩
import module
from module import func
```

### Package 구조
```python
# Package = Module들의 디렉토리
my_package/
    __init__.py  # Package 초기화
    module1.py
    module2.py
```

### Import 방식
```python
# Absolute (권장)
from my_package.module1 import func

# Relative (신중히)
from .module1 import func
```

### Package Management
```bash
# pip
pip install package
pip install -r requirements.txt

# 가상환경
python -m venv venv
source venv/bin/activate
```

---

## 📚 추가 학습 자료

- Module Search Path: https://dsaint31.tistory.com/528
- Package Manager: https://dsaint31.tistory.com/534
- pip 사용법: https://ds31x.tistory.com/16
- conda: https://ds31x.blogspot.com/2023/07/env-conda-anaconda-and-miniconda.html
- PyPI: https://pypi.org/

---

## 🤔 토론 주제

### 1. "from module import * 는 왜 나쁜가?"

**문제점:**
- Namespace 오염
- 출처 불명확
- 이름 충돌 위험

### 2. "Relative vs Absolute Import"

**언제 무엇을 사용?**
- Absolute: 대부분의 경우 (명확성)
- Relative: 깊은 Package 구조 (간결성)

### 3. "pip vs conda"

**선택 기준:**
- 순수 Python: pip
- Data Science: conda
- 혼용 가능 (주의 필요)

---

## 수고하셨습니다! 🎉