# Practice 1. Python 기초 (Python Basics)
## 기계공학과를 위한 AI 프로그래밍 입문

이 노트북에서는 AI/머신러닝 코드를 이해하고 작성하기 위해 필요한 **Python 기본 문법**을 학습합니다.

### 학습 목표
- Python의 기본 자료형과 연산자를 이해한다
- 리스트, 튜플, 딕셔너리 등 자료구조를 활용할 수 있다
- 조건문과 반복문으로 프로그램 흐름을 제어할 수 있다
- 함수를 정의하고 활용할 수 있다
- 클래스와 상속의 개념을 이해한다
- NumPy 배열과 Matplotlib 시각화의 기초를 익힌다

### 이 노트북의 구성
| 섹션 | 내용 | 
|:---:|------|
| 1 | 변수와 자료형 | 
| 2 | 자료구조 (리스트, 튜플, 딕셔너리) | 
| 3 | 제어문 (조건문, 반복문) | 
| 4 | 함수 | 
| 5 | 문자열 다루기 | 
| 6 | 클래스와 객체지향 프로그래밍 | 
| 7 | 리스트 컴프리헨션과 람다 함수 | 
| 8 | NumPy 기초 | 
| 9 | Matplotlib 기초 시각화 | 
| 10 | Class 상속 | 
| 11 | 종합 정리 | 

### Jupyter Notebook 사용법

| 단축키 | 동작 |
|--------|------|
| `Shift + Enter` | 현재 셀 실행 후 다음 셀로 이동 |
| `Ctrl + Enter` | 현재 셀 실행 (이동하지 않음) |
| `Esc` | 현재 셀에서 나오기 (아래 명령어 실행 가능) |
| `A` | 위에 새 셀 추가 |
| `B` | 아래에 새 셀 추가 |
| `M` | 마크다운 셀로 변경 |
| `Y` | 코드 셀로 변경 |

- 셀 왼쪽 `[ ]`: 실행 전 &nbsp;|&nbsp; `[*]`: 실행 중 &nbsp;|&nbsp; `[숫자]`: 실행 완료
- **코드 셀에서 직접 수정하고 실행하면서 학습하세요!**

In [None]:
# 첫 번째 Python 코드를 실행해 봅시다!
print("Hello, Mechanical Engineering!")
print("AI 수업에 오신 것을 환영합니다!")

---
# 1. 변수와 자료형 (Variables & Data Types)

Python에서 **변수(variable)**는 데이터를 저장하는 이름표입니다.  
C/MATLAB과 달리 Python은 변수를 선언할 때 **자료형을 지정하지 않아도** 됩니다.

> **왜 중요한가?** 머신러닝에서 데이터는 숫자(`int`, `float`)로 표현되고,  
> 모델의 예측 결과는 문자열(`str`)이나 논리값(`bool`)으로 해석됩니다.

In [None]:
# 정수형 (int) - 센서 측정 횟수, 데이터 개수 등
num_samples = 100         # 학습 데이터 수
num_features = 4          # 특성(feature)의 수 (예: 붓꽃 데이터)
print(num_samples, type(num_samples))

# 실수형 (float) - 온도, 압력, 학습률 등
temperature = 25.3        # 섭씨 온도
learning_rate = 0.001     # 머신러닝 학습률
pi = 3.14159
print(temperature, type(temperature))
print(learning_rate, type(learning_rate))

In [None]:
# 문자열 (str) - 파일 경로, 레이블 이름 등
material = "Steel"
label = 'setosa'          # 붓꽃 품종 이름
file_path = "data/iris.csv"
print(material, type(material))

# 논리형 (bool) - 조건 판단, GPU 사용 여부 등
is_training = True
use_gpu = False
print(is_training, type(is_training))

### 1.1 산술 연산자

| 연산자 | 의미 | 예시 | 결과 |
|:---:|------|------|:---:|
| `+` | 덧셈 | `3 + 2` | `5` |
| `-` | 뺄셈 | `3 - 2` | `1` |
| `*` | 곱셈 | `3 * 2` | `6` |
| `/` | 나눗셈 | `7 / 2` | `3.5` |
| `//` | 정수 나눗셈 | `7 // 2` | `3` |
| `%` | 나머지 | `7 % 2` | `1` |
| `**` | 거듭제곱 | `3 ** 2` | `9` |

In [None]:
# 공학 계산 예제: 원형 단면의 면적과 관성 모멘트
import math

radius = 0.05  # 반지름 50mm = 0.05m

area = math.pi * radius ** 2                    # 단면적 A = pi * r^2
moment_of_inertia = math.pi * radius ** 4 / 4   # 관성 모멘트 I = pi * r^4 / 4

print("단면적:", area, "m^2")
print("관성 모멘트:", moment_of_inertia, "m^4")

In [None]:
# 비교 연산자 - ML에서 조건 분기에 자주 사용
accuracy = 0.95
threshold = 0.90

print("accuracy > threshold :", accuracy > threshold)   # True
print("accuracy == 1.0     :", accuracy == 1.0)         # False
print("accuracy >= 0.95    :", accuracy >= 0.95)        # True
print("accuracy != threshold:", accuracy != threshold)  # True

# 논리 연산자
is_accurate = accuracy > 0.90
is_fast = True
print("\nis_accurate and is_fast:", is_accurate and is_fast)  # 둘 다 참이어야 참
print("is_accurate or is_fast :", is_accurate or is_fast)     # 하나라도 참이면 참
print("not is_accurate        :", not is_accurate)            # 반전

### 1.2 자료형 변환 (Type Conversion)

머신러닝 코드에서는 자료형 변환이 매우 자주 필요합니다.  
예를 들어, 이미지 데이터를 정수(0~255)에서 실수(0.0~1.0)로 변환하는 것은 모든 딥러닝 코드에서 등장합니다.

```python
# 앞으로 자주 볼 코드:
x_train = x_train.astype(np.float32) / 255.0
```

In [None]:
# 자료형 변환 예제
pixel_value = 128          # 이미지 픽셀값 (0~255 정수)
normalized = float(pixel_value) / 255.0  # 정규화: 0.0~1.0 실수로 변환
print(f"원본: {pixel_value} ({type(pixel_value).__name__})")
print(f"정규화: {normalized:.4f} ({type(normalized).__name__})")

# 문자열 <-> 숫자 변환
epoch_str = "100"
epoch_num = int(epoch_str)
print(f"\n문자열 '100' -> 정수 {epoch_num}")

# bool 변환 - 0은 False, 나머지는 True
print(f"\nbool(0)={bool(0)}, bool(1)={bool(1)}, bool(-1)={bool(-1)}, bool(0.0)={bool(0.0)}")

### 1.3 변수 할당과 다중 할당

Python에서는 여러 변수를 한 줄에 할당할 수 있습니다.  
이 패턴은 ML 코드에서 데이터셋을 로드할 때 **매우 자주** 사용됩니다.

```python
# 앞으로 자주 볼 코드:
(x_train, y_train), (x_test, y_test) = mnist.load_data()
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
```

In [None]:
# 다중 할당
width, height, channels = 28, 28, 1   # MNIST 이미지 크기
print(f"이미지 크기: {width} x {height} x {channels}")

# 값 교환 (swap) - 다른 언어보다 간결!
a, b = 10, 20
print(f"교환 전: a={a}, b={b}")
a, b = b, a
print(f"교환 후: a={a}, b={b}")

# 튜플 언패킹 (tuple unpacking) - ML 데이터 로드 패턴 미리보기
train_data = (100, 0.95)    # (에폭 수, 정확도) 형태의 데이터
epochs, accuracy = train_data
print(f"\n학습 에폭: {epochs}, 정확도: {accuracy}")

### 연습 문제 1

1. 변수 `force`에 100.0 (단위: N), `area`에 0.01 (단위: m²)을 저장하고, 응력(stress = force / area)을 계산하여 출력하세요.
2. `type()` 함수를 사용하여 계산 결과의 자료형을 확인하세요.
3. 결과를 정수형(`int`)으로 변환하여 출력하세요.

In [None]:
# 연습 문제 1 풀이 공간
# 아래에 코드를 작성하세요



---
# 2. 자료구조 (Data Structures)

Python의 핵심 자료구조: **리스트(list)**, **튜플(tuple)**, **딕셔너리(dict)**

> **왜 중요한가?**
> - **리스트**: 학습 손실값 기록, 예측 결과 저장 (`self.errors_ = []`, `losses.append(...)`)
> - **튜플**: 이미지 크기 `(28, 28, 1)`, 커널 크기 `(3, 3)` 등 불변 데이터
> - **딕셔너리**: 하이퍼파라미터 설정, 데이터셋 속성 (`hist.history['accuracy']`)

In [None]:
# 리스트 (List) - 순서가 있고, 변경 가능한 데이터 모음
# ML에서 학습 과정 기록에 필수적으로 사용

losses = []                         # 빈 리스트 생성
losses.append(2.35)                 # 에폭 1의 손실값
losses.append(1.82)                 # 에폭 2의 손실값
losses.append(0.95)                 # 에폭 3의 손실값
losses.append(0.43)                 # 에폭 4의 손실값
print("손실값 기록:", losses)
print("총 에폭 수:", len(losses))
print("마지막 손실값:", losses[-1])    # 음수 인덱스: 끝에서부터
print("첫 번째 손실값:", losses[0])

In [None]:
# 인덱싱과 슬라이싱 - NumPy 배열 조작의 기초!
# Python의 인덱스는 0부터 시작합니다

feature_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width']

print("첫 번째:", feature_names[0])       # 첫 번째 원소
print("마지막:", feature_names[-1])        # 마지막 원소
print("1~2번째:", feature_names[1:3])      # 인덱스 1부터 2까지 (3은 미포함!)
print("처음~1번째:", feature_names[:2])    # 처음부터 인덱스 1까지
print("2번째~끝:", feature_names[2:])      # 인덱스 2부터 끝까지

In [None]:
# 리스트 연산과 메서드
layers = [784, 128, 64]
layers.append(10)               # 끝에 추가
print("신경망 구조:", layers)

layers.insert(1, 256)           # 인덱스 1 위치에 삽입
print("레이어 추가 후:", layers)

layers.remove(256)              # 값으로 삭제
print("레이어 제거 후:", layers)

# 리스트 합치기
train_acc = [0.8, 0.85, 0.9]
test_acc = [0.75, 0.80, 0.85]
all_acc = train_acc + test_acc
print("\n전체 정확도:", all_acc)

# 정렬
scores = [92, 87, 95, 78, 88]
print("오름차순:", sorted(scores))
print("내림차순:", sorted(scores, reverse=True))

### 2.1 튜플 (Tuple)

튜플은 리스트와 비슷하지만 **변경할 수 없습니다(immutable)**.  
ML/DL 코드에서 데이터의 크기(shape), 커널 크기 등 **바뀌면 안 되는 값**에 사용합니다.

```python
# 앞으로 자주 볼 코드:
input_shape = (28, 28, 1)
kernel_size = (3, 3)
pool_size = (2, 2)
```

In [None]:
# 튜플 - 변경 불가능한 데이터 모음
image_shape = (28, 28, 1)     # (높이, 너비, 채널)
kernel_size = (3, 3)
pool_size = (2, 2)

print(f"이미지 형태: {image_shape}")
print(f"높이: {image_shape[0]}, 너비: {image_shape[1]}, 채널: {image_shape[2]}")

# 튜플 언패킹
height, width, channels = image_shape
print(f"H={height}, W={width}, C={channels}")

# 튜플은 수정 불가!
# image_shape[0] = 32  # <- 이 줄의 주석을 해제하면 TypeError 발생

### 2.2 딕셔너리 (Dictionary)

딕셔너리는 **키(key)-값(value)** 쌍으로 이루어진 자료구조입니다.  
ML에서는 하이퍼파라미터 설정, 학습 기록, 데이터셋 메타정보 등에 사용합니다.

```python
# 앞으로 자주 볼 코드:
hist.history['accuracy']
hist.history['val_accuracy']
```

In [None]:
# 딕셔너리 - 하이퍼파라미터 관리에 유용
hyperparams = {
    'learning_rate': 0.001,
    'batch_size': 128,
    'epochs': 30,
    'optimizer': 'Adam'
}

print("학습률:", hyperparams['learning_rate'])
print("배치 크기:", hyperparams['batch_size'])

# 값 수정 및 추가
hyperparams['epochs'] = 50           # 기존 키의 값 수정
hyperparams['dropout_rate'] = 0.5    # 새 키-값 추가
print("\n수정 후:", hyperparams)

# 키, 값 접근
print("\n키 목록:", list(hyperparams.keys()))
print("값 목록:", list(hyperparams.values()))

In [None]:
# 학습 기록을 딕셔너리로 관리하기 (실제 ML 코드 패턴)
history = {
    'accuracy': [0.65, 0.78, 0.85, 0.91, 0.94],
    'val_accuracy': [0.60, 0.72, 0.80, 0.86, 0.88],
    'loss': [2.1, 1.5, 0.9, 0.5, 0.3],
    'val_loss': [2.3, 1.8, 1.2, 0.8, 0.6]
}

print(f"최종 학습 정확도: {history['accuracy'][-1]}")
print(f"최종 검증 정확도: {history['val_accuracy'][-1]}")
print(f"에폭 수: {len(history['accuracy'])}")

### 2.3 자료구조 비교 요약

| 특성 | 리스트 `[ ]` | 튜플 `( )` | 딕셔너리 `{ }` |
|:---:|:---:|:---:|:---:|
| 변경 가능 | O | **X** | O |
| 순서 있음 | O | O | O (3.7+) |
| 인덱싱 방법 | 숫자 | 숫자 | 키(key) |
| ML 용도 | 기록 저장 | shape, 크기 | 설정, 이력 |

### 연습 문제 2

1. 5개의 온도 데이터 `[22.1, 23.5, 21.8, 24.2, 22.9]`를 리스트로 만들고, 슬라이싱을 사용하여 **앞의 3개만** 출력하세요.
2. 보(beam)의 정보를 딕셔너리로 만드세요: 길이=2.0m, 재료="Steel", 단면적=0.01m². 그리고 `'재료'` 키의 값을 출력하세요.
3. 빈 리스트를 만들고, `append`를 사용하여 1, 4, 9, 16, 25를 추가한 후 전체 리스트를 출력하세요.

In [None]:
# 연습 문제 2 풀이 공간



---
# 3. 제어문 (Control Flow)

프로그램의 실행 순서를 제어하는 문법입니다.

> **왜 중요한가?**
> - `if/elif/else`: 예측 결과 분류, GPU 사용 여부 결정
> - `for` 루프: **에폭 반복**, 데이터 배치 처리, 모델 평가
> - `while` 루프: 수렴 조건 확인

> **주의!** Python은 들여쓰기(indentation)로 코드 블록을 구분합니다.  
> C/Java의 중괄호 `{}` 대신 **4칸 스페이스**를 사용합니다.

In [None]:
# 조건문 - 정확도에 따른 모델 평가
accuracy = 0.87

if accuracy >= 0.95:
    grade = "Excellent"
elif accuracy >= 0.90:
    grade = "Good"
elif accuracy >= 0.80:
    grade = "Acceptable"
else:
    grade = "Needs Improvement"

print(f"정확도: {accuracy*100}% -> 평가: {grade}")

In [None]:
# 삼항 연산자 - 실제 ML 코드에서 자주 사용하는 패턴
import random

# GPU 사용 가능 여부에 따른 장치 선택
# (실제로는 torch.cuda.is_available() 사용)
gpu_available = random.choice([True, False])  # 시뮬레이션

# if-else로 작성
if gpu_available:
    device = 'cuda'
else:
    device = 'cpu'
print(f"GPU 사용 가능: {gpu_available} -> 장치: {device}")

# 같은 코드를 삼항 연산자로 한 줄에!
device = 'cuda' if gpu_available else 'cpu'
print(f"삼항 연산자 결과: {device}")

### 3.1 for 반복문

`for` 반복문은 ML/DL 코드의 핵심입니다.

```python
# 앞으로 자주 볼 코드:
for epoch in range(n_epochs):
    for batch_idx, (data, target) in enumerate(train_loader):
        ...
```

In [None]:
# range() 함수 - 숫자 순서열 생성
print("range(5)      :", list(range(5)))          # [0, 1, 2, 3, 4]
print("range(1, 6)   :", list(range(1, 6)))       # [1, 2, 3, 4, 5]
print("range(0, 10, 2):", list(range(0, 10, 2)))  # [0, 2, 4, 6, 8]

print()

# 에폭 반복 (ML 학습 코드의 기본 구조)
n_epochs = 5
for epoch in range(n_epochs):
    print(f"Epoch {epoch+1}/{n_epochs}")

In [None]:
# enumerate() - 인덱스와 값을 동시에 (ML 코드에서 매우 자주 사용!)
feature_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width']

for idx, name in enumerate(feature_names):
    print(f"특성 {idx}: {name}")

In [None]:
# zip() - 두 리스트를 동시에 순회
# 참고: Perceptron 클래스의 for xi, target in zip(X, y): 패턴

models = ['KNN', 'SVM', 'Random Forest']
accuracies = [0.93, 0.87, 0.91]

for model, acc in zip(models, accuracies):
    print(f"{model}: {acc*100:.1f}%")

In [None]:
# 중첩 반복문 - DL 학습 루프의 기본 구조
import random

n_epochs = 3
n_batches = 4  # 실제로는 len(train_loader)

for epoch in range(n_epochs):
    total_loss = 0
    for batch_idx in range(n_batches):
        batch_loss = random.random()  # 임의의 손실값 (시뮬레이션)
        total_loss += batch_loss
    avg_loss = total_loss / n_batches
    print(f"Epoch [{epoch+1}/{n_epochs}], Avg Loss: {avg_loss:.4f}")

In [None]:
# while 반복문 - 조건이 만족될 때까지 반복
# 예: 손실값이 충분히 작아질 때까지 학습

loss = 10.0
threshold = 0.5
iteration = 0

while loss > threshold:
    loss = loss * 0.7    # 매 반복마다 30% 감소 (시뮬레이션)
    iteration += 1

print(f"수렴 완료! 총 {iteration}회 반복, 최종 loss = {loss:.4f}")

In [None]:
# break와 continue
# Early Stopping 시뮬레이션: 검증 손실이 연속으로 증가하면 학습 중단

val_losses = [2.1, 1.8, 1.5, 1.3, 1.4, 1.6, 1.8]
patience = 2           # 개선 없이 참을 수 있는 횟수
no_improve_count = 0
best_loss = float('inf')  # 무한대로 초기화

for epoch, val_loss in enumerate(val_losses):
    if val_loss < best_loss:
        best_loss = val_loss
        no_improve_count = 0
        print(f"Epoch {epoch+1}: val_loss={val_loss:.2f} (개선됨!)")
    else:
        no_improve_count += 1
        print(f"Epoch {epoch+1}: val_loss={val_loss:.2f} (개선 없음 {no_improve_count}/{patience})")
    
    if no_improve_count >= patience:
        print(f"\n>> Early stopping at epoch {epoch+1}!")
        break

### 연습 문제 3

1. 1부터 100까지 정수 중 **3의 배수의 합**을 `for` 루프로 계산하세요.
2. 리스트 `temperatures = [22, 35, 18, 40, 25, 38, 15]`에서 **30도 이상인 값만** 출력하세요.
3. (도전) 구구단 5단을 `for` 루프로 출력하세요. 형식: `5 x 1 = 5`

In [None]:
# 연습 문제 3 풀이 공간



---
# 4. 함수 (Functions)

함수는 반복되는 코드를 **재사용 가능한 블록**으로 묶은 것입니다.

> **왜 중요한가?** ML/DL 코드는 함수 중심으로 구성됩니다.
> - 데이터 전처리 함수, 모델 학습 함수, 평가 함수 등
> - scikit-learn의 `.fit()`, `.predict()`, `.transform()` 모두 함수(메서드)입니다.

In [None]:
# 함수 정의와 호출
def calculate_stress(force, area):
    """응력을 계산하는 함수
    
    Parameters:
        force: 힘 (N)
        area: 면적 (m^2)
    Returns:
        stress: 응력 (Pa)
    """
    stress = force / area
    return stress

# 함수 호출
result = calculate_stress(1000, 0.01)
print(f"응력: {result} Pa")
print(f"응력: {result/1e6} MPa")

In [None]:
# 기본 매개변수 (default parameters) - ML 모델 설정에서 필수!
# 참고: sklearn의 SVC(kernel='rbf', C=1.0), MLPClassifier(hidden_layer_sizes=(100,))

def create_model_config(n_layers=3, learning_rate=0.001, optimizer='Adam'):
    """모델 설정을 딕셔너리로 반환"""
    config = {
        'n_layers': n_layers,
        'learning_rate': learning_rate,
        'optimizer': optimizer
    }
    return config

# 기본값 사용
config1 = create_model_config()
print("기본 설정:", config1)

# 일부 값만 변경
config2 = create_model_config(n_layers=5, learning_rate=0.01)
print("수정 설정:", config2)

In [None]:
# 여러 값 반환 - ML 평가 함수에서 자주 사용
def evaluate_model(y_true, y_pred):
    """모델 평가: 정확도와 오차 개수를 반환"""
    correct = sum(1 for t, p in zip(y_true, y_pred) if t == p)
    total = len(y_true)
    accuracy = correct / total
    errors = total - correct
    return accuracy, errors    # 튜플로 반환

y_true = [0, 1, 2, 1, 0, 2, 1, 0]
y_pred = [0, 1, 2, 1, 0, 1, 1, 0]  # 6번째가 다름

acc, err = evaluate_model(y_true, y_pred)
print(f"정확도: {acc:.2%}, 오류 수: {err}")

### 4.1 `*args`와 `**kwargs`

함수를 정의할 때, 인자의 개수를 미리 정하지 않고 **유연하게** 받을 수 있습니다.

- `*args`는 여러 개의 위치 인자를 **튜플**로 받습니다.
- `**kwargs`는 여러 개의 키워드 인자를 **딕셔너리**로 받습니다.

> **왜 중요한가?** ML 코드에서 다양한 수의 인자를 처리하는 함수가 많습니다:
> ```python
> # 임의 개수의 데이터에 대한 통계 계산
> calculate_mean(1, 2, 3)          # *args → (1, 2, 3)
> calculate_mean(10, 20, 30, 40)   # *args → (10, 20, 30, 40)
>
> # 다양한 하이퍼파라미터를 유연하게 전달
> train_model(lr=0.001, epochs=100, batch_size=32)  # **kwargs
> ```
>
> 또한, 6장에서 배울 **클래스 상속**에서도 핵심적으로 사용됩니다.

In [None]:
# *args - 여러 개의 인자를 받는 함수
def calculate_mean(*args):
    """임의 개수의 숫자에 대한 평균 계산"""
    print(f"받은 인자: {args} (타입: {type(args).__name__})")
    return sum(args) / len(args)

print("평균:", calculate_mean(1, 2, 3))
print("평균:", calculate_mean(10, 20, 30, 40, 50))

In [None]:
# **kwargs - 키워드 인자를 딕셔너리로 받음
def print_model_info(**kwargs):
    """모델 정보를 키-값 형태로 출력"""
    print(f"받은 인자: {kwargs} (타입: {type(kwargs).__name__})")
    for key, value in kwargs.items():
        print(f"  {key}: {value}")

print_model_info(name="SVM", accuracy=0.93, dataset="Iris")
print()
print_model_info(model="Random Forest", n_estimators=100, max_depth=5)

In [None]:
# *args와 **kwargs를 함께 사용
def flexible_function(required_arg, *args, **kwargs):
    print(f"필수 인자: {required_arg}")
    print(f"추가 위치 인자: {args}")
    print(f"추가 키워드 인자: {kwargs}")

flexible_function("hello", 1, 2, 3, name="test", value=42)

### 연습 문제 4

1. 두 점 `(x1, y1)`과 `(x2, y2)` 사이의 유클리드 거리를 계산하는 함수 `distance(x1, y1, x2, y2)`를 작성하세요.  
   (힌트: `((x2-x1)**2 + (y2-y1)**2) ** 0.5`)
2. 임의 개수의 숫자를 받아 **최대값과 최소값을 동시에 반환**하는 함수를 작성하세요. (`*args` 사용)

In [None]:
# 연습 문제 4 풀이 공간



---
# 5. 문자열 포매팅 (String Formatting)

학습 진행 상황을 출력할 때 문자열 포매팅이 필수입니다.

```python
# 앞으로 자주 볼 코드:
print(f'Epoch [{epoch+1}/{n_epochs}], Loss: {loss.item():.4f}')
print('iter= {},\t t0: {:3f}'.format(t, self.t0.item()))
```

In [None]:
# f-string (권장 방법, Python 3.6+)
epoch = 5
total_epochs = 100
loss = 0.123456789
accuracy = 0.9567

print(f"Epoch [{epoch}/{total_epochs}]")
print(f"Loss: {loss:.4f}")             # 소수점 4자리
print(f"Accuracy: {accuracy:.2%}")      # 퍼센트로 표시 (자동 x100)
print(f"Accuracy: {accuracy*100:.2f}%") # 수동 퍼센트

# 정렬과 패딩
print()
for i in range(1, 4):
    neurons = 128 * (2 ** (3 - i))
    print(f"Layer {i}: {neurons:5d} neurons")

In [None]:
# .format() 방법 - 기존 코드에서 많이 볼 수 있음
print('iter= {},\t t0: {:.3f},\t t1: {:.3f}'.format(10, 0.115726, 0.305614))

# 학습 로그 출력 패턴
template = "Epoch [{}/{}], Loss: {:.4f}, Accuracy: {:.2f}%"
print(template.format(5, 100, 0.3456, 95.67))

In [None]:
# 실용적인 문자열 메서드 - 파일 경로, 데이터 처리에 사용
filename = "model_v2_final.h5"
print("split('_') :", filename.split("_"))         # ['model', 'v2', 'final.h5']
print("endswith   :", filename.endswith(".h5"))     # True
print("replace    :", filename.replace(".h5", ".pt")) # 확장자 변경

# 문자열 결합 - join()
layers = [784, 128, 64, 10]
architecture = " -> ".join([str(l) for l in layers])
print(f"\n신경망 구조: {architecture}")

---
# 6. 클래스와 객체지향 프로그래밍 (Classes & OOP)

클래스는 **데이터(속성)**와 **기능(메서드)**을 하나로 묶은 설계도입니다.

> **왜 중요한가?** ML/DL의 거의 모든 코드가 클래스로 작성됩니다:
> - scikit-learn: `SVC()`, `RandomForestClassifier()`, `MLPClassifier()`
> - PyTorch: `nn.Module`을 상속하여 모델 정의
> - 모든 모델이 `.fit()`, `.predict()` 메서드를 가짐
>
> 이 섹션은 처음에는 어렵게 느껴질 수 있지만,  
> 이후 **모든 실습에서 반복적으로 사용**하므로 천천히 이해해 주세요.

In [None]:
# 가장 간단한 클래스 정의
class Sensor:
    """온도 센서 클래스"""
    
    def __init__(self, name, unit="C"):
        """생성자: 객체가 만들어질 때 자동 호출"""
        self.name = name           # 속성(attribute)
        self.unit = unit
        self.readings = []         # 측정값 저장 리스트
    
    def measure(self, value):
        """측정값을 기록"""
        self.readings.append(value)
    
    def get_average(self):
        """평균 측정값 반환"""
        if len(self.readings) == 0:
            return 0
        return sum(self.readings) / len(self.readings)
    
    def info(self):
        """센서 정보 출력"""
        print(f"센서명: {self.name}, 단위: {self.unit}, 측정 횟수: {len(self.readings)}")

# 클래스로 객체(인스턴스) 생성
sensor1 = Sensor("ThermoSensor_A")
sensor1.measure(22.5)
sensor1.measure(23.1)
sensor1.measure(22.8)
sensor1.info()
print(f"평균 온도: {sensor1.get_average():.1f} C")

### 6.1 ML 스타일 클래스: fit / predict 패턴

scikit-learn의 모든 모델은 동일한 인터페이스를 따릅니다:
1. `model = ModelClass(하이퍼파라미터)` — 모델 생성
2. `model.fit(X_train, y_train)` — 학습
3. `model.predict(X_test)` — 예측

이 패턴을 직접 구현해 봅시다.

In [None]:
# sklearn 스타일의 단순 분류기 클래스
class SimpleThresholdClassifier:
    """임계값 기반 단순 분류기
    특성값이 threshold보다 크면 1, 작으면 0으로 분류
    """
    
    def __init__(self, threshold=0.5):
        self.threshold = threshold
        self.is_fitted = False
    
    def fit(self, X, y):
        """학습 (데이터의 평균을 임계값으로 설정)"""
        self.threshold = sum(X) / len(X)
        self.is_fitted = True
        print(f"학습 완료! 임계값: {self.threshold:.2f}")
        return self  # sklearn 관례: fit은 self를 반환
    
    def predict(self, X):
        """예측"""
        predictions = []
        for x in X:
            if x > self.threshold:
                predictions.append(1)
            else:
                predictions.append(0)
        return predictions

# 사용 예시 (sklearn과 동일한 패턴!)
X_train = [1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0]
y_train = [0, 0, 0, 0, 1, 1, 1, 1]

clf = SimpleThresholdClassifier()
clf.fit(X_train, y_train)

X_test = [2.5, 5.5, 4.0, 7.5]
predictions = clf.predict(X_test)
print(f"입력: {X_test}")
print(f"예측: {predictions}")

### 6.2 상속 (Inheritance)

상속은 기존 클래스의 기능을 물려받아 **새로운 클래스를 만드는 것**입니다.

> **왜 중요한가?** PyTorch 모델은 반드시 `nn.Module`을 상속해야 합니다:
> ```python
> class SimpleNN(nn.Module):
>     def __init__(self):
>         super().__init__()
>         self.fc1 = nn.Linear(784, 128)
>         ...
> ```

In [None]:
# 상속 기초
class Animal:
    def __init__(self, name):
        self.name = name
        self.default_age = 10
        print(f"Animal '{self.name}' created.")
    
    def speak(self):
        return "Some sound"
    
    def intro(self):
        print(f"I'm {self.name}, age={self.default_age}.")

# Dog은 Animal의 모든 것을 물려받음
class Dog(Animal):
    def speak(self):        # 메서드 오버라이딩 (재정의)
        return "Bark!"

print("=== Animal ===")
a1 = Animal("Buddy")
print(f"speak: {a1.speak()}")

print("\n=== Dog (Animal 상속) ===")
a2 = Dog("Rex")             # __init__은 부모의 것을 사용
print(f"speak: {a2.speak()}")  # speak()은 재정의된 것을 사용
a2.intro()                    # intro()는 부모의 것을 사용

#### `super().__init__()`과 `*args`, `**kwargs`

자식 클래스에서 부모의 `__init__`을 호출할 때, 4장에서 배운 `*args`/`**kwargs`가 유용합니다.  
부모가 어떤 인자를 받든 **그대로 전달**할 수 있기 때문입니다.

```python
# 부모의 인자를 모르거나, 나중에 바뀌어도 안전하게 전달
class Dog(Animal):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)  # 부모에게 그대로 전달!
        self.tricks = []                    # 자식만의 새 속성 추가
```

> 이 패턴은 **PyTorch 모델 정의에서 반드시** 사용됩니다:  
> `super().__init__()` 없이는 `nn.Module`의 기능을 사용할 수 없습니다.

In [None]:
# super().__init__() 사용 - 부모 생성자 호출 후 속성 변경/추가
# 이 패턴은 PyTorch 모델 정의에서 반드시 사용됩니다!

class Dog2(Animal):
    def __init__(self, *args, **kwargs):       # 4장에서 배운 *args, **kwargs!
        super().__init__(*args, **kwargs)       # 부모의 __init__ 호출
        self.default_age = 5                    # 부모에서 설정된 속성을 변경
        self.tricks = ['sit', 'shake']          # 자식만의 새 속성 추가
    
    def speak(self):
        return "Bark!"

print("=== Dog2 (super().__init__ + *args/**kwargs 사용) ===")
a3 = Dog2("Max")
a3.intro()           # default_age가 10 → 5로 변경됨!
print(f"tricks: {a3.tricks}")  # 자식만의 새 속성

In [None]:
# PyTorch nn.Module 스타일 미리보기
class BaseModel:
    """부모 클래스: 기본 모델 프레임워크"""
    def __init__(self):
        self.layers = []
        self.trained = False
    
    def forward(self, x):
        raise NotImplementedError("하위 클래스에서 구현해야 합니다!")
    
    def summary(self):
        print(f"모델 레이어: {self.layers}")
        print(f"학습 여부: {self.trained}")

class MySimpleModel(BaseModel):
    """자식 클래스: 구체적인 모델 구현"""
    def __init__(self, input_size, hidden_size, output_size):
        super().__init__()  # 부모의 __init__ 호출
        self.layers = [input_size, hidden_size, output_size]
    
    def forward(self, x):
        print(f"입력 -> 레이어 {self.layers} 통과 -> 출력")
        return x

model = MySimpleModel(784, 128, 10)
model.summary()
model.forward([1.0, 2.0, 3.0])

### 연습 문제 5

1. `Vehicle` 클래스를 만드세요. (속성: `name`, `max_speed`). `info()` 메서드로 이름과 최고속도를 출력합니다.
2. `Vehicle`을 상속받는 `ElectricCar` 클래스를 만드세요. 추가 속성 `battery_capacity`를 가지고, `info()` 메서드를 재정의하여 배터리 용량도 함께 출력하세요.

In [None]:
# 연습 문제 5 풀이 공간



---
# 7. 리스트 컴프리헨션과 람다 함수

Python의 강력한 단축 문법으로, ML 코드에서 데이터 변환에 자주 사용됩니다.

```python
# 앞으로 자주 볼 코드:
yr_mean = [df.loc[df["year"]==y, "value"].mean() for y in years]
y_pred_df.apply(lambda x: accuracy_score(y_test, x))
```

In [None]:
# 일반 for 루프 vs 리스트 컴프리헨션

# 방법 1: 일반 for 루프
squares_loop = []
for i in range(10):
    squares_loop.append(i ** 2)
print("for 루프  :", squares_loop)

# 방법 2: 리스트 컴프리헨션 (같은 결과를 한 줄로!)
squares_comp = [i ** 2 for i in range(10)]
print("컴프리헨션:", squares_comp)

In [None]:
# 조건부 리스트 컴프리헨션
numbers = [1, -2, 3, -4, 5, -6, 7, -8, 9, -10]

# 양수만 필터링
positives = [x for x in numbers if x > 0]
print("양수만:", positives)

# 조건에 따라 변환 (음수는 절대값으로)
absolute = [x if x > 0 else -x for x in numbers]
print("절대값:", absolute)

# ML 패턴: 예측값과 실제값 비교하여 정확도 계산
y_true = [0, 1, 1, 0, 1, 0]
y_pred = [0, 1, 0, 0, 1, 1]
correct = [1 if t == p else 0 for t, p in zip(y_true, y_pred)]
accuracy = sum(correct) / len(correct)
print(f"\n맞은 것: {correct}")
print(f"정확도: {accuracy:.2%}")

### 7.1 람다(Lambda) 함수

`lambda`는 이름 없는 한 줄짜리 함수입니다.  
`sorted()`, `map()`, `filter()`와 함께 데이터 변환에 주로 사용합니다.

```python
# 앞으로 자주 볼 코드:
y_pred_df.apply(lambda x: accuracy_score(y_test, x))
sorted(results, key=lambda x: x['accuracy'], reverse=True)
```

In [None]:
# 일반 함수 vs 람다 함수
def square(x):
    return x ** 2

square_lambda = lambda x: x ** 2   # 동일한 기능

print("일반 함수:", square(5))
print("람다 함수:", square_lambda(5))

# 람다의 주요 활용: sorted()의 정렬 기준으로 사용
print()
data = [{'name': 'SVM', 'acc': 0.87},
        {'name': 'RF', 'acc': 0.93},
        {'name': 'KNN', 'acc': 0.91}]

# 정확도 기준 내림차순 정렬
sorted_data = sorted(data, key=lambda x: x['acc'], reverse=True)
for d in sorted_data:
    print(f"  {d['name']}: {d['acc']:.2%}")

In [None]:
# map() - 모든 원소에 함수 적용
pixel_values = [128, 64, 255, 0, 192]
normalized = list(map(lambda x: x / 255.0, pixel_values))
print("정규화:", [f"{v:.2f}" for v in normalized])

# filter() - 조건에 맞는 원소만 선택
accuracies = [0.65, 0.78, 0.92, 0.55, 0.88, 0.95]
good_models = list(filter(lambda x: x >= 0.80, accuracies))
print("좋은 모델 (>=80%):", good_models)

---
# 8. NumPy 기초

**NumPy**는 Python에서 수치 계산을 위한 핵심 라이브러리입니다.  
ML/DL의 모든 데이터는 NumPy 배열 또는 이와 호환되는 텐서(Tensor)로 처리됩니다.

> **왜 중요한가?**
> - 이미지 데이터: `(60000, 28, 28)` 형태의 NumPy 배열
> - 특성 데이터: `(150, 4)` 형태의 2차원 배열
> - 모든 ML 라이브러리(sklearn, tensorflow, pytorch)가 NumPy를 기반으로 합니다
>
> ```python
> # 앞으로 자주 볼 코드:
> import numpy as np
> x_train = x_train.reshape(60000, 28, 28, 1)
> x_train = x_train.astype(np.float32) / 255.0
> ```

In [None]:
import numpy as np

# 배열 생성
a = np.array([1, 2, 3, 4, 5])
print(f"1차원 배열: {a}")
print(f"  shape: {a.shape}, dtype: {a.dtype}")

b = np.array([[1, 2, 3],
              [4, 5, 6]])
print(f"\n2차원 배열:\n{b}")
print(f"  shape: {b.shape}")

# 특수 배열 생성
print(f"\nnp.zeros((2, 3)):\n{np.zeros((2, 3))}")
print(f"\nnp.ones((2, 3)):\n{np.ones((2, 3))}")
print(f"\nnp.arange(0, 10, 2): {np.arange(0, 10, 2)}")
print(f"np.linspace(0, 1, 5): {np.linspace(0, 1, 5)}")

### 8.1 reshape — ML/DL에서 가장 중요한 연산 중 하나!

```python
# 앞으로 자주 볼 코드:
x_train = x_train.reshape(60000, 28, 28, 1)   # CNN 입력
x_train = x_train.reshape(-1, 784)              # FC 입력
X = X.reshape(-1, 1)                            # 열 벡터
```

In [None]:
# reshape 실습
data_1d = np.arange(12)
print(f"원본: {data_1d}, shape: {data_1d.shape}")

# 1차원 -> 2차원 (3행 4열)
data_2d = data_1d.reshape(3, 4)
print(f"\nreshape(3, 4):\n{data_2d}")
print(f"shape: {data_2d.shape}")

# -1은 '자동 계산' (매우 자주 사용!)
data_col = data_1d.reshape(-1, 1)   # 열 벡터
print(f"\nreshape(-1, 1): shape={data_col.shape}")

# 이미지 데이터 reshape 예시
image = np.random.randint(0, 256, (28, 28))  # 28x28 이미지
print(f"\n원본 이미지: shape={image.shape}")
print(f"CNN 입력:    shape={image.reshape(28, 28, 1).shape}")  # 채널 추가
print(f"FC 입력:     shape={image.reshape(-1).shape}")          # 1차원으로 펴기

In [None]:
# 배열 인덱싱과 슬라이싱
data = np.array([[1, 2, 3, 4],
                 [5, 6, 7, 8],
                 [9, 10, 11, 12]])

print("전체:\n", data)
print("\n(0,0) 원소:", data[0, 0])
print("첫 번째 행:", data[0, :])        # 또는 data[0]
print("첫 번째 열:", data[:, 0])
print("부분 행렬:\n", data[0:2, 1:3])

In [None]:
# Boolean 인덱싱 - ML에서 데이터 필터링에 필수!
# 참고: X_train_01 = X_train[(y_train == 0) | (y_train == 1)]

labels = np.array([0, 1, 2, 0, 1, 2, 0, 1, 2])
scores = np.array([0.8, 0.9, 0.7, 0.85, 0.95, 0.6, 0.75, 0.88, 0.72])

# 레이블이 1인 데이터만 선택
mask = labels == 1
print(f"마스크: {mask}")
print(f"레이블 1의 점수: {scores[mask]}")

# 점수가 0.8 이상인 데이터
high_scores = scores[scores >= 0.8]
print(f"\n0.8 이상 점수: {high_scores}")

In [None]:
# 벡터 연산 - 반복문 없이 배열 전체에 연산 적용 (빠르다!)
a = np.array([1, 2, 3, 4, 5])
b = np.array([10, 20, 30, 40, 50])

print("a + b  =", a + b)         # 원소별 덧셈
print("a * b  =", a * b)         # 원소별 곱셈
print("a * 2  =", a * 2)         # 스칼라 곱셈 (broadcasting)
print("a ** 2 =", a ** 2)        # 원소별 제곱

# 이미지 정규화 (벡터 연산) - 모든 DL 코드의 필수 전처리!
image = np.array([128, 64, 255, 0, 192], dtype=np.uint8)
print(f"\n원본 픽셀: {image} (dtype: {image.dtype})")
normalized = image.astype(np.float32) / 255.0
print(f"정규화:    {normalized} (dtype: {normalized.dtype})")

In [None]:
# 통계 함수 - 데이터 분석 및 모델 평가에 사용
np.random.seed(42)  # 재현성을 위한 시드 고정
data = np.random.randn(100)  # 100개의 표준 정규분포 난수

print(f"평균:     {np.mean(data):.4f}")
print(f"표준편차: {np.std(data):.4f}")
print(f"최소값:   {np.min(data):.4f}")
print(f"최대값:   {np.max(data):.4f}")

# 2차원 배열의 축(axis)별 연산
matrix = np.array([[1, 2, 3],
                   [4, 5, 6]])
print(f"\n행렬:\n{matrix}")
print(f"전체 평균:          {matrix.mean():.1f}")
print(f"행별 평균 (axis=1): {matrix.mean(axis=1)}")   # 각 행의 평균
print(f"열별 평균 (axis=0): {matrix.mean(axis=0)}")   # 각 열의 평균

In [None]:
# vstack, hstack - 데이터 결합 (ML에서 자주 사용)
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])

print("vstack (수직 결합):")
print(np.vstack((a, b)))

print("\nhstack (수평 결합):")
print(np.hstack((a, b)))

# ML 패턴: 훈련/테스트 데이터 결합
X_train = np.array([[1, 2], [3, 4], [5, 6]])
X_test = np.array([[7, 8], [9, 10]])
X_combined = np.vstack((X_train, X_test))
print(f"\nX_train: {X_train.shape} + X_test: {X_test.shape} = X_combined: {X_combined.shape}")

In [None]:
# 행렬 연산 - 신경망의 핵심 연산!
# y = Wx + b (선형 변환)

W = np.array([[0.1, 0.2],
              [0.3, 0.4],
              [0.5, 0.6]])     # 가중치 행렬 (3x2)
x = np.array([1.0, 2.0])       # 입력 벡터 (2,)
b = np.array([0.1, 0.2, 0.3])  # 편향 벡터 (3,)

# 행렬-벡터 곱 + 편향
y = np.dot(W, x) + b           # (3x2) @ (2,) + (3,) = (3,)
print(f"W shape: {W.shape}")
print(f"x shape: {x.shape}")
print(f"b shape: {b.shape}")
print(f"y = Wx + b = {y}")

### 연습 문제 6

1. `np.random.randn(5, 3)`으로 5x3 행렬을 생성하고, **(a)** 전체 평균, **(b)** 각 열의 평균, **(c)** 각 행의 최대값을 구하세요.
2. 길이 10인 랜덤 배열을 만들고, **0보다 큰 값만** 선택하여 출력하세요 (Boolean 인덱싱).
3. (도전) 두 벡터 `a = [1, 2, 3]`, `b = [4, 5, 6]`의 내적(dot product)을 `np.dot()`으로 구하고, 수동 계산(`1*4 + 2*5 + 3*6`)과 비교하세요.

In [None]:
# 연습 문제 6 풀이 공간
import numpy as np



---
# 9. Matplotlib 기초 시각화

데이터 시각화는 ML 워크플로우의 핵심입니다:
- **학습 곡선** (loss / accuracy vs epoch) 그리기
- **데이터 분포** 확인
- **예측 결과** 시각화

```python
# 앞으로 자주 볼 코드:
import matplotlib.pyplot as plt
plt.plot(hist.history['accuracy'])
plt.subplot(1, 2, 1)
plt.imshow(x_test[0], cmap='gray')
```

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# 학습 곡선 시뮬레이션
epochs = list(range(1, 11))
train_loss = [2.3, 1.8, 1.4, 1.0, 0.7, 0.5, 0.35, 0.25, 0.18, 0.12]
val_loss   = [2.5, 2.0, 1.6, 1.3, 1.0, 0.8, 0.7, 0.65, 0.63, 0.62]

plt.figure(figsize=(8, 5))
plt.plot(epochs, train_loss, 'b-o', label='Train Loss')
plt.plot(epochs, val_loss, 'r--s', label='Validation Loss')
plt.title('Model Loss', fontsize=14)
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

In [None]:
# subplot - 여러 그래프를 한 figure에 배치
train_acc = [0.65, 0.78, 0.85, 0.91, 0.94, 0.96, 0.97, 0.98, 0.985, 0.99]
val_acc   = [0.60, 0.72, 0.80, 0.86, 0.88, 0.89, 0.895, 0.90, 0.90, 0.90]

plt.figure(figsize=(12, 4))

# 왼쪽: 손실 그래프
plt.subplot(1, 2, 1)
plt.plot(epochs, train_loss, 'b-')
plt.plot(epochs, val_loss, 'r--')
plt.title('Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend(['Train', 'Validation'])
plt.grid(True, alpha=0.3)

# 오른쪽: 정확도 그래프
plt.subplot(1, 2, 2)
plt.plot(epochs, train_acc, 'b-')
plt.plot(epochs, val_acc, 'r--')
plt.title('Accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.legend(['Train', 'Validation'])
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

In [None]:
# 산점도 - 2차원 분류 데이터 시각화
np.random.seed(42)

# 3개 클래스의 2차원 데이터 생성 (붓꽃 데이터 시뮬레이션)
class0_x, class0_y = np.random.randn(30) + 1, np.random.randn(30) + 1
class1_x, class1_y = np.random.randn(30) + 4, np.random.randn(30) + 4
class2_x, class2_y = np.random.randn(30) + 7, np.random.randn(30) + 1

plt.figure(figsize=(8, 6))
plt.scatter(class0_x, class0_y, c='red', marker='o', label='Class 0', alpha=0.7)
plt.scatter(class1_x, class1_y, c='blue', marker='s', label='Class 1', alpha=0.7)
plt.scatter(class2_x, class2_y, c='green', marker='^', label='Class 2', alpha=0.7)
plt.title('2D Classification Data', fontsize=14)
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

In [None]:
# 히스토그램 + 막대 그래프
plt.figure(figsize=(12, 4))

# 히스토그램: 데이터 분포 확인
plt.subplot(1, 2, 1)
data = np.random.randn(1000)
plt.hist(data, bins=30, edgecolor='black', alpha=0.7, color='skyblue')
plt.title('Normal Distribution')
plt.xlabel('Value')
plt.ylabel('Frequency')

# 막대 그래프: 모델 성능 비교
plt.subplot(1, 2, 2)
models = ['LR', 'KNN', 'SVM', 'DT', 'RF']
accuracies = [0.93, 0.93, 0.87, 0.90, 0.87]
colors = ['#4ECDC4', '#FF6B6B', '#45B7D1', '#FFA07A', '#98D8C8']
plt.bar(models, accuracies, color=colors, edgecolor='black')
plt.title('Model Comparison')
plt.ylabel('Accuracy')
plt.ylim(0.8, 1.0)

plt.tight_layout()
plt.show()

In [None]:
# imshow - 이미지 표시 (DL에서 입력 데이터 확인에 필수)
np.random.seed(0)
fake_image = np.random.randint(0, 256, (28, 28))

plt.figure(figsize=(10, 3))

plt.subplot(1, 3, 1)
plt.imshow(fake_image, cmap='gray')
plt.title('Grayscale')
plt.colorbar(shrink=0.8)

plt.subplot(1, 3, 2)
plt.imshow(fake_image, cmap='hot')
plt.title('Hot')
plt.colorbar(shrink=0.8)

plt.subplot(1, 3, 3)
plt.imshow(fake_image, cmap='viridis')
plt.title('Viridis')
plt.colorbar(shrink=0.8)

plt.tight_layout()
plt.show()

### 연습 문제 7

1. `y = sin(x)` 그래프를 그리세요. (`np.linspace(0, 2*np.pi, 100)`으로 x를 만들고, `np.sin(x)`로 y를 구합니다.)
2. 위 그래프에 `y = cos(x)`를 함께 그리고, 범례(legend)와 제목을 추가하세요.
3. (도전) `subplot`을 사용하여 sin과 cos 그래프를 나란히 표시하세요.

In [None]:
# 연습 문제 7 풀이 공간
import matplotlib.pyplot as plt
import numpy as np



---
# 10. 종합 정리

### 10.1 import 패턴 정리

이후 실습에서 매번 사용하게 될 import 패턴을 정리합니다.

In [None]:
# (1) 전체 모듈 import (as: 별칭 지정)
import numpy as np
import matplotlib.pyplot as plt

# (2) 모듈에서 특정 함수/클래스만 import
from collections import Counter
# from sklearn.model_selection import train_test_split   # 나중에 사용
# from sklearn.metrics import accuracy_score             # 나중에 사용

# 확인
print(f"NumPy version: {np.__version__}")
print("import 성공!")

### 10.2 이 수업에서 사용할 주요 라이브러리 요약

| 라이브러리 | import 패턴 | 용도 |
|-----------|-------------|------|
| NumPy | `import numpy as np` | 수치 계산, 배열 연산 |
| Matplotlib | `import matplotlib.pyplot as plt` | 데이터 시각화 |
| Pandas | `import pandas as pd` | 데이터 테이블 처리 |
| scikit-learn | `from sklearn.xxx import YYY` | 전통 ML 모델 |
| PyTorch | `import torch; import torch.nn as nn` | 딥러닝 모델 |

---
# 종합 연습 문제

### 종합 문제 1: 온도 데이터 분석기 클래스

아래 요구사항에 맞는 `TemperatureAnalyzer` 클래스를 작성하세요.

**요구사항:**
- `__init__(self, location)`: 측정 장소 이름과 빈 데이터 리스트 초기화
- `add_data(self, *temperatures)`: 여러 온도 데이터를 한 번에 추가 (`*args` 사용)
- `get_stats(self)`: 평균, 최고, 최저 온도를 딕셔너리로 반환
- `get_above(self, threshold)`: threshold 이상의 온도만 리스트로 반환 (리스트 컴프리헨션 사용)
- `plot(self)`: matplotlib으로 온도 변화 그래프를 그림

**테스트 코드:**
```python
analyzer = TemperatureAnalyzer("실험실 A")
analyzer.add_data(22.1, 23.5, 24.0, 22.8, 25.1, 23.2, 24.5)
print(analyzer.get_stats())
print(f"24도 이상: {analyzer.get_above(24.0)}")
analyzer.plot()
```

In [None]:
# 종합 문제 1 풀이 공간
import matplotlib.pyplot as plt

class TemperatureAnalyzer:
    pass  # 여기에 구현하세요


# 테스트
# analyzer = TemperatureAnalyzer("실험실 A")
# analyzer.add_data(22.1, 23.5, 24.0, 22.8, 25.1, 23.2, 24.5)
# print(analyzer.get_stats())
# print(f"24도 이상: {analyzer.get_above(24.0)}")
# analyzer.plot()

### 종합 문제 2: NumPy를 활용한 간단한 뉴런

하나의 뉴런(퍼셉트론)의 동작을 구현하세요.

**뉴런의 동작:**
1. 입력: `x = [x1, x2, x3]` (NumPy 배열)
2. 가중치: `w = [w1, w2, w3]` (NumPy 배열)
3. 편향: `b` (스칼라)
4. 출력: `y = 1 if (w · x + b) > 0 else 0`

**요구사항:**
- `np.dot()`으로 내적 계산
- 여러 입력 샘플에 대해 `for` 루프로 예측 수행
- 결과를 `f-string`으로 출력

In [None]:
# 종합 문제 2 풀이 공간
import numpy as np

# 가중치와 편향
w = np.array([0.5, -0.3, 0.8])
b = -0.1

# 테스트 입력 (3개 샘플)
X = np.array([
    [1.0, 0.5, 0.8],
    [0.2, 0.9, 0.1],
    [0.7, 0.3, 0.9]
])

# 여기에 구현하세요
# 각 샘플에 대해 z = w · x + b 를 계산하고
# z > 0 이면 1, 아니면 0을 출력하세요


### 종합 문제 3: 경사하강법 시뮬레이터

간단한 경사하강법(Gradient Descent)으로 `y = 3x + 2` 직선의 기울기와 절편을 찾으세요.

**단계:**
1. 데이터 생성: `x = np.linspace(0, 10, 50)`, `y = 3*x + 2 + noise`
2. 초기값: `w = 0.0`, `b = 0.0`
3. 100번 반복하면서 `w`와 `b`를 업데이트
4. `subplot`으로 (1) 데이터와 최종 직선, (2) 손실값 변화를 나란히 표시

**힌트:**
```python
y_pred = w * x + b
loss = np.mean((y - y_pred) ** 2)
dw = -2 * np.mean(x * (y - y_pred))
db = -2 * np.mean(y - y_pred)
w = w - lr * dw
b = b - lr * db
```

In [None]:
# 종합 문제 3 풀이 공간
import numpy as np
import matplotlib.pyplot as plt

# 여기에 구현하세요


---
## 수고하셨습니다!

**핵심 요약:**

| 주제 | 핵심 키워드 |
|------|----------|
| 변수/자료형 | `int`, `float`, `str`, `bool`, `type()` |
| 자료구조 | `list[ ]`, `tuple( )`, `dict{ }` |
| 제어문 | `if/elif/else`, `for`, `while`, `enumerate`, `zip` |
| 함수 | `def`, `return`, `*args`, `**kwargs` |
| 클래스 | `class`, `__init__`, `self`, 상속, `super()` |
| 축약 문법 | 리스트 컴프리헨션, `lambda` |
| NumPy | `np.array`, `reshape`, 인덱싱, 벡터 연산 |
| Matplotlib | `plt.plot`, `plt.subplot`, `plt.scatter`, `plt.imshow` |

