### 파이썬 클래스 기반 머신러닝 실습 과제 시리즈
-  머신러닝/딥러닝을 위한 파이썬 클래스 기반 실습 과제 시리즈로, 초급부터 고급까지 단계적으로 연결되며 반복 확장되도록 구성
- 각 단계는 이전 과제의 개념을 기반으로 발전하고, 점점 더 실제 ML 구조와 유사해지는 방향으로 설계

🔄 실습 흐름도

[Student/Score] → [Dataset] → [BaseModel 서브클래스] → [Evaluator]  
→ [Preprocessor] → [Pipeline] → [MLExperiment]

 [Step 1] 초급: 객체지향 기초 훈련 – 학생 데이터 모델링
 🎯 과제 목표:
클래스 정의, 생성자 작성

메서드 호출 활용

📝 과제 요구:
Student 클래스를 정의하라

속성: 이름, 나이, 점수

메서드:

average() → 평균 점수 반환

show() → 평균 점수 출력

__str__() 메서드를 오버라이딩하라

여러 명의 학생 객체를 리스트에 저장하고 반복 출력하라

🎯 확장 아이디어: 과락 기준(평균 60 미만)을 기준으로 is_passed() 메서드를 추가 구현하라

In [None]:
class Student:
    def __init__(self, name, age, scores):


    def average(self):


    def show(self):
    

    def is_passed(self):


    def __str__(self):



In [None]:
if __name__ == "__main__":
    students = [
        Student("홍길동", 18, [80, 75, 90]),
        Student("김유신", 17, [55, 60, 58]),
        Student("유관순", 18, [95, 88, 92]),
        Student("강감찬", 19, [40, 50, 45])
    ]

    for s in students:
        print(s)
        s.show()
        print()


출력 예시::

홍길동 (나이: 18) - 평균: 81.7점, 결과: 합격
홍길동의 평균 점수는 81.7점입니다.

김유신 (나이: 17) - 평균: 57.7점, 결과: 불합격
김유신의 평균 점수는 57.7점입니다.

유관순 (나이: 18) - 평균: 91.7점, 결과: 합격
유관순의 평균 점수는 91.7점입니다.

강감찬 (나이: 19) - 평균: 45.0점, 결과: 불합격
강감찬의 평균 점수는 45.0점입니다.


🟨 [Step 2] 중급: 데이터셋 클래스 설계 – 샘플 수집 및 분석
🎯 과제 목표:
클래스 멤버로 리스트 저장 및 관리

조건 분기와 통계 구현

📝 과제 요구:
Dataset 클래스를 정의하라

속성: (입력, 레이블) 튜플들의 리스트

메서드:

add(x, y) → 샘플 추가

summary() → 전체 개수 및 클래스별 샘플 수 출력

split(ratio=0.8) → 학습/테스트 데이터 분할 (셔플 포함)

🎯 확장 아이디어: 레이블이 숫자인 경우 평균 및 분산도 요약 출력하라

In [None]:
import random
import statistics

class Dataset:
    def __init__(self):
       # (x, y) 튜플 저장

    def add(self, x, y):
       

    def summary(self):
        print(f"총 샘플 수: {len(self.data)}개")

        label_count = {}
        numeric_labels = []

        for _, y in self.data:
        

        print("클래스별 샘플 분포:")
        for label, count in label_count.items():
          

        # 🎯 확장: 숫자 레이블인 경우 평균, 분산 출력
        if numeric_labels:
     

    def split(self, ratio=0.8):



In [None]:
if __name__ == "__main__":
    ds = Dataset()
    ds.add([1, 2], 0)
    ds.add([3, 4], 1)
    ds.add([5, 6], 1)
    ds.add([7, 8], 0)
    ds.add([9, 10], 1)
    ds.add([11, 12], 2)

    ds.summary()

    train, test = ds.split(ratio=0.67)
    print("\n[학습 데이터]")
    for x, y in train:
        print(f"X: {x}, y: {y}")

    print("\n[테스트 데이터]")
    for x, y in test:
        print(f"X: {x}, y: {y}")


출력예시::

총 샘플 수: 6개
클래스별 샘플 분포:
 - 0: 2개
 - 1: 3개
 - 2: 1개
숫자 레이블 평균: 0.83
숫자 레이블 표준편차: 0.75

[학습 데이터]
X: [3, 4], y: 1
X: [7, 8], y: 0
X: [5, 6], y: 1
X: [9, 10], y: 1

[테스트 데이터]
X: [11, 12], y: 2
X: [1, 2], y: 0


🟧 [Step 3] 고급: 추상 모델 클래스 설계 및 구현 훈련
🎯 과제 목표:
추상화 개념 이해

상속 및 메서드 오버라이딩 구현

📝 과제 요구:
BaseModel 추상 클래스를 정의하라

train(X, y) 및 predict(X)는 raise NotImplementedError로 정의

ConstantModel 클래스를 상속하여 구현하라

항상 고정된 하나의 값을 예측하는 모델 (self.constant)

train()은 빈 구현

predict()는 [self.constant] * len(X) 형태로 예측

🎯 확장 아이디어: 문자열도 예측할 수 있도록 ConstantModel을 확장해보라

In [None]:
class BaseModel:
    def train(self, X, y):
        raise NotImplementedError("train() must be implemented in subclass")

    def predict(self, X):
        raise NotImplementedError("predict() must be implemented in subclass")


In [None]:
class ConstantModel(BaseModel):
    def __init__(self, constant):


    def train(self, X, y):
        pass  # 학습 불필요

    def predict(self, X):



In [None]:
if __name__ == "__main__":
    # 숫자 예측 예시
    model1 = ConstantModel(1)
    X_test = [[1], [2], [3]]
    print("숫자 예측:", model1.predict(X_test))  # [1, 1, 1]

    # 문자열 예측 예시
    model2 = ConstantModel("spam")
    print("문자열 예측:", model2.predict(X_test))  # ['spam', 'spam', 'spam']


출력예시::

숫자 예측: [1, 1, 1]
문자열 예측: ['spam', 'spam', 'spam']


🟥 [Step 4] 평가자 클래스 설계 – 모델 평가 자동화
🎯 과제 목표:
클래스 간 협업 구조 이해

정확도 측정 구현

📝 과제 요구:
AccuracyEvaluator 클래스를 정의하라

메서드: evaluate(model, X_test, y_test)

model.predict(X_test)를 실행하고

정확도(accuracy = 맞춘 개수 / 전체)를 반환

Dataset 클래스에서 split() 후 평가자와 함께 평가하라

🎯 확장 아이디어: F1Evaluator, RMSEEvaluator 등 다양한 평가 클래스로 확장하라

In [None]:
class AccuracyEvaluator:
    def evaluate(self, model, X_test, y_test):

        return accuracy


In [None]:
class F1Evaluator:
    def evaluate(self, model, X_test, y_test):
        y_pred = model.predict(X_test)
        tp = sum(1 for p, t in zip(y_pred, y_test) if p == t == 1)
        fp = sum(1 for p, t in zip(y_pred, y_test) if p == 1 and t == 0)
        fn = sum(1 for p, t in zip(y_pred, y_test) if p == 0 and t == 1)
        if tp + fp == 0 or tp + fn == 0:
            return 0.0
        precision = tp / (tp + fp)
        recall = tp / (tp + fn)
        f1 = 2 * precision * recall / (precision + recall)
        return f1

import math
class RMSEEvaluator:
    def evaluate(self, model, X_test, y_test):
        y_pred = model.predict(X_test)
        mse = sum((p - t) ** 2 for p, t in zip(y_pred, y_test)) / len(y_test)
        return math.sqrt(mse)


In [None]:
if __name__ == "__main__":
    # 예시용 Dataset 클래스 간단 버전
    class Dataset:
        def __init__(self):
            self.data = []

        def add(self, x, y):
            self.data.append((x, y))

        def split(self, ratio=0.8):
            import random
            random.shuffle(self.data)
            n = int(len(self.data) * ratio)
            train = self.data[:n]
            test = self.data[n:]
            X_train = [x for x, _ in train]
            y_train = [y for _, y in train]
            X_test = [x for x, _ in test]
            y_test = [y for _, y in test]
            return X_train, y_train, X_test, y_test

    # 샘플 데이터셋
    ds = Dataset()
    for i in range(10):
        ds.add([i], 1 if i >= 5 else 0)

    X_train, y_train, X_test, y_test = ds.split()

    # 모델 정의: 항상 1만 예측하는 모델
    class ConstantModel:
        def __init__(self, constant):
            self.constant = constant

        def train(self, X, y):
            pass

        def predict(self, X):
            return [self.constant] * len(X)

    model = ConstantModel(1)
    model.train(X_train, y_train)

    # 평가자 사용
    acc_eval = AccuracyEvaluator()
    f1_eval = F1Evaluator()
    rmse_eval = RMSEEvaluator()

    print("정확도:", acc_eval.evaluate(model, X_test, y_test))
    print("F1 점수:", f1_eval.evaluate(model, X_test, y_test))
    print("RMSE:", rmse_eval.evaluate(model, X_test, y_test))


출력예시:

정확도: 0.6
F1 점수: 0.75
RMSE: 0.49


🟦 [Step 5] 보너스 실습: 전처리 클래스 + 파이프라인 구조
🎯 과제 목표:
전처리 도구 구성

클래스 연결 순차 호출 구조

📝 과제 요구:
Preprocessor 클래스 정의

normalize(data) → 0~1 정규화

standardize(data) → z-score 정규화


Pipeline 클래스를 정의하라

속성: preprocessor, model

fit(X, y) → 전처리 후 모델 학습

predict(X) → 전처리 후 예측


class Pipeline:
    def __init__(self, preprocessor, model):
        self.pre = preprocessor
        self.model = model

    def fit(self, X, y):
        X_new = self.pre.normalize(X)
        self.model.train(X_new, y)

    def predict(self, X):
        X_new = self.pre.normalize(X)
        return self.model.predict(X_new)

In [None]:
class Preprocessor:
    def normalize(self, data):
        # 1차원 리스트의 각 값을 0~1 범위로 정규화
        flat = [x[0] for x in data]  # [[1], [2]] → [1, 2]


    def standardize(self, data):
        import statistics



In [None]:
class Pipeline:
    def __init__(self, preprocessor, model):


    def fit(self, X, y):
        X_new = self.pre.normalize(X)  # 또는 standardize
        self.model.train(X_new, y)

    def predict(self, X):
        X_new = self.pre.normalize(X)  # 또는 standardize
        return self.model.predict(X_new)


In [None]:
class ConstantModel:
    def __init__(self, constant):
        self.constant = constant

    def train(self, X, y):
        pass  # 학습 없음

    def predict(self, X):
        return [self.constant] * len(X)


In [None]:
if __name__ == "__main__":
    # 샘플 데이터
    X = [[1], [2], [3], [4], [5]]
    y = [0, 0, 1, 1, 1]

    # 구성요소 생성
    pre = Preprocessor()
    model = ConstantModel(1)
    pipe = Pipeline(pre, model)

    # 학습 및 예측
    pipe.fit(X, y)
    preds = pipe.predict([[2], [3], [5]])

    # 출력
    print("예측 결과:", preds)


실행결과::

예측 결과: [1, 1, 1]


🟪 [Step 6] 최종 프로젝트 과제: MLExperiment 클래스 구현
🎯 과제 목표:
실험 자동화 및 클래스 통합

재사용 가능한 학습 평가 구조 설계

📝 과제 요구:
MLExperiment 클래스를 정의하라

속성: dataset, model, evaluator, preprocessor

메서드:

run() → 전체 실험 흐름 수행

데이터 분할 → 전처리 → 학습 → 예측 → 평가 출력

run() 실행 결과를 텍스트로 출력하라


In [None]:
class MLExperiment:
    def __init__(self, dataset, model, evaluator, preprocessor):
        self.dataset = dataset
        self.model = model
        self.evaluator = evaluator
        self.preprocessor = preprocessor

    def run(self, ratio=0.8):
        # 1. 데이터 분할
        X_train, y_train, X_test, y_test = self.dataset.split(ratio)

        # 2. 전처리
        X_train_proc = self.preprocessor.normalize(X_train)
        X_test_proc = self.preprocessor.normalize(X_test)

        # 3. 학습
        self.model.train(X_train_proc, y_train)

        # 4. 예측
        y_pred = self.model.predict(X_test_proc)

        # 5. 평가
        score = self.evaluator.evaluate(self.model, X_test_proc, y_test)

        # 6. 출력
        print("🔍 [실험 결과]")
        print("Test 입력:", X_test)
        print("Test 실제값:", y_test)
        print("Test 예측값:", y_pred)
        print("정확도 (Accuracy):", round(score, 2))


In [None]:
import random
import statistics

class Dataset:
    def __init__(self):
        self.data = []

    def add(self, x, y):
        self.data.append((x, y))

    def split(self, ratio=0.8):
        random.shuffle(self.data)
        n = int(len(self.data) * ratio)
        train = self.data[:n]
        test = self.data[n:]
        X_train = [x for x, _ in train]
        y_train = [y for _, y in train]
        X_test = [x for x, _ in test]
        y_test = [y for _, y in test]
        return X_train, y_train, X_test, y_test

class ConstantModel:
    def __init__(self, constant):
        self.constant = constant

    def train(self, X, y):
        pass

    def predict(self, X):
        return [self.constant] * len(X)

class AccuracyEvaluator:
    def evaluate(self, model, X_test, y_test):
        y_pred = model.predict(X_test)
        correct = sum(p == t for p, t in zip(y_pred, y_test))
        return correct / len(y_test)

class Preprocessor:
    def normalize(self, data):
        flat = [x[0] for x in data]
        min_val = min(flat)
        max_val = max(flat)
        return [[(x - min_val) / (max_val - min_val)] for x in flat]


In [None]:
if __name__ == "__main__":
    # 데이터 준비
    ds = Dataset()
    for i in range(10):
        ds.add([i], 1 if i >= 5 else 0)

    # 구성 요소 생성
    model = ConstantModel(1)
    evaluator = AccuracyEvaluator()
    preprocessor = Preprocessor()

    # 실험 객체 생성 및 실행
    experiment = MLExperiment(ds, model, evaluator, preprocessor)
    experiment.run()


실행결과::
🔍 [실험 결과]
Test 입력: [[4], [1]]
Test 실제값: [0, 0]
Test 예측값: [1, 1]
정확도 (Accuracy): 0.0
