# 🧠 머신러닝/딥러닝을 위한 파이썬 클래스 실습


이 노트북은 머신러닝/딥러닝 개발을 위해 꼭 필요한 **파이썬 클래스 코딩 역량**을 훈련하기 위한 실습입니다.  
단계별로 초급 → 중급 → 고급으로 클래스 설계를 연습하고, 실제 ML 전처리/모델 객체 설계 스타일도 접하게 됩니다.


## ✅ STEP 1: 초급 - 기본 클래스 정의

### 🎯 목표
- 생성자 정의
- 속성 저장
- 평균 계산 및 출력 메서드

### 📌 실습 과제

1. 아래 요구사항을 충족하는 `Student` 클래스를 정의하세요.
2. `홍길동` 객체를 생성하여 평균 점수를 출력하세요.

```python
# 요구사항
# - name (이름)
# - age (나이)
# - scores (과목 점수 리스트)
# - 평균 계산 함수 average()
# - 정보 출력 함수 show()
```


In [None]:
class Student:
    def __init__(self, name:str, age:int, scores:list):
        self.name = name
        self.age = age
        self.scores = scores

    def average(self):
        return sum(self.scores) / len(self.scores)

    def show(self):
        print(f"{self.name}의 평균 점수는 {self.average():.2f}점입니다.")

# 테스트
s1 = Student("홍길동", 20, [85, 90, 78])
s1.show()


홍길동의 평균 점수는 84.33점입니다.


In [3]:
class Student:
    def __init__(self,name,age:int,scores:list):
        self.name = name
        self.age = age
        self.scores = scores

    def average(self):
        return sum(self.scores) / (len(self.scores))
        
    def show(self):
        return self.name


hong_gil_dong = Student("HongGilDong",24,[70,60,84,40])
print(f"{hong_gil_dong.show()}의 평균 점수는 {hong_gil_dong.average()}점 입니다.")

HongGilDong의 평균 점수는 63.5점 입니다.


## ✅ STEP 2: 중급 - 데이터셋 클래스를 설계하고 샘플을 저장하기

### 🎯 목표
- 여러 샘플을 저장
- 샘플 요약 통계 계산
- 학습/테스트 데이터 분리 기능 구현


In [11]:
import random

class Dataset:
    def __init__(self):
        self.data = []

    def add(self, x, y):
        self.data.append((x, y))#x는 (name, score)튜플 y

    def summary(self):
        total = len(self.data)
        label_count = {}
        for _, y in self.data:
            label_count[y] = label_count.get(y, 0) + 1
        print(f"총 샘플 수: {total}")
        for label, count in label_count.items():
            print(f" - {label}: {count}개")

    def split(self, ratio=0.8):
        random.shuffle(self.data)
        n = int(len(self.data) * ratio)
        return self.data[:n], self.data[n:]

# 테스트
ds = Dataset()
for name, score, label in [
    ("홍길동", 85, 1), ("김유신", 72, 1), ("강감찬", 40, 0), ("유관순", 90, 1)
]:
    ds.add((name, score), label)

ds.summary()
train, test = ds.split()
print("Train:", train)
print("Test:", test)


총 샘플 수: 4
 - 1: 3개
 - 0: 1개
Train: [(('홍길동', 85), 1), (('유관순', 90), 1), (('강감찬', 40), 0)]
Test: [(('김유신', 72), 1)]


In [19]:

class Dataset:
    def __init__(self):
        self.lists = []
        self.length = 0
        self.ratio = 0.8

    def add(self,data:tuple, label:int):
        self.lists.append([data,label])

    def split(self):
        self.length = int(len(self.lists) * 0.8)
        train = self.lists[:self.length]
        test = self.lists[self.length:]
        return train, test
    
    def summary(self):
        summa = [0 for a in range(2)]
        for list in self.lists:
             summa[list[1]] = summa[list[1]] + 1

        
        print(f"총 샘플 수 {len(self.lists)} \n 1 : {summa[1]} \n 0 : {summa[0]}")

ds = Dataset()
for name, score, label in [
    ("홍길동", 85, 1), ("김유신", 72, 1), ("강감찬", 40, 0), ("유관순", 90, 1)
]:
    ds.add((name, score), label)
    
train, test = ds.split()
ds.summary()

print("Train:", train)
print("Test:", test)

총 샘플 수 4 
 1 : 3 
 0 : 1
Train: [[('홍길동', 85), 1], [('김유신', 72), 1], [('강감찬', 40), 0]]
Test: [[('유관순', 90), 1]]


## ✅ STEP 3: 고급 - 모델 추상 클래스와 상속 구현

### 🎯 목표
- 추상 클래스 생성
- 상속 후 메서드 오버라이딩



In [None]:
class BaseModel:
    def train(self, X, y):
        raise NotImplementedError

    def predict(self, X):
        raise NotImplementedError

class ConstantModel(BaseModel):
    def __init__(self, constant):
        self.constant = constant

    def train(self, X, y):
        pass

    def predict(self, X):
        return [self.constant] * len(X)

# 테스트
model = ConstantModel(constant=1)
X_test = [10, 20, 30]
print("예측 결과:", model.predict(X_test))

print([1,2,3]*3)#벡터의 내적이 아니라 리스트 반복!!


예측 결과: [1, 1, 1]
[1, 2, 3, 1, 2, 3, 1, 2, 3]


## ✅ 보너스 - 전처리 도구 클래스를 작성해보자



In [4]:
class Preprocessor:
    def normalize(self, data):
        min_val = min(data)
        max_val = max(data)
        return [(x - min_val) / (max_val - min_val) for x in data]

    def standardize(self, data):
        import statistics
        mean = statistics.mean(data)
        std = statistics.stdev(data)
        return [(x - mean) / std for x in data]

# 테스트
prep = Preprocessor()
data = [10, 20, 30, 40, 50]
print("정규화:", prep.normalize(data))
print("표준화:", prep.standardize(data))


정규화: [0.0, 0.25, 0.5, 0.75, 1.0]
표준화: [-1.2649110640673518, -0.6324555320336759, 0.0, 0.6324555320336759, 1.2649110640673518]
