# 🧠 머신러닝 함수 구현 실습: train_test_split, accuracy, one_hot_encode


머신러닝 실습에서 자주 사용되는 유틸리티 함수들을 **직접 구현해보는 실습**


총 3개의 함수 작성 훈련을 통해 데이터 분할, 평가, 인코딩 기초를 다지기.
## 아래 코드를 설명하는 것이 필요 


## 📦 실습용 데이터

```python
# 입력 데이터 (이름, 점수, 레이블)
data = [
    ("홍길동", 85, 1),
    ("김유신", 72, 1),
    ("이순신", 60, 1),
    ("강감찬", 45, 0),
    ("유관순", 92, 1),
    ("안중근", 55, 0),
    ("윤봉길", 78, 1),
    ("신사임당", 33, 0),
    ("장보고", 67, 1),
    ("이황", 49, 0)
]

labels = [1, 1, 1, 0, 1, 0, 1, 0, 1, 0] # 통과 불합격 판별 
```


In [1]:
data = [
    ("홍길동", 85, 1),
    ("김유신", 72, 1),
    ("이순신", 60, 1),
    ("강감찬", 45, 0),
    ("유관순", 92, 1),
    ("안중근", 55, 0),
    ("윤봉길", 78, 1),
    ("신사임당", 33, 0),
    ("장보고", 67, 1),
    ("이황", 49, 0)
]

labels = [1, 1, 1, 0, 1, 0, 1, 0, 1, 0]


## ✅ 실습 1: train_test_split 함수 구현

데이터를 주어진 비율로 섞어서 학습/테스트 데이터로 나누는 함수를 작성하기.


In [22]:
import random

## 반복해서 코드 읽기 (설명가능해야 함)
def train_test_split(data, ratio=0.8):
    shuffled = data[:]
    random.shuffle(shuffled)
    n = int(len(shuffled) * ratio)
    return shuffled[:n], shuffled[n:]

# 테스트
train, test = train_test_split(data, ratio=0.8)
print("Train set:", train)
print("Test set:", test)


Train set: [('장보고', 67, 1), ('홍길동', 85, 1), ('윤봉길', 78, 1), ('신사임당', 33, 0), ('김유신', 72, 1), ('유관순', 92, 1), ('강감찬', 45, 0), ('안중근', 55, 0)]
Test set: [('이황', 49, 0), ('이순신', 60, 1)]


## ✅ 실습 2: accuracy 함수 구현

예측값과 실제값이 주어졌을 때 정확도를 계산하는 함수를 구현하기.


In [23]:
# 분류 모델의 정확도(accuracy) 계산 
def accuracy(y_true, y_pred):
    correct = sum([1 for yt, yp in zip(y_true, y_pred) if yt == yp])
    print(correct)
    return correct / len(y_true) * 100

# 테스트
y_true = [1, 0, 1, 1, 0]
y_pred = [1, 0, 0, 1, 1]
print("정확도:", accuracy(y_true, y_pred))


3
정확도: 60.0


## ✅ 실습 3: one_hot_encode 함수 구현

레이블 리스트를 받아 원-핫 인코딩된 2차원 리스트를 반환하는 함수를 구현하기.


In [32]:
def one_hot_encode(labels):
    num_classes = max(labels) + 1
    return [[1 if i == label else 0 for i in range(num_classes)] for label in labels] # 동작 이해 필요>설명할 수 있어야 한다 

# 테스트
labels = [0, 1, 2, 3, 1]
print("원-핫 인코딩 결과:")
for row in one_hot_encode(labels):
    print(row)


원-핫 인코딩 결과:
[1, 0, 0, 0]
[0, 1, 0, 0]
[0, 0, 1, 0]
[0, 0, 0, 1]
[0, 1, 0, 0]


파이썬에서 __call__() 메서드를 오버라이드하면 객체를 함수처럼 호출

이를 이용하면 model(input)처럼 썼을 때 자동으로 forward() 메서드가 호출

✅ __call__()로 forward() 자동 호출 예제

In [None]:
class BaseModel:
    def __call__(self, X):
        return self.forward(X)
    
    def forward(self, X):
        raise NotImplementedError("forward() must be implemented in subclass")


class MyModel(BaseModel):
    #__call__() 상속했으니까 따로 안 씀씀
    def forward(self, X):
        return [x * 2 for x in X]


In [6]:
model = MyModel()

input_data = [1, 2, 3]
output = model(input_data)  # __call__() → forward() 자동 호출

print(output)  # [2, 4, 6]


[2, 4, 6]


✅ 핵심 흐름

model(input_data) 호출

→ __call__(self, X) 실행

→ 내부에서 self.forward(X) 호출

→ 자식 클래스가 정의한 forward()가 동작


이 방식은 딥러닝 프레임워크(PyTorch) 스타일과 유사


In [None]:
import torch
import torch.nn as nn # torch.nn 모듈은 신경망 레이어, 모델 구조, 손실 함수 등을 담고 있는 PyTorch의 핵심 구성요소

class Net(nn.Module): #nn.Module을 상속받아 PyTorch 모델로 인식
    def forward(self, x): # forward() 메서드를 자동 연결해주는 __call__() 등이 내장
        return x + 1

net = Net()
print(net(torch.tensor(3)))  # __call__ → forward 자동 호출


tensor(4)


net(torch.tensor(3))
→ net.__call__(torch.tensor(3))
→ net.forward(torch.tensor(3))
→ return x + 1 → tensor(4)


✅ 모델의 순전파(forward propagation) 연산을 정의하는 함수


PyTorch에서는 model(input)을 호출하면 __call__() → forward()로 연결


여기서는 입력 x에 단순히 1을 더해서 반환


__call__()	객체를 함수처럼 사용 가능하게 함

forward()	주 연산 로직 (직접 호출은 안 함)

model(X)	내부적으로 forward(X) 실행됨

PyTorch에서 신경망 모델(nn.Module)은 __call__()을 정의해 
model(input)처럼 호출하면 내부적으로 forward()를 실행

In [9]:
import torch  # ⬅️ 반드시 필요!

class Net:
    def __call__(self, x):
        return self.forward(x)

    def forward(self, x):
        return x + 1

net = Net()
print(net(torch.tensor(3)))  # ⬅️ __call__ → forward 자동 호출


tensor(4)
